AI AgentDEEPSEEK-V4
DeepSeek-V4 终于更新了!一百万超长上下文,Agent 能力大幅增强,能力接近 Opus 4.6
DeepSeek发布并开源V4预览版,包含Pro和Flash两个版本,原生支持1M token上下文并强调Agent能力提升。
BestBlogs · Agent 关键词39 分钟阅读中文
阅读原文TL;DR: DeepSeek发布并开源V4预览版,包含Pro和Flash两个版本,原生支持1M token上下文并强调Agent能力提升。
以下为 BestBlogs · Agent 关键词 原文(中文)
📌 一句话摘要
DeepSeek 正式发布并开源 V4 系列模型(Pro/Flash),原生支持 1M 超长上下文,Agent 能力大幅增强,性能对标顶级闭源模型。
📝 详细摘要
文章报道了 DeepSeek-V4 的发布信息。V4 系列包含 Pro 和 Flash 两个版本,均原生支持 1M token 的超长上下文。V4-Pro 作为旗舰版本,总参数达 1.6T,激活参数 49B,在 Agentic Coding 评测中达到开源模型最佳水平,内部评测体验优于 Sonnet 4.5,交付质量接近 Opus 4.6。V4-Flash 则面向成本敏感场景,参数更小但推理能力接近 Pro。文章还介绍了 V4 在架构上的核心创新,包括全新的 CSA+HCA 混合注意力机制、mHC 流形约束超连接以及 Muon 优化器,这些创新使得在 1M 上下文下,Pro 版本的推理 FLOPs 仅为 V3.2 的 27%,KV Cache 仅为 10%。目前模型已在官网、App 和 API 同步上线,并已开源权重和技术报告。
💡 主要观点
DeepSeek-V4 系列发布,包含 Pro 和 Flash 两个版本,均支持 1M 超长上下文。
V4-Pro 为旗舰版,总参数 1.6T,激活参数 49B;V4-Flash 为轻量版,总参数 284B,激活参数 13B。1M 上下文将成为 DeepSeek 所有官方服务的标配。
V4 的 Agent 能力大幅增强,在 Agentic Coding 评测中达到开源模型最佳水平。
内部评测显示,V4-Pro 的 Agent 体验优于 Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式,并针对 Claude Code 等主流 Agent 产品进行了专项优化。
V4 采用全新的 CSA+HCA 混合注意力机制,大幅提升长上下文效率。
在 1M token 场景下,V4-Pro 的单 token 推理 FLOPs 仅为 V3.2 的 27%,KV Cache 大小仅为 10%,实现了计算和显存需求的大幅降低。
💬 文章金句
DeepSeek 正式上线并开源了 DeepSeek-V4 的预览版,分为 Pro 和 Flash 两个版本。
一百万上下文将成为 DeepSeek 所有官方服务的标配。 V4-Pro 在 Agentic Coding 评测中已经达到了当前开源模型最佳水平。 在 1M token 上下文场景下,V4-Pro 的单 token 推理 FLOPs 仅为 DeepSeek-V3.2 的 27%,KV Cache 大小仅为 10%。
📊 文章信息
AI 初评:88
来源:Founder Park
作者:Founder Park
分类:人工智能
语言:中文
阅读时间:8 分钟
字数:1966
标签:
DeepSeek-V4, 大语言模型, 超长上下文, Agent, 开源模型
阅读完整文章