AI AgentDEEPSEEK-V4
DeepSeek V4 终于发布!打破最强闭源垄断,明确携手华为芯片
DeepSeek发布V4系列模型,包含Pro和Flash两个版本,并称下半年将批量上华为算力。
BestBlogs · Agent 关键词41 分钟阅读中文
阅读原文TL;DR: DeepSeek发布V4系列模型,包含Pro和Flash两个版本,并称下半年将批量上华为算力。
以下为 BestBlogs · Agent 关键词 原文(中文)
📌 一句话摘要
DeepSeek 正式发布 V4 系列模型,包含 Pro 和 Flash 两个版本,在 Agent 能力、世界知识和推理性能上实现开源领先,并宣布下半年批量上华为算力。
📝 详细摘要
DeepSeek 于 2026 年 4 月正式发布 V4 系列模型,包含 V4-Pro(1.6T 参数,49B 激活)和 V4-Flash(284B 参数,13B 激活)两个版本,均支持 1M 上下文长度。V4-Pro 在 Agent 能力、世界知识和推理性能上达到开源模型最佳水平,内部评测中 Agent Coding 体验优于 Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式。V4 开创了全新的注意力机制,在 token 维度进行压缩,结合 DSA 稀疏注意力,大幅降低计算和显存需求。API 同步上线,支持 OpenAI 和 Anthropic 两套接口。值得关注的是,DeepSeek 明确宣布下半年将批量上华为算力,同时旧模型名 deepseek-chat 和 deepseek-reasoner 将在三个月后停用。
💡 主要观点
DeepSeek-V4 发布 Pro 和 Flash 两个版本,均支持 1M 上下文。
V4-Pro 为 1.6T 参数、49B 激活的旗舰模型,对标顶级闭源模型;V4-Flash 为 284B 参数、13B 激活的经济版,推理能力接近 Pro。1M 上下文成为 DeepSeek 所有官方服务的标配。
V4 在 Agent 能力、世界知识和推理性能上实现开源领先。
内部评测显示 V4-Pro Agent Coding 体验优于 Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式;世界知识大幅领先其他开源模型,仅稍逊于 Gemini-Pro-3.1;推理性能超越所有已公开评测的开源模型。
V4 开创全新注意力机制,大幅降低计算和显存需求。
在 token 维度进行压缩,结合 DSA 稀疏注意力,相比传统方法显著降低对计算和显存的需求,这是实现 1M 上下文标配化的核心技术突破。
DeepSeek 宣布下半年批量上华为算力。
这一决策标志着国产 AI 芯片生态的重要进展,DeepSeek 在算力自主化道路上迈出关键一步。
💬 文章金句
在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。
DeepSeek-V4 已经成为公司内部员工使用的 Agentic Coding 模型,据评测反馈使用体验优于 Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式。 V4 开创了一种全新的注意力机制,在 token 维度进行压缩,结合 DSA 稀疏注意力一起用。相比传统方法,对计算和显存的需求大幅降低。 不诱于誉,不恐于诽,率道而行,端然正己。
📊 文章信息
AI 初评:90
来源:量子位
作者:鱼羊
分类:人工智能
语言:中文
阅读时间:9 分钟
字数:2089
标签:
DeepSeek-V4, 大语言模型, 开源模型, 华为算力, 注意力机制
阅读完整文章