DeepSeek V4 终于发布！打破最强闭源垄断，明确携手华为芯片 · RoboRadar

📌 一句话摘要

        DeepSeek 正式发布 V4 系列模型，包含 Pro 和 Flash 两个版本，在 Agent 能力、世界知识和推理性能上实现开源领先，并宣布下半年批量上华为算力。

    

        
            📝 详细摘要
        

        DeepSeek 于 2026 年 4 月正式发布 V4 系列模型，包含 V4-Pro（1.6T 参数，49B 激活）和 V4-Flash（284B 参数，13B 激活）两个版本，均支持 1M 上下文长度。V4-Pro 在 Agent 能力、世界知识和推理性能上达到开源模型最佳水平，内部评测中 Agent Coding 体验优于 Sonnet 4.5，交付质量接近 Opus 4.6 非思考模式。V4 开创了全新的注意力机制，在 token 维度进行压缩，结合 DSA 稀疏注意力，大幅降低计算和显存需求。API 同步上线，支持 OpenAI 和 Anthropic 两套接口。值得关注的是，DeepSeek 明确宣布下半年将批量上华为算力，同时旧模型名 deepseek-chat 和 deepseek-reasoner 将在三个月后停用。

    

        
            💡 主要观点
        

        
            
                    DeepSeek-V4 发布 Pro 和 Flash 两个版本，均支持 1M 上下文。
                     V4-Pro 为 1.6T 参数、49B 激活的旗舰模型，对标顶级闭源模型；V4-Flash 为 284B 参数、13B 激活的经济版，推理能力接近 Pro。1M 上下文成为 DeepSeek 所有官方服务的标配。
                

                    V4 在 Agent 能力、世界知识和推理性能上实现开源领先。
                     内部评测显示 V4-Pro Agent Coding 体验优于 Sonnet 4.5，交付质量接近 Opus 4.6 非思考模式；世界知识大幅领先其他开源模型，仅稍逊于 Gemini-Pro-3.1；推理性能超越所有已公开评测的开源模型。
                

                    V4 开创全新注意力机制，大幅降低计算和显存需求。
                     在 token 维度进行压缩，结合 DSA 稀疏注意力，相比传统方法显著降低对计算和显存的需求，这是实现 1M 上下文标配化的核心技术突破。
                

                    DeepSeek 宣布下半年批量上华为算力。
                     这一决策标志着国产 AI 芯片生态的重要进展，DeepSeek 在算力自主化道路上迈出关键一步。
                

        
    

        
            💬 文章金句
        

        
            在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。

DeepSeek-V4 已经成为公司内部员工使用的 Agentic Coding 模型，据评测反馈使用体验优于 Sonnet 4.5，交付质量接近 Opus 4.6 非思考模式。 V4 开创了一种全新的注意力机制，在 token 维度进行压缩，结合 DSA 稀疏注意力一起用。相比传统方法，对计算和显存的需求大幅降低。不诱于誉，不恐于诽，率道而行，端然正己。

来源：量子位

作者：鱼羊

分类：人工智能

语言：中文

阅读时间：9 分钟

字数：2089

                标签：
                
                    DeepSeek-V4, 大语言模型, 开源模型, 华为算力, 注意力机制
                
            

        
    

    
        阅读完整文章