返回
AI AgentDEEPSEEK-V4

DeepSeek V4 终于发布!打破最强闭源垄断,明确携手华为芯片

DeepSeek发布V4系列模型,包含Pro和Flash两个版本,并称下半年将批量上华为算力。

BestBlogs · Agent 关键词41 分钟阅读中文
阅读原文
DeepSeek V4 终于发布!打破最强闭源垄断,明确携手华为芯片
TL;DR: DeepSeek发布V4系列模型,包含Pro和Flash两个版本,并称下半年将批量上华为算力。
以下为 BestBlogs · Agent 关键词 原文(中文

📌 一句话摘要

        DeepSeek 正式发布 V4 系列模型,包含 Pro 和 Flash 两个版本,在 Agent 能力、世界知识和推理性能上实现开源领先,并宣布下半年批量上华为算力。

    

        
            📝 详细摘要
        

        DeepSeek 于 2026 年 4 月正式发布 V4 系列模型,包含 V4-Pro(1.6T 参数,49B 激活)和 V4-Flash(284B 参数,13B 激活)两个版本,均支持 1M 上下文长度。V4-Pro 在 Agent 能力、世界知识和推理性能上达到开源模型最佳水平,内部评测中 Agent Coding 体验优于 Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式。V4 开创了全新的注意力机制,在 token 维度进行压缩,结合 DSA 稀疏注意力,大幅降低计算和显存需求。API 同步上线,支持 OpenAI 和 Anthropic 两套接口。值得关注的是,DeepSeek 明确宣布下半年将批量上华为算力,同时旧模型名 deepseek-chat 和 deepseek-reasoner 将在三个月后停用。

    

        
            💡 主要观点
        

        
            
                    DeepSeek-V4 发布 Pro 和 Flash 两个版本,均支持 1M 上下文。
                     V4-Pro 为 1.6T 参数、49B 激活的旗舰模型,对标顶级闭源模型;V4-Flash 为 284B 参数、13B 激活的经济版,推理能力接近 Pro。1M 上下文成为 DeepSeek 所有官方服务的标配。
                

                    V4 在 Agent 能力、世界知识和推理性能上实现开源领先。
                     内部评测显示 V4-Pro Agent Coding 体验优于 Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式;世界知识大幅领先其他开源模型,仅稍逊于 Gemini-Pro-3.1;推理性能超越所有已公开评测的开源模型。
                

                    V4 开创全新注意力机制,大幅降低计算和显存需求。
                     在 token 维度进行压缩,结合 DSA 稀疏注意力,相比传统方法显著降低对计算和显存的需求,这是实现 1M 上下文标配化的核心技术突破。
                

                    DeepSeek 宣布下半年批量上华为算力。
                     这一决策标志着国产 AI 芯片生态的重要进展,DeepSeek 在算力自主化道路上迈出关键一步。
                

        
    

        
            💬 文章金句
        

        
            在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。

DeepSeek-V4 已经成为公司内部员工使用的 Agentic Coding 模型,据评测反馈使用体验优于 Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式。 V4 开创了一种全新的注意力机制,在 token 维度进行压缩,结合 DSA 稀疏注意力一起用。相比传统方法,对计算和显存的需求大幅降低。 不诱于誉,不恐于诽,率道而行,端然正己。

            📊 文章信息
        

        
            AI 初评:90

来源:量子位

作者:鱼羊

分类:人工智能

语言:中文

阅读时间:9 分钟

字数:2089

                标签:
                
                    DeepSeek-V4, 大语言模型, 开源模型, 华为算力, 注意力机制
                
            

        
    

    
        阅读完整文章