返回
AI AgentDEEPSEEK-V4

DeepSeek-V4 预览版:迈入百万上下文普惠时代

DeepSeek发布V4预览版,包含Pro和Flash两个版本,标配1M上下文并开源模型权重和技术报告。

BestBlogs · Agent 关键词39 分钟阅读中文
阅读原文
DeepSeek-V4 预览版:迈入百万上下文普惠时代
TL;DR: DeepSeek发布V4预览版,包含Pro和Flash两个版本,标配1M上下文并开源模型权重和技术报告。
以下为 BestBlogs · Agent 关键词 原文(中文

📌 一句话摘要

        DeepSeek 发布 V4 预览版,推出 Pro 和 Flash 两个版本,标配百万上下文,在 Agent、推理和知识能力上达到开源领先水平,并同步开源。

    

        
            📝 详细摘要
        

        DeepSeek 正式发布 V4 系列模型的预览版本,包含 DeepSeek-V4-Pro 和 DeepSeek-V4-Flash 两个版本,均支持百万字超长上下文。Pro 版本在 Agent 能力、世界知识和推理性能上达到开源模型最佳水平,性能比肩顶级闭源模型;Flash 版本则在保持接近推理能力的同时,提供更快捷经济的 API 服务。模型采用了全新的注意力机制和 DSA 稀疏注意力,大幅降低长上下文场景下的计算和显存需求。API 已同步上线,支持 OpenAI 和 Anthropic 接口格式。模型权重和技术报告已开源。

    

        
            💡 主要观点
        

        
            
                    DeepSeek-V4 标配百万上下文,采用全新注意力机制降低计算成本。
                     通过 token 维度压缩和 DSA 稀疏注意力,实现了全球领先的长上下文能力,同时大幅降低对计算和显存的需求,使百万上下文成为所有官方服务的标配。
                

                    V4-Pro 在 Agent、知识和推理上达到开源领先,比肩顶级闭源模型。
                     在 Agentic Coding 评测中达到开源模型最佳水平,世界知识测评大幅领先其他开源模型,推理性能超越所有已公开评测的开源模型,仅稍逊于顶尖闭源模型。
                

                    V4-Flash 提供更快捷经济的 API 服务,推理能力接近 Pro 版本。
                     在简单 Agent 任务上与 Pro 版本旗鼓相当,世界知识储备稍逊,但凭借更小的模型参数和激活,能够提供更高效的 API 服务,适合对成本敏感的场景。
                

        
    

        
            💬 文章金句
        

        
            从现在开始,1M(一百万)上下文将是 DeepSeek 所有官方服务的标配。

在 Agentic Coding 评测中,V4-Pro 已达到当前开源模型最佳水平。 DeepSeek-V4 开创了一种全新的注意力机制,在 token 维度进行压缩,结合 DSA 稀疏注意力,实现了全球领先的长上下文能力。 不诱于誉,不恐于诽,率道而行,端然正己。

            📊 文章信息
        

        
            AI 初评:95

精选文章:是

来源:DeepSeek

作者:DeepSeek

分类:人工智能

语言:中文

阅读时间:6 分钟

字数:1268

                标签:
                
                    DeepSeek-V4, 大语言模型, 百万上下文, 开源模型, Agent
                
            

        
    

    
        阅读完整文章