AI AgentDEEPSEEK-V4
DeepSeek-V4 预览版:迈入百万上下文普惠时代
DeepSeek发布V4预览版,包含Pro和Flash两个版本,标配1M上下文并开源模型权重和技术报告。
BestBlogs · Agent 关键词39 分钟阅读中文
阅读原文TL;DR: DeepSeek发布V4预览版,包含Pro和Flash两个版本,标配1M上下文并开源模型权重和技术报告。
以下为 BestBlogs · Agent 关键词 原文(中文)
📌 一句话摘要
DeepSeek 发布 V4 预览版,推出 Pro 和 Flash 两个版本,标配百万上下文,在 Agent、推理和知识能力上达到开源领先水平,并同步开源。
📝 详细摘要
DeepSeek 正式发布 V4 系列模型的预览版本,包含 DeepSeek-V4-Pro 和 DeepSeek-V4-Flash 两个版本,均支持百万字超长上下文。Pro 版本在 Agent 能力、世界知识和推理性能上达到开源模型最佳水平,性能比肩顶级闭源模型;Flash 版本则在保持接近推理能力的同时,提供更快捷经济的 API 服务。模型采用了全新的注意力机制和 DSA 稀疏注意力,大幅降低长上下文场景下的计算和显存需求。API 已同步上线,支持 OpenAI 和 Anthropic 接口格式。模型权重和技术报告已开源。
💡 主要观点
DeepSeek-V4 标配百万上下文,采用全新注意力机制降低计算成本。
通过 token 维度压缩和 DSA 稀疏注意力,实现了全球领先的长上下文能力,同时大幅降低对计算和显存的需求,使百万上下文成为所有官方服务的标配。
V4-Pro 在 Agent、知识和推理上达到开源领先,比肩顶级闭源模型。
在 Agentic Coding 评测中达到开源模型最佳水平,世界知识测评大幅领先其他开源模型,推理性能超越所有已公开评测的开源模型,仅稍逊于顶尖闭源模型。
V4-Flash 提供更快捷经济的 API 服务,推理能力接近 Pro 版本。
在简单 Agent 任务上与 Pro 版本旗鼓相当,世界知识储备稍逊,但凭借更小的模型参数和激活,能够提供更高效的 API 服务,适合对成本敏感的场景。
💬 文章金句
从现在开始,1M(一百万)上下文将是 DeepSeek 所有官方服务的标配。
在 Agentic Coding 评测中,V4-Pro 已达到当前开源模型最佳水平。 DeepSeek-V4 开创了一种全新的注意力机制,在 token 维度进行压缩,结合 DSA 稀疏注意力,实现了全球领先的长上下文能力。 不诱于誉,不恐于诽,率道而行,端然正己。
📊 文章信息
AI 初评:95
精选文章:是
来源:DeepSeek
作者:DeepSeek
分类:人工智能
语言:中文
阅读时间:6 分钟
字数:1268
标签:
DeepSeek-V4, 大语言模型, 百万上下文, 开源模型, Agent
阅读完整文章