返回
其它DEEPSEEK V4

DeepSeek V4 来了

DeepSeek V4 系列发布,包含 Pro 和 Flash 两个版本,并开源权重和技术报告。

BestBlogs · Agent 关键词39 分钟阅读中文
阅读原文
DeepSeek V4 来了
TL;DR: DeepSeek V4 系列发布,包含 Pro 和 Flash 两个版本,并开源权重和技术报告。
以下为 BestBlogs · Agent 关键词 原文(中文

📌 一句话摘要

        DeepSeek V4 系列模型正式发布,包含 Pro 和 Flash 两个版本,在上下文长度、推理性能和 Agent 能力上均有显著提升,权重和技术报告已开源。

    

        
            📝 详细摘要
        

        文章报道了 DeepSeek V4 系列模型的发布信息。核心亮点包括:百万级上下文窗口成为标配,通过全新的 token 压缩和 DSA 稀疏注意力机制大幅降低计算量;提供 V4-Pro(1.6T 参数,49B 激活)和 V4-Flash(更轻更快更便宜)两个版本;Agent 能力为开源最强,内部体验优于 Sonnet 4.5,接近 Opus 4.6 非思考模式;推理性能超越所有已公开评测的开源模型,比肩顶级闭源模型。文章还提供了 API 调用方式(model 参数改为 deepseek-v4-pro 或 deepseek-v4-flash)、在线体验入口、模型权重和技术报告的下载链接,以及旧模型名三个月后停用的通知。

    

        
            💡 主要观点
        

        
            
                    DeepSeek V4 系列发布,包含 Pro 和 Flash 两个版本。
                     V4-Pro 拥有 1.6T 参数和 49B 激活参数,V4-Flash 则更轻量、快速且成本更低,满足不同场景需求。
                

                    百万级上下文窗口和新型注意力机制是核心技术亮点。
                     通过全新的 token 压缩和 DSA 稀疏注意力机制,在支持超长上下文的同时,计算量远低于传统方案。
                

                    Agent 能力和推理性能达到开源模型顶尖水平。
                     官方宣称其 Agent 能力为开源最强,内部体验优于 Sonnet 4.5,接近 Opus 4.6;推理性能超越所有已公开评测的开源模型。
                

                    模型权重和技术报告已开源,API 已上线。
                     开发者可通过 HuggingFace 和 ModelScope 获取模型权重,API 调用只需修改 model 参数,支持思考和非思考模式。
                

        
    

        
            💬 文章金句
        

        
            百万上下文标配,全新 token 压缩 + DSA 稀疏注意力,计算量远低于传统方案

Agent 能力开源最强,内部已替代使用,体验优于 Sonnet 4.5,接近 Opus 4.6 非思考模式 推理性能超越所有已公开评测的开源模型,比肩顶级闭源

            📊 文章信息
        

        
            AI 初评:85

来源:逛逛GitHub

作者: 逛逛GitHub

分类:人工智能

语言:中文

阅读时间:3 分钟

字数:612

                标签:
                
                    DeepSeek V4, 大语言模型, 开源模型, 模型发布, AI Agent
                
            

        
    

    
        阅读完整文章