GPT-5.5 赢了 Opus 4.7 和 Mythos？奥特曼晒黄仁勋内部信：英伟达全员用上 Codex！ · RoboRadar

📌 一句话摘要

        本文编译自 OpenAI 官方博客及社区反馈，全面介绍了 GPT-5.5 在智能体式编码、知识工作、科学研究和网络安全四大能力上的提升，并附有定价策略、商业模式分析和社区评价。

    

        
            📝 详细摘要
        

        文章围绕 OpenAI 最新发布的 GPT-5.5 模型展开，从模型定位、能力提升、社区反馈、定价策略和商业模式等多个维度进行了详细报道。GPT-5.5 被定位为面向真实工作的智能体式模型，重点强化了规划、工具调用和跨工具执行能力。文章引用了 Andon Labs、Matthew Berman 等早期测试者的评价，展示了其在 Vending-Bench、Terminal-Bench 等评测中的表现，并与 Claude Opus 4.7、Mythos 等竞品进行了对比。此外，文章还披露了 OpenAI 内部使用 Codex 的案例、NVIDIA 全员接入 Codex 的消息，以及 Aakash Gupta 对 OpenAI 定价策略和商业模式的深度分析。

    

        
            💡 主要观点
        

        
            
                    GPT-5.5 定位为智能体式工作模型，强化规划、工具调用和跨工具执行能力。
                     与单轮问答模型不同，GPT-5.5 能自主处理复杂多步骤任务，包括编写代码、在线研究、数据分析、操作软件等，并在多个工具间切换直至任务完成。
                

                    GPT-5.5 在多项基准测试中领先竞品，尤其在智能体式编码和知识工作领域表现突出。
                     在 Terminal-Bench 2.0 上得分 82.7%，显著高于 Claude Opus 4.7 的 69.4%；在 GDPval 上得分 84.9%，高于 Opus 4.7 的 80.3%。
                

                    GPT-5.5 定价大幅上涨，但 OpenAI 通过更高效的 token 使用和快速迭代构建商业护城河。
                     输入价格从 GPT-5 的 0.63 美元涨至 5.00 美元/百万 token，8 个月涨 8 倍。分析认为，OpenAI 正通过快速迭代和涨价策略，让开发者难以离开其生态。
                

                    GPT-5.5 在安全方面被评为 High 等级，网络安全能力显著提升。
                     在 CyberGym 上得分 81.8%，高于 GPT-5.4 的 79.0% 和 Claude Opus 4.7 的 73.1%。OpenAI 部署了更严格的潜在网络风险分类器。
                

        
    

        
            💬 文章金句
        

        
            GPT-5.5 让 OpenAI 重新回到 AI 领域毫无争议的第一名。

GPT-5.5 现在就是新的标杆。它就是前沿。除了速度之外，它已经和任何 Opus 模型一样强，甚至在很多任务上更强。只要发布得足够快，让客户不断围绕你的格式重建提示词和工作流管线，之后每一轮再涨价，因为他们已经很难离开。 GPT-5.5 在 Codex 中尤其适合承担实现、重构、调试、测试和验证等真实工程任务。

来源：AI前线

作者：AI前线

分类：人工智能

语言：中文

阅读时间：22 分钟

字数：5481

                标签：
                
                    GPT-5.5, OpenAI, 大语言模型, 智能体编码, Codex
                
            

        
    

    
        阅读完整文章