AI AgentANTHROPIC
Anthropic 实锤 Claude Code「降智」:就是这三个 Bug 造成的
Anthropic 称 Claude Code 体验下降由推理强度调整、缓存清理 Bug 和系统提示词变更三项问题导致。
BestBlogs · Agent 关键词37 分钟阅读中文
阅读原文TL;DR: Anthropic 称 Claude Code 体验下降由推理强度调整、缓存清理 Bug 和系统提示词变更三项问题导致。
以下为 BestBlogs · Agent 关键词 原文(中文)
📌 一句话摘要
Anthropic 官方发布事后复盘报告,承认 Claude Code 因三个 Bug(推理强度调整、缓存清理 Bug、系统提示词变更)导致用户体验下降,但强调模型本身能力未退化。
📝 详细摘要
本文报道了 Anthropic 针对用户反馈 Claude Code「降智」问题发布的官方复盘报告。报告指出,问题并非模型能力退化,而是由 Claude Code 和 Agent SDK 运行框架中的三个 Bug 导致:一是将默认推理强度从 high 调整为 medium,牺牲了智能以换取速度;二是缓存清理逻辑出现 Bug,导致模型在每轮对话中持续失忆;三是系统提示词中加入的「降低冗长度」指令限制了模型思考深度。Anthropic 已逐一修复这些问题,并宣布将重置所有订阅用户的使用限额作为歉意。文章还介绍了 Anthropic 后续的改进措施,包括让内部员工使用公共版本、强化系统提示词评估流程、引入更长的灰度发布观察期等。
💡 主要观点
Claude Code 体验下降由三个框架层 Bug 导致,模型本身未退化。
Anthropic 调查确认,问题源于 Claude Code 和 Agent SDK 运行框架的改动,而非模型能力退化。Claude API 未受影响。
推理强度调整和缓存 Bug 是核心问题。
默认推理强度从 high 调至 medium 降低了智能;缓存清理 Bug 导致模型持续失忆。两者均已被修复,但影响了 Sonnet 4.6 和 Opus 4.6 版本。
系统提示词变更限制了模型思考深度。
加入的「降低冗长度」指令与其他改动叠加后,损害了代码任务表现。该变更已被撤回。
💬 文章金句
在过去一个月里,一些用户反馈 Claude Code 的质量有所下降。我们对此进行了调查,并发布了一份事后复盘报告,总结了发现的三个问题。
模型本身并没有出现能力退化,Claude API 也未受到影响。 这些改动分别在不同时间、作用于不同用户流量切片,叠加起来的整体效果表现为「广泛且不一致」的性能下降。
📊 文章信息
AI 初评:86
来源:机器之心
作者:机器之心
分类:人工智能
语言:中文
阅读时间:8 分钟
字数:1803
标签:
Anthropic, Claude Code, 降智, Bug 复盘, AI 编程
阅读完整文章