Anthropic 於 4/23 發佈 Claude Code 品質事故檢討,公開承認過去近兩個月內三個疊加的工程錯誤造成 Claude Code 使用品質下降,並同步將影響波及 Claude Agent SDK 與 Claude Cowork。公司表示「nous accordons une très grande importance aux retours concernant la dégradation du modèle, et nous n’avons jamais réduit volontairement les capacités du modèle」,并於 4/23 為所有訂閱者重置用量上限作為補償。
三個 bug 的時間軸與技術根因
問題 生效區間 根因 修復版本 推理預算降級 3/4–4/7 reasoning effort 默認從 high 降為 medium,用戶感受模型「變笨」 4/7 回滾 快取清理 bug 3/26–4/10 閒置逾 1 小時 session 的 thinking 快取每輪都被清,而非僅清一次 v2.1.101 簡潔 prompt 反噬 4/16–4/20 新增「工具呼叫間文字 ≤25 字」系統指令,ablation 測出整體智能下降 3% v2.1.116
推理降級:為降延遲付出的代價
3/4 Anthropic 將 Claude Code 的 reasoning effort 默認從 high 調整為 medium,目的是縮短回應延遲。但此變更使模型在程式碼推理與除錯任務上感覺「變笨」。4/7 回滾後,現在 Opus 4.7 默認 xhigh、其他模型維持 high。公司坦承:變更前內部評估未能偵測到此退化。
快取清理 bug:跨系統邊界的隱性錯誤
3/26 Anthropic 為閒置超過一小時的 session 導入 prompt caching 優化。原設計是「閒置滿一小時清一次 thinking 快取」,但實作上變成「閒置觸發後每一輪都清」,導致 Claude 在長 session 中表現「健忘、重複」,且每輪 cache miss 使用戶用量被快速消耗。Anthropic 指出此 bug「存在於 Claude Code 上下文管理、Anthropic API 與 extended thinking 三者的交集處」,牽涉多個系統邊界、是難以用單元測試捕捉的隱性錯誤。修復於 4/10 以 v2.1.101 發佈。
25 字簡潔指令:ablation 才發現智能下降 3%
4/16 Anthropic 加入一條系統指令:「工具呼叫間的文字輸出保持在 25 字以內」,本意是減少模型冗長解釋、讓體驗更乾淨。當下內部測試沒有發現退化,但經過更嚴謹的 ablation 對照實驗後,公司發現此指令對 Opus 4.6 與 4.7 兩個模型都造成約 3% 的整體智能下降。4/20 在 v2.1.116 回滾。此事件凸顯:系統 prompt 的微小措辭也可能對模型行為產生未預期的結構性影響。
影響範圍
產品層:Claude Code(三個問題皆受影響)、Claude Agent SDK(①②)、Claude Cowork(全部)
模型層:Sonnet 4.6、Opus 4.6、Opus 4.7
API 基礎設施:未受影響
用戶感受層面表現為:回應品質與「智能」感降低、延遲上升、conversation context 中途遺失、用量比預期燒得更快。
補償與流程改進
Anthropic 在 4/23 為所有訂閱者重置用量上限作為直接補償。同步承諾的流程改進包括:
對 system prompt 變更實施更廣的評估套件(evaluation suite)
改進 Code Review 工具提早偵測回歸
將內部測試標準化為公開 build,避免「內部版本」與「對外版本」行為分歧
為可能影響模型智能的變更加入 soak period 與漸進式 rollout
對使用者的啟示
對依賴 Claude Code 進行日常開發與研究的使用者而言,這份 postmortem 有三個可帶走的重點:第一,若你在 3 月中到 4 月 20 日間感受到 Claude 模型「變笨」、或是 Claude Code 對長 session 異常遺忘,那並非你的錯覺或 prompt 不當;第二,這段期間用量上限被快速吃光的用戶,可於 4/23 後確認 Anthropic 是否已自動重置;第三,即便是一條「25 字以內」的 prompt 微調,也可能對模型全域行為產生系統性影響——這是 LLM 產品工程的共通風險。
相較同業多以沉默或「這是使用者操作不當」回應模型退化質疑,Anthropic 這次的主動揭露與技術透明度,為 AI 產品事故檢討設下一個可參考的樣本。
這篇文章 Anthropic 自揭 Claude Code 三 bug 疊加:推理降級、快取遺忘、25 字指令反噬 最早出現於 鏈新聞 ABMedia。
Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'
avertissement.
Articles similaires
Les introductions en bourse de SpaceX, OpenAI et Anthropic pourraient attirer plus de $240 milliard, avec un impact potentiel sur la liquidité du marché crypto
Message de Gate News, 25 avril — Selon des rapports de marché, SpaceX devrait entrer en bourse en juin avec un objectif de levée de fonds dépassant l’introduction en bourse record de $29 milliard de Saudi Aramco, tandis qu’OpenAI et Anthropic prévoient de s’inscrire sur le marché au second semestre 2026. Les trois sociétés sont prévues pour
GateNewsIl y a 57m
Aperçu de DeepSeek-V4 publié avec une fenêtre de contexte de 1M, la solution IA Huawei DCS apporte un support complet
Message de Gate News, 25 avril — La version préliminaire de DeepSeek-V4 a été officiellement publiée et open-sourcée, avec une fenêtre de contexte étendue de 1 million de jetons et l’introduction de la fenêtre glissante KV Cache avec des algorithmes de compression pour réduire la complexité de calcul de l’Attention et la pression sur la bande passante mémoire. Le nouveau modèle améliore significativement les capacités des agents et démontre une efficacité et une stabilité améliorées dans le raisonnement sur longues séquences et le traitement de tâches complexes, bien qu’il introduise de nouveaux défis d’infrastructure.
GateNewsIl y a 1h
La pénurie de GPU revient alors que Microsoft et Amazon resserrent l’approvisionnement ; les start-ups d’IA subissent une hausse de prix de 32 % et des files d’attente jusqu’en fin d’année
Message de Gate News, 25 avril — Une pénurie de GPU refait surface alors que de grands fournisseurs de cloud, dont Microsoft et Amazon, concentrent la capacité de calcul au profit de leurs équipes internes et de leurs principaux clients comme OpenAI et Anthropic, laissant les plus petites start-ups d’IA faire face à des hausses de prix, à des délais d’attente prolongés et à des conditions contractuelles plus strictes.
GateNewsIl y a 3h
Nvidia déploie l’agent IA Codex d’OpenAI auprès de l’ensemble de son personnel sur l’infrastructure Blackwell
Message de Gate News, 25 avril — Nvidia a déployé Codex d’OpenAI, un agent IA alimenté par GPT-5.5, auprès de l’ensemble de son personnel après un essai concluant avec environ 10 000 employés, d’après des communications internes du PDG Jensen Huang et du PDG d’OpenAI Sam Altman.
Codex est conçu pour aider à
GateNewsIl y a 3h
Le Département d’État des États-Unis met en garde contre la distillation du modèle d’IA DeepSeek
Le Département d’État américain a publié une dépêche le 24 avril à destination des missions diplomatiques et consulaires du monde entier, avertissant les gouvernements étrangers au sujet des efforts chinois visant à copier des systèmes d’IA américains par distillation, selon Reuters. La dépêche
CryptoFrontierIl y a 4h
La start-up d’IA santé du professeur de Stanford recherche $100M à $1B de valorisation
Message « Gate News », 25 avril — Le professeur de Stanford James Zou lève environ $100 millions pour Human Intelligence, une start-up californienne qui développe des modèles d’IA pour la physiologie humaine, avec une valorisation d’environ $1 milliards.
L’entreprise s’appuie sur les recherches de Zou en physiologie et en IA. L’algorithme EchoNet du laboratoire
GateNewsIl y a 4h