根据 Anthropic 官方模型退役文件,Claude Haiku 3(模型 ID:claude-3-haiku-20240307)已于 2026 年 4 月 19 日正式停止服务。此日期之后,所有对该模型的 API 请求将直接回报错误,Anthropic 不会自动将流量导向新版本,开发者必须主动更新程序代码中的模型 ID 至 Haiku 4.5。这是本年度第一个大型 Claude 模型的生命周期终止事件。
影响范围以轻量应用为主
Claude Haiku 3 于 2024 年 3 月推出,是 Anthropic 当时最便宜、最快的模型,广泛用于客服 bot、摘要、分类、内容审核等高频但轻量的任务。两年后的今日,不少中小型 SaaS 与内部工具仍在使用此模型,理由是 prompt 与成本已深度调教、替换需重跑 QA。本次退役预告期自 2 月起已开始,Anthropic 通过官方通知、email、dashboard 警告对所有企业合约客户发出至少 60 天事前通知。
迁移至 Haiku 4.5 的两项破坏性变更
官方建议的替代方案为 Claude Haiku 4.5,但迁移并非仅修改字符串即可。开发者需留意两项破坏性变更:一是 temperature 与 top_p 两个采样参数现在仅允许择一设置,若既有代码两者都有明确数值,Anthropic 的 API 将回报错误;二是 Haiku 4.5 新增 refusal stop reason,当模型拒绝回应时会回传此标记,而非像 Haiku 3 一样直接 error 或回复 placeholder — 产品代码必须将 refusal 当成正常路径处理。
此外,上周 Opus 4.7 tokenizer 变更造成账单暗涨的争议,同样可能套用在 Haiku 4.5 上 — 即使 rate card 标示更低的 per-token 价格,实际业务任务的 token 消耗可能因 tokenizer 不同而异,建议所有迁移计划在切换当日实测对比成本。
AI 模型生命周期管理成为企业必修课
本次退役提醒企业 AI 基础设施的一个结构性变化:LLM 已从“一次性采购”进入“持续版本管理”的阶段,类似云端服务与作业系统。Anthropic 官方 deprecation 页面同时预告 Claude Opus 4、Sonnet 4 将于 2026 年 6 月 15 日退役,时程密集。企业 AI 采购条款应加入“最低支援期”、“替代模型自动可用”、“迁移测试补贴”等合约项目,否则生产服务可能因模型下架而中断。
对台湾开发者与 SaaS 团队的行动建议
三个立即动作:第一,搜索所有代码仓库与设定文件,把 claude-3-haiku-20240307 改成 claude-haiku-4-5;第二,检查 API 调用中是否同时设置 temperature 与 top_p,择一保留;第三,在 handler 中新增 refusal stop reason 的处理分支,避免意外的 user-facing error。对 使用按量计费企业合约的组织而言,切换当周监控 token 消耗变化也是必要动作,避免 tokenizer 差异带来意外超支。
这篇文章 Claude Haiku 3 于 4/19 正式退役:Anthropic 强制迁移至 Haiku 4.5,开发者须改模型 ID 与参数设置 最早出现于 鏈新闻 ABMedia。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
Anthropic首席执行官赴白宫破冰:与幕僚长、贝森特会商 Mythos
华尔街日报称,Anthropic 首席执行官 Amodei 4/17 白宫密会,聚焦 Mythos 的国安边界与负责任部署;白宫称会议具建设性,市场视为关系解冻。核心分歧是军方要 Claude 一切合法用途,Anthropic 坚持自家可接受使用政策裁量。双方均表示将持续对话,5月 Mythos 上线前再谈。
鏈新聞abmedia8 分钟前
Google Ironwood TPU:10 倍性能 + 四家合作夥伴对抗 Nvidia
根据 Bloomberg 深度报道与 Google 官方公告,Google 于 4 月 22 日正式扩张自研 AI 晶片阵容:推理专用 Ironwood(第七代 TPU)在 Google Cloud 全面供货,并同步启动与 Broadcom、MediaTek、Marvell、Intel 四家伙伴的下一代设计合作,目标是以定制晶片供应链正面挑战 Nvidia 在 AI 算力市场的主导地位。
Ironwood:第七代 TPU,首次专为推理设计
Ironwood 是 Google TPU 系列第七代产品,也是首款在“训练推理分流”策略下的推理专用晶片。Google 揭露的规格:单晶片峰值效能为 T
鏈新聞abmedia10 分钟前
DeepSeek 洽谈首轮外部融资、估值 200 亿美元:中国 AI 估值新高
根据 彭博 4 月 22 日报道(引 The Information 独家),中国 AI 新创 DeepSeek 正在洽谈首轮外部融资,估值达到 200 亿美元。这是 DeepSeek 自 2023 年成立以来首次对外募资,过去完全由量化对冲基金 High-Flyer Capital Management 通过内部供资。200 亿美元估值也是中国 AI 新创首次进入“百亿美金估值”下半段的里程碑。
融资规模与资金用途
DeepSeek 寻求至少 3 亿美元的首轮融资,200 亿美元估值较稍早 4 月 17 日 The Information 首次披露的“100 亿美元以上”估值再翻倍
鏈新聞abmedia12 分钟前
Google 推出 AI 代理工具,帮助企业自动化任务
Google 透露了用于构建 AI 代理的工具,以自动化任务、跟踪进度并通过专门的代理收件箱来管理工作流程;同时配合 Workspace 的更新,并展望 AI 代理将重塑日常员工的工作惯例。
摘要:Google 发布了用于创建 AI 代理的工具,用于任务自动化、监控其进度并简化工作流程,这表明 Workspace 的更新以及 AI 代理将改变日常工作的未来。
GateNews24 分钟前
Google:AI 生成的 Google 新代码占比 75%
Google 报告称,75% 的新代码由 AI 生成,且超过一半的 ML 计算投资旨在云端业务运营。
摘要:在一份企业更新中,Google 表示,AI 现在大约生成了 75% 的新代码,并且其大部分机器学习计算投资将被投向基于云的业务运营。
GateNews1小时前
Google Cloud 推出面向人工智能的 TPU8T 和 TPU8I 芯片
Gate News 消息,4月22日——Google Cloud 已推出面向人工智能应用的新型 TPU8T 和 TPU8I 芯片。
GateNews1小时前