Claude Haiku 3 于 4/19 正式退役:Anthropic 强制迁移至 Haiku 4.5,开发者须更改模型 ID 和参数设置

鏈新聞abmedia

根据 Anthropic 官方模型退役文件,Claude Haiku 3(模型 ID:claude-3-haiku-20240307)已于 2026 年 4 月 19 日正式停止服务。此日期之后,所有对该模型的 API 请求将直接回报错误,Anthropic 不会自动将流量导向新版本,开发者必须主动更新程序代码中的模型 ID 至 Haiku 4.5。这是本年度第一个大型 Claude 模型的生命周期终止事件。

影响范围以轻量应用为主

Claude Haiku 3 于 2024 年 3 月推出,是 Anthropic 当时最便宜、最快的模型,广泛用于客服 bot、摘要、分类、内容审核等高频但轻量的任务。两年后的今日,不少中小型 SaaS 与内部工具仍在使用此模型,理由是 prompt 与成本已深度调教、替换需重跑 QA。本次退役预告期自 2 月起已开始,Anthropic 通过官方通知、email、dashboard 警告对所有企业合约客户发出至少 60 天事前通知。

迁移至 Haiku 4.5 的两项破坏性变更

官方建议的替代方案为 Claude Haiku 4.5,但迁移并非仅修改字符串即可。开发者需留意两项破坏性变更:一是 temperature 与 top_p 两个采样参数现在仅允许择一设置,若既有代码两者都有明确数值,Anthropic 的 API 将回报错误;二是 Haiku 4.5 新增 refusal stop reason,当模型拒绝回应时会回传此标记,而非像 Haiku 3 一样直接 error 或回复 placeholder — 产品代码必须将 refusal 当成正常路径处理。

此外,上周 Opus 4.7 tokenizer 变更造成账单暗涨的争议,同样可能套用在 Haiku 4.5 上 — 即使 rate card 标示更低的 per-token 价格,实际业务任务的 token 消耗可能因 tokenizer 不同而异,建议所有迁移计划在切换当日实测对比成本。

AI 模型生命周期管理成为企业必修课

本次退役提醒企业 AI 基础设施的一个结构性变化:LLM 已从“一次性采购”进入“持续版本管理”的阶段,类似云端服务与作业系统。Anthropic 官方 deprecation 页面同时预告 Claude Opus 4、Sonnet 4 将于 2026 年 6 月 15 日退役,时程密集。企业 AI 采购条款应加入“最低支援期”、“替代模型自动可用”、“迁移测试补贴”等合约项目,否则生产服务可能因模型下架而中断。

对台湾开发者与 SaaS 团队的行动建议

三个立即动作:第一,搜索所有代码仓库与设定文件,把 claude-3-haiku-20240307 改成 claude-haiku-4-5;第二,检查 API 调用中是否同时设置 temperature 与 top_p,择一保留;第三,在 handler 中新增 refusal stop reason 的处理分支,避免意外的 user-facing error。对 使用按量计费企业合约的组织而言,切换当周监控 token 消耗变化也是必要动作,避免 tokenizer 差异带来意外超支。

这篇文章 Claude Haiku 3 于 4/19 正式退役:Anthropic 强制迁移至 Haiku 4.5,开发者须改模型 ID 与参数设置 最早出现于 鏈新闻 ABMedia。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

Anthropic首席执行官赴白宫破冰:与幕僚长、贝森特会商 Mythos

华尔街日报称,Anthropic 首席执行官 Amodei 4/17 白宫密会,聚焦 Mythos 的国安边界与负责任部署;白宫称会议具建设性,市场视为关系解冻。核心分歧是军方要 Claude 一切合法用途,Anthropic 坚持自家可接受使用政策裁量。双方均表示将持续对话,5月 Mythos 上线前再谈。

鏈新聞abmedia8 分钟前

Google Ironwood TPU:10 倍性能 + 四家合作夥伴对抗 Nvidia

根据 Bloomberg 深度报道与 Google 官方公告,Google 于 4 月 22 日正式扩张自研 AI 晶片阵容:推理专用 Ironwood(第七代 TPU)在 Google Cloud 全面供货,并同步启动与 Broadcom、MediaTek、Marvell、Intel 四家伙伴的下一代设计合作,目标是以定制晶片供应链正面挑战 Nvidia 在 AI 算力市场的主导地位。 Ironwood:第七代 TPU,首次专为推理设计 Ironwood 是 Google TPU 系列第七代产品,也是首款在“训练推理分流”策略下的推理专用晶片。Google 揭露的规格:单晶片峰值效能为 T

鏈新聞abmedia10 分钟前

DeepSeek 洽谈首轮外部融资、估值 200 亿美元:中国 AI 估值新高

根据 彭博 4 月 22 日报道(引 The Information 独家),中国 AI 新创 DeepSeek 正在洽谈首轮外部融资,估值达到 200 亿美元。这是 DeepSeek 自 2023 年成立以来首次对外募资,过去完全由量化对冲基金 High-Flyer Capital Management 通过内部供资。200 亿美元估值也是中国 AI 新创首次进入“百亿美金估值”下半段的里程碑。 融资规模与资金用途 DeepSeek 寻求至少 3 亿美元的首轮融资,200 亿美元估值较稍早 4 月 17 日 The Information 首次披露的“100 亿美元以上”估值再翻倍

鏈新聞abmedia12 分钟前

Google 推出 AI 代理工具,帮助企业自动化任务

Google 透露了用于构建 AI 代理的工具,以自动化任务、跟踪进度并通过专门的代理收件箱来管理工作流程;同时配合 Workspace 的更新,并展望 AI 代理将重塑日常员工的工作惯例。 摘要:Google 发布了用于创建 AI 代理的工具,用于任务自动化、监控其进度并简化工作流程,这表明 Workspace 的更新以及 AI 代理将改变日常工作的未来。

GateNews24 分钟前

Google:AI 生成的 Google 新代码占比 75%

Google 报告称,75% 的新代码由 AI 生成,且超过一半的 ML 计算投资旨在云端业务运营。 摘要:在一份企业更新中,Google 表示,AI 现在大约生成了 75% 的新代码,并且其大部分机器学习计算投资将被投向基于云的业务运营。

GateNews1小时前

Google Cloud 推出面向人工智能的 TPU8T 和 TPU8I 芯片

Gate News 消息,4月22日——Google Cloud 已推出面向人工智能应用的新型 TPU8T 和 TPU8I 芯片。

GateNews1小时前
评论
0/400
暂无评论