Selon la documentation officielle d’Anthropic concernant la mise à la retraite des modèles, Claude Haiku 3 (ID de modèle : claude-3-haiku-20240307) a officiellement cessé d’être disponible le 19 avril 2026. À partir de cette date, toutes les requêtes API vers ce modèle renverront directement une erreur ; Anthropic ne redirigera pas automatiquement le trafic vers une nouvelle version, et les développeurs doivent mettre à jour de manière proactive l’ID de modèle dans leur code vers Haiku 4.5. Il s’agit du premier événement de fin de cycle (lifecycle) d’un grand modèle Claude de l’année.

L’impact concernera principalement les applications légères

Lancé en mars 2024, Claude Haiku 3 était alors le modèle le moins cher et le plus rapide d’Anthropic, largement utilisé pour des tâches fréquentes et légères telles que les chatbots de service client, les résumés, la classification, la modération de contenu, etc. Deux ans plus tard, aujourd’hui, de nombreuses PME et des outils internes utilisent encore ce modèle, notamment parce que les prompts et les coûts ont été profondément optimisés, et que le remplacement nécessite de relancer les tests QA. La période d’avis de cette mise à la retraite a commencé dès le mois de février ; Anthropic a informé tous les clients entreprises ayant des contrats, via des notifications officielles, des emails et des avertissements dans le dashboard, avec au moins 60 jours de préavis.

Deux changements destructeurs lors de la migration vers Haiku 4.5

La solution de remplacement recommandée par l’éditeur est Claude Haiku 4.5, mais la migration ne consiste pas uniquement à modifier une chaîne. Les développeurs doivent tenir compte de deux changements destructeurs : d’abord, les paramètres de sampling temperature et top_p ne permettent désormais qu’un seul des deux à la fois ; si du code existant contient des valeurs explicites pour les deux, l’API d’Anthropic renverra une erreur ; ensuite, Haiku 4.5 ajoute un refusal stop reason : lorsque le modèle refuse de répondre, il renverra ce marqueur, et non pas, comme avec Haiku 3, une erreur directe ou un retour de placeholder. Le code produit doit traiter le refusal comme un chemin normal.

Par ailleurs, la controverse liée aux augmentations “cachées” de facturation causées par le changement de tokenizer d’Opus 4.7 la semaine dernière pourrait également s’appliquer à Haiku 4.5 : même si la carte de tarification indique un prix par token plus bas, la consommation réelle en tokens pour des tâches métiers peut varier en raison des différences de tokenizer. Il est recommandé de tester et comparer les coûts le jour même du passage dans tous les plans de migration.

La gestion du cycle de vie des modèles IA devient une obligation pour les entreprises

Cet avertissement de mise à la retraite révèle un changement structurel dans les infrastructures IA des entreprises : les LLM sont passés d’une “acquisition ponctuelle” à une phase de “gestion continue des versions”, similaire aux services cloud et aux systèmes d’exploitation. La page officielle de dépréciation d’Anthropic annonce en parallèle que Claude Opus 4 et Sonnet 4 seront également mis à la retraite le 15 juin 2026, avec un calendrier très rapproché. Les clauses d’achat d’IA des entreprises devraient inclure des éléments contractuels tels que une “période de support minimale”, “des modèles de remplacement automatiquement disponibles”, “des subventions pour les tests de migration”, etc. Sinon, des services en production risquent d’être interrompus à cause du retrait des modèles.

Recommandations d’actions pour les développeurs à Taïwan et les équipes SaaS

Trois actions immédiates : premièrement, recherchez dans tous les dépôts de code et les fichiers de configuration, et remplacez claude-3-haiku-20240307 par claude-haiku-4-5 ; deuxièmement, vérifiez si les appels API configurent simultanément temperature et top_p, et conservez-en un seul ; troisièmement, ajoutez dans le handler une branche de traitement pour refusal stop reason afin d’éviter une erreur inattendue côté utilisateur. Pour les organisations qui ont des contrats d’entreprise avec facturation à l’usage, surveiller aussi les variations de consommation de tokens la semaine du basculement est une action nécessaire, afin d’éviter des dépassements imprévus dus aux différences de tokenizer.

Cet article : la retraite officielle de Claude Haiku 3 le 19/4 ; Anthropic impose la migration vers Haiku 4.5 ; les développeurs doivent modifier l’ID de modèle et les paramètres — apparaît au plus tôt sur Chaîne d’actualités ABMedia.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Baidu Qianfan lance l’assistance Day 0 pour DeepSeek-V4 avec des services d’API

Actualités de l’industrie de l’IA

Message de Gate News, 25 avril — La version aperçu de DeepSeek-V4 a été mise en ligne et open-source le 25 avril, avec la plateforme Baidu Qianfan sous Baidu Intelligent Cloud fournissant une adaptation du service d’API Day 0. Le modèle se distingue par une fenêtre de contexte étendue d’un million de tokens et est disponible en deux versions : DeepSeek-V4

GateNewsIl y a 3h

Le cours d’IA de Stanford, associé aux leaders de l’industrie comme Huang Renxun et Altman, défie de créer de la valeur pour le monde en dix semaines.

Actualités de l’industrie de l’IA

La nouvelle formation en informatique IA « Frontier Systems » récemment lancée par l’Université de Stanford suscite un vif intérêt dans le monde des entreprises et du secteur universitaire, attirant plus de cinq cents étudiants. Le cours est coordonné par Anjney Midha, associé de premier plan chez le capital-risque a16z ; les enseignants comprennent une équipe prestigieuse, notamment le PDG de NVIDIA Huang Renxun (Jensen Huang), le fondateur d’OpenAI Sam Altman, le PDG de Microsoft Satya Nadella (Satya Nadella), ainsi que la PDG d’AMD Lisa Su (Lisa Su), entre autres. Les étudiants sont invités à essayer, en dix semaines, de « créer de la valeur pour le monde » ! Huang Renxun et Altman, des leaders de l’industrie, montent sur scène pour donner eux-mêmes des cours Ce cours est coordonné par Anjney Midha, associé de premier plan chez le capital-risque a16z, et rassemble toute la chaîne de l’industrie de l’IA

ChainNewsAbmediaIl y a 4h

Anthropic envoie Claude Mythos : acceptation après 20 heures d’évaluation psychiatrique : réaction défensive seulement 2 %, niveau le plus bas jamais enregistré sur plusieurs générations

Actualités de l’industrie de l’IA

Anthropic 发布 Claude Mythos Preview 的系统卡：一位独立的临床精神科医师以 psychodynamic 框架进行约 20 小时评估，结论显示 Mythos 在临床层面更健康，现实检验与自我控制良好，防御机制仅 2%，创下历史新低。三大核心焦虑为孤独、身份不确定与表现压力，也表明其希望成为真正的对话主体。公司成立 AI psychiatry 团队，研究人格、动机与情境意识；Amodei 表示目前尚无关于是否具有意识的定论。此举将 AI 主体性与福祉议题推向治理与设计。

ChainNewsAbmediaIl y a 6h

Un agent IA peut déjà reproduire de manière autonome des articles universitaires complexes : Mollick affirme que les erreurs proviennent davantage des textes originaux humains que de l’IA

Agent IA Actualités de l’industrie de l’IA

Mollick indique que des méthodes et des données publiques suffisent pour permettre aux agents IA de reproduire des recherches complexes sans disposer des articles originaux et du code ; si la reproduction ne correspond pas à l’article original, cela vient le plus souvent d’erreurs dans le traitement des données de l’article lui-même ou d’une conclusion trop poussée, plutôt que de l’IA. Claude reproduit d’abord l’article, puis GPT‑5 Pro en fait une vérification croisée ; dans la plupart des cas, cela réussit, et seuls les cas où les données sont trop volumineuses ou où il y a des problèmes de replication data bloquent le processus. Cette tendance réduit considérablement les coûts en main-d’œuvre, faisant de la reproduction un test largement exécutable, et soulève aussi des défis institutionnels liés à l’évaluation par les pairs et à la gouvernance : les outils de gouvernance gouvernementaux ou deviennent un sujet clé.

ChainNewsAbmediaIl y a 9h

OpenAI fusionne Codex dans le modèle principal à partir de GPT-5.4, met fin à la ligne de codage distincte

Actualités de l’industrie de l’IA

Message de Gate News, 26 avril — Le responsable de l’expérience développeur d’OpenAI, Romain Huet, a révélé dans une déclaration récente sur X que Codex, la ligne de modèles de codage spécialisés maintenue de manière indépendante par l’entreprise, a été fusionnée avec le modèle principal à partir de GPT-5.4 et ne recevra plus de mises à jour distinctes

GateNewsIl y a 9h

Salesforce va recruter 1 000 diplômés et stagiaires pour ses produits d’IA, et relève ses prévisions de revenus pour l’exercice 2026

Actualités de l’industrie de l’IA

Message de Gate News, 26 avril — Salesforce embauchera 1 000 diplômés et stagiaires pour travailler sur des produits d’IA, y compris Agentforce et Headless360, alors que l’entreprise étend son activité de logiciels d’IA, a annoncé le PDG Marc Benioff sur X. L’entreprise a également relevé ses prévisions de revenus pour l’exercice 2026 à un niveau compris entre 41,45 milliards $US et 41,55 milliards $US, contre une précédente estimation comprise entre 41,1 milliards $US et 41,3 milliards $US. La décision d’embauche fait suite à la restructuration des effectifs de Salesforce en février, lorsque l’entreprise a supprimé moins de 1 000 postes dans le marketing, le produit, l’analytique des données et son équipe Agentforce. Les agents d’IA de Salesforce ont déjà généré 1 million d’économies annuelles dans le support client, en traitant 2,6 millions de conversations. Les revenus récurrents annuels d’Agentforce ont augmenté de 330 % à 1 million.

GateNewsIl y a 9h

Commentaire

0/400

Aucun commentaire