Réalité des agents IA de la Silicon Valley : énorme gaspillage de jetons, intégration système « extrêmement chaotique », la « prochaine version de ChatGPT » selon Jensen Huang encore à confirmer

Selon un reportage approfondi de CNBC, lors de deux réunions à huis clos à Silicon Valley cette semaine, plusieurs PDG de startups d’IA et ingénieurs ont déclaré que le passage à l’échelle des déploiements d’agents IA se heurte à deux problèmes structurels majeurs : « un gaspillage massif de tokens » et « un désordre extrême entre les systèmes ». Cette note prise sur place contraste nettement avec l’optimisme de Jensen Huang, PDG de Nvidia, qui en mars a qualifié les agents IA de « le prochain ChatGPT ». Cela montre que les véritables goulots d’étranglement de cette filière ne résident pas dans la puissance de calcul, mais dans la conception des décisions, l’efficacité des tokens et l’intégration de plusieurs systèmes.

Le plus gros problème, c’est de tout confier au LLM

Lors de la réunion, le PDG de la startup d’IA Meibel, Kevin McGrath, a indiqué : « Le plus gros problème auquel on fait face aujourd’hui, c’est qu’on croit à tort que tout doit être traité par un grand modèle de langage — en mettant tous les tokens et tout l’argent dans un seul bot IA, il va brûler des millions de tokens. » Il a souligné que, lors de la conception des workflows des agents, les entreprises doivent mieux déterminer quels types de tâches nécessitent vraiment un LLM, et lesquelles peuvent être réalisées avec une logique plus simple à base de règles, ou avec un apprentissage automatique traditionnel, à moindre coût.

Cette observation fait écho à la réaction du marché après l’adoption par la version entreprise d’Anthropic Claude d’une facturation à l’usage — lorsque la consommation de tokens se traduit directement en coûts, le mode de développement qui « balance aveuglément » des éléments à l’agent fait immédiatement apparaître une pression financière. Le point de vue de Meibel représente un groupe de praticiens anti-hype : l’art de l’architecture des agents consiste à imposer des contraintes, plutôt qu’à tout laisser faire.

Systèmes de collaboration multi-agents : dépendances croisées et chaos

Dans le reportage de CNBC, un autre mot-clé revient sans cesse : « chaotic » (chaotique). Lorsque les entreprises font tourner simultanément plusieurs agents IA — par exemple un agent pour le service client, un autre pour la planification, un autre pour la finance — la transmission des messages entre agents, la cohérence de l’état, et la gestion des erreurs se répercutent les unes sur les autres. Le mauvais comportement de n’importe quel agent peut déclencher une réaction en chaîne. Karpathy a aussi mentionné cette semaine qu’il exécute en parallèle des workflows faisant appel à 10–20 agents, tout en reconnaissant que la revue de code et les processus PR deviennent un nouvel goulot d’étranglement.

Le chaos dans ces systèmes multi-agents est, fondamentalement, la réédition du vieux problème des systèmes distribués à l’ère des LLM : pas de SLA clair, pas de frontières transactionnelles, pas de sémantique de relance en cas d’échec. Même si Anthropic et OpenAI ont lancé des couches de protocole telles que MCP et Agent SDK, lors de la mise en œuvre en entreprise, la standardisation reste très en retard par rapport à la croissance du nombre d’agents.

La rémunération en tokens de 250 000 $ de Jensen Huang refroidit

En mars, le PDG de Nvidia, Jensen Huang, a fortement promu la notion de « token salary » (salaire en tokens) lors du GTC et dans des interviews ultérieures, en affirmant : « Si un ingénieur dont le salaire annuel est de 500 000 $ ne consomme pas au moins 250 000 $ de tokens, je serais vraiment inquiet ». Son raisonnement est le suivant : les ingénieurs devraient utiliser des agents IA pour remplacer leurs actions de bas niveau, et le montant absolu de tokens consommés constitue l’indicateur délégué de productivité. Cette prise de position peut être consultée dans la toute dernière interview de Jensen Huang (partie 1), où il explique en détail les besoins en calcul liés à l’IA.

Mais les opinions recueillies sur place dans le reportage de CNBC montrent que le discours suscite de plus en plus de réserve chez les ingénieurs de la Silicon Valley : la quantité de tokens consommée n’est pas synonyme de productivité, et peut même être un signal d’une conception défaillante des agents. La vraie valeur des ingénieurs reste dans « la décision de quels types de tâches valent d’être confiées à un agent, comment découper les tâches, comment concevoir la gestion des erreurs » — un travail qui ne peut pas être mesuré par le seul volume de tokens consommés.

Crypto et agents IA : il faut encore du temps

Pour l’industrie crypto, les tendances observées cette semaine — notamment le fait que l’IA absorbe 80 % du capital-risque mondial, et l’intégration active d’agents autonomes par les projets DeFi — reposent sur une hypothèse : « la technologie des agents a atteint un niveau déployable ». Mais le reportage de CNBC rappelle que même dans un environnement d’entreprise purement web2, l’efficacité en tokens des agents et l’intégration de plusieurs systèmes ne sont pas encore stables. Mettre des agents dans un environnement on-chain fonctionnant 7×24, où les actifs peuvent être volés en temps réel, amplifiera à la fois les risques techniques et les risques financiers. Le véritable point de départ de Crypto × IA pourrait encore attendre la maturité de la standardisation au niveau des frameworks d’agents (tels que MCP, LangGraph, Cloudflare Agents).

Cet article « Réalité des agents IA à Silicon Valley : gaspillage massif de tokens, intégration des systèmes “extrêmement chaotique”, la prédiction de Jensen Huang sur “le prochain ChatGPT” reste à vérifier » est apparu en premier sur Chaîne news ABMedia.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Worxphere rebaptise JobKorea avec des outils de recrutement alimentés par l’IA

Message de Gate News, 26 avril — La plateforme coréenne de RH Worxphere a rebaptisé JobKorea alors qu’elle passe des sites d’offres d’emploi en ligne traditionnels à des solutions de recrutement pilotées par l’IA. L’entreprise consolide des services, dont JobKorea et Albamon, dans une plateforme unifiée couvrant l’emploi permanent,

GateNewsIl y a 7h

Un agent IA peut déjà reproduire de manière autonome des articles universitaires complexes : Mollick affirme que les erreurs proviennent davantage des textes originaux humains que de l’IA

Mollick indique que des méthodes et des données publiques suffisent pour permettre aux agents IA de reproduire des recherches complexes sans disposer des articles originaux et du code ; si la reproduction ne correspond pas à l’article original, cela vient le plus souvent d’erreurs dans le traitement des données de l’article lui-même ou d’une conclusion trop poussée, plutôt que de l’IA. Claude reproduit d’abord l’article, puis GPT‑5 Pro en fait une vérification croisée ; dans la plupart des cas, cela réussit, et seuls les cas où les données sont trop volumineuses ou où il y a des problèmes de replication data bloquent le processus. Cette tendance réduit considérablement les coûts en main-d’œuvre, faisant de la reproduction un test largement exécutable, et soulève aussi des défis institutionnels liés à l’évaluation par les pairs et à la gouvernance : les outils de gouvernance gouvernementaux ou deviennent un sujet clé.

ChainNewsAbmediaIl y a 9h

Les Émirats arabes unis annoncent une transition vers un modèle de gouvernement basé sur l’IA au cours des deux prochaines années

Son Altesse Cheikh Mohammed bin Rashid Al Maktoum a déclaré que l’objectif était que 50% des secteurs gouvernementaux fonctionnent grâce à une IA agentique autonome. La transition comprendra également la formation des employés fédéraux pour « maîtriser l’IA », et sera supervisée par Cheikh Mansour bin Zayed. Points clés :

Coinpedia04-25 08:39

La plateforme de trading d’IA Fere AI lève 1,3 M$ de fonds, menée par Ethereal Ventures

Message de Gate News, 25 avril — Fere AI, une plateforme de trading d’actifs numériques propulsée par l’IA, a annoncé avoir finalisé un tour de financement de 1,3 million de dollars mené par Ethereal Ventures, avec la participation de Galaxy Vision Hill et de Kosmos Ventures, selon Globenewswire. La plateforme prend en charge des réseaux inter-chaînes

GateNews04-25 07:46

Nvidia déploie l’agent IA Codex d’OpenAI auprès de l’ensemble de son personnel sur l’infrastructure Blackwell

Message de Gate News, 25 avril — Nvidia a déployé Codex d’OpenAI, un agent IA alimenté par GPT-5.5, auprès de l’ensemble de son personnel après un essai concluant avec environ 10 000 employés, d’après des communications internes du PDG Jensen Huang et du PDG d’OpenAI Sam Altman. Codex est conçu pour aider à

GateNews04-25 03:11

Startup de codage IA Cognition en discussions pour une levée de fonds à une valorisation de $25B

Message de Gate News, 25 avril — La startup de codage IA Cognition est en discussions préliminaires pour lever des centaines de millions de dollars ou plus, à une valorisation d’environ $25 milliard, selon des personnes familiarisées avec le dossier. L’intérêt a augmenté après l’acquisition par SpaceX d’une startup rivale de codage par IA. Co

GateNews04-25 02:51
Commentaire
0/400
Aucun commentaire