Selon un reportage approfondi de CNBC, lors de deux réunions à huis clos à Silicon Valley cette semaine, plusieurs PDG de startups d’IA et ingénieurs ont déclaré que le passage à l’échelle des déploiements d’agents IA se heurte à deux problèmes structurels majeurs : « un gaspillage massif de tokens » et « un désordre extrême entre les systèmes ». Cette note prise sur place contraste nettement avec l’optimisme de Jensen Huang, PDG de Nvidia, qui en mars a qualifié les agents IA de « le prochain ChatGPT ». Cela montre que les véritables goulots d’étranglement de cette filière ne résident pas dans la puissance de calcul, mais dans la conception des décisions, l’efficacité des tokens et l’intégration de plusieurs systèmes.
Le plus gros problème, c’est de tout confier au LLM
Lors de la réunion, le PDG de la startup d’IA Meibel, Kevin McGrath, a indiqué : « Le plus gros problème auquel on fait face aujourd’hui, c’est qu’on croit à tort que tout doit être traité par un grand modèle de langage — en mettant tous les tokens et tout l’argent dans un seul bot IA, il va brûler des millions de tokens. » Il a souligné que, lors de la conception des workflows des agents, les entreprises doivent mieux déterminer quels types de tâches nécessitent vraiment un LLM, et lesquelles peuvent être réalisées avec une logique plus simple à base de règles, ou avec un apprentissage automatique traditionnel, à moindre coût.
Cette observation fait écho à la réaction du marché après l’adoption par la version entreprise d’Anthropic Claude d’une facturation à l’usage — lorsque la consommation de tokens se traduit directement en coûts, le mode de développement qui « balance aveuglément » des éléments à l’agent fait immédiatement apparaître une pression financière. Le point de vue de Meibel représente un groupe de praticiens anti-hype : l’art de l’architecture des agents consiste à imposer des contraintes, plutôt qu’à tout laisser faire.
Systèmes de collaboration multi-agents : dépendances croisées et chaos
Dans le reportage de CNBC, un autre mot-clé revient sans cesse : « chaotic » (chaotique). Lorsque les entreprises font tourner simultanément plusieurs agents IA — par exemple un agent pour le service client, un autre pour la planification, un autre pour la finance — la transmission des messages entre agents, la cohérence de l’état, et la gestion des erreurs se répercutent les unes sur les autres. Le mauvais comportement de n’importe quel agent peut déclencher une réaction en chaîne. Karpathy a aussi mentionné cette semaine qu’il exécute en parallèle des workflows faisant appel à 10–20 agents, tout en reconnaissant que la revue de code et les processus PR deviennent un nouvel goulot d’étranglement.
Le chaos dans ces systèmes multi-agents est, fondamentalement, la réédition du vieux problème des systèmes distribués à l’ère des LLM : pas de SLA clair, pas de frontières transactionnelles, pas de sémantique de relance en cas d’échec. Même si Anthropic et OpenAI ont lancé des couches de protocole telles que MCP et Agent SDK, lors de la mise en œuvre en entreprise, la standardisation reste très en retard par rapport à la croissance du nombre d’agents.
La rémunération en tokens de 250 000 $ de Jensen Huang refroidit
En mars, le PDG de Nvidia, Jensen Huang, a fortement promu la notion de « token salary » (salaire en tokens) lors du GTC et dans des interviews ultérieures, en affirmant : « Si un ingénieur dont le salaire annuel est de 500 000 $ ne consomme pas au moins 250 000 $ de tokens, je serais vraiment inquiet ». Son raisonnement est le suivant : les ingénieurs devraient utiliser des agents IA pour remplacer leurs actions de bas niveau, et le montant absolu de tokens consommés constitue l’indicateur délégué de productivité. Cette prise de position peut être consultée dans la toute dernière interview de Jensen Huang (partie 1), où il explique en détail les besoins en calcul liés à l’IA.
Mais les opinions recueillies sur place dans le reportage de CNBC montrent que le discours suscite de plus en plus de réserve chez les ingénieurs de la Silicon Valley : la quantité de tokens consommée n’est pas synonyme de productivité, et peut même être un signal d’une conception défaillante des agents. La vraie valeur des ingénieurs reste dans « la décision de quels types de tâches valent d’être confiées à un agent, comment découper les tâches, comment concevoir la gestion des erreurs » — un travail qui ne peut pas être mesuré par le seul volume de tokens consommés.
Crypto et agents IA : il faut encore du temps
Pour l’industrie crypto, les tendances observées cette semaine — notamment le fait que l’IA absorbe 80 % du capital-risque mondial, et l’intégration active d’agents autonomes par les projets DeFi — reposent sur une hypothèse : « la technologie des agents a atteint un niveau déployable ». Mais le reportage de CNBC rappelle que même dans un environnement d’entreprise purement web2, l’efficacité en tokens des agents et l’intégration de plusieurs systèmes ne sont pas encore stables. Mettre des agents dans un environnement on-chain fonctionnant 7×24, où les actifs peuvent être volés en temps réel, amplifiera à la fois les risques techniques et les risques financiers. Le véritable point de départ de Crypto × IA pourrait encore attendre la maturité de la standardisation au niveau des frameworks d’agents (tels que MCP, LangGraph, Cloudflare Agents).
Cet article « Réalité des agents IA à Silicon Valley : gaspillage massif de tokens, intégration des systèmes “extrêmement chaotique”, la prédiction de Jensen Huang sur “le prochain ChatGPT” reste à vérifier » est apparu en premier sur Chaîne news ABMedia.
Articles similaires
Worxphere rebaptise JobKorea avec des outils de recrutement alimentés par l’IA
Un agent IA peut déjà reproduire de manière autonome des articles universitaires complexes : Mollick affirme que les erreurs proviennent davantage des textes originaux humains que de l’IA
Les Émirats arabes unis annoncent une transition vers un modèle de gouvernement basé sur l’IA au cours des deux prochaines années
La plateforme de trading d’IA Fere AI lève 1,3 M$ de fonds, menée par Ethereal Ventures
Nvidia déploie l’agent IA Codex d’OpenAI auprès de l’ensemble de son personnel sur l’infrastructure Blackwell
Startup de codage IA Cognition en discussions pour une levée de fonds à une valorisation de $25B