En été 1858, un câble en cuivre traversant l’Atlantique sous-marin reliait Londres à New York.
L’importance de cet événement n’a jamais été la vitesse de transmission, mais la structure de pouvoir : celui qui pose le câble sous-marin contrôle le flux d’informations et peut en tirer profit. L’Empire britannique, grâce à ce réseau mondial de télégraphes, tenait dans ses mains le renseignement colonial, le prix du coton, les nouvelles de guerre.
La puissance de l’Empire ne reposait pas seulement sur sa flotte, mais aussi sur ce câble.
Plus de cent soixante ans plus tard, cette logique se répète de manière inattendue.
En 2026, les grands modèles chinois commencent discrètement à dominer le marché mondial des développeurs. Selon les dernières données d’OpenRouter, 61 % des tokens consommés par les dix principaux modèles de la plateforme proviennent de modèles chinois, dont les trois premiers sont entièrement chinois. Les requêtes API quotidiennes des développeurs de San Francisco, Berlin, Singapour traversent le câble sous-marin du Pacifique pour atteindre les centres de données en Chine, où la puissance de calcul est consommée, l’électricité circule, et le résultat revient.
L’électricité n’a jamais quitté le réseau électrique chinois, mais sa valeur est transférée à l’échelle internationale via les tokens.
Migration massive des modèles d’IA
Le 24 février 2026, OpenRouter publie une donnée hebdomadaire : environ 8,7 trillions de tokens consommés par les dix principaux modèles, dont 5,3 trillions par des modèles chinois, soit 61 %. MiniMax M2.5 domine avec 2,45 trillions de tokens, suivi de Kimi K2.5 et Zhituo GLM-5, tous chinois.
Dernières données du 26 février
Ce n’est pas une coïncidence : une étincelle a tout déclenché.
Au début de l’année, OpenClaw a émergé, un outil open source permettant à l’IA de réellement “travailler”, contrôlant directement l’ordinateur, exécutant des commandes, et réalisant en parallèle des workflows complexes. En quelques semaines, ses étoiles sur GitHub ont dépassé 210 000.
Les professionnels de la finance, comme John, ont rapidement installé OpenClaw, connecté l’API d’Anthropic, et commencé à surveiller automatiquement le marché boursier, envoyant des signaux de trading. Quelques heures plus tard, il regarde son solde : quelques dizaines de dollars, tout disparu.
C’est la nouvelle réalité apportée par OpenClaw. Avant, converser avec une IA coûtait quelques tokens, presque rien. Après son intégration, l’IA exécute simultanément plusieurs sous-tâches, réutilise le contexte, boucle, et la consommation de tokens devient exponentielle. La facture s’accélère comme une voiture sous le capot, le niveau d’essence baisse, impossible de s’arrêter.
Dans la communauté de développeurs, une astuce circule : utiliser un jeton OAuth pour relier directement le compte d’abonnement d’Anthropic ou Google à OpenClaw, transformant la limite mensuelle “illimitée” en carburant gratuit pour l’agent IA — une méthode adoptée par beaucoup.
Les contre-mesures officielles arrivent rapidement.
Le 19 février, Anthropic met à jour ses conditions, interdisant explicitement l’utilisation des abonnements Claude pour des outils tiers comme OpenClaw, exigeant le passage par une facturation API. Google a également massivement bloqué les comptes d’abonnement connectés à Antigravity et Gemini AI Ultra via OpenClaw.
“Le peuple en a assez du Qin depuis longtemps”, dit John, qui se tourne vers les grands modèles nationaux.
Sur OpenRouter, le score en tâches d’ingénierie logicielle du modèle chinois MiniMax M2.5 est de 80,2 %, contre 80,8 % pour Claude Opus, la différence est minime. Mais le prix est radicalement différent : 0,3 dollar par million de tokens pour le premier, 5 dollars pour le second — un écart d’environ 17 fois.
John a changé, le workflow tourne toujours, mais la facture a diminué d’un ordre de grandeur. Cette migration se produit partout dans le monde.
Chris Clark, COO d’OpenRouter, explique simplement : les modèles open source chinois ont conquis une part de marché énorme parce qu’ils sont très présents dans les workflows d’agents opérés par des développeurs américains.
L’exportation d’électricité
Pour comprendre la véritable nature de l’exportation de tokens, il faut d’abord saisir la structure de coût d’un token.
Il paraît léger : un token équivaut à environ 0,75 mot anglais. Une conversation ordinaire avec une IA consomme quelques milliers de tokens. Mais quand ces tokens s’accumulent en trillions, la réalité physique devient lourde.
Le coût de chaque token repose principalement sur deux éléments : la puissance de calcul et l’électricité.
La puissance de calcul correspond à l’amortissement des GPU. Acheter une H100 Nvidia coûte environ 30 000 dollars, sa durée de vie en inférence revient à calculer le coût d’amortissement. L’électricité est le carburant du centre de données : à pleine charge, chaque GPU consomme environ 700 watts, plus le refroidissement. Le coût annuel d’électricité d’un grand centre d’IA peut facilement dépasser plusieurs centaines de millions de dollars.
Visualisons cela sur une carte.
Un développeur américain envoie une requête API depuis San Francisco. Les données traversent le câble sous-marin du Pacifique, atteignent un centre de données en Chine. Le cluster GPU commence à travailler, l’électricité circule depuis le réseau chinois vers les puces, l’inférence se termine, et le résultat revient. Tout cela en une ou deux secondes.
L’électricité n’a jamais quitté le réseau électrique chinois, mais sa valeur, via le token, a été transférée à l’échelle mondiale.
Il y a là une magie que le commerce traditionnel ne peut égaler : le token n’a pas de forme physique, ne passe pas par la douane, n’est pas soumis aux taxes, et n’apparaît dans aucune statistique commerciale officielle. La Chine exporte massivement des services de puissance de calcul et d’électricité, mais dans les données commerciales officielles, c’est presque invisible.
Le token devient un dérivé de l’électricité, et l’exportation de tokens est en réalité une exportation d’électricité.
Cela est facilité par le faible coût de l’électricité en Chine, dont le prix global est inférieur d’environ 40 % à celui des États-Unis, une différence physique facilement réplicable par la concurrence.
De plus, la Chine possède un avantage algorithmique et “d’involution” dans ses grands modèles d’IA.
Le MoE de DeepSeek V3 permet d’activer seulement une partie des paramètres lors de l’inférence. Des tests indépendants montrent que ses coûts sont environ 36 fois inférieurs à ceux de GPT-4o. MiniMax M2.5, avec ses 229 milliards de paramètres, n’active que 10 milliards.
Au sommet, l’involution : Alibaba, ByteDance, Baidu, Tencent, Moon Shadow, Zhituo, MiniMax… une dizaine d’entreprises se livrent une concurrence féroce, les prix ont déjà plongé en dessous du seuil de rentabilité, la perte est devenue la norme.
En détail, cela ressemble à l’exportation chinoise de produits manufacturés : en utilisant leur chaîne d’approvisionnement et leur “involution” sectorielle, ils ont fortement réduit le prix du token.
De Bitcoin à Token
Avant le token, il y eut une autre forme d’exportation d’électricité.
Vers 2015, les gestionnaires de centrales électriques du Sichuan, du Yunnan et du Xinjiang ont commencé à accueillir des visiteurs étranges.
Ces gens louaient des usines abandonnées, y installaient des machines, et faisaient fonctionner 24h/24. Ces machines ne produisaient rien, sauf une seule chose : résoudre un problème mathématique infini, qui, de temps en temps, permettait de miner un bitcoin.
C’était la première forme d’exportation d’électricité : utiliser l’électricité bon marché — hydroélectrique et éolienne — via des machines de minage pour convertir cette énergie en actifs numériques mondiaux, puis les échanger contre des dollars.
L’électricité ne franchissait pas de frontière, mais sa valeur, via le bitcoin, circulait mondialement.
Pendant ces années, la puissance de calcul chinoise représentait plus de 70 % du minage mondial de bitcoin. L’hydroélectricité et le charbon chinois, par cette voie détournée, participaient à une redistribution mondiale des capitaux.
En 2021, tout s’est arrêté brutalement. La régulation a frappé fort, les mineurs se sont dispersés, et la puissance de calcul a migré vers le Kazakhstan, le Texas et le Canada.
Mais cette logique n’a jamais disparu, elle attendait simplement un nouveau support. Jusqu’à ce que ChatGPT et les grands modèles émergent, transformant d’anciennes mines de bitcoin en centres de données IA, les machines de minage en GPU de puissance, et les bitcoins en tokens. La seule constante : l’électricité.
L’exportation de bitcoin et celle de tokens sont en réalité structurées de manière similaire, mais aujourd’hui, le token a une valeur commerciale bien plus grande.
Le minage de bitcoin est une simple opération mathématique, le bitcoin en tant qu’actif financier tire sa valeur de sa rareté et de la confiance du marché, sans lien avec la “production”. La puissance de calcul n’est qu’un sous-produit d’un mécanisme de confiance.
Les grands modèles d’IA, eux, produisent une véritable valeur : des services cognitifs réels, du code, des analyses, des traductions, de la créativité. La valeur du token provient directement de son utilité pour l’utilisateur. C’est une intégration plus profonde : une fois qu’un workflow de développeur dépend d’un modèle, le coût de changement augmente avec le temps.
Une autre différence clé : le minage de bitcoin a été expulsé de Chine, tandis que l’exportation de tokens est une décision volontaire des développeurs mondiaux.
La guerre des tokens
La première ligne de câble sous-marin, posé en 1858, symbolise la souveraineté de l’Empire britannique sur l’autoroute de l’information : celui qui possède l’infrastructure contrôle le jeu.
L’exportation de tokens est aussi une guerre sans déclaration, avec ses résistances.
La souveraineté des données est le premier mur : lorsqu’un développeur américain envoie une requête API traitée par un centre de données chinois, les données traversent physiquement la frontière. Pour un petit développeur ou une application, ce n’est pas un problème. Mais pour des données sensibles d’entreprise, financières ou gouvernementales, c’est une faille. C’est pourquoi la pénétration des modèles chinois est forte dans les outils de développement et applications personnelles, mais quasi absente dans les systèmes critiques d’entreprise.
Les interdictions sur les puces sont le deuxième mur : la Chine fait face à des restrictions à l’exportation de ses GPU haut de gamme Nvidia. Les architectures MoE et les optimisations algorithmiques ne peuvent qu’atténuer partiellement cette faiblesse, mais le plafond reste.
Mais ces obstacles ne sont que le début. Un plus grand champ de bataille se forme.
Les tokens et les modèles d’IA sont devenus un nouveau terrain stratégique entre la Chine et les États-Unis, comparable à la guerre des semi-conducteurs, à celle d’Internet du 20e siècle, voire à une métaphore plus ancienne : la course à l’espace.
En 1957, l’URSS lance Spoutnik, provoquant la stupeur aux États-Unis. Rapidement, ils lancent le programme Apollo, mobilisant des milliards de dollars pour ne pas perdre la course spatiale.
La compétition pour l’IA est étonnamment similaire, mais bien plus intense. L’espace est une dimension physique, invisible pour le grand public. L’IA infiltre les circuits économiques : chaque ligne de code, chaque contrat, chaque système décisionnel gouvernemental peut contenir un modèle national. Celui dont le modèle devient l’infrastructure de référence mondiale, détient une influence structurelle sur l’économie numérique globale.
C’est précisément ce que fait la stratégie chinoise d’exportation de tokens, qui inquiète réellement Washington.
Quand un développeur construit sa bibliothèque de code, son workflow, sa logique produit autour d’un modèle chinois via une API, le coût de migration augmente exponentiellement avec le temps. Même si la législation américaine limite cette dépendance, les développeurs résisteront en utilisant leurs pieds, comme ils ne peuvent plus abandonner GitHub aujourd’hui.
L’exportation de tokens n’est peut-être que le début d’un long jeu. La Chine ne prétend pas renverser le système, elle offre simplement, à moindre coût, ses services à chaque développeur dans le monde, via une API.
Cette fois, ce sont les équipes de développeurs à Hangzhou, Pékin, Shanghai, et les clusters GPU tournant jour et nuit dans le sud de la Chine qui ont posé le câble.
Ce combat n’a pas de compte à rebours : il se joue 24 heures sur 24, chaque jour, chaque token, chaque terminal de développeur.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Token à l'international, vendre l'électricité chinoise au monde entier
Une guerre électrique sans fumée.
Auteur : Black Lobster, Deep Tide TechFlow
En été 1858, un câble en cuivre traversant l’Atlantique sous-marin reliait Londres à New York.
L’importance de cet événement n’a jamais été la vitesse de transmission, mais la structure de pouvoir : celui qui pose le câble sous-marin contrôle le flux d’informations et peut en tirer profit. L’Empire britannique, grâce à ce réseau mondial de télégraphes, tenait dans ses mains le renseignement colonial, le prix du coton, les nouvelles de guerre.
La puissance de l’Empire ne reposait pas seulement sur sa flotte, mais aussi sur ce câble.
Plus de cent soixante ans plus tard, cette logique se répète de manière inattendue.
En 2026, les grands modèles chinois commencent discrètement à dominer le marché mondial des développeurs. Selon les dernières données d’OpenRouter, 61 % des tokens consommés par les dix principaux modèles de la plateforme proviennent de modèles chinois, dont les trois premiers sont entièrement chinois. Les requêtes API quotidiennes des développeurs de San Francisco, Berlin, Singapour traversent le câble sous-marin du Pacifique pour atteindre les centres de données en Chine, où la puissance de calcul est consommée, l’électricité circule, et le résultat revient.
L’électricité n’a jamais quitté le réseau électrique chinois, mais sa valeur est transférée à l’échelle internationale via les tokens.
Migration massive des modèles d’IA
Le 24 février 2026, OpenRouter publie une donnée hebdomadaire : environ 8,7 trillions de tokens consommés par les dix principaux modèles, dont 5,3 trillions par des modèles chinois, soit 61 %. MiniMax M2.5 domine avec 2,45 trillions de tokens, suivi de Kimi K2.5 et Zhituo GLM-5, tous chinois.
Dernières données du 26 février
Ce n’est pas une coïncidence : une étincelle a tout déclenché.
Au début de l’année, OpenClaw a émergé, un outil open source permettant à l’IA de réellement “travailler”, contrôlant directement l’ordinateur, exécutant des commandes, et réalisant en parallèle des workflows complexes. En quelques semaines, ses étoiles sur GitHub ont dépassé 210 000.
Les professionnels de la finance, comme John, ont rapidement installé OpenClaw, connecté l’API d’Anthropic, et commencé à surveiller automatiquement le marché boursier, envoyant des signaux de trading. Quelques heures plus tard, il regarde son solde : quelques dizaines de dollars, tout disparu.
C’est la nouvelle réalité apportée par OpenClaw. Avant, converser avec une IA coûtait quelques tokens, presque rien. Après son intégration, l’IA exécute simultanément plusieurs sous-tâches, réutilise le contexte, boucle, et la consommation de tokens devient exponentielle. La facture s’accélère comme une voiture sous le capot, le niveau d’essence baisse, impossible de s’arrêter.
Dans la communauté de développeurs, une astuce circule : utiliser un jeton OAuth pour relier directement le compte d’abonnement d’Anthropic ou Google à OpenClaw, transformant la limite mensuelle “illimitée” en carburant gratuit pour l’agent IA — une méthode adoptée par beaucoup.
Les contre-mesures officielles arrivent rapidement.
Le 19 février, Anthropic met à jour ses conditions, interdisant explicitement l’utilisation des abonnements Claude pour des outils tiers comme OpenClaw, exigeant le passage par une facturation API. Google a également massivement bloqué les comptes d’abonnement connectés à Antigravity et Gemini AI Ultra via OpenClaw.
“Le peuple en a assez du Qin depuis longtemps”, dit John, qui se tourne vers les grands modèles nationaux.
Sur OpenRouter, le score en tâches d’ingénierie logicielle du modèle chinois MiniMax M2.5 est de 80,2 %, contre 80,8 % pour Claude Opus, la différence est minime. Mais le prix est radicalement différent : 0,3 dollar par million de tokens pour le premier, 5 dollars pour le second — un écart d’environ 17 fois.
John a changé, le workflow tourne toujours, mais la facture a diminué d’un ordre de grandeur. Cette migration se produit partout dans le monde.
Chris Clark, COO d’OpenRouter, explique simplement : les modèles open source chinois ont conquis une part de marché énorme parce qu’ils sont très présents dans les workflows d’agents opérés par des développeurs américains.
L’exportation d’électricité
Pour comprendre la véritable nature de l’exportation de tokens, il faut d’abord saisir la structure de coût d’un token.
Il paraît léger : un token équivaut à environ 0,75 mot anglais. Une conversation ordinaire avec une IA consomme quelques milliers de tokens. Mais quand ces tokens s’accumulent en trillions, la réalité physique devient lourde.
Le coût de chaque token repose principalement sur deux éléments : la puissance de calcul et l’électricité.
La puissance de calcul correspond à l’amortissement des GPU. Acheter une H100 Nvidia coûte environ 30 000 dollars, sa durée de vie en inférence revient à calculer le coût d’amortissement. L’électricité est le carburant du centre de données : à pleine charge, chaque GPU consomme environ 700 watts, plus le refroidissement. Le coût annuel d’électricité d’un grand centre d’IA peut facilement dépasser plusieurs centaines de millions de dollars.
Visualisons cela sur une carte.
Un développeur américain envoie une requête API depuis San Francisco. Les données traversent le câble sous-marin du Pacifique, atteignent un centre de données en Chine. Le cluster GPU commence à travailler, l’électricité circule depuis le réseau chinois vers les puces, l’inférence se termine, et le résultat revient. Tout cela en une ou deux secondes.
L’électricité n’a jamais quitté le réseau électrique chinois, mais sa valeur, via le token, a été transférée à l’échelle mondiale.
Il y a là une magie que le commerce traditionnel ne peut égaler : le token n’a pas de forme physique, ne passe pas par la douane, n’est pas soumis aux taxes, et n’apparaît dans aucune statistique commerciale officielle. La Chine exporte massivement des services de puissance de calcul et d’électricité, mais dans les données commerciales officielles, c’est presque invisible.
Le token devient un dérivé de l’électricité, et l’exportation de tokens est en réalité une exportation d’électricité.
Cela est facilité par le faible coût de l’électricité en Chine, dont le prix global est inférieur d’environ 40 % à celui des États-Unis, une différence physique facilement réplicable par la concurrence.
De plus, la Chine possède un avantage algorithmique et “d’involution” dans ses grands modèles d’IA.
Le MoE de DeepSeek V3 permet d’activer seulement une partie des paramètres lors de l’inférence. Des tests indépendants montrent que ses coûts sont environ 36 fois inférieurs à ceux de GPT-4o. MiniMax M2.5, avec ses 229 milliards de paramètres, n’active que 10 milliards.
Au sommet, l’involution : Alibaba, ByteDance, Baidu, Tencent, Moon Shadow, Zhituo, MiniMax… une dizaine d’entreprises se livrent une concurrence féroce, les prix ont déjà plongé en dessous du seuil de rentabilité, la perte est devenue la norme.
En détail, cela ressemble à l’exportation chinoise de produits manufacturés : en utilisant leur chaîne d’approvisionnement et leur “involution” sectorielle, ils ont fortement réduit le prix du token.
De Bitcoin à Token
Avant le token, il y eut une autre forme d’exportation d’électricité.
Vers 2015, les gestionnaires de centrales électriques du Sichuan, du Yunnan et du Xinjiang ont commencé à accueillir des visiteurs étranges.
Ces gens louaient des usines abandonnées, y installaient des machines, et faisaient fonctionner 24h/24. Ces machines ne produisaient rien, sauf une seule chose : résoudre un problème mathématique infini, qui, de temps en temps, permettait de miner un bitcoin.
C’était la première forme d’exportation d’électricité : utiliser l’électricité bon marché — hydroélectrique et éolienne — via des machines de minage pour convertir cette énergie en actifs numériques mondiaux, puis les échanger contre des dollars.
L’électricité ne franchissait pas de frontière, mais sa valeur, via le bitcoin, circulait mondialement.
Pendant ces années, la puissance de calcul chinoise représentait plus de 70 % du minage mondial de bitcoin. L’hydroélectricité et le charbon chinois, par cette voie détournée, participaient à une redistribution mondiale des capitaux.
En 2021, tout s’est arrêté brutalement. La régulation a frappé fort, les mineurs se sont dispersés, et la puissance de calcul a migré vers le Kazakhstan, le Texas et le Canada.
Mais cette logique n’a jamais disparu, elle attendait simplement un nouveau support. Jusqu’à ce que ChatGPT et les grands modèles émergent, transformant d’anciennes mines de bitcoin en centres de données IA, les machines de minage en GPU de puissance, et les bitcoins en tokens. La seule constante : l’électricité.
L’exportation de bitcoin et celle de tokens sont en réalité structurées de manière similaire, mais aujourd’hui, le token a une valeur commerciale bien plus grande.
Le minage de bitcoin est une simple opération mathématique, le bitcoin en tant qu’actif financier tire sa valeur de sa rareté et de la confiance du marché, sans lien avec la “production”. La puissance de calcul n’est qu’un sous-produit d’un mécanisme de confiance.
Les grands modèles d’IA, eux, produisent une véritable valeur : des services cognitifs réels, du code, des analyses, des traductions, de la créativité. La valeur du token provient directement de son utilité pour l’utilisateur. C’est une intégration plus profonde : une fois qu’un workflow de développeur dépend d’un modèle, le coût de changement augmente avec le temps.
Une autre différence clé : le minage de bitcoin a été expulsé de Chine, tandis que l’exportation de tokens est une décision volontaire des développeurs mondiaux.
La guerre des tokens
La première ligne de câble sous-marin, posé en 1858, symbolise la souveraineté de l’Empire britannique sur l’autoroute de l’information : celui qui possède l’infrastructure contrôle le jeu.
L’exportation de tokens est aussi une guerre sans déclaration, avec ses résistances.
La souveraineté des données est le premier mur : lorsqu’un développeur américain envoie une requête API traitée par un centre de données chinois, les données traversent physiquement la frontière. Pour un petit développeur ou une application, ce n’est pas un problème. Mais pour des données sensibles d’entreprise, financières ou gouvernementales, c’est une faille. C’est pourquoi la pénétration des modèles chinois est forte dans les outils de développement et applications personnelles, mais quasi absente dans les systèmes critiques d’entreprise.
Les interdictions sur les puces sont le deuxième mur : la Chine fait face à des restrictions à l’exportation de ses GPU haut de gamme Nvidia. Les architectures MoE et les optimisations algorithmiques ne peuvent qu’atténuer partiellement cette faiblesse, mais le plafond reste.
Mais ces obstacles ne sont que le début. Un plus grand champ de bataille se forme.
Les tokens et les modèles d’IA sont devenus un nouveau terrain stratégique entre la Chine et les États-Unis, comparable à la guerre des semi-conducteurs, à celle d’Internet du 20e siècle, voire à une métaphore plus ancienne : la course à l’espace.
En 1957, l’URSS lance Spoutnik, provoquant la stupeur aux États-Unis. Rapidement, ils lancent le programme Apollo, mobilisant des milliards de dollars pour ne pas perdre la course spatiale.
La compétition pour l’IA est étonnamment similaire, mais bien plus intense. L’espace est une dimension physique, invisible pour le grand public. L’IA infiltre les circuits économiques : chaque ligne de code, chaque contrat, chaque système décisionnel gouvernemental peut contenir un modèle national. Celui dont le modèle devient l’infrastructure de référence mondiale, détient une influence structurelle sur l’économie numérique globale.
C’est précisément ce que fait la stratégie chinoise d’exportation de tokens, qui inquiète réellement Washington.
Quand un développeur construit sa bibliothèque de code, son workflow, sa logique produit autour d’un modèle chinois via une API, le coût de migration augmente exponentiellement avec le temps. Même si la législation américaine limite cette dépendance, les développeurs résisteront en utilisant leurs pieds, comme ils ne peuvent plus abandonner GitHub aujourd’hui.
L’exportation de tokens n’est peut-être que le début d’un long jeu. La Chine ne prétend pas renverser le système, elle offre simplement, à moindre coût, ses services à chaque développeur dans le monde, via une API.
Cette fois, ce sont les équipes de développeurs à Hangzhou, Pékin, Shanghai, et les clusters GPU tournant jour et nuit dans le sud de la Chine qui ont posé le câble.
Ce combat n’a pas de compte à rebours : il se joue 24 heures sur 24, chaque jour, chaque token, chaque terminal de développeur.