Token-Expansion: Chinas Strom an die ganze Welt verkaufen

Autor: Schwarzer Hummer, Deep Tide TechFlow

Im Sommer 1858 wurde ein Kupferkabel quer über den Atlantik verlegt und verband London mit New York.

Die Bedeutung lag nie in der Übertragungsgeschwindigkeit, sondern in der Machtstruktur: Wer das Unterseekabel verlegte, konnte im Informationsfluss profitieren. Das British Empire nutzte dieses globale Telegrafennetz, um Kolonialinformationen, Baumwollpreise und Kriegsmeldungen zu kontrollieren.

Das Empire war nicht nur durch seine Flotte stark, sondern auch durch dieses Kabel.

Über 160 Jahre später wiederholt sich dieses Prinzip auf unerwartete Weise.

2026 beginnt Chinas große Modelle heimlich den globalen Entwicklermarkt zu übernehmen. Laut den neuesten Daten von OpenRouter verbrauchen die Top-10-Modelle der Plattform 61 % der Token, die ersten drei Plätze sind alle aus China. Entwickler in San Francisco, Berlin und Singapur senden täglich API-Anfragen, die durch die transozeanische Glasfaserkabel nach China gelangen, wo Rechenleistung und Strom fließen, und die Ergebnisse werden zurückgesendet.

Der Strom verlässt nie das chinesische Netz, doch sein Wert wird durch Token grenzüberschreitend übertragen.

AI-Migration

Am 24. Februar 2026 veröffentlichte OpenRouter wöchentliche Daten: Die Top-10-Modelle verbrauchen insgesamt etwa 8,7 Billionen Token, davon entfallen 5,3 Billionen auf chinesische Modelle, was 61 % entspricht. MiniMax M2.5 führt mit 2,45 Billionen Token, gefolgt von Kimi K2.5 und Zhipu GLM-5, alle aus China.

Am 26. Februar aktualisierte Daten

Dies ist kein Zufall, sondern ein Zündfunke, der alles in Brand setzt.

Anfang des Jahres erschien OpenClaw, ein Open-Source-Tool, das AI wirklich zum Arbeiten bringt: Es kann direkt den Computer steuern, Befehle ausführen und komplexe Workflows parallel abarbeiten. Innerhalb weniger Wochen erreichte es über 210.000 Sterne auf GitHub.

Finanzexperte John installierte OpenClaw sofort und integrierte die Anthropic API, um automatisch Börseninformationen zu überwachen und rechtzeitig Handelssignale zu liefern. Nach einigen Stunden starrte er auf sein Kontoguthaben: Nur noch wenige Dollar.

Das ist die neue Realität, die OpenClaw schafft. Früher kostete ein Gespräch mit AI nur wenige Token, kaum der Rede wert. Nach der Integration läuft die AI im Hintergrund mit mehreren Subaufgaben, ruft ständig Kontext ab und iteriert, der Token-Verbrauch wächst exponentiell. Die Rechnung läuft wie ein Auto mit offenem Motor, das immer schneller wird, der Tank leert sich unaufhörlich.

In Entwicklergemeinschaften kursiert ein „Geheimtipp“: Mit OAuth-Token die Abonnements bei Anthropic oder Google direkt in OpenClaw zu integrieren, um die monatlichen Flatrates in kostenlose Treibstoffe für AI-Agenten umzuwandeln – eine Methode, die viele Entwickler nutzen.

Die offiziellen Gegenmaßnahmen folgten rasch.

Am 19. Februar aktualisierte Anthropic die Nutzungsbedingungen und verbot ausdrücklich die Verwendung von Claude-Abonnementnachweisen in Drittanbieter-Tools wie OpenClaw. Für den Zugriff auf Claude-Funktionen müsse man die API-Gebühren bezahlen. Google sperrte großflächig Abonnements, die OpenClaw für den Zugang zu Antigravity und Gemini AI Ultra nutzten.

„Die Welt leidet schon lange unter Qin“, so Jhon, und wandte sich den chinesischen Großmodellen zu.

Auf OpenRouter erreichte das chinesische Großmodell MiniMax M2.5 bei Software-Engineering-Aufgaben 80,2 %, Claude Opus 4.6 liegt bei 80,8 %. Der Unterschied ist kaum messbar. Der Preis jedoch ist enorm: Für eine Million Token kostet der chinesische Modell-Input 0,3 USD, das französische Modell 5 USD – ein Faktor von etwa 17.

Jhon wechselte, die Workflows liefen weiter, die Rechnung wurde um eine Größenordnung kleiner. Diese Migration findet weltweit gleichzeitig statt.

Chris Clark, COO von OpenRouter, erklärt: Die chinesischen Open-Source-Modelle gewinnen Marktanteile, weil sie in den von US-Entwicklern genutzten Proxy-Workflows außergewöhnlich präsent sind.

Stromexport

Um die Essenz des Token-Exports zu verstehen, muss man die Kostenstruktur eines Tokens kennen.

Ein Token erscheint leicht, entspricht etwa 0,75 englischen Wörtern. Ein gewöhnliches Gespräch mit AI verbraucht nur wenige Tausend Token. Doch wenn diese Token in Billionen gezählt werden, wird die physische Realität schwer greifbar.

Die Kosten für einen Token bestehen im Wesentlichen aus zwei Komponenten: Rechenleistung und Strom.

Rechenleistung ist die Abschreibung der GPUs. Für eine Nvidia H100, die etwa 30.000 USD kostet, entspricht die Lebensdauer bei jedem Inferencing anfallenden Kosten der Abschreibung. Der Strom ist der Treibstoff für den Betrieb des Rechenzentrums: Bei voller Auslastung verbraucht jede GPU etwa 700 Watt, plus Kühlung. Die Stromrechnung eines großen AI-Rechenzentrums kann leicht mehrere Hundert Millionen Dollar pro Jahr betragen.

Stellen wir uns diesen physikalischen Prozess auf einer Karte vor:

Ein Entwickler in San Francisco sendet eine API-Anfrage. Die Daten reisen durch den Pazifik, landen in einem chinesischen Rechenzentrum, wo die GPU-Cluster arbeiten. Der Strom fließt aus dem chinesischen Netz, die Inferencing-Ergebnisse werden zurückgesendet. Der gesamte Vorgang dauert vielleicht nur eine oder zwei Sekunden.

Der Strom verlässt nie das chinesische Netz, doch sein Wert wird durch Token grenzüberschreitend übertragen.

Hier liegt eine magische Eigenschaft: Token haben keine physische Form, brauchen keinen Zoll, werden nicht besteuert und tauchen in keiner offiziellen Handelsstatistik auf. China exportiert enorme Rechen- und Stromdienstleistungen, sind aber in den offiziellen Handelsdaten fast unsichtbar.

Token sind eine Derivatform von Strom, der Export von Token ist im Wesentlichen Stromexport.

Das verdankt sich den niedrigen Strompreisen in China, die im Vergleich zu den USA um etwa 40 % günstiger sind – ein physikalischer Kostenvorteil, den Wettbewerber leicht kopieren können.

Zudem verfügen chinesische Großmodelle über algorithmische und „Involutions“-Vorteile.

DeepSeek V3 nutzt eine MoE-Architektur, bei der nur Teile der Parameter während des Inferencing aktiviert werden. Tests zeigen, dass die Inferencing-Kosten im Vergleich zu GPT-4o um etwa 36 % niedriger sind. MiniMax M2.5 aktiviert bei 229 Milliarden Gesamtparametern nur 10 Milliarden.

Auf der höchsten Ebene herrscht eine „Involution“: Alibaba, ByteDance, Baidu, Tencent, Moon Shadow, Zhipu, MiniMax… Mehrere Firmen konkurrieren auf derselben Spur, die Preise sind längst unterhalb der Gewinnschwelle, Verluste sind Branchenstandard.

Genau wie bei der chinesischen Fertigung, nutzt man Lieferkettenvorteile und Brancheninvolutions, um die Token-Preise massiv zu drücken.

Vom Bitcoin zum Token

Vor dem Token gab es eine weitere Form des Stromexports.

Um 2015 herum begannen die Betreiber der Kraftwerke in Sichuan, Yunnan und Xinjiang, seltsame Gäste zu empfangen.

Sie mieten verlassene Fabriken, installieren unzählige Maschinen, laufen 24/7. Die Maschinen produzieren nichts, außer unaufhörlich eine mathematische Aufgabe zu lösen. Manchmal wird aus dieser unendlichen mathematischen Aufgabe ein Bitcoin berechnet.

Dies war die erste Form des Stromexports: Billiges Wasser- und Windstrom wird durch Mining-Hardware in digitale Vermögenswerte umgewandelt, die weltweit gehandelt werden, und auf Börsen in Dollar umgetauscht.

Der Strom selbst überschreitet keine Grenzen, doch sein Wert wird durch Bitcoin transportiert, der globale Markt ist der Empfänger.

In diesen Jahren dominierte China mit über 70 % der weltweiten Bitcoin-Mining-Leistung. Das Wasser- und Kohlekraftwerk in China beteiligte sich auf indirektem Weg an einer globalen Kapitalumverteilung.

2021 endete das alles abrupt. Regulierungen wurden verschärft, Miner zerstreuten sich, die Rechenleistung wanderte nach Kasachstan, Texas und Kanada.

Doch die zugrunde liegende Logik verschwand nie. Sie wartete nur auf eine neue Hülle. Als ChatGPT erschien, die großen Modelle konkurrierten, verwandelten sich die einstigen Bitcoin-Minen in AI-Datenzentren, die Mining-Hardware wurde zu Rechen-GPUs, die produzierten Bitcoins wurden zu Tokens. Das Einzige, was gleich blieb, war der Strom.

Bitcoin-Export und Token-Export sind auf fundamentaler Ebene gleich aufgebaut, doch Token haben heute einen größeren kommerziellen Wert.

Mining ist reine Mathematik, die produzierten Bitcoins sind Finanzwerte, deren Wert auf Knappheit und Marktakzeptanz beruht, nichts mit „Rechenleistung“ zu tun. Rechenleistung ist kein produktives Gut, sondern eher ein Nebenprodukt eines Vertrauensmechanismus.

Große Modelle hingegen liefern echte kognitive Dienste: Code, Analysen, Übersetzungen, Kreativität. Der Wert eines Tokens ergibt sich direkt aus seinem Nutzen für den Nutzer. Diese tiefere Einbettung bedeutet: Wenn Entwickler ihre Workflows auf ein Modell stützen, steigen die Wechselkosten mit der Zeit.

Ein weiterer entscheidender Unterschied: Bitcoin-Mining wurde aus China vertrieben, während der Token-Export eine bewusste Wahl globaler Entwickler ist.

Token-Krieg

Die 1858 verlegte Unterseekabel symbolisierte die Souveränität des British Empire über die Hochgeschwindigkeits-Informationsautobahn. Wer die Infrastruktur besitzt, bestimmt die Spielregeln.

Der Token-Export ist ebenfalls ein Krieg ohne offizielle Kriegserklärung, voller Widerstände.

Datensouveränität ist die erste Barriere: Ein API-Request eines US-Entwicklers, der durch chinesische Rechenzentren läuft, bedeutet, dass die Daten physisch durch China fließen. Für Einzelentwickler und kleine Anwendungen ist das kein Problem, doch bei sensiblen Unternehmensdaten, Finanzinformationen oder staatlichen Szenarien ist das eine harte Grenze. Deshalb ist die Durchdringung chinesischer Modelle bei Entwickler-Tools und persönlichen Anwendungen hoch, im Kernsysteme der Unternehmen kaum vorhanden.

Chips-Embargo ist die zweite Barriere: China steht Exportkontrollen für Nvidia-Hochleistungs-GPUs gegenüber. MoE-Architekturen und Algorithmus-Optimierungen können diese Schwäche nur teilweise ausgleichen. Das Limit bleibt bestehen.

Doch diese Hindernisse sind nur der Anfang. Größere Schlachten formen sich bereits.

Token und AI-Modelle sind zu einer neuen strategischen Dimension im US-chinesischen Machtkampf geworden, vergleichbar mit der Halbleiter- oder Internet-Ära des 20. Jahrhunderts – oder noch älter: dem Weltraumrennen.

1957 schoss die Sowjetunion Sputnik ins All, die USA reagierten mit dem Apollo-Programm, investierten Milliarden, um im Weltraumwettlauf nicht zurückzubleiben.

Der AI-Kampf ist erstaunlich ähnlich, doch die Intensität wird die des Raumrennens weit übertreffen. Der Weltraum ist physisch, für den Durchschnittsmenschen kaum spürbar. AI durchdringt die Wirtschaft bis in die kleinsten Kapillaren: Jede Codezeile, jeder Vertrag, jedes Regierungssystem könnte von einem großen chinesischen Modell laufen. Wer das Modell zur Standardinfrastruktur für Entwickler macht, gewinnt unmerklich eine strukturelle Macht im globalen digitalen Ökosystem.

Genau das macht die chinesische Token-Expansion für Washington so bedrohlich.

Wenn die Code-Bibliothek, der Agent-Workflow und die Produktlogik eines Entwicklers um ein chinesisches Modell herum aufgebaut sind, steigen die Migrationskosten exponentiell. Selbst wenn die US-Gesetzgebung restriktiv wird, werden Entwickler mit den Füßen abstimmen – so wie heute kein Programmierer GitHub aufgeben kann.

Der heutige Token-Export ist vielleicht nur der Anfang dieses langen Spiels. Chinesische Großmodelle haben nichts Großes angekündigt, sie liefern nur günstiger Dienste an jeden Entwickler weltweit, der einen API-Key besitzt.

Dieses Mal sind es die Teams aus Hangzhou, Peking und Shanghai, die die Kabel verlegen, und die GPU-Cluster, die Tag und Nacht in einer südlichen Provinz laufen.

Dieses Wettrennen hat keinen Countdown, es läuft 24/7, gemessen in Token, auf jedem Entwicklerterminal.

BTC-1,28%
Original anzeigen
Diese Seite kann Inhalte Dritter enthalten, die ausschließlich zu Informationszwecken bereitgestellt werden (keine Zusicherungen oder Garantien), und sie sind nicht als Billigung der darin geäußerten Ansichten durch Gate oder als finanzielle bzw. fachliche Beratung zu verstehen. Weitere Informationen finden Sie im Haftungsausschluss.
  • Angebot
  • Kommentieren
  • Reposten
  • Teilen
Kommentieren
0/400
Keine Kommentare
  • Anheften

Handeln Sie jederzeit und überall mit Kryptowährungen
qrCode
Scannen, um die Gate App herunterzuladen
Community
Deutsch
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский язык
  • Français
  • Deutsch
  • Português (Portugal)
  • ภาษาไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)