Token para o exterior, vendendo eletricidade chinesa para o mundo inteiro

Autor: Black Lobster, Deep Tide TechFlow

No verão de 1858, um cabo de cobre atravessou o fundo do Atlântico, ligando Londres a Nova Iorque.

O significado desta ação nunca foi a velocidade de transmissão, mas sim a estrutura de poder: quem instalou o cabo submarino controlava o fluxo de informação e podia extrair valor dele. O Império Britânico, com a sua rede global de telégrafos, tinha nas mãos informações coloniais, preços de algodão, notícias de guerra.

A força do império não vinha apenas da sua frota, mas também daquele cabo.

Mais de cento e sessenta anos depois, essa lógica está a repetir-se de uma forma inesperada.

Em 2026, os grandes modelos chineses estão a conquistar silenciosamente o mercado global de desenvolvedores. Dados recentes do OpenRouter mostram que 61% do consumo de tokens dos dez principais modelos da plataforma é de modelos chineses, com os três primeiros totalmente chineses. Desenvolvedores de São Francisco, Berlim, Singapura enviam pedidos API através do Pacífico, chegando a centros de dados na China, onde o poder computacional e a eletricidade fluem, e os resultados regressam.

A eletricidade nunca saiu da rede elétrica chinesa, mas o seu valor é entregue através de tokens transfronteiriços.

Migração em massa de modelos de IA

Em 24 de fevereiro de 2026, o OpenRouter publicou dados semanais: os dez principais modelos consumiram cerca de 8,7 trilhões de tokens, com modelos chineses a dominar com 5,3 trilhões (61%). MiniMax M2.5 lidera com 2,45 trilhões, seguido por Kimi K2.5 e o GLM-5 da Zhìpǔ, todos chineses.

Dados de 26 de fevereiro mostram que isto não foi por acaso: uma faísca acendeu tudo.

No início do ano, surgiu o OpenClaw, uma ferramenta open-source que permite controlar diretamente o computador, executar comandos e realizar fluxos de trabalho complexos em paralelo, com mais de 210 mil estrelas no GitHub em poucas semanas.

John, um profissional financeiro, instalou o OpenClaw e integrou a API da Anthropic, automatizando a monitorização do mercado de ações e gerando sinais de negociação. Horas depois, olhou para o saldo da conta: dezenas de dólares desaparecidos.

Este é o novo cenário trazido pelo OpenClaw. Antes, conversar com IA custava poucos tokens por diálogo. Agora, a IA executa várias tarefas simultaneamente, chamando contextos repetidamente, com consumo de tokens que cresce exponencialmente. As contas aceleram como um carro com o capô aberto, o combustível a diminuir, sem parar.

Na comunidade de desenvolvedores, circula uma dica: usar tokens OAuth para conectar contas de assinatura da Anthropic ou Google ao OpenClaw, transformando limites mensais em combustível gratuito para os agentes de IA — uma estratégia comum.

As respostas oficiais não tardaram.

A Anthropic atualizou os termos a 19 de fevereiro, proibindo o uso de credenciais de assinatura do Claude em ferramentas de terceiros como o OpenClaw, exigindo o uso de API com cobrança. A Google também bloqueou amplamente contas de assinatura conectadas ao OpenClaw para Antigravity e Gemini AI Ultra.

“Há muito tempo que o povo sofre com Qin”, disse John, que passou a apostar nos grandes modelos nacionais.

Na plataforma OpenRouter, o modelo chinês MiniMax M2.5 atingiu 80,2% de pontuação em tarefas de engenharia de software, quase igual ao Claude Opus com 80,8%. Mas o preço é completamente diferente: o custo por milhão de tokens na entrada é de 0,3 dólares para o chinês, contra 5 dólares do Claude, uma diferença de cerca de 17 vezes.

John migrou, o fluxo de trabalho continuou, e a conta reduziu-se em uma ordem de magnitude. Essa migração ocorre globalmente.

Chris Clark, COO do OpenRouter, explica de forma direta: os modelos open-source chineses conquistaram grande fatia do mercado porque representam uma proporção anormalmente alta nos fluxos de trabalho de agentes operados por desenvolvedores americanos.

Eletricidade para além-fronteiras

Para entender a essência da exportação de tokens, é preciso compreender a estrutura de custos de um token.

Parece leve: um token equivale a cerca de 0,75 palavras em inglês. Uma conversa comum com IA consome apenas alguns milhares de tokens. Mas, quando esses tokens se acumulam em trilhões, a realidade física torna-se pesada.

O custo de um token baseia-se em duas componentes principais: poder de computação e eletricidade.

O poder de computação é a depreciação do GPU. Comprar uma Nvidia H100, que custa cerca de 30 mil dólares, implica uma depreciação por inferência. A eletricidade é o combustível que mantém o centro de dados em funcionamento: cada GPU, sob carga máxima, consome cerca de 700 watts, mais o custo de refrigeração. Um grande centro de IA pode facilmente gastar centenas de milhões de dólares por ano em eletricidade.

Vamos mapear esse processo.

Um desenvolvedor nos EUA faz uma requisição API de São Francisco. Os dados viajam pelo cabo submarino do Pacífico até um centro de dados na China. Os GPUs trabalham, a eletricidade flui da rede chinesa para as chips, a inferência termina, e o resultado é enviado de volta. Tudo isso em um ou dois segundos.

A eletricidade nunca saiu da rede chinesa, mas seu valor é entregue através de tokens, cruzando fronteiras.

Há uma magia que o comércio tradicional não consegue igualar: tokens não têm forma física, não passam por alfândega, não pagam tarifas, e nem entram nas estatísticas comerciais oficiais. A China exporta uma vasta quantidade de serviços de computação e eletricidade, mas, nos dados oficiais de comércio, é quase invisível.

Tokens tornaram-se derivados de eletricidade; a exportação de tokens é, na essência, a exportação de eletricidade.

Graças ao baixo custo de eletricidade na China, cerca de 40% mais barato que nos EUA, essa é uma vantagem física que qualquer concorrente pode copiar.

Além disso, os grandes modelos chineses têm vantagens em algoritmos e na “competição interna”.

DeepSeek V3, com arquitetura MoE, ativa apenas parte dos parâmetros durante a inferência. Testes independentes mostram que seu custo de inferência é cerca de 36 vezes menor que o do GPT-4o. MiniMax M2.5, com 229 bilhões de parâmetros, ativa apenas 10 bilhões.

No topo, há uma competição interna: Alibaba, ByteDance, Baidu, Tencent, Shadow of the Moon, Zhìpǔ, MiniMax… dezenas de empresas na mesma pista, com preços já abaixo do limite de lucro razoável. Perder dinheiro virou rotina.

Essa estratégia, semelhante à de exportar manufatura na China, usa a cadeia de suprimentos e a competição interna para reduzir drasticamente os preços dos tokens.

De Bitcoin a tokens

Antes dos tokens, houve uma primeira forma de exportação de eletricidade.

Por volta de 2015, gerentes de usinas em Sichuan, Yunnan e Xinjiang começaram a receber visitantes estranhos.

Esses indivíduos alugavam fábricas abandonadas, enchiam-nas de máquinas, e operavam 24 horas por dia. Essas máquinas não produziam nada, apenas resolviam um problema matemático infinito, e, de vez em quando, mineravam um bitcoin.

Era a primeira forma de exportação de eletricidade: usar eletricidade barata de água e vento, através de mineração, para transformar energia em ativos digitais globais, que eram vendidos em exchanges por dólares.

A eletricidade não atravessava fronteiras, mas seu valor, via bitcoin, circulava globalmente.

Naqueles anos, a China respondia por mais de 70% da mineração mundial de bitcoin. Sua energia hidrelétrica e carvão participavam dessa redistribuição de capital de forma indireta.

Em 2021, tudo mudou. Regulamentações severas dispersaram os mineradores, e a capacidade de mineração migrou para Cazaquistão, Texas e Canadá.

Mas a lógica não desapareceu: só aguardava uma nova forma. Quando o ChatGPT surgiu, os grandes modelos dominaram o cenário, e antigas fazendas de mineração se transformaram em centros de IA, com GPUs substituindo mineradoras, e bitcoins virando tokens. O que permaneceu foi a eletricidade.

A saída de bitcoin e a exportação de tokens têm uma lógica semelhante, mas, atualmente, os tokens têm maior valor comercial.

Mineração é cálculo matemático puro; o bitcoin é um ativo financeiro, cujo valor depende de escassez e consenso de mercado, sem relação com “o que foi calculado”. Poder de computação não produz nada por si só, é mais uma consequência de um mecanismo de confiança.

Já a inferência de grandes modelos é diferente. GPUs consomem eletricidade, e produzem serviços cognitivos reais: códigos, análises, traduções, criatividade. O valor do token vem diretamente da sua utilidade para o usuário. É uma integração mais profunda: uma vez que o fluxo de trabalho do desenvolvedor dependa de um modelo, o custo de troca aumenta com o tempo.

Outro ponto importante: enquanto a mineração de bitcoin foi expulsamente banida na China, a exportação de tokens é uma escolha voluntária dos desenvolvedores globais.

Guerra de tokens

A cabos submarinos de 1858 simbolizavam a soberania do Império Britânico sobre a autoestrada da informação: quem controla a infraestrutura, define as regras do jogo.

A exportação de tokens é uma guerra silenciosa, com obstáculos complexos.

A soberania de dados é a primeira barreira: uma requisição API de um desenvolvedor americano, processada por um centro de dados na China, faz os dados passarem fisicamente pela China. Para desenvolvedores individuais ou pequenas aplicações, isso não é um problema. Mas, em cenários envolvendo dados sensíveis de empresas, informações financeiras ou requisitos governamentais, é uma barreira difícil de superar. É por isso que a penetração de modelos chineses é maior em ferramentas de desenvolvimento e aplicações pessoais, enquanto sua presença em sistemas corporativos é quase inexistente.

A proibição de chips é a segunda barreira: a China enfrenta restrições à exportação de GPUs de alta gama da Nvidia. As arquiteturas MoE e as otimizações de algoritmos só podem mitigar parcialmente essa desvantagem, e o limite máximo ainda existe.

Mas esses obstáculos são apenas o começo. Um campo de batalha maior está se formando.

Tokens e modelos de IA tornaram-se uma nova dimensão de disputa estratégica entre China e EUA, equiparando-se à guerra por semicondutores e internet do século XX, ou até a uma metáfora mais antiga: a corrida pelo espaço.

Em 1957, a União Soviética lançou o Sputnik, assustando os EUA, que responderam com o programa Apollo, investindo bilhões de dólares para não ficarem atrás na corrida espacial.

A lógica da competição de IA é surpreendentemente semelhante, mas a intensidade será muito maior. O espaço é físico, invisível ao público. A IA infiltra-se na economia, nas linhas de produção, nos contratos, nos sistemas de decisão governamental. Quem tiver o modelo padrão para desenvolvedores, terá uma influência estrutural na economia digital global.

É exatamente isso que faz a exportação de tokens chinesa preocupar Washington.

Quando o código, os agentes e a lógica de produtos de um desenvolvedor se basearem em um modelo chinês, o custo de migração cresce exponencialmente com o tempo. Mesmo que os EUA imponham restrições legislativas, os desenvolvedores resistirão com os pés, como hoje não há programador que abandone o GitHub.

A exportação de tokens de hoje pode ser apenas o começo dessa longa disputa. Os grandes modelos chineses não pretendem derrubar nada, apenas oferecem serviços a preços mais baixos, entregando-os a todos os desenvolvedores com API keys ao redor do mundo.

Desta vez, quem instalou os cabos foram engenheiros em Hangzhou, Pequim, Xangai, e clusters de GPUs operando dia e noite no sul do país.

Essa batalha não tem contagem regressiva; ela acontece 24 horas por dia, em cada terminal de desenvolvedor, com tokens como unidades de combate.

BTC-2,05%
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Fixar

Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)