No verão de 1858, um cabo de cobre atravessou o fundo do Atlântico, conectando Londres e Nova York.
O significado dessa conquista nunca foi a velocidade de transmissão, mas a estrutura de poder: quem instalou o cabo submarino controlava o fluxo de informações. O Império Britânico, com sua rede global de telégrafos, tinha em mãos informações coloniais, preços de algodão, notícias de guerra.
A força do império não vinha apenas de sua frota, mas também daquele cabo.
Mais de 160 anos depois, essa lógica está sendo repetida de uma forma inesperada.
Em 2026, os grandes modelos chineses estão silenciosamente dominando o mercado global de desenvolvedores. Dados do OpenRouter mostram que, entre os dez principais modelos, 61% do consumo de tokens vem da China, com os três primeiros totalmente chineses. Desenvolvedores de São Francisco, Berlim, Cingapura enviam requisições API através do cabo submarino do Pacífico, chegando aos centros de dados na China, onde o poder de processamento e a eletricidade fluem, e os resultados retornam.
A eletricidade nunca saiu da rede elétrica chinesa, mas seu valor é entregue através de tokens transfronteiriços.
Migração em massa de modelos de IA
Em 24 de fevereiro de 2026, o OpenRouter divulgou dados semanais: os dez principais modelos consumiram cerca de 8,7 trilhões de tokens, dos quais 5,3 trilhões (61%) eram chineses. MiniMax M2.5 liderou com 2,45 trilhões de tokens, seguido por Kimi K2.5 e Zhìpǔ GLM-5, todos chineses.
Dados de 26 de fevereiro
Não foi por acaso: um estopim acendeu tudo.
No início do ano, surgiu o OpenClaw, uma ferramenta open source que permite controlar diretamente o computador, executar comandos e realizar fluxos de trabalho complexos em paralelo, com mais de 210 mil estrelas no GitHub em poucas semanas.
Profissionais de finanças, como John, instalaram o OpenClaw imediatamente, conectaram à API da Anthropic e começaram a monitorar o mercado de ações automaticamente, enviando sinais de negociação. Horas depois, olhou para o saldo da conta e ficou alguns segundos em choque: dezenas de dólares sumiram.
Essa é a nova realidade trazida pelo OpenClaw. Antes, conversar com IA custava poucos tokens por diálogo. Agora, a IA roda várias tarefas simultaneamente, chamando contextos repetidamente, e o consumo de tokens cresce exponencialmente. As contas aceleram como carros com o capô aberto, o combustível desaparecendo rapidamente.
Na comunidade de desenvolvedores, circula uma dica: usar tokens OAuth para conectar contas de assinatura da Anthropic ou Google ao OpenClaw, transformando o limite mensal “ilimitado” em combustível gratuito para agentes de IA — uma estratégia comum.
A resposta oficial veio logo depois.
Em 19 de fevereiro, a Anthropic atualizou seus termos, proibindo o uso de credenciais de assinatura do Claude em ferramentas de terceiros como o OpenClaw, exigindo o uso de API com cobrança. A Google também bloqueou amplamente contas de assinatura conectadas ao OpenClaw para Antigravity e Gemini AI Ultra.
“Há muito tempo sofríamos com isso”, disse John, que então abraçou os grandes modelos nacionais.
Na plataforma OpenRouter, o modelo chinês MiniMax M2.5 atingiu 80,2% de pontuação em tarefas de engenharia de software, enquanto Claude Opus alcançou 80,8%. A diferença é mínima, mas o preço é totalmente diferente: o primeiro custa US$0,3 por milhão de tokens, o segundo US$5 — uma disparidade de cerca de 17 vezes.
John migrou, o fluxo de trabalho continuou, e a conta diminuiu em uma ordem de magnitude. Essa migração ocorre globalmente.
Chris Clark, COO do OpenRouter, explica claramente: a grande fatia de mercado dos modelos open source chineses se deve ao fato de eles serem usados por uma proporção excepcionalmente alta de desenvolvedores nos EUA.
Eletrificação global
Para entender a exportação de tokens, é preciso primeiro compreender a estrutura de custos de um token.
Parece leve: um token equivale a cerca de 0,75 palavras em inglês. Uma conversa comum com IA consome alguns milhares de tokens. Mas, quando esses tokens se acumulam na casa dos trilhões, a realidade física se torna pesada.
O custo de um token se resume a duas coisas: poder de processamento e eletricidade.
O poder de processamento é a depreciação das GPUs. Comprar uma Nvidia H100, que custa cerca de US$30.000, equivale à depreciação por inferência. A eletricidade é o combustível que mantém o data center funcionando: uma GPU sob carga consome cerca de 700 watts, mais o sistema de resfriamento. Um grande centro de IA pode gastar centenas de milhões de dólares por ano só em energia.
Vamos mapear esse processo.
Um desenvolvedor nos EUA faz uma requisição API de São Francisco. Os dados viajam pelo cabo submarino do Pacífico até um data center na China. As GPUs começam a trabalhar, a eletricidade flui da rede chinesa para os chips, a inferência é concluída, e o resultado volta. Tudo isso em um ou dois segundos.
A eletricidade nunca saiu da rede chinesa, mas seu valor é entregue através de tokens, cruzando fronteiras.
Há uma magia que o comércio tradicional não consegue igualar: tokens não têm forma física, não passam por alfândega, não são tributados, e nem entram nas estatísticas comerciais oficiais. A China exporta uma enorme quantidade de serviços de computação e energia, mas, nos dados oficiais de comércio, quase não aparece.
Tokens tornaram-se derivados de eletricidade; a exportação de tokens é, na essência, a exportação de energia.
Graças ao baixo custo de eletricidade na China, que é cerca de 40% mais barato que nos EUA, essa é uma vantagem física que qualquer concorrente pode copiar facilmente.
Além disso, os grandes modelos chineses têm vantagens em algoritmos e “involução”.
A arquitetura MoE do DeepSeek V3 ativa apenas parte dos parâmetros durante a inferência. Testes independentes mostram que seu custo é cerca de 36 vezes menor que o do GPT-4o. MiniMax M2.5, com 229 bilhões de parâmetros, ativa apenas 10 bilhões.
No topo, há a involução: empresas como Alibaba, ByteDance, Baidu, Tencent, MingYue AnMo, Zhìpǔ, MiniMax… dezenas de companhias competem na mesma pista, com preços já abaixo do limite de lucro razoável. Perder dinheiro virou rotina.
Analisando, é semelhante à estratégia de exportação da manufatura chinesa: usar vantagens na cadeia de suprimentos e na competição interna para reduzir drasticamente os preços do token.
De Bitcoin a tokens
Antes dos tokens, houve uma primeira fase de exportação de energia.
Por volta de 2015, gerentes de usinas em Sichuan, Yunnan e Xinjiang começaram a receber visitantes estranhos.
Esses visitantes alugavam fábricas abandonadas, enchiam-nas de máquinas, e operavam 24 horas por dia. Essas máquinas não produziam nada, apenas resolviam um problema matemático infinito, e, de vez em quando, mineravam um bitcoin.
Era a primeira forma de exportação de energia: usar energia hidrelétrica e eólica barata, através de mineradoras, para criar ativos digitais globais, que eram vendidos em exchanges por dólares.
A energia não atravessava fronteiras, mas seu valor, via bitcoin, circulava pelo mercado mundial.
Naqueles anos, a China respondia por mais de 70% da mineração global de bitcoin. Sua energia hidrelétrica e carvão participava dessa redistribuição de capital de forma indireta.
Em 2021, tudo acabou abruptamente. Regulamentações severas dispersaram os mineradores, e a capacidade de mineração migrou para Cazaquistão, Texas e Canadá.
Mas a lógica nunca desapareceu; apenas aguardava uma nova forma. Quando o ChatGPT surgiu, os grandes modelos se tornaram o novo campo de batalha. As antigas fazendas de bitcoin se transformaram em centros de IA, as mineradoras viraram GPUs de processamento, e os bitcoins viraram tokens. O que permaneceu constante foi a eletricidade.
Bitcoin e tokens têm uma lógica semelhante, mas, atualmente, os tokens têm maior valor comercial.
Mineração de bitcoin é cálculo matemático puro, e o bitcoin é um ativo financeiro, cujo valor vem da escassez e do consenso de mercado. Não tem relação com “o que foi calculado”. O poder de processamento não produz nada por si só, é mais uma consequência de um mecanismo de confiança.
Já a inferência de grandes modelos é diferente. GPUs consomem energia, e o resultado é um serviço cognitivo real: código, análises, traduções, criatividade. O valor do token vem diretamente da utilidade que oferece ao usuário. Essa é uma integração mais profunda: uma vez que o fluxo de trabalho do desenvolvedor dependa de um modelo, o custo de troca aumenta com o tempo.
Outro diferencial importante: a mineração de bitcoin foi expulsamente pelos chineses, enquanto a exportação de tokens é uma escolha voluntária dos desenvolvedores globais.
Guerra de tokens
Aquela cablagem submarina de 1858 simboliza a soberania do Império Britânico sobre a estrada de informações: quem controla a infraestrutura, define as regras do jogo.
A exportação de tokens é uma guerra silenciosa, com obstáculos pesados.
A soberania de dados é a primeira barreira: uma requisição API de um desenvolvedor nos EUA, processada por um data center na China, faz os dados atravessarem fronteiras físicas. Para desenvolvedores individuais e pequenas aplicações, isso não é um problema. Mas, em cenários envolvendo dados sensíveis, financeiros ou governamentais, é uma barreira difícil. É por isso que a penetração de modelos chineses é maior em ferramentas de desenvolvimento e aplicações pessoais, enquanto sua presença em sistemas corporativos é quase inexistente.
A proibição de chips é a segunda barreira: a China enfrenta restrições à exportação de GPUs de alta performance da Nvidia. As arquiteturas MoE e as otimizações de algoritmos podem mitigar parcialmente essa desvantagem, mas o limite ainda existe.
Porém, esses obstáculos são apenas o começo. Um campo maior está se formando.
Tokens e modelos de IA tornaram-se uma nova dimensão de disputa estratégica entre China e EUA, equiparando-se às guerras por semicondutores e internet do século XX, ou até a uma metáfora mais antiga: a corrida pelo espaço.
Em 1957, a União Soviética lançou o Sputnik, assustando os EUA, que responderam com o programa Apollo, investindo bilhões de dólares para não ficarem para trás na corrida espacial.
A lógica da disputa por IA é surpreendentemente semelhante, mas a intensidade será muito maior. O espaço é físico, invisível ao público. A IA penetra as veias da economia: cada linha de código, cada contrato, cada sistema de decisão governamental pode estar rodando um grande modelo de um país. Quem fizer do seu modelo a infraestrutura padrão para desenvolvedores globais terá uma influência estrutural na economia digital mundial.
É exatamente isso que faz a entrada de tokens chineses no mercado assustar Washington.
Quando o código, os agentes e a lógica de produtos de um desenvolvedor se basearem em um modelo chinês, o custo de migração aumenta exponencialmente com o tempo. Mesmo que os EUA criem leis restritivas, os desenvolvedores resistirão, assim como hoje não há programador que abandone o GitHub.
A exportação de tokens pode ser apenas o começo dessa longa disputa. Os grandes modelos chineses não pretendem derrubar nada, apenas oferecem serviços a preços mais baixos, entregando-os a todos os desenvolvedores com API keys ao redor do mundo.
Desta vez, quem instalou os cabos foram os engenheiros de Hangzhou, Pequim, Xangai, e os clusters de GPUs operando dia e noite em alguma província do sul.
Essa batalha não tem contagem regressiva; ela acontece 24 horas por dia, em tokens, no terminal de cada desenvolvedor.
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
Token para o exterior, vendendo eletricidade chinesa para o mundo inteiro
Uma guerra silenciosa de energia elétrica.
Autor: Caranguejo Preto, Deep潮 TechFlow
No verão de 1858, um cabo de cobre atravessou o fundo do Atlântico, conectando Londres e Nova York.
O significado dessa conquista nunca foi a velocidade de transmissão, mas a estrutura de poder: quem instalou o cabo submarino controlava o fluxo de informações. O Império Britânico, com sua rede global de telégrafos, tinha em mãos informações coloniais, preços de algodão, notícias de guerra.
A força do império não vinha apenas de sua frota, mas também daquele cabo.
Mais de 160 anos depois, essa lógica está sendo repetida de uma forma inesperada.
Em 2026, os grandes modelos chineses estão silenciosamente dominando o mercado global de desenvolvedores. Dados do OpenRouter mostram que, entre os dez principais modelos, 61% do consumo de tokens vem da China, com os três primeiros totalmente chineses. Desenvolvedores de São Francisco, Berlim, Cingapura enviam requisições API através do cabo submarino do Pacífico, chegando aos centros de dados na China, onde o poder de processamento e a eletricidade fluem, e os resultados retornam.
A eletricidade nunca saiu da rede elétrica chinesa, mas seu valor é entregue através de tokens transfronteiriços.
Migração em massa de modelos de IA
Em 24 de fevereiro de 2026, o OpenRouter divulgou dados semanais: os dez principais modelos consumiram cerca de 8,7 trilhões de tokens, dos quais 5,3 trilhões (61%) eram chineses. MiniMax M2.5 liderou com 2,45 trilhões de tokens, seguido por Kimi K2.5 e Zhìpǔ GLM-5, todos chineses.
Dados de 26 de fevereiro
Não foi por acaso: um estopim acendeu tudo.
No início do ano, surgiu o OpenClaw, uma ferramenta open source que permite controlar diretamente o computador, executar comandos e realizar fluxos de trabalho complexos em paralelo, com mais de 210 mil estrelas no GitHub em poucas semanas.
Profissionais de finanças, como John, instalaram o OpenClaw imediatamente, conectaram à API da Anthropic e começaram a monitorar o mercado de ações automaticamente, enviando sinais de negociação. Horas depois, olhou para o saldo da conta e ficou alguns segundos em choque: dezenas de dólares sumiram.
Essa é a nova realidade trazida pelo OpenClaw. Antes, conversar com IA custava poucos tokens por diálogo. Agora, a IA roda várias tarefas simultaneamente, chamando contextos repetidamente, e o consumo de tokens cresce exponencialmente. As contas aceleram como carros com o capô aberto, o combustível desaparecendo rapidamente.
Na comunidade de desenvolvedores, circula uma dica: usar tokens OAuth para conectar contas de assinatura da Anthropic ou Google ao OpenClaw, transformando o limite mensal “ilimitado” em combustível gratuito para agentes de IA — uma estratégia comum.
A resposta oficial veio logo depois.
Em 19 de fevereiro, a Anthropic atualizou seus termos, proibindo o uso de credenciais de assinatura do Claude em ferramentas de terceiros como o OpenClaw, exigindo o uso de API com cobrança. A Google também bloqueou amplamente contas de assinatura conectadas ao OpenClaw para Antigravity e Gemini AI Ultra.
“Há muito tempo sofríamos com isso”, disse John, que então abraçou os grandes modelos nacionais.
Na plataforma OpenRouter, o modelo chinês MiniMax M2.5 atingiu 80,2% de pontuação em tarefas de engenharia de software, enquanto Claude Opus alcançou 80,8%. A diferença é mínima, mas o preço é totalmente diferente: o primeiro custa US$0,3 por milhão de tokens, o segundo US$5 — uma disparidade de cerca de 17 vezes.
John migrou, o fluxo de trabalho continuou, e a conta diminuiu em uma ordem de magnitude. Essa migração ocorre globalmente.
Chris Clark, COO do OpenRouter, explica claramente: a grande fatia de mercado dos modelos open source chineses se deve ao fato de eles serem usados por uma proporção excepcionalmente alta de desenvolvedores nos EUA.
Eletrificação global
Para entender a exportação de tokens, é preciso primeiro compreender a estrutura de custos de um token.
Parece leve: um token equivale a cerca de 0,75 palavras em inglês. Uma conversa comum com IA consome alguns milhares de tokens. Mas, quando esses tokens se acumulam na casa dos trilhões, a realidade física se torna pesada.
O custo de um token se resume a duas coisas: poder de processamento e eletricidade.
O poder de processamento é a depreciação das GPUs. Comprar uma Nvidia H100, que custa cerca de US$30.000, equivale à depreciação por inferência. A eletricidade é o combustível que mantém o data center funcionando: uma GPU sob carga consome cerca de 700 watts, mais o sistema de resfriamento. Um grande centro de IA pode gastar centenas de milhões de dólares por ano só em energia.
Vamos mapear esse processo.
Um desenvolvedor nos EUA faz uma requisição API de São Francisco. Os dados viajam pelo cabo submarino do Pacífico até um data center na China. As GPUs começam a trabalhar, a eletricidade flui da rede chinesa para os chips, a inferência é concluída, e o resultado volta. Tudo isso em um ou dois segundos.
A eletricidade nunca saiu da rede chinesa, mas seu valor é entregue através de tokens, cruzando fronteiras.
Há uma magia que o comércio tradicional não consegue igualar: tokens não têm forma física, não passam por alfândega, não são tributados, e nem entram nas estatísticas comerciais oficiais. A China exporta uma enorme quantidade de serviços de computação e energia, mas, nos dados oficiais de comércio, quase não aparece.
Tokens tornaram-se derivados de eletricidade; a exportação de tokens é, na essência, a exportação de energia.
Graças ao baixo custo de eletricidade na China, que é cerca de 40% mais barato que nos EUA, essa é uma vantagem física que qualquer concorrente pode copiar facilmente.
Além disso, os grandes modelos chineses têm vantagens em algoritmos e “involução”.
A arquitetura MoE do DeepSeek V3 ativa apenas parte dos parâmetros durante a inferência. Testes independentes mostram que seu custo é cerca de 36 vezes menor que o do GPT-4o. MiniMax M2.5, com 229 bilhões de parâmetros, ativa apenas 10 bilhões.
No topo, há a involução: empresas como Alibaba, ByteDance, Baidu, Tencent, MingYue AnMo, Zhìpǔ, MiniMax… dezenas de companhias competem na mesma pista, com preços já abaixo do limite de lucro razoável. Perder dinheiro virou rotina.
Analisando, é semelhante à estratégia de exportação da manufatura chinesa: usar vantagens na cadeia de suprimentos e na competição interna para reduzir drasticamente os preços do token.
De Bitcoin a tokens
Antes dos tokens, houve uma primeira fase de exportação de energia.
Por volta de 2015, gerentes de usinas em Sichuan, Yunnan e Xinjiang começaram a receber visitantes estranhos.
Esses visitantes alugavam fábricas abandonadas, enchiam-nas de máquinas, e operavam 24 horas por dia. Essas máquinas não produziam nada, apenas resolviam um problema matemático infinito, e, de vez em quando, mineravam um bitcoin.
Era a primeira forma de exportação de energia: usar energia hidrelétrica e eólica barata, através de mineradoras, para criar ativos digitais globais, que eram vendidos em exchanges por dólares.
A energia não atravessava fronteiras, mas seu valor, via bitcoin, circulava pelo mercado mundial.
Naqueles anos, a China respondia por mais de 70% da mineração global de bitcoin. Sua energia hidrelétrica e carvão participava dessa redistribuição de capital de forma indireta.
Em 2021, tudo acabou abruptamente. Regulamentações severas dispersaram os mineradores, e a capacidade de mineração migrou para Cazaquistão, Texas e Canadá.
Mas a lógica nunca desapareceu; apenas aguardava uma nova forma. Quando o ChatGPT surgiu, os grandes modelos se tornaram o novo campo de batalha. As antigas fazendas de bitcoin se transformaram em centros de IA, as mineradoras viraram GPUs de processamento, e os bitcoins viraram tokens. O que permaneceu constante foi a eletricidade.
Bitcoin e tokens têm uma lógica semelhante, mas, atualmente, os tokens têm maior valor comercial.
Mineração de bitcoin é cálculo matemático puro, e o bitcoin é um ativo financeiro, cujo valor vem da escassez e do consenso de mercado. Não tem relação com “o que foi calculado”. O poder de processamento não produz nada por si só, é mais uma consequência de um mecanismo de confiança.
Já a inferência de grandes modelos é diferente. GPUs consomem energia, e o resultado é um serviço cognitivo real: código, análises, traduções, criatividade. O valor do token vem diretamente da utilidade que oferece ao usuário. Essa é uma integração mais profunda: uma vez que o fluxo de trabalho do desenvolvedor dependa de um modelo, o custo de troca aumenta com o tempo.
Outro diferencial importante: a mineração de bitcoin foi expulsamente pelos chineses, enquanto a exportação de tokens é uma escolha voluntária dos desenvolvedores globais.
Guerra de tokens
Aquela cablagem submarina de 1858 simboliza a soberania do Império Britânico sobre a estrada de informações: quem controla a infraestrutura, define as regras do jogo.
A exportação de tokens é uma guerra silenciosa, com obstáculos pesados.
A soberania de dados é a primeira barreira: uma requisição API de um desenvolvedor nos EUA, processada por um data center na China, faz os dados atravessarem fronteiras físicas. Para desenvolvedores individuais e pequenas aplicações, isso não é um problema. Mas, em cenários envolvendo dados sensíveis, financeiros ou governamentais, é uma barreira difícil. É por isso que a penetração de modelos chineses é maior em ferramentas de desenvolvimento e aplicações pessoais, enquanto sua presença em sistemas corporativos é quase inexistente.
A proibição de chips é a segunda barreira: a China enfrenta restrições à exportação de GPUs de alta performance da Nvidia. As arquiteturas MoE e as otimizações de algoritmos podem mitigar parcialmente essa desvantagem, mas o limite ainda existe.
Porém, esses obstáculos são apenas o começo. Um campo maior está se formando.
Tokens e modelos de IA tornaram-se uma nova dimensão de disputa estratégica entre China e EUA, equiparando-se às guerras por semicondutores e internet do século XX, ou até a uma metáfora mais antiga: a corrida pelo espaço.
Em 1957, a União Soviética lançou o Sputnik, assustando os EUA, que responderam com o programa Apollo, investindo bilhões de dólares para não ficarem para trás na corrida espacial.
A lógica da disputa por IA é surpreendentemente semelhante, mas a intensidade será muito maior. O espaço é físico, invisível ao público. A IA penetra as veias da economia: cada linha de código, cada contrato, cada sistema de decisão governamental pode estar rodando um grande modelo de um país. Quem fizer do seu modelo a infraestrutura padrão para desenvolvedores globais terá uma influência estrutural na economia digital mundial.
É exatamente isso que faz a entrada de tokens chineses no mercado assustar Washington.
Quando o código, os agentes e a lógica de produtos de um desenvolvedor se basearem em um modelo chinês, o custo de migração aumenta exponencialmente com o tempo. Mesmo que os EUA criem leis restritivas, os desenvolvedores resistirão, assim como hoje não há programador que abandone o GitHub.
A exportação de tokens pode ser apenas o começo dessa longa disputa. Os grandes modelos chineses não pretendem derrubar nada, apenas oferecem serviços a preços mais baixos, entregando-os a todos os desenvolvedores com API keys ao redor do mundo.
Desta vez, quem instalou os cabos foram os engenheiros de Hangzhou, Pequim, Xangai, e os clusters de GPUs operando dia e noite em alguma província do sul.
Essa batalha não tem contagem regressiva; ela acontece 24 horas por dia, em tokens, no terminal de cada desenvolvedor.