Análise do OpenRouter sobre 100 biliões de tokens: Para que é que os humanos realmente usam IA, a ascensão dos modelos chineses e o segredo da retenção de utilizadores
O relatório da OpenRouter revela que a IA está a entrar na era do raciocínio por agentes, que os modelos open-source chineses estão a emergir com força no mercado global graças às suas capacidades de roleplay e programação, e partilha ainda cenários de utilização real dos utilizadores.
(Resumo anterior: Cathie Wood afirma “IA não é uma bolha”: está a replicar o momento de explosão de riqueza da internet)
(Contexto adicional: Google lança oficialmente o “Gemini 3”! O modelo de IA mais inteligente do mundo, quais são os destaques?)
A plataforma agregadora de modelos de IA OpenRouter publicou esta semana o seu aguardado relatório anual “Relatório do Estado da IA 2025”. Este relatório não se baseia em inquéritos ou notícias sensacionalistas, mas sim numa análise empírica dos dados gerados na plataforma OpenRouter, que totalizam 100 triliões (100 Trillion) de Tokens.
Estes dados abrangem mais de 300 grandes modelos de linguagem (LLM) e mais de 60 fornecedores, oferecendo-nos uma nova perspetiva sobre “como é que a IA está realmente a ser usada” no mundo real.
Mudança de paradigma: do “próximo token previsto” ao “raciocínio por agentes”
Se até 2024 a competição em IA era sobre quem conseguia continuar textos de forma mais fluida, o tema de 2025 é “pensar”. O relatório indica que o último ano marcou um verdadeiro ponto de viragem na evolução dos LLM.
A era dos modelos o1 e do raciocínio
O relatório define o dia 5 de dezembro de 2024 como um marco crucial na indústria, quando a OpenAI lançou o primeiro modelo de raciocínio amplamente adotado: o1. Antes disso, mesmo os modelos mais poderosos (como Claude 3.5 Sonnet ou GPT-4) eram, na essência, preditores probabilísticos de passagem única. Dependiam dos padrões dos dados de treino para imitar raciocínio, mas não realizavam cálculos internos genuínos.
A chegada do o1 mudou tudo isto. Introduziu processos computacionais durante a inferência, em que o modelo, antes de apresentar a resposta final, realiza múltiplos passos internos de deliberação, planeamento latente e auto-correção.
Prova em dados:
Segundo as estatísticas da OpenRouter, desde o início de 2025, a proporção de Tokens direcionados para “modelos otimizados para raciocínio” cresceu exponencialmente. No final de 2025, mais de 50% do uso de Tokens envolvia este tipo de modelos com capacidade de pensar. Isto significa que os utilizadores deixaram de ver a IA apenas como um chatbot, mas passaram a encará-la como um “cérebro” capaz de resolver problemas lógicos complexos.
Ascensão dos fluxos de trabalho por agentes
Com a melhoria das capacidades de raciocínio, “fluxos de trabalho por agentes” tornou-se outra palavra-chave. Os utilizadores começaram a criar sistemas automáticos complexos, permitindo que os modelos não só respondessem a perguntas, mas também “tomassem ações”.
O relatório analisou em particular os dados sobre “invocação de ferramentas”. Trata-se da capacidade dos modelos de IA utilizarem ferramentas externas (como pesquisar na internet, executar programas, consultar bases de dados).
Tendência:
O uso da invocação de ferramentas registou um aumento estável e significativo ao longo de 2025.
Paisagem dos modelos:
Inicialmente, este domínio era liderado pelo gpt-4o-mini da OpenAI e pela série Claude 3.5 da Anthropic. No entanto, na segunda metade do ano, o mercado tornou-se mais diversificado, com o Gemini Flash da Google, o Grok Code Fast da xAI e o GLM 4.5 da China a recuperarem rapidamente terreno na capacidade de utilização de ferramentas, impulsionando a adoção da automação empresarial.
A guerra entre open-source e closed-source: ascensão dos modelos chineses
No ecossistema de modelos, o relatório evidencia um mundo dual, onde os modelos closed-source ainda dominam as receitas, mas os modelos open-source (OSS) ocupam posições-chave em inovação e nichos específicos.
Closed-source ainda domina, mas open-source ganha terreno
Apesar de modelos closed-source (como GPT-5, Claude 4.5) ainda representarem cerca de 70% do consumo total de Tokens, ao longo do último ano, a quota de mercado dos modelos open-source cresceu de forma acelerada, aproximando-se dos 30%.
Isto mostra que programadores e empresas procuram cada vez mais um equilíbrio entre controlo, privacidade e custos, e os modelos open-source de alta qualidade oferecem essa alternativa.
O domínio dos modelos open-source chineses
Um dos achados mais marcantes do relatório: modelos open-source desenvolvidos na China já se tornaram os pilares do ecossistema open-source global.
Principais players:
Séries Qwen da Alibaba, DeepSeek e Kimi da Moonshot AI ocupam uma enorme fatia das chamadas globais na OpenRouter.
Vantagens competitivas:
O relatório destaca que o rápido crescimento dos modelos chineses se deve sobretudo aos “ciclos de iteração intensivos” e à “qualidade altamente competitiva dos modelos”. Por exemplo, o Qwen 2.5 Coder desafia diretamente a posição de muitos modelos closed-source no domínio da programação.
Posicionamento único:
Os dados mostram que os modelos open-source chineses têm menos filtragem de conteúdo (em comparação com as rigorosas salvaguardas de segurança de alguns modelos ocidentais), o que os torna mais populares a nível global em cenários como escrita criativa, roleplay e continuação de histórias.
Desenvolvimento “em M” do tamanho dos modelos
O mercado open-source também está a passar por mudanças estruturais interessantes:
Declínio dos modelos pequenos:
Apesar do lançamento de modelos pequenos como o Gemma da Google, a utilização global destes modelos está a cair. Os utilizadores percebem que o limiar de inteligência destes modelos limita a sua aplicação em tarefas complexas.
Era dourada dos modelos médios:
Modelos com cerca de 32B (32 mil milhões de parâmetros) tornaram-se o “sweet spot”. Exemplificado pelo Qwen 2.5 Coder 32B, estes modelos alcançaram um equilíbrio ideal entre desempenho e custos de raciocínio, estabelecendo com sucesso o “product-market fit” dos modelos.
Diversificação dos modelos grandes:
Na faixa dos 70B aos 200B+ parâmetros, o mercado não está monopolizado por um único modelo, mas sim marcado por uma concorrência diversificada (como a série Llama 3, Qwen 72B, etc.), com os utilizadores a alternar entre grandes modelos consoante a tarefa.
Cenários reais: afinal, para que usam as pessoas a IA?
Esta pode ser a parte mais inspiradora do relatório. Através do sistema de classificação GoogleTagClassifier da OpenRouter, a equipa analisou o conteúdo de milhares de milhões de pedidos. Os resultados desafiam muitos estereótipos sobre a “IA ser usada sobretudo para produtividade empresarial”.
Roleplay
Os dados mostram que os jogos de roleplay são a categoria de maior utilização dos modelos open-source (OSS), representando mais de 60%.
Fenómeno:
Muitos utilizadores recorrem à IA para diálogos com personagens virtuais, criação de novelas interativas e experiências de jogo imersivas. Não se trata apenas de um nicho, mas sim de um enorme mercado de necessidade primária.
Fatores de impulso:
Os utilizadores preferem modelos open-source para roleplay principalmente porque estes modelos (sobretudo os de laboratórios fora dos EUA) tendem a ter menos restrições de moderação, proporcionando interações mais ricas e livres.
Valor comercial:
Estes utilizadores revelam uma fidelização impressionante, construindo fortes laços emocionais e hábitos de utilização em torno de modelos específicos.
Programação
Logo a seguir está a categoria de programação, também uma das que cresce mais rapidamente…
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
Análise do OpenRouter sobre 100 biliões de tokens: Para que é que os humanos realmente usam IA, a ascensão dos modelos chineses e o segredo da retenção de utilizadores
O relatório da OpenRouter revela que a IA está a entrar na era do raciocínio por agentes, que os modelos open-source chineses estão a emergir com força no mercado global graças às suas capacidades de roleplay e programação, e partilha ainda cenários de utilização real dos utilizadores.
(Resumo anterior: Cathie Wood afirma “IA não é uma bolha”: está a replicar o momento de explosão de riqueza da internet) (Contexto adicional: Google lança oficialmente o “Gemini 3”! O modelo de IA mais inteligente do mundo, quais são os destaques?)
A plataforma agregadora de modelos de IA OpenRouter publicou esta semana o seu aguardado relatório anual “Relatório do Estado da IA 2025”. Este relatório não se baseia em inquéritos ou notícias sensacionalistas, mas sim numa análise empírica dos dados gerados na plataforma OpenRouter, que totalizam 100 triliões (100 Trillion) de Tokens.
Estes dados abrangem mais de 300 grandes modelos de linguagem (LLM) e mais de 60 fornecedores, oferecendo-nos uma nova perspetiva sobre “como é que a IA está realmente a ser usada” no mundo real.
Mudança de paradigma: do “próximo token previsto” ao “raciocínio por agentes”
Se até 2024 a competição em IA era sobre quem conseguia continuar textos de forma mais fluida, o tema de 2025 é “pensar”. O relatório indica que o último ano marcou um verdadeiro ponto de viragem na evolução dos LLM.
A era dos modelos o1 e do raciocínio
O relatório define o dia 5 de dezembro de 2024 como um marco crucial na indústria, quando a OpenAI lançou o primeiro modelo de raciocínio amplamente adotado: o1. Antes disso, mesmo os modelos mais poderosos (como Claude 3.5 Sonnet ou GPT-4) eram, na essência, preditores probabilísticos de passagem única. Dependiam dos padrões dos dados de treino para imitar raciocínio, mas não realizavam cálculos internos genuínos.
A chegada do o1 mudou tudo isto. Introduziu processos computacionais durante a inferência, em que o modelo, antes de apresentar a resposta final, realiza múltiplos passos internos de deliberação, planeamento latente e auto-correção.
Prova em dados: Segundo as estatísticas da OpenRouter, desde o início de 2025, a proporção de Tokens direcionados para “modelos otimizados para raciocínio” cresceu exponencialmente. No final de 2025, mais de 50% do uso de Tokens envolvia este tipo de modelos com capacidade de pensar. Isto significa que os utilizadores deixaram de ver a IA apenas como um chatbot, mas passaram a encará-la como um “cérebro” capaz de resolver problemas lógicos complexos.
Ascensão dos fluxos de trabalho por agentes
Com a melhoria das capacidades de raciocínio, “fluxos de trabalho por agentes” tornou-se outra palavra-chave. Os utilizadores começaram a criar sistemas automáticos complexos, permitindo que os modelos não só respondessem a perguntas, mas também “tomassem ações”.
O relatório analisou em particular os dados sobre “invocação de ferramentas”. Trata-se da capacidade dos modelos de IA utilizarem ferramentas externas (como pesquisar na internet, executar programas, consultar bases de dados).
Tendência: O uso da invocação de ferramentas registou um aumento estável e significativo ao longo de 2025.
Paisagem dos modelos: Inicialmente, este domínio era liderado pelo gpt-4o-mini da OpenAI e pela série Claude 3.5 da Anthropic. No entanto, na segunda metade do ano, o mercado tornou-se mais diversificado, com o Gemini Flash da Google, o Grok Code Fast da xAI e o GLM 4.5 da China a recuperarem rapidamente terreno na capacidade de utilização de ferramentas, impulsionando a adoção da automação empresarial.
A guerra entre open-source e closed-source: ascensão dos modelos chineses
No ecossistema de modelos, o relatório evidencia um mundo dual, onde os modelos closed-source ainda dominam as receitas, mas os modelos open-source (OSS) ocupam posições-chave em inovação e nichos específicos.
Closed-source ainda domina, mas open-source ganha terreno
Apesar de modelos closed-source (como GPT-5, Claude 4.5) ainda representarem cerca de 70% do consumo total de Tokens, ao longo do último ano, a quota de mercado dos modelos open-source cresceu de forma acelerada, aproximando-se dos 30%.
Isto mostra que programadores e empresas procuram cada vez mais um equilíbrio entre controlo, privacidade e custos, e os modelos open-source de alta qualidade oferecem essa alternativa.
O domínio dos modelos open-source chineses
Um dos achados mais marcantes do relatório: modelos open-source desenvolvidos na China já se tornaram os pilares do ecossistema open-source global.
Principais players: Séries Qwen da Alibaba, DeepSeek e Kimi da Moonshot AI ocupam uma enorme fatia das chamadas globais na OpenRouter.
Vantagens competitivas: O relatório destaca que o rápido crescimento dos modelos chineses se deve sobretudo aos “ciclos de iteração intensivos” e à “qualidade altamente competitiva dos modelos”. Por exemplo, o Qwen 2.5 Coder desafia diretamente a posição de muitos modelos closed-source no domínio da programação.
Posicionamento único: Os dados mostram que os modelos open-source chineses têm menos filtragem de conteúdo (em comparação com as rigorosas salvaguardas de segurança de alguns modelos ocidentais), o que os torna mais populares a nível global em cenários como escrita criativa, roleplay e continuação de histórias.
Desenvolvimento “em M” do tamanho dos modelos
O mercado open-source também está a passar por mudanças estruturais interessantes: Declínio dos modelos pequenos: Apesar do lançamento de modelos pequenos como o Gemma da Google, a utilização global destes modelos está a cair. Os utilizadores percebem que o limiar de inteligência destes modelos limita a sua aplicação em tarefas complexas.
Era dourada dos modelos médios: Modelos com cerca de 32B (32 mil milhões de parâmetros) tornaram-se o “sweet spot”. Exemplificado pelo Qwen 2.5 Coder 32B, estes modelos alcançaram um equilíbrio ideal entre desempenho e custos de raciocínio, estabelecendo com sucesso o “product-market fit” dos modelos.
Diversificação dos modelos grandes: Na faixa dos 70B aos 200B+ parâmetros, o mercado não está monopolizado por um único modelo, mas sim marcado por uma concorrência diversificada (como a série Llama 3, Qwen 72B, etc.), com os utilizadores a alternar entre grandes modelos consoante a tarefa.
Cenários reais: afinal, para que usam as pessoas a IA?
Esta pode ser a parte mais inspiradora do relatório. Através do sistema de classificação GoogleTagClassifier da OpenRouter, a equipa analisou o conteúdo de milhares de milhões de pedidos. Os resultados desafiam muitos estereótipos sobre a “IA ser usada sobretudo para produtividade empresarial”.
Roleplay
Os dados mostram que os jogos de roleplay são a categoria de maior utilização dos modelos open-source (OSS), representando mais de 60%.
Fenómeno: Muitos utilizadores recorrem à IA para diálogos com personagens virtuais, criação de novelas interativas e experiências de jogo imersivas. Não se trata apenas de um nicho, mas sim de um enorme mercado de necessidade primária.
Fatores de impulso: Os utilizadores preferem modelos open-source para roleplay principalmente porque estes modelos (sobretudo os de laboratórios fora dos EUA) tendem a ter menos restrições de moderação, proporcionando interações mais ricas e livres.
Valor comercial: Estes utilizadores revelam uma fidelização impressionante, construindo fortes laços emocionais e hábitos de utilização em torno de modelos específicos.
Programação
Logo a seguir está a categoria de programação, também uma das que cresce mais rapidamente…