Китайские модели доминируют в OpenRouter: резкий рост вызовов токенов, программирование и интеллектуальные агенты становятся ключевыми факторами победы
Использование отечественных больших моделей в период праздника Весны можно назвать бурным. Последние недельные данные OpenRouter показывают, что общий объем токенов десяти лучших моделей платформы составляет около 8,7 триллионов, из которых отечественные модели занимают 5,3 триллиона, что составляет 61%.
Три модели с наибольшим количеством вызовов токенов за неделю — все отечественные большие модели, а именно Minimax M2.5, Kimi K2.5 и GLM-5, при этом их объем вызовов за неделю вырос на 197%, снизился на 20% и вырос на 158% соответственно. Среди них MiniMax M2.5 с 2,45 триллиона токенов внезапно заняла первое место, Kimi K2.5 с 1,21 триллиона — второе, а модели Zhipu GLM 5 и DeepSeek V3.2 расположились на третьем и пятом местах.
OpenRouter — крупнейшая в мире платформа агрегирования API больших моделей, предоставляющая разработчикам единый API-интерфейс для доступа к сотням крупных языковых моделей по всему миру. Основные функции включают вызов нескольких моделей, интеллектуальную маршрутизацию и прозрачные рейтинги производительности, что призвано решить проблему сложности интеграции нескольких моделей и блокировки со стороны поставщиков.
Согласно данным платформы, программирование (Coding) и интеллектуальные агенты (Agent) становятся двумя ключевыми направлениями конкуренции среди больших моделей.
Общий объем вызовов на OpenRouter недавно значительно вырос. Официально подтверждено, что M2.5 стимулировала рост вызовов в диапазоне длинных текстов от 100K до 1M токенов, что является типичным сценарием для рабочих процессов интеллектуальных агентов.
В рейтинге по количеству вызовов токенов все три ведущие отечественные большие модели сфокусированы на повышении программных возможностей и автоматизации задач интеллектуальных агентов, что является важным прорывом отечественных моделей в прикладной сфере в начале 2026 года.
稀宇科技(MiniMax) 13 февраля выпустила MiniMax M2.5, назвав эту модель первой в мире производственной моделью, созданной специально для сценариев интеллектуальных агентов. Уже через семь дней после выпуска объем вызовов превысил 3,07 триллиона токенов. Благодаря выдающейся производительности и очень низкой стоимости в задачах программирования и рабочих потоках интеллектуальных агентов, она стала предпочтением разработчиков.
Moonshot AI 27 января выпустила KimiK2.5, которая использует нативную мультимодальную архитектуру, способную запускать до 100 “агентских копий” параллельно, повышая эффективность сложных задач в 3–10 раз. Эта модель занимает первое место во многих нишевых рейтингах (например, программирование, вызовы инструментов), а объем вызовов значительно превышает Gemini 3 и Claude. По данным Пэнпай, менее чем за месяц после выпуска, доход Kimi за 20 дней уже превысил общие доходы за весь 2025 год, что связано с ростом числа платных пользователей по всему миру и увеличением вызовов API, особенно за рубежом.
智谱 12 февраля выпустила GLM-5, модель с расширенным числом параметров и использующая разреженное внимание, специально разработанная для сложных системных инженерных задач и долгосрочных задач интеллектуальных агентов. Благодаря бесплатному доступу, окну контекста в 200K и другим преимуществам, после релиза число пользователей быстро выросло. В связи с этим, компания предприняла меры по ограничению продаж и повышению цен на Coding Plan, а в канун китайского Нового года объявила о поиске “партнеров по вычислительным мощностям” по всей сети.
По мере углубления применения AI-моделей, пользователи переходят от простых вопросов к сложным рабочим сценариям, таким как переписывание кода, редактирование файлов, создание документов, а также распространение режима интеллектуальных агентов, что приводит к явному росту потребления токенов.
Несмотря на рост производительности, отечественные модели по-прежнему выделяются соотношением цена/качество. Например, MiniMax M2.5 и Zhipu GLM-5 имеют значительное ценовое преимущество по сравнению с Claude Opus 4.6: в сегменте входных данных цена MiniMax M2.5 и GLM-5 составляет 0,3 доллара за миллион токенов, тогда как Claude Opus 4.6 — до 5 долларов, что примерно в 16,7 раз дороже; в сегменте вывода цена MiniMax M2.5 — 1,1 доллара за миллион токенов, GLM-5 — 2,55 доллара, а Claude Opus 4.6 — 25 долларов, что примерно в 22,7 и 9,8 раз дороже соответственно.
Эти отечественные модели не полностью отражают ситуацию с вызовами токенов внутри страны. Согласно данным Haitong International Securities, среднесуточный объем вызовов токенов у модели Huoshan Engine вырос с 20 триллионов в конце 2024 года до 63 триллионов к концу 2025 года; у внешних клиентов Alibaba Cloud — около 5 триллионов в день в 2025 году, а к 2026 году планируется достичь 15–20 триллионов. Внутренние бизнес-процессы планируют увеличить среднесуточные вызовы с 16–17 триллионов до 100 триллионов. В целом по отрасли, среднесуточное потребление токенов в Китае в начале 2024 года составляло 100 миллиардов, к середине 2025 года — более 30 триллионов, а к февралю 2026 года суммарное ежедневное потребление токенов крупнейших моделей достигло порядка 180 триллионов.
Последний отчет Dongguan Securities отмечает, что с ростом возможностей программирования и интеллектуальных агентов отечественных моделей их вызовы значительно увеличиваются, что способствует ускорению внедрения приложений и росту потребления токенов.
Ранее Changjiang Securities заявил, что по мере зрелости моделей для программирования и мультимодальных продуктов, реальные сценарии применения начнут активно развиваться, создавая высокий спрос на качественные токены. Анализируя развитие зарубежной индустрии AI, существует задержка примерно в два года между капиталовложениями и взрывным ростом спроса на токены. Внутренние крупные компании начали инвестировать в AI примерно на год позже зарубежных, с второй половины 2024 года. В результате доходы отечественных облачных провайдеров уже начинают расти, а настоящий взрыв спроса на токены ожидается в 2026 году.
(Источник: Цайляньшэ)
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
Китайские модели доминируют в OpenRouter: резкий рост вызовов токенов, программирование и интеллектуальные агенты становятся ключевыми факторами победы
Использование отечественных больших моделей в период праздника Весны можно назвать бурным. Последние недельные данные OpenRouter показывают, что общий объем токенов десяти лучших моделей платформы составляет около 8,7 триллионов, из которых отечественные модели занимают 5,3 триллиона, что составляет 61%.
Три модели с наибольшим количеством вызовов токенов за неделю — все отечественные большие модели, а именно Minimax M2.5, Kimi K2.5 и GLM-5, при этом их объем вызовов за неделю вырос на 197%, снизился на 20% и вырос на 158% соответственно. Среди них MiniMax M2.5 с 2,45 триллиона токенов внезапно заняла первое место, Kimi K2.5 с 1,21 триллиона — второе, а модели Zhipu GLM 5 и DeepSeek V3.2 расположились на третьем и пятом местах.
OpenRouter — крупнейшая в мире платформа агрегирования API больших моделей, предоставляющая разработчикам единый API-интерфейс для доступа к сотням крупных языковых моделей по всему миру. Основные функции включают вызов нескольких моделей, интеллектуальную маршрутизацию и прозрачные рейтинги производительности, что призвано решить проблему сложности интеграции нескольких моделей и блокировки со стороны поставщиков.
Согласно данным платформы, программирование (Coding) и интеллектуальные агенты (Agent) становятся двумя ключевыми направлениями конкуренции среди больших моделей.
Общий объем вызовов на OpenRouter недавно значительно вырос. Официально подтверждено, что M2.5 стимулировала рост вызовов в диапазоне длинных текстов от 100K до 1M токенов, что является типичным сценарием для рабочих процессов интеллектуальных агентов.
В рейтинге по количеству вызовов токенов все три ведущие отечественные большие модели сфокусированы на повышении программных возможностей и автоматизации задач интеллектуальных агентов, что является важным прорывом отечественных моделей в прикладной сфере в начале 2026 года.
稀宇科技(MiniMax) 13 февраля выпустила MiniMax M2.5, назвав эту модель первой в мире производственной моделью, созданной специально для сценариев интеллектуальных агентов. Уже через семь дней после выпуска объем вызовов превысил 3,07 триллиона токенов. Благодаря выдающейся производительности и очень низкой стоимости в задачах программирования и рабочих потоках интеллектуальных агентов, она стала предпочтением разработчиков.
Moonshot AI 27 января выпустила KimiK2.5, которая использует нативную мультимодальную архитектуру, способную запускать до 100 “агентских копий” параллельно, повышая эффективность сложных задач в 3–10 раз. Эта модель занимает первое место во многих нишевых рейтингах (например, программирование, вызовы инструментов), а объем вызовов значительно превышает Gemini 3 и Claude. По данным Пэнпай, менее чем за месяц после выпуска, доход Kimi за 20 дней уже превысил общие доходы за весь 2025 год, что связано с ростом числа платных пользователей по всему миру и увеличением вызовов API, особенно за рубежом.
智谱 12 февраля выпустила GLM-5, модель с расширенным числом параметров и использующая разреженное внимание, специально разработанная для сложных системных инженерных задач и долгосрочных задач интеллектуальных агентов. Благодаря бесплатному доступу, окну контекста в 200K и другим преимуществам, после релиза число пользователей быстро выросло. В связи с этим, компания предприняла меры по ограничению продаж и повышению цен на Coding Plan, а в канун китайского Нового года объявила о поиске “партнеров по вычислительным мощностям” по всей сети.
По мере углубления применения AI-моделей, пользователи переходят от простых вопросов к сложным рабочим сценариям, таким как переписывание кода, редактирование файлов, создание документов, а также распространение режима интеллектуальных агентов, что приводит к явному росту потребления токенов.
Несмотря на рост производительности, отечественные модели по-прежнему выделяются соотношением цена/качество. Например, MiniMax M2.5 и Zhipu GLM-5 имеют значительное ценовое преимущество по сравнению с Claude Opus 4.6: в сегменте входных данных цена MiniMax M2.5 и GLM-5 составляет 0,3 доллара за миллион токенов, тогда как Claude Opus 4.6 — до 5 долларов, что примерно в 16,7 раз дороже; в сегменте вывода цена MiniMax M2.5 — 1,1 доллара за миллион токенов, GLM-5 — 2,55 доллара, а Claude Opus 4.6 — 25 долларов, что примерно в 22,7 и 9,8 раз дороже соответственно.
Эти отечественные модели не полностью отражают ситуацию с вызовами токенов внутри страны. Согласно данным Haitong International Securities, среднесуточный объем вызовов токенов у модели Huoshan Engine вырос с 20 триллионов в конце 2024 года до 63 триллионов к концу 2025 года; у внешних клиентов Alibaba Cloud — около 5 триллионов в день в 2025 году, а к 2026 году планируется достичь 15–20 триллионов. Внутренние бизнес-процессы планируют увеличить среднесуточные вызовы с 16–17 триллионов до 100 триллионов. В целом по отрасли, среднесуточное потребление токенов в Китае в начале 2024 года составляло 100 миллиардов, к середине 2025 года — более 30 триллионов, а к февралю 2026 года суммарное ежедневное потребление токенов крупнейших моделей достигло порядка 180 триллионов.
Последний отчет Dongguan Securities отмечает, что с ростом возможностей программирования и интеллектуальных агентов отечественных моделей их вызовы значительно увеличиваются, что способствует ускорению внедрения приложений и росту потребления токенов.
Ранее Changjiang Securities заявил, что по мере зрелости моделей для программирования и мультимодальных продуктов, реальные сценарии применения начнут активно развиваться, создавая высокий спрос на качественные токены. Анализируя развитие зарубежной индустрии AI, существует задержка примерно в два года между капиталовложениями и взрывным ростом спроса на токены. Внутренние крупные компании начали инвестировать в AI примерно на год позже зарубежных, с второй половины 2024 года. В результате доходы отечественных облачных провайдеров уже начинают расти, а настоящий взрыв спроса на токены ожидается в 2026 году.
(Источник: Цайляньшэ)