Лютневий сплеск! Обсяг викликів китайського ШІ вперше перевищив США Чотири великі моделі домінують у світовому топ-5 Внутрішні потреби у обчислювальній потужності зазнають експоненційного зростання

2月, Китайський виклик моделей ШІ вибухово зріс, вперше обійшовши США.

Дані найбільшої глобальної платформи агрегування API моделей ШІ OpenRouter показують, що з 9 по 15 число цієї тижня, китайські моделі з обсягом викликів 4,12 трильйонів токенів вперше перевищили американські моделі з 2,94 трильйона токенів у той же період.

З 16 по 22 число цей показник для китайських моделей ще більше зріс до 5,16 трильйонів токенів, що на 127% за три тижні, тоді як обсяг викликів американських моделей знизився до 2,7 трильйонів токенів. У той же час, серед п’яти найпопулярніших моделей у світі, чотири належать Китаю. Цей потужний зростаючий імпульс не залежить від окремого бестселера, а є результатом колективного підйому китайських AI-компаній.

Token — це найменша одиниця обробки тексту моделлю ШІ. У порівнянні з кількістю користувачів, обсяг викликів Token є більш точним показником реальної інтенсивності використання моделей, залученості користувачів та комерційної цінності.

Китайські виробники моделей ШІ, завдяки швидкій ітерації та конкурентним витратам, захоплюють світовий ринок, а внутрішній попит на обчислювальні ресурси зростає експоненційно.

Перестановка у рейтингу: китайські Token виклики вперше перевищили американські, чотири великі моделі домінують

Платформа OpenRouter об’єднує сотні великих мовних моделей з усього світу, має понад 5 мільйонів розробників-користувачів і є найбільшою у світі платформою агрегування API моделей ШІ. Тому її дані про виклики API вважаються найчіткішим індикатором глобальних трендів впровадження AI, оскільки вони безпосередньо відображають вибір розробників, що “голосують ногами”, і показують популярність та конкурентоспроможність моделей у реальних застосуваннях.

Звертає на себе увагу, що основна частина користувачів цієї платформи — закордонні розробники, з яких американські користувачі становлять 47,17%, а китайські — лише 6,01%, що дозволяє більш об’єктивно оцінити реальну привабливість китайських моделей у світі.

Журналіст «Daily Economic News» (далі — кожен день) проаналізував дані OpenRouter і виявив, що за минулий рік глобальний обсяг Token викликів моделей значно зріс. З 3 по 9 березня 2025 року, у періоді топ-10 моделей платформи, обсяг викликів становив лише 1,24 трильйона токенів. До середини лютого 2026 року ця цифра зросла до 13,95 трильйонів токенів, що більш ніж у 10 разів за менше ніж рік.

У 2025 році основним драйвером зростання був американський ринок, де обсяг викликів Token у тиждень займав майже 70% від загальної кількості топ-10 моделей платформи, тоді як китайські моделі займали менше 20%. Однак, у 2026 році темпи зростання американських моделей почали спадати, а китайські — стрімко зростати.

Дані показують, що у перший тиждень лютого 2026 року (з 2 по 8 число) обсяг викликів китайських моделей досяг 2,27 трильйонів токенів, що сигналізує про потужний натиск.

Лише через тиждень, у тиждень з 9 по 15 лютого, китайські моделі з обсягом 4,12 трильйонів токенів вперше перевищили американські з 2,94 трильйона, досягнувши історичного рекорду.

Цей тренд не зупинився. У тиждень з 16 по 22 лютого обсяг викликів китайських моделей ще більше зріс до 5,16 трильйонів токенів, що за три тижні становить зростання на 127%, і ще більше закріпило їх лідерство.

Цей потужний імпульс зростання не залежить від окремого бестселера, а є результатом колективного підйому китайських AI-компаній.

Згідно з даними за тиждень з 16 по 22 лютого 2026 року, чотири з п’яти найпопулярніших моделей у світі належать китайським компаніям: MiniMax M2.5, Kimi K2.5 від Yue Zhi An, GLM-5 від Zhipu, та V3.2 від DeepSeek. Ці чотири моделі разом становлять 85,7% від загального обсягу викликів у топ-5.

Зокрема, MiniMax випустила модель M2.5 13 лютого 2026 року, і менш ніж за тиждень вона швидко зайняла перше місце за обсягом викликів. У тиждень з 9 по 15 лютого, з усього обсягу викликів платформи у 3,21 трильйона токенів, модель M2.5 забезпечила 1,44 трильйона — значний внесок.

Модель Kimi K2.5 від Yue Zhi An, випущена 27 січня, завдяки своїй багатомодальній архітектурі та потужним можливостям паралельної обробки агентів, демонструє безперервне зростання викликів. Вона може керувати до 100 “агентських копій” одночасно, підвищуючи ефективність обробки складних завдань у 3–10 разів. За повідомленнями, за менш ніж місяць після запуску Kimi K2.5 її загальний дохід уже перевищив річний показник 2025 року, що зумовлено зростанням платних користувачів і викликів API.

Флагманська модель GLM-5 від Zhipu, запущена 12 лютого, з урахуванням її 200K довжини контексту та глибокої оптимізації довгострокових завдань, швидко зросла до 0,8 трильйона токенів у перший тиждень.

За минулий рік, хоча модель Alibaba Qianwen не часто входила до топу, спільний звіт а16z і OpenRouter показує, що її серія моделей має сумарний обсяг викликів 5,59 трильйона токенів, посідаючи друге місце у світі після DeepSeek з 14,37 трильйона.

Згідно з дослідженням Frost & Sullivan, у другій половині 2025 року, в сегменті B2B китайських великих моделей, Qwen серія займала 32,1% у середньодобовому обсязі викликів токенів, що майже вдвічі більше ніж у першій половині року (17,7%), і значно випереджала ByteDance (21,3%) та DeepSeek (18,4%).

Щодо структури ринку великих моделей ШІ у Китаї, професор Шанхайського фінансового університету Ху Янпін у інтерв’ю кожен день висловив ідею “AI-спільноти Китаю”.

Він вважає, що концентрація ринку не є обов’язково позитивною, і що наявність кількох провідних компаній у широкому технічному та промисловому колі сприяє конкуренції, інноваціям і розвитку талантів, а також створює колективну перевагу у глобальній конкуренції США і Китаю.

Відомий венчурний інвестор, партнер Andreessen Horowitz (a16z) Мартін Касадо зазначає, що у сучасних стартапах у Кремнієвій долині, що шукають фінансування, до 80% основних моделей для презентацій — китайські відкриті моделі.

Конкурентоспроможність: чому китайські Token дешевші за американські — менше ніж у 1/10?

Китайські моделі змогли швидко захопити світовий ринок завдяки не лише високій продуктивності, що конкурує або перевищує найкращі міжнародні моделі, а й надзвичайно низьким витратам, що є беззаперечним ключовим перевагою.

Наприклад, ціни на платформі OpenRouter показують очевидну перевагу китайських моделей.

На етапі обробки вхідної інформації (Input), MiniMax M2.5 і Zhipu GLM-5 коштують 0,3 долара за мільйон токенів. Для порівняння, популярний західний аналог Claude Opus4.6 коштує 5 доларів за мільйон токенів — у 16,7 разів дорожче.

На етапі генерації вихідного контенту (Output), ціна MiniMax M2.5 становить 1,1 долара за мільйон токенів, Zhipu GLM-5 — 2,55 долара, тоді як Claude Opus4.6 — 25 доларів, що у 22,7 і 9,8 разів дорожче відповідно.

Такий значний розрив у цінах безпосередньо впливає на економічний вибір розробників API.

Цей різкий розрив у вартості зумовлений, перш за все, архітектурними інноваціями на рівні алгоритмів.

Директор Frost & Sullivan у Китаї Лі Цін зазначає, що технологічний підхід із використанням архітектури “мішаних експертів” (Mixture-of-Experts, MoE) — один із головних чинників, що дозволяє китайським моделям значно знизити витрати на обчислення. Зараз у списку є моделі DeepSeek, Alibaba 通义千问3.5-Plus, які широко застосовують архітектуру MoE.

Суть MoE полягає у тому, що великий модельний блок розбивається на кілька менших “експертних мереж” і один “керуючий блок”. Хоча загальна кількість параметрів може бути дуже великою (тисячі мільярдів), модель зберігає “запаси знань” і здатність, а при виконанні конкретного завдання керуючий блок визначає, які експертні мережі активувати, і викликає лише найрелевантніші.

Ця “активація за потребою”, у порівнянні з традиційною щільною моделлю, що викликає всі параметри, значно зменшує обчислювальні навантаження і потребу у ресурсах. Дані показують, що застосування MoE знижує використання пам’яті відеокарти на 60% і підвищує пропускну здатність у 19 разів. Це — основна причина їхньої низької вартості.

Крім архітектурних інновацій, китайські AI-компанії активно досліджують шлях “вертикальної інтеграції”, щоб ще більше знизити вартість кожного Token. Ідея полягає у глибокій, інтегрованій розробці та оптимізації верхнього рівня моделей, хмарної інфраструктури і AI-чипів, що дозволяє вирішити проблеми сумісності між софтом і залізом і максимально використовувати обчислювальні ресурси.

Лі Цін на прикладі системи Alibaba “通义-云-芯” пояснює, що така вертикальна інтеграція дозволяє за допомогою передових алгоритмів розподілу обчислень максимально ефективно використовувати апаратні ресурси і знижувати інфраструктурні витрати. Це системне оптимізування знижує вартість генерації Token.

Морган Стенлі у своєму аналітичному звіті дає дуже оптимістичний прогноз для ринку Китаю: з 2025 по 2030 рік, річний темп зростання споживання Token у Китаї становитиме 330%, і за 5 років воно зросте у 370 разів.

Зміна цінностей: Token стає “пальним” у епоху AI, а не просто “трафіком”

Експоненційне зростання споживання Token виглядає як результат зростання кількості користувачів і тривалості використання, але за цим стоїть глибша зміна у моделях використання AI. AI перетворюється з простого інструменту для відповідей і розваг у “продуктивний інструмент”, здатний глибоко інтегруватися у робочі процеси і виконувати складні завдання.

У недавньому звіті “Міжнародної фінансової корпорації” (МФК) введено поняття “інфляції Token”. Це не означає зростання ціни Token, а структурне збільшення їх споживання в одиницю часу і користувача. Це зумовлено трьома ключовими тенденціями.

По-перше, основні потреби користувачів переходять від поверхневого “запитання-відповіді” до глибшої “роботи”, наприклад, переписування коду, редагування файлів, створення документів і тестування. Програмні сценарії мають “довгий контекст”, багатоетапну обробку і великий обсяг вихідних даних, що значно споживає Token.

По-друге, зростання популярності AI Agent’ів збільшує споживання Token. Агент планує, шукає, виконує, рефлексує, багаторазово викликає модель, і кожен крок збільшує споживання Token.

По-третє, з підвищенням рівня складності обчислень і довжиною ланцюгів логіки, зростає і споживання Token у процесі глибокого аналізу і генерації. Але для користувачів це означає вищу ймовірність успіху і менше повторних робіт, і вони готові вкладати більше Token для підвищення ефективності.

Ці зміни означають, що Token — це вже не “трафік” із нульовою маржею, як у традиційному інтернеті, а “паливо” для виконання виробничих завдань у епоху AI.

Ця тенденція збігається з думкою провідних світових виробників чипів. Генеральний директор Nvidia Jensen Huang 26 лютого на фінансовій конференції повторював: “Обчислення — це дохід”, “Розрахунок — це дохід”. Він підкреслював, що без обчислювальної потужності не можна генерувати Token, а без Token — не буде зростання доходів. У епоху AI продуктивність розрахунків безпосередньо визначає здатність клієнтів отримувати дохід, і головне у цьому — ефективне створення комерційних Token. У світі, де енергетичні обмеження дата-центрів зростають, “продуктивність/ват” стала ключовим показником ефективності AI-сервісів і доходів.

Лі Цін зазначає, що бізнес-модель AI-сервісів поступово переходить від простого “оплати за використання” до гібридної моделі “паливо + результат”. З одного боку, ціна Token з часом знижується завдяки технологічним досягненням і масштабам. З іншого — з переходом AI від “інструменту відповідей” до “продуктивного інструменту”, компанії будуть більш схильні платити за “конкретний результат”, що сприятиме розвитку підписних моделей.

Лі Цін прогнозує, що у майбутньому ціноутворення AI-сервісів стане більш гнучким і індивідуальним. Вона вважає, що з появою агента, завдання будуть різноманітними за складністю, і єдиний ціновий підхід вже не підходить. Майбутнє — це багатовимірна і динамічна система ціноутворення, що враховує обсяг обчислень, частоту викликів, складність завдань і багато інших факторів.

(Джерело: Daily Economic News)

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити