Guolian Minsheng Securities: Попит на токени в умовах "інфляції" Короткострокове спостереження за підвищенням цін великих виробників моделей та граничним покращенням, викликаним попитом
Згідно з даними APP «Zhìtōng Cáijīng», компанія Guolian Minsheng Securities опублікувала аналітичний звіт, у якому зазначено, що хмарні обчислення поступово перетворюються з «продажу ресурсів» у «продаж токенів + продаж результатів». Підвищення цін на GLM Coding Plan від компанії Zhipu (02513) відображає зміну логіки ціноутворення в галузі: коли обчислювальні ресурси стають виробничим матеріалом для логіки, виробники моделей мають можливість перетворити «дефіцит обчислювальної потужності» у прибуток і грошовий потік через багаторівневе ціноутворення та підписні продукти. У короткостроковій перспективі спостерігається покращення через підвищення цін і попит (інфляція токенів), у середньостроковій — слідкувати за залученням клієнтів і утриманням підписників для повторних платежів і розширення, у довгостроковій — позитивно оцінюється поширення інструментів управління, що створює новий ринок «AI-фаєрволів».
Основні положення Guolian Minsheng Securities такі:
Подія: 12 лютого компанія Zhipu офіційно оголосила про підвищення ціни на підписку GLM Coding Plan щонайменше на 30%.
Раніше, іноземні провайдери хмарних послуг цього місяця також підвищили ціни: Google Cloud у Північній Америці підняв ціну на 100%, у Європі та Азії — також одночасно; AWS підвищив ціну приблизно на 15%. Загалом, попит на токени «інфляція» сприяє не лише хмарним обчисленням, а й надає виробникам моделей можливість впливати на цінову політику.
Зміни у традиційному безкоштовному інтернеті
Типовий шлях традиційного інтернет-програмного забезпечення — спочатку залучення користувачів через безкоштовний доступ, щоб отримати «кількість і тривалість користування», потім монетизація через рекламу, підписки, додаткові послуги та комісії з транзакцій. Основна причина безкоштовності — дуже низькі маргінальні витрати. Тобто кожен додатковий користувач або кліки зменшують витрати за рахунок ефекту масштабування пропускної здатності та зберігання, що робить їх майже нульовими.
У епоху хмарних обчислень також був схожий підхід «спочатку безкоштовно/низька ціна — потім розширення», але швидко одиниці обліку змінилися на CPU/зберігання/пропускну здатність/кількість запитів, і клієнти звикли платити за обсяг. Оплата за хмару можлива, оскільки вона надає чітко визначені ресурси та SLA (угода про рівень обслуговування). Однак, коли галузь ще перебуває у «ціновій війні моделей», Zhipu почав сигналізувати про підвищення цін, що означає, що у епоху великих моделей одиниці виміру змінюються з трафіку (DAU/час) на токени (обчислювальні витрати на推理), і споживання токенів стає необхідністю у все більшій кількості сценаріїв.
Зміни у епоху великих моделей: токени стають «вимірюваним виробничим ресурсом», а не «безкоштовним трафіком»
Великі моделі перетворюють «діалог/писання коду/генерація контенту», які раніше вважалися сервісами від постачальників програмного забезпечення, у онлайн-послуги, що сильно залежать від обчислювальної потужності. Для виробників моделей кожен відповідь вимагає реальних витрат GPU, пам’яті, пропускної здатності та електроенергії; для користувачів кожне «дозвольте моделі подумати ще трохи, напишіть довший код, виконайте складніше завдання» — це додаткові витрати токенів, тому токени природно стають новою мірою. Раніше через зростання користувачів Zhipu вводив обмеження на кількість використання Coding Plan, що стало класичним ланцюгом попиту і пропозиції: різке зростання попиту → жорсткі обмеження ресурсів (обмеження потоку/кількості) → підвищення цін.
Коли виникає пікове навантаження і дефіцит ресурсів, підвищення цін — це механізм відбору попиту, що краще захищає досвід користувачів, ніж «безвідбіркове обмеження потоку». Витрати виробників моделей залишаються тісно пов’язаними з постачанням GPU, рівнем використання та оптимізацією推理; більш раціональне багаторівневе ціноутворення допомагає виробникам уникнути пастки «чим більша масштабність — тим більше збитків», підвищуючи маржу і якість грошового потоку.
Попит на токени у контексті «інфляції»
«Інфляція токенів» — не означає, що самі токени дорожчають, а що структура споживання токенів на одиницю часу і користувача зростає системно. Основні причини високого попиту на токени:
З «відповідей» у «роботу»: розвиток моделей довів, що користувачі вже не задоволені простими відповідями, а вимагають, щоб модель переписувала код, редагувала файли, генерувала документацію і тестувала. У сценаріях програмування характерна «довга контекстна історія, багатоетапна взаємодія, великий обсяг вихідних даних», що значно збільшує споживання токенів. Zhipu підтверджує, що розробники активно використовують моделі для підтримки кодування, що швидко зростає споживання токенів.
З «одиного раунду» до «багатокрокових агентів»: Zhipu позиціонує GLM-5 як нове покоління моделей для сценаріїв кодування і агентів; 12 лютого MiniMax-WP (00100) офіційно запустив найновішу флагманську модель для програмування M2.5, яка є першою у світі моделлю, створеною спеціально для сценаріїв агентів. M2.5 поєднує програмування та інтелектуальні агенти (Coding&Agentic), що активно планують, шукають, виконують і рефлексують, багаторазово викликаючи модель, а споживання токенів зростає по кроках.
Зростання інтенсивності推理: глибше мислення і довші ланцюги推理 значно підвищують витрати токенів на вихід і проміжні етапи. Для розробників це означає вищий рівень успішності і менше повторної роботи, користувачі ж готові «спалювати більше токенів заради більшої ефективності».
Це означає, що токени — це не просто «трафік» з нульовими маргінальними витратами, як у традиційному інтернеті, а необхідний «паливо» для виробничих завдань.
Рекомендації для інвестицій
Хмарні обчислення поступово перетворюються з «продажу ресурсів» у «продаж токенів + результатів». Підвищення цін на GLM Coding Plan від Zhipu відображає зміну логіки ціноутворення в галузі: коли推理 стає виробничим ресурсом, виробники моделей можуть перетворити «дефіцит обчислювальної потужності» у прибуток і грошовий потік через багаторівневе ціноутворення і підписні продукти. Рекомендується слідкувати за:
Постачальниками хмарних сервісів і інфраструктурою: AI стимулює зростання IT-витрат і інвестицій у інфраструктуру, зокрема GPU, зберігання і мережеві I/O, що триватиме у підйомі.
Виробниками великих моделей: коли вони зможуть підтримувати підписки і розширювати корпоративні клієнтські сегменти у високорентабельних сценаріях, таких як програмування, агенти і бізнес-процеси, і перетворювати «споживання токенів» у цінність «економії часу і зусиль», вони зможуть подолати цінову конкуренцію і відкривати нові можливості.
Інструментами безпеки і управління: з поширенням AI у робочих процесах зростає ризик витоку даних і порушення прав доступу, що зробить «платформи безпеки AI/інструменти управління» необхідністю.
У короткостроковій перспективі — підвищення цін і попит (інфляція токенів) покращують ситуацію; у середньостроковій — слідкувати за залученням клієнтів і утриманням підписників для повторних платежів і розширення; у довгостроковій — поширення інструментів управління створює новий ринок «AI-фаєрволів».
Ризики:
Зміни у технологічних підходах мають невизначеність; посилення конкуренції у галузі.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Guolian Minsheng Securities: Попит на токени в умовах "інфляції" Короткострокове спостереження за підвищенням цін великих виробників моделей та граничним покращенням, викликаним попитом
Згідно з даними APP «Zhìtōng Cáijīng», компанія Guolian Minsheng Securities опублікувала аналітичний звіт, у якому зазначено, що хмарні обчислення поступово перетворюються з «продажу ресурсів» у «продаж токенів + продаж результатів». Підвищення цін на GLM Coding Plan від компанії Zhipu (02513) відображає зміну логіки ціноутворення в галузі: коли обчислювальні ресурси стають виробничим матеріалом для логіки, виробники моделей мають можливість перетворити «дефіцит обчислювальної потужності» у прибуток і грошовий потік через багаторівневе ціноутворення та підписні продукти. У короткостроковій перспективі спостерігається покращення через підвищення цін і попит (інфляція токенів), у середньостроковій — слідкувати за залученням клієнтів і утриманням підписників для повторних платежів і розширення, у довгостроковій — позитивно оцінюється поширення інструментів управління, що створює новий ринок «AI-фаєрволів».
Основні положення Guolian Minsheng Securities такі:
Подія: 12 лютого компанія Zhipu офіційно оголосила про підвищення ціни на підписку GLM Coding Plan щонайменше на 30%.
Раніше, іноземні провайдери хмарних послуг цього місяця також підвищили ціни: Google Cloud у Північній Америці підняв ціну на 100%, у Європі та Азії — також одночасно; AWS підвищив ціну приблизно на 15%. Загалом, попит на токени «інфляція» сприяє не лише хмарним обчисленням, а й надає виробникам моделей можливість впливати на цінову політику.
Зміни у традиційному безкоштовному інтернеті
Типовий шлях традиційного інтернет-програмного забезпечення — спочатку залучення користувачів через безкоштовний доступ, щоб отримати «кількість і тривалість користування», потім монетизація через рекламу, підписки, додаткові послуги та комісії з транзакцій. Основна причина безкоштовності — дуже низькі маргінальні витрати. Тобто кожен додатковий користувач або кліки зменшують витрати за рахунок ефекту масштабування пропускної здатності та зберігання, що робить їх майже нульовими.
У епоху хмарних обчислень також був схожий підхід «спочатку безкоштовно/низька ціна — потім розширення», але швидко одиниці обліку змінилися на CPU/зберігання/пропускну здатність/кількість запитів, і клієнти звикли платити за обсяг. Оплата за хмару можлива, оскільки вона надає чітко визначені ресурси та SLA (угода про рівень обслуговування). Однак, коли галузь ще перебуває у «ціновій війні моделей», Zhipu почав сигналізувати про підвищення цін, що означає, що у епоху великих моделей одиниці виміру змінюються з трафіку (DAU/час) на токени (обчислювальні витрати на推理), і споживання токенів стає необхідністю у все більшій кількості сценаріїв.
Зміни у епоху великих моделей: токени стають «вимірюваним виробничим ресурсом», а не «безкоштовним трафіком»
Великі моделі перетворюють «діалог/писання коду/генерація контенту», які раніше вважалися сервісами від постачальників програмного забезпечення, у онлайн-послуги, що сильно залежать від обчислювальної потужності. Для виробників моделей кожен відповідь вимагає реальних витрат GPU, пам’яті, пропускної здатності та електроенергії; для користувачів кожне «дозвольте моделі подумати ще трохи, напишіть довший код, виконайте складніше завдання» — це додаткові витрати токенів, тому токени природно стають новою мірою. Раніше через зростання користувачів Zhipu вводив обмеження на кількість використання Coding Plan, що стало класичним ланцюгом попиту і пропозиції: різке зростання попиту → жорсткі обмеження ресурсів (обмеження потоку/кількості) → підвищення цін.
Коли виникає пікове навантаження і дефіцит ресурсів, підвищення цін — це механізм відбору попиту, що краще захищає досвід користувачів, ніж «безвідбіркове обмеження потоку». Витрати виробників моделей залишаються тісно пов’язаними з постачанням GPU, рівнем використання та оптимізацією推理; більш раціональне багаторівневе ціноутворення допомагає виробникам уникнути пастки «чим більша масштабність — тим більше збитків», підвищуючи маржу і якість грошового потоку.
Попит на токени у контексті «інфляції»
«Інфляція токенів» — не означає, що самі токени дорожчають, а що структура споживання токенів на одиницю часу і користувача зростає системно. Основні причини високого попиту на токени:
З «відповідей» у «роботу»: розвиток моделей довів, що користувачі вже не задоволені простими відповідями, а вимагають, щоб модель переписувала код, редагувала файли, генерувала документацію і тестувала. У сценаріях програмування характерна «довга контекстна історія, багатоетапна взаємодія, великий обсяг вихідних даних», що значно збільшує споживання токенів. Zhipu підтверджує, що розробники активно використовують моделі для підтримки кодування, що швидко зростає споживання токенів.
З «одиного раунду» до «багатокрокових агентів»: Zhipu позиціонує GLM-5 як нове покоління моделей для сценаріїв кодування і агентів; 12 лютого MiniMax-WP (00100) офіційно запустив найновішу флагманську модель для програмування M2.5, яка є першою у світі моделлю, створеною спеціально для сценаріїв агентів. M2.5 поєднує програмування та інтелектуальні агенти (Coding&Agentic), що активно планують, шукають, виконують і рефлексують, багаторазово викликаючи модель, а споживання токенів зростає по кроках.
Зростання інтенсивності推理: глибше мислення і довші ланцюги推理 значно підвищують витрати токенів на вихід і проміжні етапи. Для розробників це означає вищий рівень успішності і менше повторної роботи, користувачі ж готові «спалювати більше токенів заради більшої ефективності».
Це означає, що токени — це не просто «трафік» з нульовими маргінальними витратами, як у традиційному інтернеті, а необхідний «паливо» для виробничих завдань.
Рекомендації для інвестицій
Хмарні обчислення поступово перетворюються з «продажу ресурсів» у «продаж токенів + результатів». Підвищення цін на GLM Coding Plan від Zhipu відображає зміну логіки ціноутворення в галузі: коли推理 стає виробничим ресурсом, виробники моделей можуть перетворити «дефіцит обчислювальної потужності» у прибуток і грошовий потік через багаторівневе ціноутворення і підписні продукти. Рекомендується слідкувати за:
Постачальниками хмарних сервісів і інфраструктурою: AI стимулює зростання IT-витрат і інвестицій у інфраструктуру, зокрема GPU, зберігання і мережеві I/O, що триватиме у підйомі.
Виробниками великих моделей: коли вони зможуть підтримувати підписки і розширювати корпоративні клієнтські сегменти у високорентабельних сценаріях, таких як програмування, агенти і бізнес-процеси, і перетворювати «споживання токенів» у цінність «економії часу і зусиль», вони зможуть подолати цінову конкуренцію і відкривати нові можливості.
Інструментами безпеки і управління: з поширенням AI у робочих процесах зростає ризик витоку даних і порушення прав доступу, що зробить «платформи безпеки AI/інструменти управління» необхідністю.
У короткостроковій перспективі — підвищення цін і попит (інфляція токенів) покращують ситуацію; у середньостроковій — слідкувати за залученням клієнтів і утриманням підписників для повторних платежів і розширення; у довгостроковій — поширення інструментів управління створює новий ринок «AI-фаєрволів».
Ризики:
Зміни у технологічних підходах мають невизначеність; посилення конкуренції у галузі.