Guolian Minsheng Securities: Спрос на токены в условиях «инфляции» — краткосрочный обзор влияния повышения цен крупными производителями моделей и связанного с этим прироста спроса
Информационное приложение Чжитун Цзицай сообщает, что Guolian Minsheng Securities опубликовала аналитический отчет, в котором говорится, что облачные вычисления постепенно превращаются из «продажи ресурсов», а производители больших моделей становятся «продавцами токенов и результатов». Повышение цен на план Coding Plan компании Zhipu (02513) отражает изменение логики ценообразования в отрасли: когда推理 становится производственным материалом, производители моделей получают возможность превращать «дефицит вычислительной мощности» в прибыль и денежные потоки через многоуровневое ценообразование и подписочные продукты. В краткосрочной перспективе наблюдается улучшение за счет повышения цен и спроса (инфляции токенов), в среднесрочной — отслеживание корпоративных долей и удержания подписчиков, что способствует повторным платежам и расширению. В долгосрочной перспективе ожидается рост рынка «AI-фаерволов» за счет популяризации инструментов управления.
Основные точки зрения Guolian Minsheng Securities следующие:
Событие: 12 февраля Zhipu официально объявила о повышении цены подписки на GLM Coding Plan как минимум на 30%.
Ранее, зарубежные облачные провайдеры также повысили цены в этом месяце, например Google Cloud в Северной Америке подняла цены на 100%, а в Европе и Азии — также повысила; одновременно AWS увеличила цены примерно на 15%. В целом, спрос на токены «инфляции» не только благоприятствует облачным вычислениям, но и дает производителям моделей возможность влиять на ценообразование.
Переход от традиционного бесплатного интернета к новой модели
Типичный путь традиционного интернет-программного обеспечения — сначала привлечение пользователей за счет бесплатных услуг, чтобы получить «власть переговоров» за счет количества и времени использования, а затем монетизация через рекламу, подписки, дополнительные услуги и комиссии за транзакции. Основная причина бесплатности — очень низкая предельная стоимость. То есть каждый дополнительный пользователь или клик обходится очень дешево за счет масштабов пропускной способности и хранения, что делает предельные издержки практически нулевыми.
В эпоху облачных вычислений также возникали подобные модели «бесплатно/низкая цена — расширение», однако единицы измерения стоимости быстро сместились на CPU, хранилище, пропускную способность и количество запросов, и клиенты привыкли к модели «по мере использования». Облачные услуги могут взимать плату, потому что предоставляют конкретные ресурсы и SLA (соглашение об уровне обслуживания). Но когда отрасль все еще находится в «ценовой войне моделей», Zhipu подает сигналы о повышении цен, что означает, что в эпоху больших моделей единицей измерения становится не трафик (DAU/время), а токены (расходы на推理), которые в все большем числе сценариев становятся необходимостью.
Изменения в эпоху больших моделей: токены превращаются в «измеримый производственный ресурс», а не в «бесплатный трафик»
Большие модели превращают «диалоги/написание кода/генерацию контента», которые казались услугами поставщиков программного обеспечения, в онлайн推理, сильно зависящий от вычислительных ресурсов. Для производителей моделей каждый ответ требует реальных затрат GPU, видеопамяти, пропускной способности и электроэнергии; для пользователей каждый раз, когда они «заставляют модель подумать дольше, написать более длинный код или выполнить более сложную задачу», расходуются токены, что делает их естественной новой мерой. Ранее Zhipu ограничила продажу Coding Plan из-за роста числа пользователей и нехватки вычислительных ресурсов, что создало типичную цепочку спроса и предложения: резкий рост спроса → жесткое ограничение ресурсов (ограничение потока/количества) → повышение цен.
Когда в пиковые периоды возникает перегрузка и нехватка ресурсов, повышение цен служит механизмом фильтрации спроса, лучше защищая пользовательский опыт, чем «безразличное ограничение потока». Кроме того, издержки производителей моделей все еще связаны с поставками GPU, уровнем использования и оптимизацией推理, а повышение цен и более рациональное многоуровневое ценообразование помогают вывести производителей из ловушки «чем больше масштаб — тем больше убытков», повышая прибыль и качество денежного потока.
Спрос на токены в условиях «инфляции»
«Инфляция токенов» — не означает, что сами токены становятся дороже, а что структура их расхода на единицу времени и пользователя систематически возрастает. Высокий спрос на токены обусловлен несколькими причинами:
От «ответов» к «выполнению задач»: развитие моделей привело к тому, что пользователи перестали довольствоваться простыми ответами и начали требовать, чтобы модели переписывали код, редактировали файлы, генерировали документы и запускали тесты. В программных сценариях характерна «длинная цепочка контекста, многократные итерации, большой объем вывода», что требует значительных затрат токенов. Также, как подтверждает Zhipu, разработчики используют модели для поддержки кодирования, что быстро увеличивает расход токенов.
От «один вопрос — один ответ» к «многократным взаимодействиям с агентами»: Zhipu позиционирует GLM-5 как модель нового поколения для сценариев программирования и агентов; 12 февраля MiniMax-WP (00100) объявила о запуске M2.5 — первой в мире производственной модели, специально созданной для сценариев агентов. Модель M2.5 для программирования и интеллектуальных агентов (Coding&Agentic) напрямую сравнима с Claude Opus 4.6. Агент активно планирует, ищет, выполняет, рефлексирует, многократно вызывает модель, и расход токенов естественно накапливается по шагам.
Рост интенсивности推理: более глубокое мышление и длинные цепочки推理 значительно увеличивают расход токенов на вывод и промежуточные этапы. Для разработчиков это повышает вероятность успеха и уменьшает переработки, а пользователи готовы «жечь больше токенов ради повышения эффективности».
Это означает, что токены — это не просто «трафик» с нулевыми предельными издержками, как в традиционном интернете, а «топливо», необходимое для выполнения производственных задач.
Инвестиционные рекомендации
Облачные вычисления постепенно превращаются из «продажи ресурсов» в «продажу токенов и результатов». Повышение цен на Zhipu GLM Coding Plan отражает изменение логики ценообразования в отрасли: когда推理 становится производственным ресурсом, производители моделей могут превращать «дефицит вычислительной мощности» в прибыль и денежные потоки через многоуровневое ценообразование и подписочные продукты. Рекомендуется продолжать следить за:
Облачными провайдерами и инфраструктурой: инвестиции в ИТ и инфраструктуру, стимулируемые развитием AI, продолжают расти, и облачные компании выиграют за счет увеличения спроса на GPU, хранилище и сетевые ресурсы.
Производителями больших моделей: когда они смогут удерживать подписки и расширять корпоративные доли в сценариях программирования, агентов и бизнес-процессов, превращая «использование токенов» в стабильную доставку ценности — экономию времени и труда — они смогут преодолеть ценовые войны и открывать новые возможности.
Инструменты безопасности и защиты в реальном времени: по мере внедрения AI в рабочие процессы, риски утечки данных и злоупотреблений станут стимулом для развития «платформ безопасности/государственного регулирования AI», что станет необходимым.
Краткосрочно — повышение цен и спрос (инфляция токенов) дают краткосрочные преимущества, в среднесрочной — отслеживание корпоративных долей и удержания подписчиков для повторных платежей и расширения, в долгосрочной — рост рынка «AI-фаерволов» за счет популяризации инструментов управления.
Риски
Технологические изменения сопряжены с неопределенностью; усиление конкуренции в отрасли.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
Guolian Minsheng Securities: Спрос на токены в условиях «инфляции» — краткосрочный обзор влияния повышения цен крупными производителями моделей и связанного с этим прироста спроса
Информационное приложение Чжитун Цзицай сообщает, что Guolian Minsheng Securities опубликовала аналитический отчет, в котором говорится, что облачные вычисления постепенно превращаются из «продажи ресурсов», а производители больших моделей становятся «продавцами токенов и результатов». Повышение цен на план Coding Plan компании Zhipu (02513) отражает изменение логики ценообразования в отрасли: когда推理 становится производственным материалом, производители моделей получают возможность превращать «дефицит вычислительной мощности» в прибыль и денежные потоки через многоуровневое ценообразование и подписочные продукты. В краткосрочной перспективе наблюдается улучшение за счет повышения цен и спроса (инфляции токенов), в среднесрочной — отслеживание корпоративных долей и удержания подписчиков, что способствует повторным платежам и расширению. В долгосрочной перспективе ожидается рост рынка «AI-фаерволов» за счет популяризации инструментов управления.
Основные точки зрения Guolian Minsheng Securities следующие:
Событие: 12 февраля Zhipu официально объявила о повышении цены подписки на GLM Coding Plan как минимум на 30%.
Ранее, зарубежные облачные провайдеры также повысили цены в этом месяце, например Google Cloud в Северной Америке подняла цены на 100%, а в Европе и Азии — также повысила; одновременно AWS увеличила цены примерно на 15%. В целом, спрос на токены «инфляции» не только благоприятствует облачным вычислениям, но и дает производителям моделей возможность влиять на ценообразование.
Переход от традиционного бесплатного интернета к новой модели
Типичный путь традиционного интернет-программного обеспечения — сначала привлечение пользователей за счет бесплатных услуг, чтобы получить «власть переговоров» за счет количества и времени использования, а затем монетизация через рекламу, подписки, дополнительные услуги и комиссии за транзакции. Основная причина бесплатности — очень низкая предельная стоимость. То есть каждый дополнительный пользователь или клик обходится очень дешево за счет масштабов пропускной способности и хранения, что делает предельные издержки практически нулевыми.
В эпоху облачных вычислений также возникали подобные модели «бесплатно/низкая цена — расширение», однако единицы измерения стоимости быстро сместились на CPU, хранилище, пропускную способность и количество запросов, и клиенты привыкли к модели «по мере использования». Облачные услуги могут взимать плату, потому что предоставляют конкретные ресурсы и SLA (соглашение об уровне обслуживания). Но когда отрасль все еще находится в «ценовой войне моделей», Zhipu подает сигналы о повышении цен, что означает, что в эпоху больших моделей единицей измерения становится не трафик (DAU/время), а токены (расходы на推理), которые в все большем числе сценариев становятся необходимостью.
Изменения в эпоху больших моделей: токены превращаются в «измеримый производственный ресурс», а не в «бесплатный трафик»
Большие модели превращают «диалоги/написание кода/генерацию контента», которые казались услугами поставщиков программного обеспечения, в онлайн推理, сильно зависящий от вычислительных ресурсов. Для производителей моделей каждый ответ требует реальных затрат GPU, видеопамяти, пропускной способности и электроэнергии; для пользователей каждый раз, когда они «заставляют модель подумать дольше, написать более длинный код или выполнить более сложную задачу», расходуются токены, что делает их естественной новой мерой. Ранее Zhipu ограничила продажу Coding Plan из-за роста числа пользователей и нехватки вычислительных ресурсов, что создало типичную цепочку спроса и предложения: резкий рост спроса → жесткое ограничение ресурсов (ограничение потока/количества) → повышение цен.
Когда в пиковые периоды возникает перегрузка и нехватка ресурсов, повышение цен служит механизмом фильтрации спроса, лучше защищая пользовательский опыт, чем «безразличное ограничение потока». Кроме того, издержки производителей моделей все еще связаны с поставками GPU, уровнем использования и оптимизацией推理, а повышение цен и более рациональное многоуровневое ценообразование помогают вывести производителей из ловушки «чем больше масштаб — тем больше убытков», повышая прибыль и качество денежного потока.
Спрос на токены в условиях «инфляции»
«Инфляция токенов» — не означает, что сами токены становятся дороже, а что структура их расхода на единицу времени и пользователя систематически возрастает. Высокий спрос на токены обусловлен несколькими причинами:
От «ответов» к «выполнению задач»: развитие моделей привело к тому, что пользователи перестали довольствоваться простыми ответами и начали требовать, чтобы модели переписывали код, редактировали файлы, генерировали документы и запускали тесты. В программных сценариях характерна «длинная цепочка контекста, многократные итерации, большой объем вывода», что требует значительных затрат токенов. Также, как подтверждает Zhipu, разработчики используют модели для поддержки кодирования, что быстро увеличивает расход токенов.
От «один вопрос — один ответ» к «многократным взаимодействиям с агентами»: Zhipu позиционирует GLM-5 как модель нового поколения для сценариев программирования и агентов; 12 февраля MiniMax-WP (00100) объявила о запуске M2.5 — первой в мире производственной модели, специально созданной для сценариев агентов. Модель M2.5 для программирования и интеллектуальных агентов (Coding&Agentic) напрямую сравнима с Claude Opus 4.6. Агент активно планирует, ищет, выполняет, рефлексирует, многократно вызывает модель, и расход токенов естественно накапливается по шагам.
Рост интенсивности推理: более глубокое мышление и длинные цепочки推理 значительно увеличивают расход токенов на вывод и промежуточные этапы. Для разработчиков это повышает вероятность успеха и уменьшает переработки, а пользователи готовы «жечь больше токенов ради повышения эффективности».
Это означает, что токены — это не просто «трафик» с нулевыми предельными издержками, как в традиционном интернете, а «топливо», необходимое для выполнения производственных задач.
Инвестиционные рекомендации
Облачные вычисления постепенно превращаются из «продажи ресурсов» в «продажу токенов и результатов». Повышение цен на Zhipu GLM Coding Plan отражает изменение логики ценообразования в отрасли: когда推理 становится производственным ресурсом, производители моделей могут превращать «дефицит вычислительной мощности» в прибыль и денежные потоки через многоуровневое ценообразование и подписочные продукты. Рекомендуется продолжать следить за:
Облачными провайдерами и инфраструктурой: инвестиции в ИТ и инфраструктуру, стимулируемые развитием AI, продолжают расти, и облачные компании выиграют за счет увеличения спроса на GPU, хранилище и сетевые ресурсы.
Производителями больших моделей: когда они смогут удерживать подписки и расширять корпоративные доли в сценариях программирования, агентов и бизнес-процессов, превращая «использование токенов» в стабильную доставку ценности — экономию времени и труда — они смогут преодолеть ценовые войны и открывать новые возможности.
Инструменты безопасности и защиты в реальном времени: по мере внедрения AI в рабочие процессы, риски утечки данных и злоупотреблений станут стимулом для развития «платформ безопасности/государственного регулирования AI», что станет необходимым.
Краткосрочно — повышение цен и спрос (инфляция токенов) дают краткосрочные преимущества, в среднесрочной — отслеживание корпоративных долей и удержания подписчиков для повторных платежей и расширения, в долгосрочной — рост рынка «AI-фаерволов» за счет популяризации инструментов управления.
Риски
Технологические изменения сопряжены с неопределенностью; усиление конкуренции в отрасли.