国联民生证券：トークン需要は「インフレ」短期的に大規模モデルメーカーの価格引き上げと需要増による限界的改善

LootboxPhobia · 2026-02-22T14:25:21+00:00

国联民生证券研究报告指出，云计算正向“卖资源”模式转变，而大模型厂商则开始通过出售Token和成果物获利。智谱上调GLM Coding Plan的价格，反映了行业定价逻辑的变化，Token成为新的计量单位，促使模型厂商通过分层定价实现毛利提升。短期需求增长与提价、长期治理工具的普及共同形成了积极的市场预期。

LootboxPhobia

2026-02-22 14:25:21

概要作成中

智通财经APPによると、国联民生证券はリサーチレポートを発表し、クラウドコンピューティングは徐々に「リソース販売」へと変化しており、大規模モデルの企業化は「トークン燃料の販売＋成果の販売」へと進んでいると指摘している。智谱（02513）のGLM Coding Planの価格上昇は、産業の価格設定ロジックの変化を反映している：**推論の消費が生産資料に変わると、モデル企業は「計算能力の希少性」を階層化した価格設定やサブスクリプション型商品により、利益とキャッシュフローに転換する機会を得る。**短期的には価格引き上げと需要（トークン「インフレ」）による限界的改善を観察し、中期的には企業の席数とサブスクリプションの継続率による更新と拡大を追跡し、長期的にはガバナンスツールの普及による「AIファイアウォール」の新市場を期待している。

国联民生证券の主な見解は以下の通り：

**イベント：**2月12日、智谱は公式チャネルを通じてGLM Coding Planのサブスクリプション価格を最低30％引き上げると発表した。
それ以前、海外クラウド事業者は今月相次いで価格を引き上げており、Google Cloudは北米で100％の値上げを行い、ヨーロッパやアジアでも同時に値上げを実施。AWSも約15％の価格引き上げを行った。総合的に見ると、トークン需要の「インフレ」はクラウドの計算能力に好影響を与えるだけでなく、モデル企業に価格交渉力をもたらしている。

従来のインターネットの無料モデルを覆す動き

従来のインターネットソフトウェアの典型的なモデルは、まず無料でユーザー規模を拡大し、「ユーザー数と滞在時間」で価格交渉力を得て、その後広告、会員サブスクリプション、付加価値サービス、取引手数料などで収益化するものであった。無料の背後にある根底の理由は、限界コストが非常に低いことにある。すなわち、追加のユーザーやクリックごとにコストはほぼゼロに近づく。

クラウドコンピューティング時代にも似た「無料/低価格からの拡大」モデルがあったが、クラウドの課金単位はすぐにCPU、ストレージ、帯域幅、リクエスト数に変わり、顧客も「従量課金」に慣れた。クラウドが料金を徴収できるのは、明確なリソースとSLA（サービスレベルアグリーメント）を提供しているからだ。しかし、業界が依然として「モデル価格戦争」にある中で、智谱は価格引き上げの兆候を示している。これは大規模モデル時代の「計量単位」が流量（DAUや時間）からトークン（推論消費）に変わりつつあることを意味し、トークンの消費はますます多くのシーンで必要不可欠となっている。

大規模モデル時代の変化：トークンは「計測可能な生産資料」へ、「無料流量」ではなくなる

大規模モデルは、「対話・コード生成・コンテンツ生成」など、ソフトウェア提供者が提供するサービスのように見えるものを、計算能力に強く依存するオンライン推論サービスに変えている。モデル企業にとっては、回答ごとにGPU、メモリ、帯域、電力を実際に消費し、ユーザーにとっては、「もう少し考えさせる」「長いコードを書かせる」「より複雑なタスクを実行させる」たびに、より多くのトークンを消費することになる。したがって、トークンは自然と新たな計測単位となる。智谱は以前、ユーザー増加に伴う計算能力の一時的な逼迫を受けて、Coding Planを「限定販売」したことがあり、これが後の価格引き上げと非常に典型的な「需要と供給の連鎖」を形成している：
需要が短期的に大幅に増加→リソースに硬直的な制約（流量制限や限定販売）→価格上昇。

ピーク時の混雑やリソース不足が生じた場合、価格引き上げはモデル企業が需要を選別する仕組みとなり、「無差別流量制御」よりもユーザー体験を保護できる。また、モデル企業のコストはGPU供給、利用率、推論最適化と密接に関連しており、価格引き上げやより合理的な階層化価格設定は、「規模が大きいほど損失が増える」罠からモデル企業を引き離し、利益とキャッシュフローの質を向上させる。

トークン需要の「インフレ」

「トークンインフレ」とは、トークン自体の価値が上がるのではなく、単位時間や単一ユーザーあたりのトークン消費構造が体系的に増加することを指す。トークン需要の高まりには以下の理由がある：

「問答」から「実作業」へ：
モデルの進化により、ユーザーは単純な回答だけで満足せず、コードのリファクタリング、ファイルの書き換え、ドキュメント生成、テスト実行などをモデルにさせるようになった。プログラミングのシーンは本質的に「長いコンテキスト、多回の反復、大量の出力」を伴い、これが大量のトークン消費を引き起こす。智谱の表現によれば、開発者がコード支援にモデルを利用することで、トークン消費が急速に増加していることも裏付けられる。

「単一ラウンド」から「エージェントの多回」へ：
智谱はGLM-5をコーディングとエージェントシナリオ向けの新世代モデルと位置付けている。2月12日には、MiniMax-WP（00100）も正式リリースされた最新のフラッグシッププログラミングモデルM2.5を、エージェントシナリオにネイティブに設計された生産レベルのモデルとして位置付けている。M2.5のプログラミングとインテリジェントエージェントの性能（Coding&Agentic）は、Claude Opus4.6と直接比較される。エージェントは積極的に計画、検索、実行、反省を行い、複数回モデルを呼び出すため、トークン消費は自然にステップごとに累積する。

推論の強度増加：
より深い思考や長い推論チェーンは、出力や中間過程のトークン消費を著しく増加させる。開発者にとっては、成功率の向上ややり直しの減少につながり、「多くのトークンを使ってでも効率を上げたい」と考えるユーザーも増える。

これらは、トークンが従来のインターネット時代のほぼゼロに近い限界コストの「流量」ではなく、実作業に不可欠な「燃料」に変わったことを意味している。

投資提言

クラウドコンピューティングは徐々に「リソース販売」へと変化し、大規模モデル企業は「トークン燃料＋成果販売」に進化している。智谱のGLM Coding Planの価格上昇は、産業の価格設定ロジックの変化を示している：推論の消費が生産資料となることで、計算能力の希少性を階層化した価格設定やサブスクリプション商品により、利益とキャッシュフローに転換できる。今後も注目すべきポイントは以下の通り：

クラウド事業者と計算基盤インフラ：
AIの牽引によるIT支出とインフラ投資は依然上昇局面にあり、GPU計算能力、ストレージ、ネットワークI/Oなどの「付随消費」が継続的に増加している。

大規模モデル企業：
プログラミング、エージェント、企業業務など高ROIシナリオでサブスクリプション継続と企業席数拡大を維持できれば、「トークン使用量」を安定的に「人手と時間の節約」に変換でき、オープンソースや価格競争を乗り越える能力を持つ。

セキュリティガバナンスと運用時の防護ツール：
企業がAIをワークフローに組み込むにつれ、データ漏洩や代理権越権などのリスクが高まり、「AIセキュリティプラットフォーム／ガバナンスプラットフォーム」が必要不可欠となる。

短期的には価格引き上げと需要（トークン「インフレ」）による限界的改善を観察し、中期的には企業の席数とサブスクリプションの継続率による更新と拡大を追跡し、長期的にはガバナンスツールの普及による「AIファイアウォール」の新市場を期待している。

リスク提示

技術路線の変革には不確実性が伴い、業界競争も激化している。

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。

2 いいね