これは AI 投資研究 100 編シリーズの第九篇、2万字、先に保存しておくことをお勧めします。最後まで読める人は多くないでしょう。
前の数篇では Intel、AMD、ARM について見てきました。彼らの過去1年の株価上昇はかなりのものです——AMDは倍増、Intelは3倍、ARMも歴史的高値に到達。上昇後、素朴な疑問が浮かびます：これら既に上昇した株はまだ持ち続けられるのか？上昇していないものにまだチャンスはあるのか？
この問いに答えるには、避けて通れない核心語があります——推理。前述の会社が上昇した背景には、分析の中で繰り返し登場するこの二文字があります。
では：推理の市場規模はどれくらい？現在はどの段階にある？どの企業がどのように恩恵を受ける？既に市場価格に織り込まれているものとそうでないものは何か？
これを最初に理解すべきです。
一、赛道（市場規模）はどれくらい
モデル訓練は「プログラムを書く」ことであり、推理は「このプログラムが毎日呼び出される過程」です。GPTを訓練した後、毎日何億人もの人が質問し、そのたびに推理計算能力を消費します。Claude Codeが一つのタスクを実行し、エージェントが自ら100ラウンドを行う場合、各ラウンドは推理です。
多くの業界調査やメディアの引用も同じ方向を指しています：モデルが生産環境に入った後、推理はライフサイクルコストの大部分を占めるようになり、一般的な推定範囲は80-90％です。つまり、未来のAI時代の計算能力の請求書では、10元のうち8元は推理に使われることになります。
しかし、市場は過去3年間ほとんど訓練について議論してきました。なぜなら訓練はより「セクシー」なストーリーだからです——誰のH100が多いか、誰のパラメータが大きいか、誰が最初に次世代モデルを訓練したか。推理は訓練後の付随作業とみなされてきました。
この認知バイアスは今、覆されつつあります。そして、それこそが過去1年間にこの半導体企業群が再評価された根本的な理由です。
では、推理の市場はどれくらい大きいのか？具体的には5つの角度から測定できます。
一つはユーザー数です。ChatGPTの週アクティブは9億人、課金者は5000万人です。中国側の比較もより直接的です——2024年初の1日あたりトークン呼び出し量は1000億から2026年には140兆に増加し、1400倍です。この項目はまだ飽和していません。
二つ目は使用強度です。OpenAIのトークン処理量は2025年10月には1分あたり60億、2026年4月には150億に達し、半年で2.5倍です。企業版の収益比率は40％超で、企業ユーザーの使用強度は消費者の数十倍です。
三つ目は対話の長さです。コンテキスト長は初期の数百トークンから、DeepSeek APIドキュメントに記載されたV4 Pro / Flashのコンテキスト長は1M、最大出力は384Kです。ドキュメントが長くなるほど、一回の推理に必要なメモリと計算能力は増加します。
四つ目はモデル自体の計算コストが増加していることです。OpenAIのo1、DeepSeek R1、Claude thinkingのような推理モデルは、質問に答える前に内部で何千、何万ものトークンを「考える」必要があります。黄仁勋はDeepSeek R1を例に、推理モデルははるかに多くの計算量を必要とし、百倍に達する可能性もあると述べました。
過去はAIに一つの質問をすると直接答えを返しましたが、今は難しい問題を質問すると、まず頭の中で半分の時間考え、その後答えを出します。この「半分の時間考える」間に、追加の計算能力が消費されるのです。
五つ目はエージェントです。一つのエージェントのタスクは通常、モデルを10〜100回呼び出す必要があります。OpenAI Codexの週アクティブはすでに300万を突破しています——これは一つの企業の製品に過ぎません。あるAI産業関係者の見解では、AIインテリジェントエージェントの総計算能力消費は、同規模の大規模言語モデルの10倍以上に達する可能性があるといいます。
これら五つの要素を掛け合わせると、3〜5年以内に推理の総需要は規模の拡大を見せることは、誇張ではなく、ますます主流の判断に近づいています。
経済学には「Jevons Paradox（ジェヴォンズの逆説）」という古典的な現象があります——あるものの単位使用効率が向上すると、総消費量が逆に増加します。なぜなら、それが安くなるからです。蒸気機関の効率が向上した結果、英国の石炭消費は爆増しました。推理トークンの単価が下がった後、AI呼び出し回数は爆発的に増加します。これは同じシナリオです。IEAの推計によると、世界のデータセンターの電力消費は2024年の総電力の1.5％を占め、2030年には倍増し、945 TWhに達します——これはドイツとフランスの年間電力消費量を合わせた規模に相当します。
さらに、産業の最前線の具体的な動きも、議論をより堅固にします：
AnthropicのARRは2024年末の10億ドルから、2026年初には300億ドルに増加——14ヶ月で30倍です。そのために、同社は2025年末から2026年初にかけて、11GW超の計算能力を確保し、その一環としてBroadcomに210億ドルのTPUを発注しました。OpenAIはすでに10GWのカスタムチップの展開を約束しています。GoogleのTPU出荷目標は2026年に50％引き上げられ、600万個に達します。
クラウド事業者の資本支出もより直接的です。Googleは2026年の資本支出計画を1750億〜1850億ドルとし、2025年のほぼ2倍に増やします。Amazonは2026年に2000億ドルを投入。Metaは65％増の1180億ドルに拡大予定です。8大クラウド事業者の合計資本支出は2026年に6000億ドル超に達し、年成長率は40％です。
これらを総合すると、結論は明白——AI推理の需要曲線は、どのハードウェア供給者の能力も超えつつあります。
これが推理市場の全体像です：訓練時代は「神を創る」ことでしたが、推理時代は「この神が毎日何億人に呼び出され、各エージェントが100回呼び出され、1回の思考に数万のトークンを使う」時代です。前者から後者への移行に伴い、計算能力の消費は線形ではなく、指数的に増加しています。
二、どの株が恩恵を受けるか？
市場規模が大きいからといって、すべての企業が恩恵を受けるわけではありません。さらに、NVIDIAの独占状態も市場データ上で緩みつつあります！
2026年の世界AI推理チップ市場において、NVIDIAのシェアは約48.2％、AMDは約16.7％、ASIC勢は合計約18.5％（Google TPU 7.8％、AWS Inferentia 5.2％、その他ASIC 5.5％）、国内推理チップは合計16.6％です。
NVIDIAは訓練市場では依然80％超のシェアを維持していますが、推理市場ではすでに半分未満の48.2％にとどまっています。
なぜこうなったのか？
訓練時代のNVIDIAは総合力で勝負していました——高性能GPU + NVLink高速インターコネクト + CUDAエコシステム。この組み合わせは訓練において圧倒的な優位性を持ちます。

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。

報酬
いいね
コメント
リポスト
共有

コメントを追加

コメントなし

人気の話題
もっと見る
#
WCTCTradingKingPK
265.06K 人気度
#
CryptoMarketSeesVolatility
325.35K 人気度
#
IsraelStrikesIranBTCPlunges
33.96K 人気度
#
rsETHAttackUpdate
114.38K 人気度
#
US-IranTalksStall
504.01K 人気度

ピン

サイトマップ

《英伟达份额只剩 48%，推理大时代机会在哪？》

人気の話題

WCTCTradingKingPK

CryptoMarketSeesVolatility

IsraelStrikesIranBTCPlunges

rsETHAttackUpdate

US-IranTalksStall

ピン