DeepSeek V4 震撼登场:与对手较量的十个第一性原理

午後3時30分、カリフォルニア通りの太陽はすでにスタンフォード方面に斜めに傾き始めている。Zombie Caféの入り口の犬は、またもや白い椅子の下に伏せている。テーブルには三つのプリントアウトが広げられている:Anthropicの4月16日のOpus 4.7リリース稿、OpenAIの4月23日のGreg BrockmanによるGPT-5.5リリース会議の逐語訳、そして今朝未明に出たばかりの、インクが乾いていないDeepSeek V4の技術報告書。

8日以内に、三社が2026年第2四半期の全てのカードをテーブルに並べた。

コーヒーを飲み終える前に、シリコンバレーのAlan Walkerはこの事態を明確に語る。ベンチマークの水を吹き込まず、どのモデルが「より良い感じ」かを語らず、広報文も書かない。第一原理から解き明かす——技術、チップ、価格、ターゲット、戦略、エコシステム——2026年に各社がどこに立ち、誰がリードし、誰が守り、誰がテーブルをひっくり返すのか。

01 オープンソース vs クローズドソース——この戦いの根本的な路線争い

DeepSeekは今回、V4-ProとV4-Flashの二つのモデルを同期でオープンにした。標準MITライセンス、重みはHugging Faceに直接アップロード、誰でもダウンロード、微調整、商用利用可能。Claude Opus 4.7とGPT-5.5は純粋なクローズドソース——APIだけ提供し、モデルの重みには一生触れられない。

多くの人はこれを商業モデルの争いだと誤解している。違う。これは信頼構造の争いだ。

クローズドソースの堀は「あなたは私のところにしか来られない」——ユーザーを門の前に閉じ込めて並ばせる。オープンソースの堀は「あなたはこのエコシステムから離れられない」——開発者、企業、国家のAIインフラを私のアーキテクチャに長く育てる。前者は料金所、後者は高速道路。

DeepSeekはV3、R1、V3.2、V4と連続4世代のオープンソースでこの事実を実証してきた。今日、世界中のどの企業もローカル展開や金融、医療、行政、軍事で大規模モデルを動かしたいなら、最初に思い浮かべるのはDeepSeekだ。中国の国営企業、中東の主権基金、ヨーロッパのデータを米国クラウドに預けたくない銀行——これらは絶対にクローズドAPIは使わない。AnthropicとOpenAIの賭けは逆だ:最先端の知能格差は永遠に存在し、最も賢い顧客は最も金を惜しまない。

しかし、この賭けには時間枠がある。R1が出てから今日まで、オープンとクローズドの能力差は1年から3ヶ月に縮まった。3ヶ月が1ヶ月に短縮されれば、クローズドのラインは裂け始める。

_02_モデルアーキテクチャ——三社が歩む根本的に異なる道

V4-Proは1.6兆パラメータ/49Bのアクティベーション;V4-Flashは284Bのパラメータ/13Bのアクティベーション。1Mのコンテキストは出荷時のデフォルト。アーキテクチャの核心は混合アテンション(CSA + HCA交錯)+Manifold-Constrained Hyper-Connections+Muon最適化器+FP4トレーニング。1Mトークンのシナリオでは、V4-Proの単一トークン推論FLOPsはV3.2の27%、KVキャッシュは10%しか使わない。V4-Flashはさらに厳しい——FLOPsは10%、KVキャッシュは7%に低減。

このアーキテクチャの本質的な賭けは一言——長いコンテキストは能力の問題ではなく、効率の問題だ。V3世代はMoEで訓練コストを削減したが、V4世代は混合アテンションで推論コストを削減する。最も高価な部分を一刀ずつ切り詰めていく。

GPT-5.5は違う。OpenAI公式は明言——これはGPT-4.5以降、初めてゼロから再訓練した基盤モデルだ。前の5.1、5.2、5.3、5.4はすべて同じベース上のポストトレーニングの反復だった。5.5はアーキテクチャ、事前訓練のコーパス、エージェント指向の訓練目標を全面的にやり直した。Pachockiはリリース会見で一言——「過去2年のモデルの進歩は驚くほど遅い」——と述べているが、実際には彼らのベースモデルが新しいスケーリング曲線に対応できなくなったため、エンジンを換える必要があったのだ。

Claude Opus 4.7は4.6からの正確な改良だ。Anthropicは明確に位置付けている: notable improvement、paradigm shiftではない。SWE-benchのスコアは80.8から87.6に引き上げられ、視覚解像度は1568pxから2576pxに向上、全体的なスループットは以前の3.3倍、トークナイザーも一度交換(同じテキストで1〜1.35倍のトークンを使用)した。Mythos Previewは彼らの次世代の本命だが、今はセーフティーボックスに封印されており、12社のパートナーだけ試用可能、一般公開はまだ先。

_03_基底チップ——今日最も過小評価されているニュース

主流の英語メディアはV4のベンチマークを取り上げているが、誤りだ。今日、真にゲームチェンジャーとなる一行の言葉は——V4の一部訓練が華為の昇腾(Ascend)上で行われたことだ。

リリース当日、華為はAscend SuperPoDシリーズ全てに対し、「full support」を発表。寒武紀も同期で対応を表明。SMICの香港株はその日に10%急騰。この三つのラインをつなげて読むのがニュースだ——中国のAIは初めて、訓練と推論のフルスタックを国産ハードウェア上で走らせ、重要なパスにNVIDIAのチップは一つも使われていない。

この事実の重みは、すべてのベンチマークの合計を超える。

過去3年、米国は中国に対して最も効果的なレバレッジを一つだけ持っていた:先進GPUの輸出規制。背後の論理は単純——最強のモデルは訓練できない、H100やB200が買えないからだ。V4のリリースは、このレバのトルクを半分に削ぎ落としたことに等しい。第一線のオープンソースモデルは、NVIDIA以外のハードウェア上でも訓練・量産・展開できる。これが広く市場に認められれば、制裁はAI分野ではほぼ無効となる。

ClaudeとGPT-5.5は、NVIDIAのH100/H200/B200+Google TPU+Anthropicの自社開発Trainium2のスタック上で動いている。第二の道も、第二の供給者も存在しない。これが壁であり、単一点だ。いつNVIDIAの価格が上がるか、供給が追いつかなくなるか、その時は両者ともに被害を受ける。DeepSeekは今、独立したサプライチェーンを持つ——彼らはもう一つのカードを持っている。

_04_訓練コスト構造——Muon、FP4、32Tトークンで今日の価格をどう作り出すか

V4の技術報告には明確に書かれている:Muon最適化器(収束を早め、訓練を安定させる)、FP4精度(メモリ使用量を直接半減)、二段階のポストトレーニング(各分野の専門家によるSFT+RLを独立させ、その後on-policy蒸留で統一)そして32兆トークンの事前訓練コーパス。これらは飾りではなく、訓練コストを実際に削減するための真の機械だ。

結果として——V4-ProのAPI価格はV3.2以下に抑えられ、V4-Flashはオープンソースの小型モデルの最低価格帯に到達。

GPT-5.5の戦略は明示的に値上げだ。毎百万トークンの入力に5ドル、出力に30ドル——これはGPT-5.4の2倍。OpenAIの公式見解は「トークン効率は40%向上、総コストはわずか20%増」だが、実際の運用環境でプロンプトを走らせると——長いプロンプトと短い出力のワークフローでは、請求額はそのまま2倍になる。OpenAIは「最先端の知能の希少性」がもう一周期持つと見て、敢えて値上げしている。

Claude Opus 4.7の戦略は隠れた値上げだ。表面上の価格は変わらず、5/25ドルとOpus 4.6と完全一致だが、Anthropicのドキュメントにはこう書かれている——新しいトークナイザーは同じテキストで最大1.35倍のトークンを使う。つまり、価格は変わらず、請求は最大35%増。これは高感度な値上げだが、大量流量を扱うエンジニアチームはすぐに月次報告で気づく。

DeepSeekは逆に値下げ——V3.2の価格はすでに低く、V4-Proはそれより下。数ヶ月後、華為のAscend 950が量産されればさらに値下げもあり得る。これは中国のインターネット伝統の戦略:規模と効率で価格を骨折させ、そのエコシステムで人を引き留める。

_05_API価格——1ドルでどれだけの知能を買えるか

価格表を見てみよう。

サードパーティの評価サイトArtificial Analysisは、同じスコアの知能指数(Intelligence Index)で比較すると、GPT-5.5(ミディアム)≈ Claude Opus 4.7(最大)で、前者は全テスト約$1,200、後者は約$4,800だ。V4-Proは同じ知能レベルで、その三分の一から十分の一のコスト。

これが何を意味するか——月に百万ドルのトークン消費をする企業にとっては、以前は10のエージェントラインしか動かせなかったのが、今や80も動かせる。以前は高すぎて実験できなかったことも、今や格安で気軽に試せる。これが市場で3、4社のトップ企業に証明されれば(例えば、ある企業がコアのカスタマーサポートエージェントをOpusからV4-Proに切り替え、コストを70%削減しつつ品質を維持した例など)、残る全てが追随する。これは反射的な動きだ——一社が移行すれば、次の一社の心理的ハードルは一段下がる。

OpenAIとAnthropicの反撃は二つの方向性しかない:一つはクローズド最先端との差を再び広げる(Mythosを早くリリースする)、もう一つは企業関係、コンプライアンス、信頼性の面で移行コストを厚くする。前者は時間と資金、後者は顧客の忍耐力が必要だ。

_06_百万コンテキストの実際の経済学

三社とも1Mのコンテキストを採用している。表面上は同じ数字だ。

しかし——できることと安くできることは別次元だ。

V4-ProはMRCR長文検索ベンチで83.5点を獲得し、Gemini-3.1-Proの76.3点を上回り、Claude Opus 4.6の92.9点には及ばない。CorpusQAでは1Mトークンで62%、Gemini 3.1 Proの53.8%を超える。リトリーバル精度は128Kで94%、512Kで82%、1Mで66%。絶対値では最も高くはないが、オープンソースの中ではトップであり、最初に1Mをデフォルトにした。

Claude Opus 4.7の1Mコンテキストには長い上下文追加料金はない——これがAnthropicの硬派な技術だ。GPT-5.5も同じだ。しかし、問題は次の通り:三社の推論単位コストは10倍の差があり、長いコンテキストシナリオではその差が10倍に拡大される。

簡単な計算をしよう。500Kトークンの法律文書をモデルに分析させると、Opus 4.7は入力だけで$2.5、出力も含めて$3〜4程度。GPT-5.5もほぼ同じ、V4-Proは約$1。このワークフローを1日に1万回実行した場合、年間コストの差は数百万から1千万ドル超に及ぶ。中規模企業のエージェント分析ワークロードの最大のボトルネックは長いコンテキストコストであり、V4-Proはこのボトルネックを直接排除している。

_07_コーディングとエージェント能力——三社が守る一線

ベンチマーク表を見れば、この局面は非常に明確だ。

_このデータは、誰がより強いかではなく、_三社が異なるエージェント形態に重心を置いていることを示している。

Anthropicは「実際のコードベースで実際の問題を解決する」ことに重きを置く。Cursor、Devin、Factory、Rampなどの顧客はOpusを使い、「ToDoアプリを書く」ようなおもちゃのタスクではなく、「200万行のコードベースの中で3週間前に埋めたレースコンディションを修正する」ことを目的としている。NVIDIAはCodexを1万人の社員に展開し、デバッグサイクルを数日から数時間に短縮した——この数字はAnthropicも持ち合わせている。Opus 4.7はSWE-Benchで64.3%を叩き出せる——実際の生産ラインで磨き上げられた結果だ。

OpenAIは「エージェントによるコンピュータ操作」に重きを置く。Terminal-Bench 2.0、OSWorld、Codexのシェル操作——これらは未来を指し示す:AIは単にコードを書くのではなく、あなたの代わりに端末を開き、コマンドを打ち、Macを操作する。Brockmanの発表会の「scaleでのエージェント的計算」は飾りではなく、OpenAIの次の10年のスローガンだ。

DeepSeekは「オープンソース開発者の公共知能資産」に重きを置く。SWE-Bench Proには勝てないが、オープンソース界の天井をCodeforcesの3206点に引き上げた。これにより、どんなスタートアップもAnthropicやOpenAIに金を払わず、自分のマシン上でほぼトップレベルの競技用コードモデルを動かせる。

_08_ターゲット層——三社が狙うのは全く異なる資金層

Anthropicの顧客リストを見れば、その方向性は一目瞭然:PayPal、Hex、Devin、Factory、Ramp、Notion、GitHub Copilot、Stripe、Block——すべてフィンテックとエンタープライズSaaSだ。これらの企業の共通点は二つ:資金が潤沢、ミスに対してゼロトレランス。Opus 4.7の5/25ドルの価格設定、安全監査、コンプライアンスのストーリー、Bedrock/Vertex AI/Foundryのマルチクラウド展開——これらはすべて、調達に半年、三年契約、年百万ドルの顧客をターゲットにしている。Forge Globalの評価額は1兆ドル超、OpenAIの8800億を超え、資本はこの「企業顧客密度」のストーリーに投資している。

OpenAIの基盤は、消費者+開発者+企業の三輪駆動だ。ChatGPTは週10億のアクティブユーザーを持ち、これが真の堅牢性だ。GPT-5.5はPlus/Pro/Business/Enterpriseに同時展開され、APIの値上げはC端のトラフィックで相殺される。Codexの開発者層は半年で数十万から数百万に増加し、NVIDIAやStripe、Shopifyなどの企業は大規模に内部展開している。OpenAIは規模を重視——単位コストは巨大な分母で薄められている。

DeepSeekのターゲット層は全く異なる。中国の国営企業、銀行、病院、政府機関;中東のデータを米国クラウドに預けたくない主権基金;GDPR厳守のヨーロッパの医薬品企業;東南アジアやラテンアメリカの主権AIを志す発展途上国政府。さらに、シリコンバレーの一部「自分たちでモデルを動かしたい、APIに金を払いたくない」硬派開発者やスタートアップも含む。これらの人々は、OpenAIの10億C端ユーザー規模ではないが、別の規模——地政学と主権の観点からの規模だ。

三つの全く異なる資金層、三つの全く異なる販売ロジック。

_09_安全性とサイバー攻防の姿勢——三社の「モデルを武器にする」態度は全く異なる

Anthropicは4月初めにProject Glasswingを公開した。Opus 4.7は、最初に「高リスクのサイバーセキュリティリクエストを自動検知・拒否する」機能を内蔵した生産モデルだ。技術報告には率直に書かれている——訓練時に攻撃性の高いネットワーク能力を意図的に抑制したと。CyberGymのスコアは73.1で、Opus 4.6の73.8とほぼ同じ。これは政策の選択であり、能力の天井ではない。Mythos Previewは同じベンチマークで83.1を叩き出すが、12社のパートナーだけに限定使用、しかもそのリスト自体も機密——数日前に漏洩した(DiscordのコミュニティがURLを推測した)。Anthropicは事故報告も出している。

一方、OpenAIは別の道を歩む。GPT-5.5のシステムカードには明記されている: 「Preparedness Framework」の「High」レベルのサイバーリスクには到達していない。OpenAIの方針は、モデルの能力を下げるのではなく、より厳格な入力分類器を装備し、本人確認を強化し、「cyber-permissive access program」を推進する——攻撃的能力を使いたいなら、まず身分証を提出せよ、ということだ。Mia Glaeseはリリース会見で「first identity-verified release」と表現したが、これは——能力は渡すが、責任はユーザーが負う、という含意だ。

DeepSeekのV4技術報告にはこの部分はほぼ空白だ。オープンソースコミュニティの伝統は「コードは公開、責任は持て」だ。これは規制当局にとって悪夢、独立開発者にとっては天国だが、その真のリスクは——誰でも自分のGPU上でOpus 4.7に近い能力のモデルを動かせることにある。これには何の抑止層もない。規制はどう動くのか、2026年後半から2027年が重要なウィンドウだ。

_10_市場戦略——三つの全く異なる賭けだが、唯一最大になるのは一つだけ

DeepSeekはAI界のLinuxを目指す。

オープンソース+極限コスト+国産チップで世界のAIインフラを民主化。各国・各企業・各開発者があなたのアーキテクチャ上で動けば——ライセンス料ではなく、エコシステムの価値から税金を取る。今日Hugging Faceのダウンロード数、明日には国産チップのSDKがデフォルトでDeepSeek対応、翌日には新世代AI開発者の最初の一行は「from deepseek import…」になる。この戦略は20年前のLinus Torvaldsがやったことと同じだが、今やLLMはOSの10,000倍高価、資金は1000倍多く、地政学的価値は100倍高い。

Anthropicの狙いは、世界の最先端企業のAI運用エンジンになることだ。

ターゲットは10億C端ユーザーではなく、世界のトップ1万社のITとコンプライアンス予算だ。Opus 4.7の「狭く深い」定位、Mythos Previewの希少供給、Bedrock/Vertex/Foundryのマルチクラウド展開、Forgeの1兆ドル評価——これらを合わせて語るとこうなる:法務、財務、研究開発、カスタマーサポート、それぞれの重要な仕事は私のモデル上で動き、絶対にダウンさせてはいけない。これは弁護士事務所や投資銀行の論理であり、Facebookのそれではない。顧客は少なく、単価は高く、移行コストはほぼ無限大だ。

OpenAIは次のWindows+Office+Googleの超アプリを目指す。

ChatGPTはその配信権(週10億アクティブ)、Codexは開発者ロック、Operatorはコンピュータ操作の入口、新しいMacアプリはデスクトップのポジションだ。Brockmanの発表会の「scaleでのエージェント的計算」は飾りではなく、OpenAIの次の10年のスローガンだ。

三つの道はローマに通じる。しかし、唯一最大になるのは一つだけ——そして、その最大の道が次の10年のAI産業の富の分配を決める。

三社は同じ週に全カードを公開した。

Claude Opus 4.7は堅実だ——狭く深く、三年契約、百万ドル支払いを喜ぶ企業向けの堅実さだ。勝ち筋はこうだ:AIを使った生産性ツールを求める中規模以上の企業で、Opusより信頼できる選択肢はない。

GPT-5.5は高価だ——値上げ、超アプリの野望、コマンドラインとコンピュータ操作をリードするエージェント能力。勝ち筋はこうだ:もし「AIがあなたの代わりにコンピュータを操作する」未来が2027年に実現すれば、OpenAIはこの革命のMicrosoft 1995になる。そうでなければ、5/30ドルの価格は高い付箋になる。

DeepSeek V4は激しい——オープンソース、低価格、国産チップで、他の二社の堀を一つ一つ削り取る。勝ち筋はこうだ:もし地政学的な断片化が進み続け、世界のAIインフラが中米の二つのエコシステムに分裂すれば、DeepSeekは中国エコシステムのLinuxとなる。この確率は50%ではないが、一年前の5%をはるかに超えている。

2025年1月のR1登場時、市場の第一反応は「中国AIが追いついた」だった。今回のV4では、市場が学ぶべき新語は——「中国AIがルールを変え始めた」だ。

ルールが一度変われば、元に戻すことはできない。

午後4時30分、カリフォルニア通りの風が冷たくなる。Zombie Caféのカップは空になった。Alanは三つのプリントを重ねてバックパックにしまう。出口を出ると、その犬は頭を少し上げて、また伏せた。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン