OpenAIは火曜日に正式にChatGPT Images 2.0を公開し、文字生成の正確度だけでなく、ポスターや人物画像におけるデザインの美しさも大幅に向上させました。このモデルはまた初めて「思考モード」を導入し、画像生成にネット検索や複数枚の一括出力の能力を持たせ、商用アプリケーションのシナリオに全面的に近づけています。
(CanvaがClaudeを深く統合すると発表し、AIの下書きをデザインの完成品へ変換する)
でたらめの創作から完璧なメニューへ:AIはついに「綴り」を覚えた
2年前を振り返ると、AIの画像生成モデルの文字生成における弱点はほぼ誰もが知っていました。プロンプトに文字の要件が含まれているだけで、出力結果には不条理な綴りミスやでたらめな創作がしばしば混ざり、英語以外の中国語・日本語・韓国語の言語ではさらに深刻でした。
公式発表の韓国語ポスターのイメージ図
いまや、ChatGPT Images 2.0は、事業者がそのまま利用できる宣伝用ポスターを1枚生成でき、文字は明確で正確です。研究者たちは近年、自身に自己回帰するモデル (Autoregressive Models) などの新しいアーキテクチャを積極的に探求しており、その動作ロジックや文字の理解、生成・検証能力が顕著に向上しています。
思考モードがオンライン:連網検索、構図の一貫性まですべて対応
ChatGPT Images 2.0の最も重要なアップグレードは「思考モード (Thinking Capabilities)」で、現在はChatGPT Plus、Pro、商用版、企業版の有料ユーザーに提供されています。これを有効にすると、モデルは画像生成を補助するためにリアルタイムでネット検索を行えるほか、ユーザーがアップロードしたファイルに基づいて対応する視覚的な説明図を作成し、正式な出力の前に画像内容を自己審査して最適化します。
大量生成の面では、思考モード下での単一プロンプトあたりの最大出力は一度に8枚の画像で、各画像の間で一貫したキャラクターの姿、物のスタイル、全体的なテイストを維持できるため、漫画の分割コマ、ソーシャルメディアの連載用の図と文章、さらには室内デザインの各空間の企画図にも適しています。
公式発表の漫画分割コマのイメージ図
解像度の面では、新モデルは最高2K出力に対応し、さらに3:1から1:3までの複数の縦横比オプションを追加して、さまざまな商用ニーズをより一層満たします。
アジア言語が大幅に最適化され、中日韓ユーザーに朗報!
英語以外に、OpenAIはImages 2.0がアジアの文字において重大な最適化を実施したと特別に指摘しており、日本語、韓国語、中国語などで明らかな改善が見られます。
数日前に中国のテクノロジー系コミュニティで拡散されたテスト記事も、この情報を裏づけており、複数の知乎のクリエイターが当時GPT-Image-2と競合のGoogle Nano Banana Proの実測比較を行いました。これには、中国語ポスターのデザイン、ECの表紙画像、ソーシャルメディアのインターフェース、データ化されたグラフなど、多様なシーンが含まれます。
知乎の記事のテスト:GPT-Image 2.0
テスト結果は、GPT-Image-2が中国語の文字の書体の美しさ、レイアウト階層、全体のデザイン感のいずれにおいても明確に優れていることを示しています。生成されたポスターのテイストは、明らかな「AI感」があるテンプレート式の出力ではなく、実際の商用素材により近いものになっています。記事では同時に、GPT-Image-2がインターフェースの再現、つまり「ゲーム画面やコミュニケーションアプリのスクリーンショット」(と真の人物のシーンの再現においても、より高いディテールの精度を示したと述べています。
ChatGPT Images 2.0が全面的に開放され、APIも同時に上線
現時点で、ChatGPT Images 2.0は今週火曜日からすべてのChatGPTおよびCodexユーザーに基礎機能を無料提供しています。有料ユーザーは、より高度な出力効果を解放できます。同時に、OpenAIもGPT-Image-2のAPIを開放しており、価格は出力品質と解像度に応じて段階的に計算され、企業側と開発者に統合の柔軟性を提供します。
注目すべき点として、新しいモデルの知識の締め切り日は2025年12月であり、最新の時事に関わる画像生成プロンプトでは、正確度に一定の制限がかかる可能性があります。さらに、複雑な構図の生成速度も、一般的な文字の質疑応答ほどは即時ではありませんが、それでも数分で済みます。
この記事:ChatGPT Images 2.0登場!文字生成の正確度が大幅に向上し、簡単に販促用ポスターを作成 最初に登場したのは 鏈新聞 ABMediaです。
関連記事
OpenAI が GPT-5.5 を公開:12M の文脈、AA 指数で首位獲得、Terminal-Bench 82.7% が代理のベンチマークを更新