ChatGPTの画像2.0が登場!文字生成の精度が大幅に向上し、簡単に販促ポスターを作成できます

ChainNewsAbmedia

OpenAIは火曜日に正式にChatGPT Images 2.0を公開し、文字生成の正確度だけでなく、ポスターや人物画像におけるデザインの美しさも大幅に向上させました。このモデルはまた初めて「思考モード」を導入し、画像生成にネット検索や複数枚の一括出力の能力を持たせ、商用アプリケーションのシナリオに全面的に近づけています。

(CanvaがClaudeを深く統合すると発表し、AIの下書きをデザインの完成品へ変換する)

でたらめの創作から完璧なメニューへ:AIはついに「綴り」を覚えた

2年前を振り返ると、AIの画像生成モデルの文字生成における弱点はほぼ誰もが知っていました。プロンプトに文字の要件が含まれているだけで、出力結果には不条理な綴りミスやでたらめな創作がしばしば混ざり、英語以外の中国語・日本語・韓国語の言語ではさらに深刻でした。

公式発表の韓国語ポスターのイメージ図

いまや、ChatGPT Images 2.0は、事業者がそのまま利用できる宣伝用ポスターを1枚生成でき、文字は明確で正確です。研究者たちは近年、自身に自己回帰するモデル (Autoregressive Models) などの新しいアーキテクチャを積極的に探求しており、その動作ロジックや文字の理解、生成・検証能力が顕著に向上しています。

思考モードがオンライン:連網検索、構図の一貫性まですべて対応

ChatGPT Images 2.0の最も重要なアップグレードは「思考モード (Thinking Capabilities)」で、現在はChatGPT Plus、Pro、商用版、企業版の有料ユーザーに提供されています。これを有効にすると、モデルは画像生成を補助するためにリアルタイムでネット検索を行えるほか、ユーザーがアップロードしたファイルに基づいて対応する視覚的な説明図を作成し、正式な出力の前に画像内容を自己審査して最適化します。

大量生成の面では、思考モード下での単一プロンプトあたりの最大出力は一度に8枚の画像で、各画像の間で一貫したキャラクターの姿、物のスタイル、全体的なテイストを維持できるため、漫画の分割コマ、ソーシャルメディアの連載用の図と文章、さらには室内デザインの各空間の企画図にも適しています。

公式発表の漫画分割コマのイメージ図

解像度の面では、新モデルは最高2K出力に対応し、さらに3:1から1:3までの複数の縦横比オプションを追加して、さまざまな商用ニーズをより一層満たします。

アジア言語が大幅に最適化され、中日韓ユーザーに朗報!

英語以外に、OpenAIはImages 2.0がアジアの文字において重大な最適化を実施したと特別に指摘しており、日本語、韓国語、中国語などで明らかな改善が見られます。

数日前に中国のテクノロジー系コミュニティで拡散されたテスト記事も、この情報を裏づけており、複数の知乎のクリエイターが当時GPT-Image-2と競合のGoogle Nano Banana Proの実測比較を行いました。これには、中国語ポスターのデザイン、ECの表紙画像、ソーシャルメディアのインターフェース、データ化されたグラフなど、多様なシーンが含まれます。

知乎の記事のテスト:GPT-Image 2.0

テスト結果は、GPT-Image-2が中国語の文字の書体の美しさ、レイアウト階層、全体のデザイン感のいずれにおいても明確に優れていることを示しています。生成されたポスターのテイストは、明らかな「AI感」があるテンプレート式の出力ではなく、実際の商用素材により近いものになっています。記事では同時に、GPT-Image-2がインターフェースの再現、つまり「ゲーム画面やコミュニケーションアプリのスクリーンショット」(と真の人物のシーンの再現においても、より高いディテールの精度を示したと述べています。

ChatGPT Images 2.0が全面的に開放され、APIも同時に上線

現時点で、ChatGPT Images 2.0は今週火曜日からすべてのChatGPTおよびCodexユーザーに基礎機能を無料提供しています。有料ユーザーは、より高度な出力効果を解放できます。同時に、OpenAIもGPT-Image-2のAPIを開放しており、価格は出力品質と解像度に応じて段階的に計算され、企業側と開発者に統合の柔軟性を提供します。

注目すべき点として、新しいモデルの知識の締め切り日は2025年12月であり、最新の時事に関わる画像生成プロンプトでは、正確度に一定の制限がかかる可能性があります。さらに、複雑な構図の生成速度も、一般的な文字の質疑応答ほどは即時ではありませんが、それでも数分で済みます。

この記事:ChatGPT Images 2.0登場!文字生成の正確度が大幅に向上し、簡単に販促用ポスターを作成 最初に登場したのは 鏈新聞 ABMediaです。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

NEC株式会社がAnthropicの日本における最初のグローバル・パートナーになります

NECは、日本におけるAnthropicの初のグローバル・パートナーになることを発表しました。双方は、金融、製造、地方自治体などの高度に規制された業界向けに、安全で産業知識を備えたAIソリューションを開発し、またClaudeシリーズをNEC BluStellarに統合します。データ駆動型のマネジメントと顧客体験の変革に焦点を当てると同時に、Claude CoworkとSOCの統合を導入し、サイバーセキュリティ防御を強化します。効果を検証するために、NECは「ゼロ号顧客計画」を立ち上げ、社内でAIエージェントを全面的にテストし、さらに全世界でClaudeの導入を推進する計画です。日本最大規模のAIネイティブ・エンジニアCoEを構築します。

ChainNewsAbmedia12分前

Vercelのセキュリティ侵害が数百人のユーザーに拡大;AI開発者はより高いリスク

Gate Newsメッセージ、4月23日—Vercelは4月19日、当初「限られた顧客の一部に影響している」と説明されていた同社のセキュリティインシデントが、特にAIエージェントのワークフローを構築している人々を中心とする、はるかに広範な開発者コミュニティにまで拡大したことを明らかにしました。攻撃は数百人のユーザーに影響する可能性があります

GateNews1時間前

OpenAI が GPT-5.5 を公開:12M の文脈、AA 指数で首位獲得、Terminal-Bench 82.7% が代理のベンチマークを更新

OpenAI が GPT-5.5 を公開し、主力はエージェント型の作業と企業のナレッジ処理で、同時に ChatGPT と Codex でも提供されます。要点として、1200 万 token のコンテキストウィンドウ、AA Intelligence Index 60、Claude Opus 4.7、Gemini 3.1 Pro より優位です。価格は、1 百万 token あたり入力 5 米ドル、出力 30 米ドルで、出力 token は約 40% 減少し、実際のコストは約 20% 上昇します。

ChainNewsAbmedia2時間前

Cluster Protocolが$5M を調達し、EVM向けブラウザネイティブAI IDEのCodeXeroを加速

ゲートニュース 4月23日 — AIディープテックおよびWeb3インフラ企業のCluster Protocolは、DAO5が主導する新たな資金調達ラウンドで$5 百万ドルを調達したことを発表しました。Paper Ventures、JPEG Trading、Mapleblock Capitalの参加により、累計調達額は7.75百万ドルに達しました。資金はCodeXeroを加速させるために活用されます。

GateNews2時間前

供給網の課題の中、Nvidiaが英国、中国、そして自動車セクターでのAIパートナーシップを拡大

Gate Newsメッセージ、4月23日 — Googleとの競争やサプライチェーンの混乱にもかかわらず、NvidiaはAIハードウェアにおける支配的プレイヤーであり続けています。TD Cowenは木曜日にNvidiaの買い推奨(buy rating)を再確認し、同社のパフォーマンスにおけるリーダーシップとソフトウェア・エコシステムの幅広さを挙げました。この賛同は、Nvidiaが複数の産業にまたがる新たなパートナーシップを発表したのと同時期に得られました。

GateNews2時間前

Anthropic が Claude Code の3つのバグを自ら開示:推論の低下、キャッシュの忘却、25文字の指令による逆襲

Anthropic が Claude Code の3件の障害が重なったことを公表:3/4–4/7 で推論レベルが medium にまで低下し、応答遅延と「頭が悪くなった」ような感覚を引き起こした;3/26–4/10 にキャッシュクリアのエラーがあり、長い会話で物忘れのようになる;4/16–4/20 に「25字以内」ツール呼び出し指示を追加し、その後 4/20 にロールバック。影響を受けるのは Claude Code、Agent SDK、Cowork、モデルは Sonnet 4.6、Opus 4.6/4.7;API は影響なし。4/23 に利用量をリセットし、評価と回帰の検知を強化。

ChainNewsAbmedia3時間前
コメント
0/400
コメントなし