OpenAI secara resmi meluncurkan ChatGPT Images 2.0 pada hari Selasa, tidak hanya sangat meningkatkan akurasi dalam pembuatan teks, serta keindahan desain pada poster dan foto potret. Model ini juga untuk pertama kalinya memperkenalkan “mode berpikir”, sehingga pembuatan gambar memiliki kemampuan pencarian di web dan output batch multi-gambar, mendekati sepenuhnya skenario penerapan untuk keperluan komersial.

(Canva mengumumkan integrasi mendalam Claude, mewujudkan konversi draf AI menjadi produk desain jadi)

Dari mengarang dari nol hingga menu sempurna: AI akhirnya belajar mengeja

Menilik dua tahun lalu, kelemahan model generasi gambar AI dalam pembuatan teks hampir sudah diketahui semua orang. Selama prompt menyertakan kebutuhan akan teks, hasil keluaran sering kali dipenuhi dengan kesalahan ejaan yang absurd, bahkan mengarang tanpa dasar. Hal ini bahkan lebih parah pada bahasa non-Inggris seperti bahasa Tionghoa, Jepang, dan Korea.

Ilustrasi poster berbahasa Korea dari pengumuman resmi

Kini, ChatGPT Images 2.0 sudah mampu menghasilkan satu poster promosi yang dapat langsung digunakan oleh penyedia, dengan teks yang jelas dan akurat. Peneliti dalam beberapa tahun terakhir secara aktif mengeksplorasi arsitektur-arsitektur baru seperti (Autoregressive Models) dan sejenisnya untuk kembali ke model, sehingga logika operasional, pemahaman terhadap teks, kemampuan generasi, serta verifikasi mengalami peningkatan yang signifikan.

Mode berpikir diluncurkan: pencarian online, konsistensi komposisi semuanya pas

Peningkatan paling inti pada ChatGPT Images 2.0 adalah “Mode Berpikir (Thinking Capabilities)”; saat ini dibuka untuk pengguna berbayar ChatGPT Plus, Pro, versi komersial, dan versi perusahaan. Setelah diaktifkan, model dapat langsung melakukan pencarian informasi di web untuk membantu pembuatan gambar, juga dapat membuat penjelasan visual yang sesuai berdasarkan file yang diunggah pengguna, serta melakukan pemeriksaan diri dan optimasi atas konten gambar sebelum keluaran resmi.

Untuk pembuatan batch, dalam mode berpikir, satu prompt dapat menghasilkan hingga delapan gambar sekaligus, dan setiap gambar dapat mempertahankan konsistensi citra karakter, gaya objek, serta gaya keseluruhan. Ini cocok untuk storyboard komik, rangkaian gambar dan teks untuk media sosial, bahkan hingga gambar perencanaan berbagai ruang untuk desain interior.

Ilustrasi storyboard komik dari pengumuman resmi

Dari sisi resolusi, model baru mendukung keluaran hingga 2K, dan menambahkan opsi berbagai rasio aspek dari 3:1 hingga 1:3, sehingga makin memenuhi kebutuhan bisnis yang beragam.

Bahasa Asia dioptimalkan secara besar-besaran, pengguna Jepang, Tiongkok, dan Korea mendapat kabar baik!

Selain bahasa Inggris, OpenAI secara khusus menyoroti peningkatan besar pada tulisan berbahasa Asia di Images 2.0; bahasa Jepang, Korea, dan Tionghoa semuanya mengalami perbaikan yang jelas.

Artikel uji yang beberapa hari lalu beredar luas di komunitas teknologi Tiongkok juga membuktikan kabar tersebut. Beberapa kreator di Zhihu saat itu melakukan perbandingan uji coba antara GPT-Image-2 dan pesaing Google Nano Banana Pro, mencakup berbagai skenario seperti desain poster berbahasa Tionghoa, gambar sampul e-commerce, antarmuka media sosial, serta bagan visual berbasis data.

Uji GPT-Image 2.0 di artikel Zhihu

Hasil pengujian menunjukkan bahwa GPT-Image-2 secara nyata unggul dalam rasa estetika font Tionghoa, hierarki tata letak, dan nuansa desain secara keseluruhan. Gaya poster yang dihasilkan lebih mendekati materi komersial yang nyata, bukan keluaran model yang tampak jelas “bernuansa AI”. Artikel tersebut juga menyebutkan bahwa pada replikasi antarmuka (seperti tampilan layar permainan atau tangkapan layar aplikasi komunikasi) dan pencocokan adegan orang asli, GPT-Image-2 juga menunjukkan ketepatan detail yang lebih tinggi.

ChatGPT Images 2.0 dibuka sepenuhnya, API juga diluncurkan

Saat ini, ChatGPT Images 2.0 sejak hari Selasa di minggu ini sudah tersedia gratis untuk semua pengguna ChatGPT dan Codex untuk fitur dasar; sementara pengguna berbayar dapat membuka efek keluaran yang lebih lanjut. Bersamaan dengan itu, OpenAI juga membuka akses GPT-Image-2 API, dengan penetapan harga dihitung berdasarkan kualitas output dan pengelompokan resolusi, untuk memberi fleksibilitas integrasi bagi tim perusahaan dan pengembang.

Perlu dicatat bahwa tanggal berakhirnya pengetahuan model baru adalah Desember 2025; untuk prompt pembuatan gambar yang melibatkan peristiwa terkini, akurasi mungkin mengalami batasan tertentu. Selain itu, kecepatan pembuatan komposisi yang rumit juga tidak dapat secepat tanya-jawab teks biasa secara instan, namun tetap hanya membutuhkan beberapa menit.

Artikel ini, ChatGPT Images 2.0 hadir! Akurasi pembuatan teks meningkat pesat, dengan mudah menghasilkan poster pemasaran, pertama kali muncul di Rantai Berita ABMedia.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

CEO Google Cloud: Gemini akan Menggerakkan Peluncuran Siri Apple yang Dipersonalisasi pada 2026

Berita Industri AI

Ringkasan: Gemini akan menggerakkan Siri Apple yang dipersonalisasi pada 2026, dibangun di atas Foundation Models milik Apple dan kolaborasi Gemini; Apple sedang menguji Siri bergaya obrolan di iOS 27/macOS 27, yang dijadwalkan untuk WWDC 2026. Abstrak: Gemini milik Google Cloud ditargetkan untuk menggerakkan Siri Apple yang dipersonalisasi pada 2026, menggabungkan Gemini dengan Foundation Models milik Apple dalam kolaborasi bernilai sekitar $1 miliar. Apple sedang menguji versi Siri yang didesain ulang dan bergaya obrolan di iOS 27/macOS 27, dengan antarmuka Dynamic Island dan fitur baru, menjelang pengungkapan di WWDC 2026 pada 8 Juni.

GateNews22menit yang lalu

Kesepakatan SpaceX-Cursor $60B Memberikan Bukti Baru untuk Argumen Pengampunan SBF

Berita Industri AI

Ringkasan SpaceX mengumumkan kemitraan $60 miliar Cursor dengan opsi untuk mengakuisisi, membentuk upaya pengampunan SBF karena kepemilikan awal Cursor Alameda akan bernilai sekitar $3 miliar saat ini. Tulisan ini menimbang klaim insolvensi SBF, kampanye yang dilakukan orang tuanya, keberatan para kreditur, dan peluang pengampunan yang tipis. Ringkasan Singkat Kesepakatan SpaceX-Cursor mendorong upaya pengampunan SBF; saham $200k Alameda akan menjadi ~ $3B hari ini (15,000x). SBF berargumen bahwa FTX tidak benar-benar insolven; pasar menunjukkan peluang pengampunan yang rendah; Trump kemungkinan besar tidak akan mengampuni.

GateNews29menit yang lalu

Saham Chegg Anjlok 99% karena AI Mengganggu Pasar Edtech

Saham Berita Industri AI

Ringkasan: Chegg melonjak seiring permintaan pendidikan online, lalu alat AI mengganggu modelnya, memicu PHK besar-besaran dan anjlok hingga turun di bawah $2, dengan pergeseran yang lebih luas didorong AI yang juga menekan penambang kripto dan perusahaan fintech. Abstrak: Artikel ini menelaah kebangkitan Chegg sebagai idola edtech pada era pandemi dan penurunannya berikutnya di tengah adopsi cepat AI generatif, yang memberikan jawaban cepat dan menggerus proposisi nilai Chegg. Artikel ini mendokumentasikan PHK pada 2025 dan penurunan saham yang mendekati penghapusan pencatatan, serta menempatkan pengalaman Chegg dalam konteks gangguan AI yang lebih luas: penambang Bitcoin beralih ke operasi AI, dan strategi yang lahir dari AI mendefinisikan ulang daya saing di fintech dan seterusnya.

CryptoFrontier39menit yang lalu

OpenAI Merilis Model Filter Privasi Open-Source untuk Deteksi dan Penyensoran PII

Berita Industri AI

Abstrak: Filter Privasi OpenAI adalah model open-source yang dapat dijalankan secara lokal untuk mendeteksi dan menyensor PII dalam teks. Model ini mendukung konteks yang besar, mengidentifikasi banyak kategori PII, dan dimaksudkan untuk alur kerja yang menjaga privasi seperti persiapan data, pengindeksan, pencatatan, dan moderasi. Filter Privasi OpenAI adalah model open-source yang dijalankan secara lokal (konteks 128k-token) yang mendeteksi dan menyensor PII dalam teks, mencakup data kontak, data finansial, dan data kredensial untuk alur kerja privasi.

GateNews1jam yang lalu

OpenAI Berencana Menerapkan 30GW Kekuatan Komputasi pada 2030

Berita Industri AI

OpenAI menargetkan 30GW komputasi pada tahun 2030 untuk memenuhi kebutuhan AI yang terus meningkat, dengan 8GW telah diselesaikan dari target 10GW pada tahun 2025. Ekspansi ini menandakan strategi untuk memperbesar infrastruktur bagi pengembangan dan penerapan AI generasi berikutnya. OpenAI berencana mencapai 30GW kekuatan komputasi pada tahun 2030 untuk mengakomodasi meningkatnya kebutuhan AI, dengan sudah menyelesaikan 8GW dari target 10GW untuk tahun 2025. Langkah ini mencerminkan perluasan strategis infrastruktur untuk mendukung pengembangan dan penerapan AI generasi berikutnya.

GateNews1jam yang lalu

Agen Penemuan Kerentanan Berbasis AI 360 Menemukan Hampir 1.000 Eksploitasi Zero-Day, Bersaing dengan Mythos

Agen AI Berita Industri AI

Agen AI yang digerakkan oleh 360 Digital Security mengklaim telah menemukan sekitar 1.000 kerentanan baru, termasuk di Office dan OpenClaw; kini AI menjadi inti untuk penemuan dan persiapan rantai eksploit, menyaingi Mythos. Abstrak: Sebuah laporan yang dikutip Bloomberg mencatat bahwa 360 Digital Security Group’s AI-driven Vulnerability Discovery Agent telah mengidentifikasi hampir 1.000 kerentanan yang sebelumnya tidak dikenal dalam beberapa bulan terakhir, termasuk pada Microsoft Office dan framework OpenClaw. Perusahaan tersebut mengatakan bahwa AI telah menjadi mesin utama untuk penemuan kerentanan dan telah mengumumkan sebuah alat AI untuk mempercepat konstruksi rantai eksploit. Benincasa menggambarkan 360 sebagai pesaing Mythos milik Anthropic, berdasarkan tinjauan Natto Thoughts atas pengumuman berbahasa Mandarin perusahaan tersebut.

GateNews1jam yang lalu

Komentar

0/400

Tidak ada komentar