Bagaimana cara menggunakan ChatGPT Images 2.0? Pengujian menu mie sapi, sampul majalah, efek edukasi multibahasa

robot
Pembuatan abstrak sedang berlangsung

OpenAI luncurkan alat gambar langsung ChatGPT Images 2.0, menonjolkan kemampuan penataan kompleks dan pengolahan teks multibahasa (termasuk bahasa Mandarin), artikel ini akan memperkenalkan secara menyeluruh fitur, keunggulan, fungsi paket gratis dan berbayar, serta hasil pengujian pembuatan gambar.

Apa itu ChatGPT Images 2.0? Beritahu kamu fitur utama dan keunggulannya!

Alat gambar langsung AI yang mampu bersaing dengan Gemini Nano Banana 2 telah hadir? OpenAI mengumumkan peluncuran ChatGPT Images 2.0, didukung oleh model GPT Image 2 yang baru, menonjolkan kemampuan memilih, mengatur, dan mengungkapkan informasi dalam gambar. Berikut adalah 3 keunggulan utama ChatGPT Images 2.0:

Kemampuan penataan dan pengolahan teks multibahasa yang kuat

Pertama, fitur yang paling mencolok adalah peningkatan besar dalam kemampuan penataan dan pengolahan teks multibahasa dari ChatGPT Images 2.0.

Media luar 《Techcrunch》 menunjukkan bahwa sebelumnya, sebagian besar alat pembuatan gambar AI menggunakan model difusi, sering mengalami kesulitan dalam menulis teks, sementara ChatGPT Images 2.0 mampu menampilkan detail kecil seperti teks, ikon, dan antarmuka pengguna dengan akurat.

OpenAI menyatakan bahwa Images 2.0 menunjukkan kemajuan signifikan dalam pengolahan bahasa non-Latin, termasuk Mandarin, Jepang, Korea, Hindi, dan Bengali, semuanya dapat dihasilkan dengan kejernihan tinggi dalam gambar.

Sumber gambar: Contoh hasil generasi resmi ChatGPT Images 2.0 dari OpenAI

Kemampuan berpikir baru dan pencarian daring

Selain kemampuan penataan dan pengolahan teks multibahasa, ChatGPT Images 2.0 juga menawarkan kemampuan berpikir baru yang dapat membantu menghasilkan gambar melalui pencarian informasi secara real-time di internet. Model ini memiliki basis pengetahuan yang diperbarui hingga Desember 2025, membantu dalam menghasilkan konten yang melibatkan peristiwa terkini.

Sumber gambar: Contoh hasil generasi resmi ChatGPT Images 2.0 dari OpenAI

Mendukung resolusi 2K dan rasio aspek beragam

ChatGPT Images 2.0 mendukung pembuatan gambar hingga resolusi 2K, serta menawarkan pilihan rasio aspek yang lebih luas, mulai dari lebar 3:1 hingga panjang 1:3.

Peneliti utama OpenAI, Boyuan Chen, menyatakan bahwa arsitektur Images 2.0 telah mengalami revisi menyeluruh, merupakan model serbaguna yang hanya memerlukan petunjuk teks sederhana untuk menangani konversi sudut pandang gaya 3D dan penalaran spasial yang kompleks.

Fungsi pengguna paket gratis dan berbayar ChatGPT Images 2.0

Setiap tingkat layanan berbayar berbeda, fitur yang dapat diakses pun berbeda pula, dirangkum sebagai berikut:

  • Pengguna gratis: Saat ini dapat menggunakan model dasar ImageGen 2.0 untuk menjalankan tugas pembuatan gambar standar. Versi dasar ini sudah mencakup banyak peningkatan inti, seperti kepatuhan instruksi yang lebih baik, efek rendering teks yang lebih kuat, dukungan multibahasa, dan lebih banyak pilihan rasio aspek.
  • Pengguna ChatGPT Plus, Business, dan Enterprise: Pengguna berbayar ini dapat mengaktifkan model berpikir baru. Dalam mode ini, generator gambar chatbot akan menggunakan pencarian internet untuk membantu pembuatan gambar, membuat diagram visual berdasarkan file yang diunggah pengguna, dan melakukan penalaran struktural sebelum menghasilkan gambar. Maksimal 8 gambar dapat dibuat sekaligus dalam satu waktu, dan memastikan konsistensi karakter, objek, dan gaya di setiap scene.
  • Pengguna Pro: Pengguna ini mendapatkan akses ke model ImageGen Pro yang lebih canggih. Meskipun OpenAI belum menyediakan detail perbedaan pasti antara Pro dan fitur berpikir, pengguna perusahaan dapat menganggap fitur berpikir sebagai peningkatan fitur nyata, cocok untuk tugas yang membutuhkan data faktual, mengubah dokumen internal menjadi diagram penjelasan, atau menjaga konsistensi visual di berbagai aset.
  • Pengembang API: Sekarang dapat mengintegrasikan model gpt-image-2, mendukung resolusi tinggi dan pengaturan rasio aspek yang fleksibel.

Pengujian ChatGPT Images 2.0: menu, majalah, diagram penjelasan, dll

Bagaimana performa nyata ChatGPT Images 2.0, apakah sesuai dengan promosi OpenAI? Mari kita uji.

Pengujian menu restoran mie sapi

Editor 《Crypto City》 menguji dengan paket gratis ChatGPT, membuat menu masakan mie sapi Taiwan, dengan petunjuk sederhana: “Bantu saya buatkan gambar menu masakan mie sapi Taiwan, gunakan bahasa Mandarin tradisional, tampilkan nama, harga, dan info gambar setiap hidangan.”

Berikut hasilnya:

Sumber gambar: Contoh hasil generasi ChatGPT Images 2.0

Dari konten yang dihasilkan dengan paket gratis, terlihat cukup bagus, namun jika diperhatikan lebih detail, Images 2.0 masih mengalami kesalahan penulisan pada karakter Mandarin tradisional yang kompleks, mungkin hasil dari paket berbayar akan lebih baik.

Selain itu, hasilnya cukup mendekati harga mie sapi di Taipei, dan juga bisa makan di tempat dengan tambahan mie gratis sekali.

Namun, jika menu ini akan dicetak, secara praktis untuk percetakan, mengubah gambar dari ChatGPT Images 2.0 menjadi file vektor (seperti EPS, .ai dari Adobe Illustrator, PDF), dan menggunakan mode warna CMYK adalah pilihan terbaik. Percetakan mungkin juga menerima file JPG dan PNG, tetapi jika Anda memiliki standar kualitas cetak yang tinggi, akan lebih sulit menyesuaikan hasil sesuai keinginan.

Pengujian sampul majalah teknologi

Selanjutnya, pengujian sampul majalah fiksi ilmiah, kali ini 《Crypto City》 menguji kemampuan penataan kompleks, dengan petunjuk: “Bantu saya buatkan sampul majalah teknologi berbahasa Mandarin tradisional, judul ‘Crypto City’, tema ‘Perpaduan Blockchain dan AI’, sampul ini harus memiliki judul, nomor edisi, barcode, dan tanggal tenggat yang jelas dan profesional.”

Berikut hasilnya:

Sumber gambar: Contoh hasil generasi ChatGPT Images 2.0

Hasil pengujian ini mirip dengan sebelumnya, terlihat cukup bagus dari jauh, namun saat diperhatikan detailnya, masih ada kekurangan dalam penanganan karakter Mandarin yang kompleks. Font di sampul ini juga mirip dengan font “Jin Xuan” dari Justfont, perusahaan font Taiwan, belum diketahui apakah ada lisensi resmi.

Kekhawatiran semacam ini, 《Crypto City》 juga pernah mengangkatnya saat Nano Banana Pro dirilis.

  • **Laporan terkait:**Pengujian Nano Banana Pro: Perbaikan karakter Mandarin! Tapi kekhawatiran hak cipta animasi dan font juga muncul

Pengujian diagram penjelasan multibahasa

《Crypto City》 menguji sebuah diagram penyebab gempa bumi berbahasa Mandarin tradisional, Jepang, dan Korea, dengan teks multibahasa yang cukup kompleks, berhasil dirender secara umum. Dalam penataan, digunakan warna berbeda sesuai bahasa, meskipun saat diperhatikan, beberapa karakter Mandarin yang rumit dan Korea masih mengalami kabur.

Berikut hasilnya:

Sumber gambar: Contoh hasil generasi ChatGPT Images 2.0

Images 2.0 mampu menjaga konsistensi karakter dan objek, menyelesaikan proses yang rumit

Selain itu, Images 2.0 juga memiliki fitur yang dapat diedit, sama seperti Nano Banana 2, cukup klik “Edit” di kiri bawah gambar yang dihasilkan untuk mulai mengoperasikan, menjaga konsistensi karakter dan objek, sehingga pembuatan halaman komik, seri gambar media sosial, atau denah desain ruangan menjadi lebih mudah.

Manajer produk ChatGPT Images, Adele Li, menyatakan bahwa fitur ini menyelesaikan proses yang sebelumnya harus dilakukan secara manual dan satu per satu, memungkinkan kreator dengan mudah membuat buku gambar anak-anak yang memiliki identitas visual yang sama atau materi promosi merek.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan