ظهور ChatGPT Images 2.0! يُزعم أنه يفكر، وتطور في عرض النصوص، وتجربة فعالة لقائمة نودلز اللحم البقري

robot
إنشاء الملخص قيد التقدم

أطلقت OpenAI أداة الصور 2.0 لـ ChatGPT، والتي تتميز بقدرات قوية في التنسيق المعقد ومعالجة النصوص متعددة اللغات (بما في ذلك الصينية)، ستقدم المقالة شرحًا شاملًا لوظائف وميزات Images 2.0، وخطط الاستخدام المجاني والمدفوع، بالإضافة إلى نتائج الاختبار الفعلي.

ما هو ChatGPT Images 2.0؟ سنوضح لك الوظائف والميزات الرئيسية!

هل أداة إنشاء الصور الذكية التي تنافس Gemini Nano Banana 2 قد وصلت؟ أعلنت OpenAI عن إطلاق ChatGPT Images 2.0، المدعوم بنموذج GPT Image 2 الجديد، والذي يركز على إنتاج صور ذات قدرة عالية على الاختيار، والترتيب، والكشف عن المعلومات. إليك أهم ثلاث ميزات لـ ChatGPT Images 2.0:

معالجة قوية للتنسيق والنصوص متعددة اللغات

أول ميزة واضحة هي تحسين كبير في قدرات التنسيق ومعالجة النصوص متعددة اللغات في ChatGPT Images 2.0.

ذكرت وسائل الإعلام الأجنبية «Techcrunch» أن أدوات توليد الصور بالذكاء الاصطناعي السابقة كانت غالبًا تعتمد على نماذج الانتشار، وغالبًا ما كانت تواجه صعوبة في كتابة النصوص، لكن ChatGPT Images 2.0 يمكنه بدقة عرض النصوص الصغيرة، والرموز، وواجهات المستخدم وغيرها من التفاصيل.

قالت OpenAI إن Images 2.0 أحرز تقدمًا ملحوظًا في معالجة اللغات غير اللاتينية، بما في ذلك الصينية، واليابانية، والكورية، والهندية، والبنغالية، حيث يمكنها توليدها بوضوح عالٍ داخل الصور.

مصدر الصورة: أمثلة من توليد رسمي من OpenAI ChatGPT Images 2.0

قدرات تفكير جديدة والبحث عبر الإنترنت

بالإضافة إلى قدرات التنسيق ومعالجة النصوص متعددة اللغات، يوفر ChatGPT Images 2.0 قدرات تفكير جديدة، حيث يمكنه البحث في الإنترنت في الوقت الحقيقي لمساعدة في توليد الصور. قاعدة معرفته محدثة حتى ديسمبر 2025، مما يساعد على إنشاء محتوى يتضمن أحداثًا حديثة.

مصدر الصورة: أمثلة من توليد رسمي من OpenAI ChatGPT Images 2.0

دعم دقة 2K وتنوع نسب الطول والعرض

يدعم ChatGPT Images 2.0 توليد صور بدقة تصل إلى 2K، ويوفر خيارات أوسع لنسب الطول والعرض، من 3:1 للعرض الواسع إلى 1:3 للطول الطويل.

قال الباحث في OpenAI، Boyuan Chen، إن بنية Images 2.0 قد خضعت لإعادة تصميم كاملة، وهي نموذج عام يمكنه، عبر أوامر نصية بسيطة، التعامل مع تحويلات زوايا بأسلوب ثلاثي الأبعاد واستنتاجات فضائية معقدة.

وظائف المستخدمين في خطة مجانية ومدفوعة لـ ChatGPT Images 2.0

هل الجودة مقابل السعر؟ تختلف الوظائف التي يمكن للمستخدمين المدفوعين في ChatGPT Images 2.0 فتحها، وتنظم كالتالي:

  • المستخدمون المجانيون: يمكنهم حاليًا استخدام نموذج ImageGen 2.0 الأساسي لأداء مهام توليد الصور القياسية. النسخة الأساسية تتضمن العديد من الترقيات الأساسية، مثل تحسين التوافق مع الأوامر، وتعزيز تأثيرات النص، ودعم اللغات المتعددة، وخيارات نسب الطول والعرض المتنوعة.
  • مستخدمو ChatGPT Plus، Business، وEnterprise: يمكنهم تفعيل نموذج التفكير الجديد. في هذا الوضع، يستخدم مولد الصور الخاص بالدردشة الإنترنت للبحث عن المعلومات، ويقوم بإنشاء رسومات تفسيرية استنادًا إلى الملفات التي يرفعها المستخدم، ويقوم بعمل استنتاجات هيكلية قبل توليد الصورة. يمكنه توليد حتى 8 صور في مرة واحدة، مع ضمان التناسق في الشخصيات، والأشياء، والأساليب في كل مشهد.
  • مستخدمو Pro: يحصلون على وصول أكثر تقدمًا إلى نموذج ImageGen Pro. على الرغم من أن OpenAI لم توضح بعد الفروق الدقيقة بين Pro ووظيفة التفكير، إلا أن المستخدمين المؤسساتيين يمكنهم اعتبار وظيفة التفكير ترقية حقيقية، وتناسب المهام التي تتطلب حقائق، وتحويل المستندات الداخلية إلى رسومات تفسيرية، أو الحفاظ على التناسق البصري عبر أصول متعددة.
  • مطورو API: يمكنهم الآن دمج نموذج gpt-image-2، مع دعم دقة عالية وخيارات مرنة لنسب الطول والعرض.

اختبار ChatGPT Images 2.0: قوائم الطعام، المجلات، الرسوم التوضيحية

هل الأداء الفعلي لـ ChatGPT Images 2.0 يطابق ما أعلنت عنه OpenAI؟ لنختبر ذلك.

اختبار قائمة طعام لوجبة لحم البقر

استخدم محرر «عاصمة التشفير» خطة مجانية من ChatGPT لاختبار، وطلب إنشاء قائمة طعام لوجبة لحم البقر التايوانية، مع توجيه بسيط: «ساعدني في إنشاء قائمة طعام تركز على لحم البقر التايواني، ويجب أن تكون باللغة التقليدية، وتعرض أسماء الأطباق، والأسعار، والمعلومات المصورة.»

وفيما يلي نتائج التوليد:

مصدر الصورة: توليد من ChatGPT Images 2.0

بالنسبة للمحتوى الذي يمكن إنشاؤه باستخدام الخطة المجانية، يبدو جيدًا للوهلة الأولى، لكن عند التدقيق ستجد أن Images 2.0 لا تزال تواجه مشاكل في كتابة الحروف المعقدة في الصينية التقليدية، مع أخطاء في الكتابة، وربما تكون نتائج الخطط المدفوعة أفضل.

كما أن النتائج تتقارب مع أسعار لحم البقر في تايبيه، ويمكنك أيضًا طلب إضافة نودلز مجانًا.

لكن إذا كنت ستطبع قائمتك، فمن الأفضل تحويل الصور التي يوفرها ChatGPT Images 2.0 إلى ملفات متجهة (مثل EPS، أو ملفات .ai من Adobe Illustrator، أو PDF)، واستخدام ألوان CMYK، فهي الأنسب للطباعة. قد يقبل الطابعون ملفات JPG و PNG، لكن إذا كانت لديك متطلبات عالية للجودة، سيكون من الصعب تعديلها لتلبية رغباتك.

اختبار غلاف مجلة تقنية

ثم نختبر غلاف مجلة خيالية، وهذه المرة اختبار «عاصمة التشفير» لتنسيق معقد، مع توجيه: «ساعدني في إنشاء غلاف لمجلة تقنية باللغة التقليدية، عنوان المجلة هو “عاصمة التشفير”، موضوعها “تقاطع البلوكشين والذكاء الاصطناعي”، ويجب أن يحتوي الغلاف على عنوان، ورقم المجلد، وتاريخ انتهاء الصلاحية فوق الباركود، ويجب أن تكون جميع النصوص واضحة ومحترفة في الترتيب.»

وفيما يلي نتائج التوليد:

مصدر الصورة: توليد من ChatGPT Images 2.0

هذه النتيجة مشابهة للنتائج السابقة، فهي تبدو جيدة من النظرة الأولى، لكن عند التدقيق في معالجة الحروف الصينية المعقدة، لا تزال هناك بعض الأخطاء، والخطوط المستخدمة على الغلاف تشبه خط «كينغسون» من Justfont، وهو خط صيني تجاري، ولا نعلم إن كان تم الحصول على ترخيص له.

مثل هذا الشكوك، طرحتها «عاصمة التشفير» أيضًا عند إصدار Nano Banana Pro.

  • تقرير ذو صلة: اختبار Nano Banana Pro: تقدم في الحروف الصينية! لكن تظهر مخاوف من حقوق النشر للرسوم المتحركة والخطوط

اختبار الرسوم البيانية متعددة اللغات التفسيرية

اختبر «عاصمة التشفير» رسمًا بيانيًا لسبب حدوث زلزال، مكتوبًا بالصينية التقليدية، واليابانية، والكورية، ونجح في تقريبًا في عرض النصوص متعددة اللغات بشكل جيد. من ناحية التنسيق، تم تمييز اللغات بألوان مختلفة، رغم أن بعض الحروف الصينية المعقدة، والكلمات الكورية، أو الحروف الصينية ذات التفاصيل الدقيقة لا تزال تظهر ضبابية.

وفيما يلي نتائج التوليد:

مصدر الصورة: توليد من ChatGPT Images 2.0

Images 2.0 تحافظ على تماسك الشخصيات والأشياء، وتُحل مشكلة العمليات المعقدة

بالإضافة إلى ذلك، فإن Images 2.0، مثل Nano Banana 2، تتيح إمكانية التعديل، حيث يمكن النقر على زر «تحرير» أسفل الصورة المولدة لبدء التعديل، مما يحافظ على تماسك الشخصيات والأشياء، ويسهل تصميم صفحات المانغا، أو سلسلة الصور الاجتماعية، أو مخططات تصميم غرف المنازل.

قالت Adele Li، مسؤولة منتجات ChatGPT Images، إن هذه الميزة تحل مشكلة كانت تواجه المستخدمين سابقًا، حيث كان يتعين عليهم توليد صورة واحدة يدوياً ثم تجميعها، مما يستهلك وقتًا وجهدًا، الآن يمكن للمبدعين إنشاء كتب أطفال ذات طابع بصري موحد أو مواد تسويقية للعلامة التجارية بسهولة.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت