في يوم الثلاثاء، أصدرت OpenAI ChatGPT Images 2.0، وهو تحديث لنموذج إنشاء الصور المدمج في chatbot. يوفر النظام المسمى gpt-image-2 تحسينات في عرض النص ودعم لغات متعددة والقدرة على إنشاء تركيبات أكثر تعقيدًا. يمكن الآن للمستخدمين في جميع خطط ChatGPT الوصول إلى الإصدار القياسي.
تم الإطلاق في 21 أبريل 2026. وسلطت الشركة الضوء على تضمين وضع “التفكير” الذي يسمح للنموذج بالبحث في الويب والتحقق من التفاصيل وإنشاء ما يصل إلى ثماني صور من موجه واحد. وهذا يسهل إنتاج القصص المصورة والرسوم البيانية والمواد ذات التخطيط المنظم. تصل الدقة إلى 2K في بعض الحالات.
يسلط OpenAI الضوء على المنطق والإخلاص في الميزات الجديدة
يتبع النموذج الآن التعليمات بشكل أكثر دقة ويحافظ على العناصر المطلوبة مثل الرموز والواجهات والنص الصغير. واستشهدت OpenAI بأمثلة على الملصقات العلمية وبطاقات الوصفات وشرائح العرض التقديمي كمجالات لتحقيق مكاسب. كما تم تحسين دعم النصوص اليابانية والكورية والهندية والبنغالية.
يمكن للمطورين الوصول عبر واجهة برمجة التطبيقات (API)، بأسعار تعتمد على الجودة والدقة. يتمتع المستخدمون المدفوعون بقدرة أكبر في الوضع المتقدم. ويأتي التحديث بعد أشهر من التحسينات السابقة لنظام التصوير.
- توليد صور متعددة مترابطة
- وضع التفكير مع بحث الويب
- عرض أفضل للنص بلغات متعددة
- دعم نسب العرض إلى الارتفاع المختلفة، من 3:1 إلى 1:3
- دقة تصل إلى 2K على المخرجات المحددة
https://twitter.com/OpenAI/status/2046670978890276918?ref_src=twsrc%5Etfw
ويشير الناقد إلى العيوب في الفهم الوظيفي
قام غاري ماركوس، الباحث المعروف بتشكيكه في قدرات الذكاء الاصطناعي الحالية، باختبار النظام الجديد باستخدام مخططات الدراجات. في الملصق الأوتوماتيكي، خلط النموذج بين الفرامل الخلفية وأنبوب المقعد والعتاد مع الفرامل. علامة تشير إلى مساحة فارغة.
في اختبار أكثر صعوبة، طلب ماركوس دراجة ترادفية أطول من المتوسط، مع رف للأمتعة وحقائب سرج. أظهرت الصورة التي تم إنشاؤها مشاكل مثل إدخال العجلة الخلفية في العجلة، ورافعة الفرامل في وضع سيئ، والمقود الخلفي على شكل سرج. وأشار ماركوس إلى أن النظام يجمع بين الأنماط المرئية دون فهم الوظيفة الفعلية للأجزاء.
ويقارنه الخبراء بالقيود البشرية
أدرك ماركوس أن الإنسان العادي سيواجه أيضًا صعوبة في رسم الترادف بدقة. ومع ذلك، فإن الميكانيكيين وراكبي الدراجات ذوي الخبرة أو المصممين سيتعرفون على الأخطاء بسرعة. يعمل المثال على مناقشة مدى فهم النموذج للعالم المادي.
تجري المناقشة بينما يحتفل القطاع بالقفزات في التصوير الاحترافي. أكدت الاختبارات المستقلة المكاسب في النص المقروء والتخطيطات الكثيفة، لكن حالات محددة لا تزال تكشف عن ثغرات في الاستدلال السببي.
الورقة الفنية لـ ChatGPT Images 2.0
- النموذج الأساسي: gpt-image-2
- التوفر: جميع مستخدمي ChatGPT
- الوضع المتقدم: المشتركون المدفوعون
- الميزات الرئيسية: المنطق، مخرجات متعددة، نص متعدد اللغات
- القرار: ما يصل إلى 2K
- واجهة برمجة التطبيقات (API): تم إصدارها بأسعار متغيرة
لم يعلق OpenAI علنًا على اختبارات ماركوس حتى الآن. يستمر النظام في التطور، مع تحديثات منتظمة بناءً على تعليقات المستخدمين.

