اكتب "لوحة قائمة مقهى" في نموذج صور قبل عام، وستحصل على لافتة جميلة مغطاة بحروف ذائبة لا معنى لها. حروف تكاد تهجئ كلمات. ذلك الفشل الواحد أبقى مولدات الصور خارج أعمال التصميم الحقيقية، حيث يكون النص هو الفكرة كلها. GPT Image 2، الصادر في 21 أبريل 2026، هو أول نموذج تختفي معه هذه الشكوى تقريباً.
توفره OpenAI بطريقتين. داخل ChatGPT يحمل اسم "Images 2.0" ويعمل على كل الخطط، بما فيها الطبقة المجانية. وفي API هو النموذج gpt-image-2، ويستبدل النموذج المهمل حالياً gpt-image-1. النموذج نفسه من الداخل، ببابين مختلفين. تقرأ هذه المراجعة الأدلة العامة: وثائق توليد الصور من OpenAI، وصفحة الأسعار، وبطاقة نظام Images 2.0، ولوحات التفضيل العامة.
مشكلة النص، حُلّت تقريباً
القدرة الرئيسية هي رسم نص مقروء، لا شعار من ثلاث كلمات فقط. توصيف OpenAI نفسه يشير إلى "توليد التفاصيل والتعقيد مثل النص الكثيف"، وهناك تشعر بالقفزة: شريحة بعنوان وأربع نقاط، إنفوجرافيك بتسميات، نموذج عبوة بقائمة مكونات حقيقية، أو لافتة بنص غير لاتيني. كانت النماذج السابقة تنهار بمجرد ارتفاع عدد الكلمات. هذا النموذج يتماسك عبر التخطيطات الكثيفة والنصوص متعددة اللغات.
هناك تغييران آخران مهمان في الاستخدام اليومي. يوجد وضع "تفكير" اختياري لتوليد الصور في الخطط المدفوعة، يستهلك حوسبة أكبر ليخطط لتركيب أصعب قبل الرسم. كما أصبح التوليد أسرع بنحو أربعة أضعاف من النموذج السابق، لذلك صارت دورة التجربة والتعديل التي يعتمد عليها عمل الصور أقل إيلاماً.
أين ما زال يتعثر
لا تفهم "حُلّت" على أنها "مثالية". يصرح دليل OpenAI بأن النموذج "قد ما زال يتعثر في موضع النص الدقيق ووضوحه"، خصوصاً في الطلبات المزدحمة، وقد لا يحافظ على العناصر البصرية باتساق داخل تخطيط منظم. عملياً ستظل ترى أحياناً حرفاً ساقطاً أو تعليقاً منزاحاً نصف سطر. العلاج نفسه مع أي مولد: تعامل مع الناتج الأول كمسودة، واقرأ كل كلمة، وأعد توليد ما أخطأ فيه.
هناك حدود صلبة تستحق معرفتها قبل ربطه بخط إنتاج. GPT Image 2 لا يدعم الخلفيات الشفافة، وهذا يستبعد كثيراً من أعمال الشعارات والملصقات ما لم تضف خطوة قص منفصلة. وعلى مستوى API، لا يدعم نموذج الصور البث أو استدعاء الدوال أو المخرجات المنظمة أو الضبط الدقيق، لذلك لا يدخل في حلقات الوكلاء بالطريقة التي يدخل بها نموذج نصي.
هل يتصدر لوحات الترتيب؟
في اختبار التفضيل العمياء للنص إلى الصورة على Arena.ai، حيث يختار الناس الأفضل بين صورتين بلا تسميات، يأتي GPT Image 2 في المركز الأول عموماً وبفارق واسع عن النموذج التالي. خذ رقم Elo الدقيق بحذر؛ فالرقم الحي قرأناه بشكل غير متسق عند الفحص، ودرجات تفضيل الجمهور تتحرك مع تراكم الأصوات. الادعاء الموثوق هو الترتيب وحجم الفجوة، لا رقم محدد. وهذا هو التحفظ نفسه الذي يطرحه مقال benchr عن لماذا توقفت المعايير عن إخبارك بأي شيء حول كل لوحة ترتيب: شارة المركز الأول نقطة بداية، لا حكم على طلباتك المحددة.
من المهم توضيح النطاق أيضاً. هذه المراجعة عن توليد الصور، أي أن النموذج يرسم صورة. هذا سؤال مختلف عن مدى جودة قراءة النموذج لصورة تقدمها له واستدلاله عليها، وهذا ما يقيسه benchr's multimodal capability ranking measures across the frontier models. A model can be great at one and ordinary at the other.
كم يكلف؟
داخل ChatGPT لا توجد رسوم منفصلة: توليد الصور مدمج في خطتك، بما فيها الطبقة المجانية، مع حدود استخدام لا تنشرها OpenAI كرقم ثابت. هذا يجعله الافتراضي السهل للصور الفردية.
عند الحجم الكبير، يكون API هو مكان الحساب. صورة 1024x1024 تكلف تقريباً $0.006 بجودة منخفضة، ونحو $0.053 بجودة متوسطة، وحوالي $0.211 بجودة عالية، مع إضافة تكاليف الرموز فوقها (نحو $5 لكل مليون رمز إدخال نصي، و$8 لكل مليون رمز إدخال صور، و$30 لكل مليون رمز إخراج صور). تتغير أرقام الصورة الواحدة حسب الحجم والجودة، لذلك سعّر إعداداتك الفعلية عبر حاسبة OpenAI قبل وضع ميزانية دفعة. كما يحتاج الوصول إلى API تحقق المؤسسة، وهي خطوة تربك المستخدمين الجدد. إذا كنت توازن حزمة OpenAI الأوسع، تغطي مراجعة GPT-5.5 أين استقر جانب النص في تلك المجموعة.
الخلاصة
اختر ChatGPT Images 2.0 إذا كانت الكلمات تظهر في أي مكان داخل صورتك. لا شيء آخر في السوق يتعامل مع النص الكثيف الصحيح بالموثوقية نفسها الآن، وهذه القدرة الواحدة تغطي معظم أعمال التصميم العملية التي يريدها الناس من مولد. الوصول المجاني داخل ChatGPT يجعله جديراً بالتجربة قبل التفكير في أداة صور مدفوعة.
تريث، أو احتفظ بأداة ثانية، إذا كان عملك يدور حول أصول بخلفية شفافة، أو تحتاج تحكماً برمجياً صارماً عبر API، أو تعمل بأسلوب لا يظهر فيه نص إطلاقاً ويبدو نموذج آخر أنسب. لكل من يصنع شرائح ولافتات ورسومات اجتماعية، انتهى عصر الحروف المشوهة، وهذا هو النموذج الذي أنهاه.
أسئلة شائعة
ما ChatGPT Images 2.0 وما الفرق بينه وبين GPT Image 2؟
هما الإصدار نفسه. "ChatGPT Images 2.0" هو الاسم الذي تستخدمه OpenAI لتسويق توليد الصور داخل ChatGPT؛ و"GPT Image 2" (معرّف النموذج gpt-image-2) هو النموذج الأساسي في API. أُطلق في 21 أبريل 2026 ويستبدل gpt-image-1 الأقدم الذي أصبح مهملاً.
هل يستطيع GPT Image 2 رسم نص مقروء داخل الصور؟
نعم، وهذه هي ترقية العنوان. يتعامل مع تخطيطات نصية كثيفة مثل الإنفوجرافيك والشرائح والقوائم والرسوم، إضافة إلى نصوص متعددة اللغات، أفضل بكثير من نماذج الصور السابقة. ما زالت OpenAI تنبه إلى أنه قد يتعثر في وضع النص بدقة ووضوحه في الطلبات المعقدة، لذلك راجع الناتج قبل نشره.
كم يكلف ChatGPT Images 2.0؟
داخل ChatGPT هو مشمول في خطتك، بما في ذلك الطبقة المجانية، مع حدود استخدام لا تنشرها OpenAI كرقم ثابت. عبر API (gpt-image-2)، تكلف كل صورة تقريباً بين $0.006 للجودة المنخفضة و$0.211 للجودة العالية عند 1024x1024، فوق تكاليف الرموز البالغة نحو $5 لكل مليون رمز إدخال نصي و$30 لكل مليون رمز إخراج صور. يتطلب الوصول إلى API التحقق من المؤسسة.
ما أبرز نقاط ضعف GPT Image 2؟
وفق دليل OpenAI نفسه، قد يختل وضع النص ووضوحه أحياناً، وتضيف الطلبات المعقدة كموناً، وقد يكون غير متسق في الحفاظ على العناصر البصرية داخل التخطيطات المنظمة. كما أنه لا يدعم الخلفيات الشفافة، ولا تتوفر ميزات البث، واستدعاء الدوال، والمخرجات المنظمة، والضبط الدقيق لنموذج الصور.
هل GPT Image 2 أفضل مولد صور الآن؟
يتصدر لوحة تفضيلات النص إلى الصورة العمياء في Arena.ai بفارق واسع، رغم أن رقم Elo الدقيق ظهر بشكل غير متسق، وهذه أصوات جماعية لا درجة ثابتة. في العمل كثيف النصوص هو الاختيار الواضح. أما للأنماط الأخرى، فاختبر طلباتك أمام منافس قبل الالتزام.
سجل التغييرات
- 30 مايو 2026 — نُشرت النسخة الأولى. تم التحقق من القدرات والأسعار والحدود وموقع لوحة الترتيب وفق وثائق توليد الصور من OpenAI، وصفحة الأسعار، وبطاقة نظام Images 2.0، وArena.ai.
المراجع
- OpenAI, "gpt-image-2 model," developers.openai.com، اطُّلع عليه في مايو 2026.
- OpenAI, "Image generation guide," developers.openai.com، اطُّلع عليه في مايو 2026.
- OpenAI, "Pricing," developers.openai.com، اطُّلع عليه في مايو 2026.
- OpenAI, "ChatGPT Images 2.0 system card," deploymentsafety.openai.com, April 21, 2026.
- Arena.ai, "Text-to-Image leaderboard," arena.ai, May 2026 snapshot.