السؤال مع GPT-5.5 ليس هل هو جيد. السؤال هل الانتقال من GPT-5 يستحق كلفته، لأن OpenAI رفعت سعر API كثيراً للوصول إلى هذه القفزة. سعر GPT-5.5 هو $5 للإدخال و$30 للإخراج لكل مليون رمز؛ وسعر GPT-5 في وثائق نماذج OpenAI الرسمية هو $1.25 للإدخال و$10 للإخراج، ما يجعل GPT-5.5 أعلى بنحو 4 مرات في الإدخال و3 مرات في الإخراج. هذا بند تكلفة حقيقي لأي جهة تعمل بحجم استخدام كبير، ويغيّر السؤال من: "هل GPT-5.5 أفضل؟" إلى: "هل هو أفضل في العمل الذي تنجزه يومياً بما يكفي لتبرير فرق السعر؟"
القراءة الصريحة أن الترقية ضيقة ومقصودة. ركزت OpenAI عليها في الأماكن التي كانت النماذج أضعف فيها، وحيث يتجه الإنفاق: البرمجة الوكيلية واستخدام الحاسوب، أي أن يكتب النموذج الكود وينقحه، ويدير البرامج، ويواصل استخدام الأدوات عبر خطوات كثيرة حتى تكتمل المهمة. إذا كان هذا هو عبء العمل لديك فالحجة قوية. وإذا لم يكن كذلك، فالحجة تضعف بسرعة. مراجعة benchr السابقة لـ GPT-5 تنتهي إلى مزيج يستخدم أكثر من نموذج لمعظم الفرق؛ وGPT-5.5 لا يقلب هذه الخلاصة بقدر ما يحدد بدقة أين يستحق مفتاح OpenAI مكانه.
ما الذي تغيّر تحت الغطاء؟
تقدّم OpenAI نموذج GPT-5.5 بوصفه "فئة جديدة من الذكاء" للبرمجة الوكيلية والعمل المعرفي الاحترافي. إذا أزلنا لغة التسويق، فالادعاء العملي هو التالي: النموذج أفضل في البقاء مع المهمة عبر خطوات كثيرة، وقراءة المخرجات، وتحديد الإجراء التالي، وعدم فقدان الخيط في منتصف حلقة طويلة من استخدام الأدوات. هذا هو نمط الفشل الذي منع الوكلاء من أن يكونوا موثوقين، وهو المحور الذي تتراكم فيه المكاسب الصغيرة طوال الجلسة.
يدعم الرقمان الرئيسيان هذا التموضع، مع تحفظ يجب ذكره من البداية. في Terminal-Bench 2.0، الذي يقيس مهام الوكلاء على سطر الأوامر، تعلن OpenAI نتيجة 82.7%. وفي OSWorld-Verified، وهو معيار استخدام الحاسوب حيث يقود النموذج بيئة سطح مكتب حقيقية، تعلن نتيجة 78.7%. كلا الرقمين من تقييمات OpenAI نفسها، ونُقلا عبر مقالات طرف ثالث تستشهد بإعلان الإطلاق لا عبر لوحة محايدة. لذلك اقرأهما كأرقام مزود: مفيدة للاتجاه العام، لكنها غير مؤكدة مستقلاً.
| المعيار | GPT-5.5 | GPT-5 |
|---|---|---|
| Terminal-Bench 2.0 (برمجة وكيلية / الطرفية) | 82.7% | غير منشور على هذا الإصدار |
| OSWorld-Verified (استخدام الحاسوب) | 78.7% | غير منشور على هذا الإصدار |
| SWE-bench Pro | 58.6% | غير منشور على هذا الإصدار |
ملاحظة حول ما يستطيع الجدول قوله وما لا يستطيع. معايير الوكلاء واستخدام الحاسوب هنا تتبع نسخة الاختبار التي شغّلتها OpenAI عند إطلاق GPT-5.5؛ ولم تكن أرقام GPT-5 المطابقة على نسخ الاختبار نفسها جزءاً من سجل موثّق، لذلك تُترك خلايا المقارنة فارغة بدلاً من تخمينها. رقم SWE-bench Pro البالغ 58.6% منقول عبر مراسلين ويظهر غالباً في مقارنات المنافسين، لا كرقم رئيسي من OpenAI، لذلك اقرأه كتموضع تقريبي لا كمواجهة مباشرة نظيفة. يوجد أيضاً رقم SWE-bench Verified متداول بكثرة عند 88.7% في لوحات طرف ثالث؛ لم تؤكده OpenAI في إعلانها، لذلك تُرك خارج هذه الصفحة عمداً.
السعر ارتفع. هل ارتفعت القيمة؟
هذه هي العقدة. عند $5 / $30 لكل مليون رمز، يعمل GPT-5.5 بسعر إدخال أعلى بنحو 4 مرات من GPT-5 وسعر إخراج أعلى بنحو 3 مرات. تصف OpenAI GPT-5.5 بأنه أكثر كفاءة في استخدام الرموز من أسلافه، لذلك لا ترتفع الكلفة الفعلية للمهمة دائماً بنسبة السعر المعلن نفسها؛ لكن مقدار الفائدة يعتمد بالكامل على عبء عملك، وهو أول ما يجب قياسه قبل الانتقال.
في أعمال الوكلاء، قد تميل الحسابات لصالح الترقية رغم السعر الأعلى. النموذج الذي ينهي مهمة متعددة الخطوات في تشغيل نظيف واحد أرخص من نموذج أرخص يتوقف ويتراجع ويحرق محاولة ثانية كاملة. ضريبة إعادة المحاولة هي المكان الذي تنزف فيه ميزانيات الوكلاء بهدوء. إذا خفّض سلوك GPT-5.5 الأكثر ثباتاً في الحلقات الطويلة معدل التشغيلات الفاشلة لديك، فقد يتفوّق السعر الأعلى لكل رمز في الفاتورة المهمة فعلاً: فاتورة العمل المنجز. مقارنة benchr بين GPT-5 وClaude Opus تشرح كيف تقلب اقتصاديات المهمة نفسها القرار بين النماذج المتقدمة، والمنطق نفسه ينطبق داخل تشكيلة OpenAI.
أما كل ما ليس وكيلياً، فالدفاع عن السعر الإضافي أصعب. المحادثة، والطلبات القصيرة، والتصنيف، والمسودات بضربة واحدة: لا يعتمد أي منها على قوة الحلقات الطويلة التي بُني GPT-5.5 حولها، وبالتالي ستدفع ضريبة البرمجة الوكيلية على عمل لا يستخدمها. لهذا النمط يبقى GPT-5 أفضل من حيث القيمة، ولا يهم سعر الإدخال المخبأ في GPT-5.5 عند $0.50 لكل مليون إلا إذا كنت تعيد استخدام سياقات ثابتة كبيرة. إذا كانت فاتورتك حساسة، فإن دليل benchr عن خفض استخدام الرموز سيؤثر أكثر من تبديل النموذج.
نموذجان باسم "5.5" لا تخلط بينهما
هناك فخ يستحق التنبيه لأنه سهل الوقوع فيه. يوجد إصداران منفصلان يحملان شارة 5.5. الأول هو الإصدار الرئيسي: GPT-5.5 وGPT-5.5 Pro الأعلى، أُعلن عنهما في 23 أبريل 2026؛ وهو نموذج البرمجة والعمل الاحترافي العالي الذي تغطيه هذه المراجعة، بسعر $5 / $30 (وتشير التقارير إلى أن Pro حول $30 / $180، من دون تأكيد رسمي). الثاني هو GPT-5.5 Instant، صدر في 5 مايو 2026 بوصفه النموذج الافتراضي الجديد في ChatGPT بدلاً من GPT-5.3 Instant. نموذج Instant سريع للمحادثة اليومية، ويظهر في API باسم "chat-latest"؛ ويبقى GPT-5.3 Instant متاحاً للمستخدمين المدفوعين نحو ثلاثة أشهر.
سبب أهمية ذلك في قرار الترقية: إذا كنت من مستخدمي ChatGPT، فقد تكون على GPT-5.5 Instant افتراضياً من دون أن تلمس النموذج الرئيسي أصلاً. رؤية "5.5" في واجهة المحادثة لا تعني أنك تشغّل النموذج الذي تتصدر أرقامه في Terminal-Bench وOSWorld هذه الصفحة. النموذج الرئيسي يعيش في API وCodex، ووصل إلى باقات ChatGPT المدفوعة (Plus وPro وBusiness وEnterprise)، مع قصر GPT-5.5 Pro على Pro وBusiness وEnterprise.
من يرقّي، ومن ينتظر؟
اختر GPT-5.5 إذا كنت تبني أو تشغّل وكلاء: نموذج داخل حلقة طرفية، أو وكيل برمجة يغلق تذاكر عبر مستودع، أو إعداد استخدام حاسوب يدير برنامجاً عبر مهمة متعددة الخطوات. هذا هو جوهر الإصدار، وهنا تتطابق أرقام المزود مع نية التصميم. اقرنه بطبقة Batch ($2.50 / $15.00) لأي تشغيل وكيل غير تفاعلي يحتمل تأخر النتيجة، وسيصبح السعر الإضافي أسهل قبولاً.
استخدم GPT-5.5 Pro فقط عندما تكون المهمة صعبة بما يكفي لأن يستحق معدل نجاح أعلى سعره المعلن في التقارير، نحو $30 / $180 لكل مليون: تنقيح أعطال معقدة، أو عمل متعدد الخطوات عالي المخاطر تكون فيه المحاولة الفاشلة الثانية أغلى من علاوة الرموز. لمعظم الفرق هو أداة متخصصة تستدعيها عمداً، لا خياراً افتراضياً.
ابقَ على GPT-5 عندما يكون عملك محادثة أو نصوصاً قصيرة أو تنفيذاً بضربة واحدة، حيث لا تُستخدم ميزة GPT-5.5 في الحلقات الطويلة أصلاً وستدفع أكثر مقابل هامش لا تلمسه. وإذا كنت تقارن GPT-5.5 بمختبرات النماذج المتقدمة الأخرى لا بسابقه فقط، فسباق البرمجة الوكيلية متقارب جداً الآن. مراجعة benchr لـ Claude Opus 4.8 تغطي أقوى موقع منافس في أعمال الطرفية واستخدام الحاسوب، والفارق بينهما ضيق بما يكفي لأن تختبرهما على مهامك قبل أن تخصص ربع إنفاق الوكلاء لأي منهما.
الخلاصة
GPT-5.5 هو أنظف نموذج أطلقته OpenAI حتى الآن للبرمجة الوكيلية واستخدام الحاسوب، وأرقام المزود تشير إلى الاتجاه نفسه الذي يشير إليه السعر: نحو الوكلاء. كترقية موجّهة يستحق تقييماً عالياً. أما كقرار عام من نوع "استبدل GPT-5 في كل مكان"، فلا يثبت الحالة؛ لأن المكاسب لا تظهر في عمل لا يعتمد على استخدام أدوات متعدد الخطوات، بينما ترتفع الفاتورة في كل الأحوال.
نصيحة الشراء بسيطة. وجّه حركة الوكلاء وحلقات البرمجة إلى GPT-5.5، وأبقِ GPT-5 الأرخص لكل رمز للمحادثة والعمل بضربة واحدة، واحجز GPT-5.5 Pro لعدد قليل من المهام التي يكون فيها معدل نجاح أعلى أهم من فاتورة أكبر. قِس معدل التشغيلات الفاشلة قبل التبديل وبعده؛ هذا الرقم، لا لوحة الترتيب، هو ما يخبرك هل دفعت الترقية قيمتها.