ابدأ بالرقم الذي يُفاجئ الناس: يتقاضى هذان النموذجان الرائدان السعر ذاته وهو $5 لكل مليون رمز مدخل. هذا هو ثمن إرسال الكود والوثائق والسياق إليهما. يظهر الفارق في الإخراج: Opus 4.8 يُفوتر $25 لكل مليون، وGPT-5.5 يُفوتر $30. ميزة دولار لكل مليون تبدو هامشية حتى تبدأ في توليد سجلات وكلاء طويلة طوال اليوم، حيث يهيمن الإخراج على الفاتورة.
هذه جولة مُعادة من مباراة قديمة. آخر مرة كانت بين GPT-5 وOpus 4.7، وكلا المختبرين أصدرا نسخة نقطية منذ ذلك الحين. تغيّر شكل المنافسة، لذا يستحق الحكم نظرة جديدة لا مجرد استبدال رقم الإصدار.
| النموذج | إدخال ($/مليون) | إخراج ($/مليون) | ملاحظات |
|---|---|---|---|
| Claude Opus 4.8 | $5 | $25 | سياق 1 مليون، حد أقصى 128 ألف رمز للإخراج |
| Opus 4.8 وضع السرعة | $10 | $50 | سرعة إخراج تصل إلى 2.5×، معاينة بحثية |
| GPT-5.5 | $5 | $30 | سياق 1.05 مليون، إدخال مخزَّن $0.50 |
| GPT-5.5 Pro | ~$30 | ~$180 | مستوى دقة أعلى؛ الأسعار متداولة على نطاق واسع لكنها غير مؤكدة رسمياً من OpenAI |
البرمجة: حيث يتقدم Opus 4.8
إذا كان قرارك يرتكز على كتابة البرمجيات ومراجعتها، فـ Opus 4.8 هو الاختيار. تُشير Anthropic إلى أنه حقق 69.2% في SWE-bench Pro، الصيغة الأصعب التي تقيس حل تذاكر GitHub من البداية للنهاية، مقابل 58.6% التي أفادت بها OpenAI لـ GPT-5.5. هذه فجوة واسعة على أقرب معيار للعمل الإنتاجي الحقيقي. وتصف Anthropic أيضاً Opus 4.8 بأنه أقوى نموذج لاستخدام الحاسوب وتصفح الويب اختبرته، بنسبة 83.4% في OSWorld-Verified.
الفوز الأكثر هدوءاً يتعلق بالثقة. تقول Anthropic إن Opus 4.8 أقل بنحو أربع مرات من Opus 4.7 في السماح بمرور عيب في كود كتبه دون تعليق، وأكثر استعداداً للإشارة حين يشعر بعدم اليقين. في مراجعة الكود، تلك الغريزة في رفع اليد تستحق أكثر من نقطة معيار، لأن الثغرة التي تصل للإنتاج بهدوء هي التي تكلّفك. الصورة الكاملة في مراجعة Opus 4.8.
الفائز في البرمجة الإنتاجية: Opus 4.8، بوضوح.
معيار الأداء الذي يخسره Opus
الآن الجزء الصريح، لأن المقارنة التي تسرد انتصارات نموذج واحد فقط لا تستحق القراءة. يتفوق GPT-5.5 على Opus 4.8 في Terminal-Bench، معيار أداء أعمال وكيل سطر الأوامر الطويلة متعددة الخطوات. في تشغيل Anthropic الخاص باستخدام إطار Terminus-2 العام، يحصل Opus 4.8 على نحو 74.6% مقابل 78.2% لـ GPT-5.5. وتُفيد OpenAI بأن GPT-5.5 أعلى من ذلك، بنسبة 82.7% في Terminal-Bench 2.0، وتُشير الحاشية التوضيحية لـ Anthropic إلى أنه يصل إلى 83.4% وفق إطار Codex CLI الخاص بـ OpenAI.
الإطار مهم والدرجات تتغير معه، لكن الاتجاه لا يتغير: GPT-5.5 هو وكيل الطرفية الأقوى. إذا كان عبء عملك وكيلاً مستقلاً يعمل لساعات عبر أوامر الصدفة وعمليات البناء وأدوات الاستدعاء، فهذا الملعب المفضّل لـ GPT-5.5، وهو بالضبط نوع العمل الذي بنت OpenAI هذا الإصدار حوله.
الفائز في عمل وكيل الطرفية: GPT-5.5.
GPT-5.5 بوصفه النموذج اليومي
خارج نطاق البرمجة الصرفة، GPT-5.5 هو الأكثر شمولية. يحمل نافذة سياق أكبر قليلاً تبلغ 1.05 مليون رمز، ضُبِط لإجابات موجزة، وهو موجَّه بوضوح لأعمال المعرفة الاحترافية الكثيفة بالوثائق: البحث والتوليف والتحليل. وهو أيضاً النموذج الذي يعتمده ChatGPT افتراضياً للجميع، مما يعني أن معظم زملائك غير المطورين يستخدمونه بالفعل. تتتبع مراجعة GPT-5 كيف يصمد هذا الإرث الشامل.
حيث تظهر أهمية ذلك فعلاً هو الكتابة. لا يُروِّج أيٌّ من المختبرَين لنموذج "الكاتب الأفضل"، وللكتابة الطويلة يتبادلان الهيمنة بطرق لن تلتقطها معايير الأداء. نفصّل تلك المنافسة بالتحديد في Claude مقابل ChatGPT للكتابة الطويلة، بما فيها حدود طول الإخراج التي تحدد كمية ما يمكن لكل منهما إنتاجه في تمرير واحد.
وضع السرعة وحساب التكلفة
وضع السرعة في Opus 4.8 هو الرافعة الجديدة. بـ $10 مدخلاً و$50 مخرجاً لكل مليون، ضعف السعر القياسي، تحصل على ما يصل إلى 2.5 مرة سرعة الرموز المخرجة في الثانية، مع سلوك نموذج مطابق. العنوان البارز هو أن هذا أرخص بنحو ثلاث مرات من وضع السرعة في Opus 4.7 الذي كان بـ $30 و$150. إذا كان الكمون هو عنق الزجاجة لديك في وكيل برمجة تفاعلي، فهذا خيار حقيقي الآن لا رفاهية. لا يزال محجوباً خلف قائمة انتظار وخاصاً بـ API، فعامله كأداة تنمو إليها.
لكل ما هو حساس للتكلفة، فإن سعر الإدخال المتطابق $5 هو العنوان الذي يجب أن تخطط حوله. تغذية السياق لا فارق في تكلفتها بين النموذجين؛ فقط مزيج الإخراج يحرّك الفاتورة. للاطلاع على تفصيل تكلفة أشمل عبر أعباء العمل المختلفة، يُجري سعر كل حالة استخدام الحسابات اللازمة.
اجعل Opus 4.8 إعدادك الافتراضي لكتابة الكود ومراجعته، حيث يفوز في SWE-bench Pro واستخدام الحاسوب والاستعداد للإشارة إلى أخطائه الخاصة. انتقل إلى GPT-5.5 لتشغيل وكلاء الطرفية، والأعمال المعرفية الأوسع، وبوصفه النموذج الجامع الذي يمكن لفريقك بأكمله مشاركته. أسعار إدخالهما متطابقة، فاستخدم كليهما إذا كنت تطوّر برمجيات، وتجنب مستوى GPT-5.5 Pro ما لم تكن قد قست حاجتك إليه.