Is GPT-5 better than Claude Opus 4.7?

Not overall. OpenAI positions GPT-5 on visual design, structured output, and breadth. Anthropic positions Claude Opus on coding, reasoning under uncertainty, and long-document analysis. The public leaderboards (SWE-bench Verified, LMArena) are consistent with both positioning claims.

How much does GPT-5 cost?

$1.25 per million input tokens and $10 per million output (per OpenAI's pricing page). GPT-5 Mini drops to $0.25 / $2.00 for high-volume work. The Batch API offers roughly half off with a 24-hour turnaround.

What's the context window on GPT-5?

400K tokens advertised. As with all long-context models, retrieval is more reliable than one-shot summarization across the full window. Verify on your workload before relying on it past the middle of the range.

When should you choose GPT-5 over the alternatives?

Visual design (landing pages, layouts), structured output (JSON, XML), math-heavy reasoning, and conversational English where stylistic flexibility matters. Pick something else when calibrated hedging on technical questions is part of the value.

Does GPT-5 hallucinate?

On niche technical questions, the model's default tone is confident even when the answer is not well-grounded. That is a known pattern across all frontier models, but it shows up more on GPT-5 than on Claude. Verify API signatures and citations against primary sources.

مراجعة·يناير 2026

مراجعة GPT-5

Name: GPT-5, reviewed
Item: GPT-5
Rating: 4.2
Author: benchr

أين يختلف GPT-5 عن Claude في الجوانب المهمة: السرعة والاتساع، مع الشقوق التي تظهر في الأسئلة التقنية المتخصصة.

تم التحديث في 25 مايو 2026 · عرض سجل التغييرات · تم التحقق من الأرقام من مصادر رسمية في 30 مايو 2026

تاريخ الإطلاق أغسطس 2025 وفق منشور الإطلاق من OpenAI

تكلفة الإدخال / 1M $1.25 $10 للإخراج، والإدخال المخبأ أرخص

SWE-Bench Verified 74.9% وفق رقم معلن من OpenAI

السياق 400K المعلن

أطلقت OpenAI نموذج GPT-5 في أغسطس 2025، وفق منشور الإطلاق من OpenAI. كان GPT-5 قفزة كبيرة عن GPT-4o، ولا أحد ينازع في ذلك. السؤال الحقيقي هو هل ما زال ينبغي أن تدفع له بعدما أصبح Claude Opus 4.7 وعائلة Gemini 3 مطروحين أيضاً. في أعمال محددة، نعم. تشرح هذه المقالة أي أعمال تحديداً، بالاعتماد على سجل المعايير المنشور، وتموضع OpenAI نفسه، وأنماط المقارنة الظاهرة علناً بين المختبرات الثلاثة المتقدمة.

GPT-5 هو الأكثر مرونة أسلوبياً بين النماذج المتقدمة الثلاثة الجادة في بدايات 2026، والأكثر ثقة في المخرجات البصرية والمنظمة. وهو أيضاً الأكثر احتمالاً لأن يعطي إجابات ناعمة لكنها خاطئة في الأسئلة التقنية خارج مناطقه الأقوى. لا شيء من ذلك يستبعده، لكنه يحدد أين تضعه داخل مجموعتك.

كيف تضع OpenAI النموذج

تركز مواد إطلاق GPT-5 من OpenAI على ثلاثة أمور ينبغي وزنها بعناية. الأول جودة التفكير في الرياضيات وحل المسائل المنظمة (تعلن الشركة أداءً قوياً في معيار MATH وسلوكاً محسناً في سلاسل التفكير). الثاني اتساع تعدد الوسائط، إذ يغطي الرؤية والصوت والنص في نموذج واحد، مع وضع جودة الرؤية على أنها الأفضل في فئتها. الثالث هو "دفء المحادثة"، وهو مصطلح الشركة لطريقة تعامل النموذج مع التفاعل المفتوح.

تخبرك هذه الادعاءات أين يعتقد المختبر أن النموذج سيصمد. لكنها ليست تحققاً مستقلاً من عبء عملك. ضع GPT-5 في عمل داخل نقاط القوة الثلاث التي وضعته OpenAI حولها، وستدفع مقابل ما بُنِي له. ضعه في عمل خارج تلك المناطق، وستراهن ضد نية التصميم لدى المختبر نفسه، وهي مراهنة قد تنجح أحياناً لكنها لا ينبغي أن تكون خيارك الافتراضي.

النمط في الكود: يبدو صحيحاً، لكنه يعمل خطأ

أفيد إشارة عامة للبرمجة هي SWE-bench Verified، الذي يقيس هل تستطيع النماذج إغلاق مشكلات GitHub حقيقية داخل مستودعات إنتاجية. الرقم الذي تعلنه OpenAI لـ GPT-5 يدور حول 74.9% على المجموعة الموثقة (وفق مواد الإطلاق من OpenAI، مع تقاطع تحقق ضد لوحة swebench.com). أما Claude Opus 4.7 فيقع في أواخر الثمانينات على المعيار نفسه وفق رقم Anthropic المعلن. هذا الفارق يطابق نمطاً ظاهراً في نقاش المجتمع المفتوح حول النموذجين، وهو أوسع من أن يُصرف بوصفه ضجيج معيار.

النمط: ينتج GPT-5 كوداً يقبله المترجم، لكن عليك أن تشكك فيه. البنية تبدو صحيحة، وتواقيع الدوال تستخدم APIs حقيقية بطرق معقولة. الخطأ غالباً سوء فهم لحالة طرفية، أو خطأ بمقدار واحد في عملية تقطيع، أو استخدام خاطئ لآلية تزامن لا يظهر أبداً في المسار السعيد. لا شيء كارثي، لكن كله يحتاج قارئاً حذراً لالتقاطه.

إذا كان سير عملك هو "اكتب المسودة بسرعة، وراجع يدوياً"، فهذا النمط قابل للعمل. يصبح مكلفاً عندما تكون العادة هي شحن ما ينتجه النموذج بمراجعة خفيفة فقط. في عمل الإنتاج حيث تهم الصحة أكثر من السرعة، يكون Claude الخيار الأكثر أماناً. مراجعة Opus 4.7 تدخل أكثر في مسألة الذوق المعماري التي يعكسها ترتيب النماذج.

المترجم ليس المراجع الأهم هنا. أخطاء GPT-5 تمر من البناء وتنتظر إنساناً يلاحظها؛ أما Claude فيميل إلى الإشارة أولاً إلى مواضعه غير المستقرة.

الكتابة والتصميم واتساع المحادثة

الفئة التي يتصدر فيها GPT-5 بوضوح هي الكتابة المفتوحة والتصميم. اطلب من النموذج الكتابة بصوت محدد، قصة بوليسية من خمسينيات القرن الماضي مثلاً، أو مؤرخ من القرن التاسع عشر، وستلتقط المسودة الأولى النبرة بثبات أكبر من البدائل. قد يصبح مخرج Claude أفضل بعد مرور ثانٍ، لكن GPT-5 يحتاج تكرارات أقل للوصول إلى شيء قابل للنشر.

يتحول ذلك إلى ميزة عملية في أي مهمة تكون فيها المرونة الأسلوبية أهم من الصحة أو التحفظ: صياغة نص بصوت علامة تجارية لم يوثقه أحد، كتابة سردية بجو مقصود، إنتاج عروض تقديمية تحمل فيها الكلمات وزناً يساوي البيانات، وكل ما في هذه العائلة. في هذا النوع من العمل سيمنحك GPT-5 أنفع محاولة أولى بين النماذج المتقدمة الثلاثة.

تظهر المرونة نفسها عبر لغات العالم. ينتج GPT-5 مخرجات تبدو طبيعية في الإسبانية والفرنسية والبرتغالية والألمانية والإيطالية واليابانية والكورية والصينية، ويتعامل مع ذيل أوسع من اللغات منخفضة الموارد مما توحي به المعايير العامة. الاستثناء الذي يجب التخطيط له: العربية الدارجة، حيث يعود النموذج إلى مفردات مصرية حتى عندما يطلب منه الطلب لهجة خليجية. مقالة المحتوى العربي تغطي أين يقع كل نموذج متقدم على هذا المحور تحديداً.

الهلوسة التقنية المتخصصة

خارج الزوايا المزدحمة من اللغات والمكتبات الكبرى، قد يعطيك GPT-5 أحياناً توقيع دالة يبدو واثقاً لكنه غير موجود، أو يصف سلوك API مهجوراً كأنه ما زال حديثاً. هذا نمط معروف في كل النماذج المتقدمة. يظهر أكثر على GPT-5 مقارنة بـ Claude لأن نبرة GPT-5 الافتراضية واثقة، والثقة ليست دائماً مضبوطة على مدى رسوخ الإجابة.

لا تثق بأي ادعاء عن API لا تستطيع التحقق منه في الوثائق. هذه ممارسة جيدة مع أي نموذج، لكن غياب التحفظ في GPT-5 سبب لأن تكون أكثر انضباطاً هنا من Claude، الذي ينبه إلى عدم اليقين أكثر عندما يعمل عند الأطراف. إذا كان عملك يتضمن مكتبات صغيرة كثيرة، أو أطر عمل متخصصة، أو APIs قديمة، ففجوة المعايرة هذه هي الثمن الذي تدفعه مقابل السرعة والاتساع اللذين يجلبهما GPT-5 في بقية الأماكن.

كم يكلف؟

يُسعّر GPT-5 عبر OpenAI API عند $1.25 لكل مليون رمز إدخال و$10 لكل مليون رمز إخراج، وفق أسعار API من OpenAI. هذا يجعله أقل من Claude Sonnet 4.6 وClaude Opus 4.7 على أساس كل رمز. في معظم جلسات العمل يكون GPT-5 الخيار الأرخص، ما يعني أن القرار يعود غالباً إلى ملاءمة القدرة لا إلى الفاتورة. للأعمال كبيرة الحجم، يكون GPT-5 Mini بسعر $0.25 / $2.00 لكل مليون رمز هو المقارنة الأعدل؛ فهو ينافس Sonnet في الأعباء الحساسة للتكلفة. مقالة السعر حسب حالة الاستخدام تشرح أي طبقة تناسب أي عبء عمل على مستوى تكلفة الرمز.

تسعير طبقات OpenAI GPT-5، يناير 2026، وفق أسعار OpenAI API
الطبقة	الإدخال ($/مليون رمز)	الإخراج ($/مليون رمز)	ملاحظات
GPT-5	$1.25	$10	الطبقة المتقدمة القياسية
GPT-5 Mini	$0.25	$2.00	نموذج مقطر للاستخدام الكثيف
GPT-5 (Batch API)	$5	$25	خصم نحو 50%، ومدة معالجة 24 ساعة

لا يزال Batch API أقل استخداماً مما ينبغي. لأي عبء عمل لا يحتاج استجابة متزامنة، مثل معالجة مستندات خلال الليل أو تصنيف دفعات كبيرة، فالخصم مال تتركه على الطاولة. إذا كان خطك يتحمل مدة معالجة 24 ساعة ولا تستخدم Batch، فهذا أول مقبض ينبغي سحبه.

أين يستحق GPT-5 مكانه؟

بضع فئات يكون فيها GPT-5 هو الاختيار الصحيح لك.

العمل البصري وكثيف التصميم هو أوضحها: صفحات الهبوط، وعروض الشرائح، وتخطيطات التسويق. افتراضات النموذج الجمالية أحدث وأكثر ثقة من البدائل، والمخرج يحتاج إعادة تشكيل أقل ليصل إلى مستوى قابل للنشر. إذا كان عملك يتضمن الكثير من HTML/CSS أو التفكير في التخطيط، فاتجه إلى GPT-5.

بعد ذلك، الكتابة المفتوحة حيث تكون المرونة الأسلوبية هي الشرط المركزي: مطابقة الصوت، والنثر ذي الجو المحدد، وعمل العلامات التجارية. يلتقط GPT-5 النبرة من المحاولة الأولى بثبات أكبر من Claude. إذا كان فريقك ينشر نصوصاً أكثر مما ينشر كوداً، فاجعل GPT-5 الخيار الافتراضي وابقِ Claude احتياطياً للمحتوى التقني.

وكذلك العمل متعدد اللغات خارج العربية. في اللغات التي لم يُضبط Claude لها تحديداً، ينتج GPT-5 مخرجاً أكثر صقلاً في المحاولة الأولى. في أي مكان يقرأ فيه جمهورك لغة غير الإنجليزية، فهو الخيار الأول الأكثر أماناً، مع استثناء العربية المذكور أعلاه.

أين تتجاوزه؟

تجاوز GPT-5 في مراجعة كود الإنتاج، حيث يهم التقاط الخطأ الخفي من المرور الأول أكثر من نعومة الإجابة. نمط الفشل الواثق لكنه الخاطئ هو أسوأ أنواع الفشل في البرمجيات العاملة، وغريزة Claude في التحفظ تناسب هذا العمل أكثر.

وتجاوزه أيضاً في التفكير تحت عدم اليقين عندما تكون الصراحة جزءاً مما تدفع مقابله: مراجعة قانونية، أو أسئلة طبية، أو تحليل مالي. في هذه الأعباء، إجابة واثقة يتبين أنها خاطئة تضر أكثر من "لست متأكداً" صادقة.

وتجاوزه في تركيب السياق الطويل عندما يحتاج النموذج إلى الحفاظ على الاتساق عبر مئات الآلاف من الرموز. GPT-5 كفء في السياق الطويل، لكن Claude أفضل في عمل التركيب عبر المقاطع، وهو ما يفرق بين إجابة طويلة السياق مفيدة وملخص لقسم واحد.

OpenAI's flagship release cadence, 2022 through 2025. Roughly one major model per year, with the gap from GPT-4o to GPT-5 the longest.

الخلاصة التي لم تتغير

GPT-5 هو ثاني نموذج متقدم يستحق الدفع في 2026. يستحق موقعه لأنه أسرع من البدائل في معظم الأعباء، وأكثر مرونة أسلوبياً، وأوسع عبر اللغات، وأكثر وضوحاً في الرأي البصري. ما يبقيه خارج المركز الأول هو فجوة المعايرة في الأسئلة التقنية، إضافة إلى نمط فشل في الكود (يُترجم لكنه يعمل خطأ) وهو بالضبط الشكل الخاطئ لعمل الإنتاج، حيث تميل الإجابة السيئة إلى النجاة من المراجعة.

لمعظم الفرق، تبقى التوصية كما كانت منذ تغطية الإطلاق: Claude Opus 4.7 كافتراضي للعمل التقني، وGPT-5 كاشتراك مكمل للفئات التي يتصدر فيها: التصميم، والكتابة، والاتساع متعدد اللغات، والمخرجات المنظمة. مفتاحا API وفاتورة واحدة هي المجموعة العملية التي يعود إليها benchr باستمرار.

إذا كنت مضطراً لاختيار واحد لأسباب تكلفة، فدع العمل يقرر. الفرق التي تكتب أكثر مما تبرمج ينبغي أن تختار GPT-5؛ والفرق التي تبرمج أكثر مما تكتب ينبغي أن تختار Claude. معظم القراء في الوسط، وبالنسبة لهم يكون إعداد النموذجين هو الجواب.

أسئلة شائعة

هل GPT-5 أفضل من Claude Opus 4.7؟

ليس إجمالاً. تضع OpenAI نموذج GPT-5 في التصميم البصري والمخرجات المنظمة والاتساع. وتضع Anthropic نموذج Claude Opus في البرمجة والتفكير تحت عدم اليقين وتحليل المستندات الطويلة. لوحات الترتيب العامة (SWE-bench Verified وLMArena) منسجمة مع الادعاءين.

كم يكلف GPT-5؟

$1.25 لكل مليون رمز إدخال و$10 لكل مليون رمز إخراج. ينخفض GPT-5 Mini إلى $0.25 / $2.00 للأعمال كبيرة الحجم. يقدم Batch API خصماً يقارب النصف مع مدة معالجة 24 ساعة.

ما حجم سياق GPT-5؟

المعلن 400K رمز. وكما في كل نماذج السياق الطويل، يكون الاسترجاع أكثر موثوقية من التلخيص بضربة واحدة عبر النافذة كاملة. تحقق على عبء عملك قبل الاعتماد عليه بعد منتصف النطاق.

متى تختار GPT-5 على البدائل؟

مهام التصميم البصري (صفحات الهبوط والتخطيطات)، والمخرجات المنظمة (JSON وXML)، والتفكير كثيف الرياضيات، والإنجليزية الحوارية عندما تهم المرونة الأسلوبية. اختر شيئاً آخر عندما يكون التحفظ المعاير في الأسئلة التقنية جزءاً من القيمة.

هل يهلوس GPT-5؟

في الأسئلة التقنية المتخصصة، تكون النبرة الافتراضية واثقة حتى عندما لا تكون الإجابة راسخة. هذا نمط معروف في كل النماذج المتقدمة، لكنه يظهر على GPT-5 أكثر من Claude. تحقق من تواقيع APIs والاستشهادات في المصادر الأساسية.

سجل التغييرات

25 مايو 2026 — أُعيدت كتابة الأقسام التي كانت تسرد اختبارات مختبرية أصلية؛ تستند المقالة الآن في حكمها إلى المعايير المنشورة، وتموضع OpenAI، وسجل لوحات الترتيب العامة. تم التحقق من الأسعار وفق وثائق OpenAI الحالية.
22 يناير 2026 — Re-verified pricing against the OpenAI pricing page.
8 يناير 2026 — حُدثت ملاحظات الإنتاجية بعد تحديث API من OpenAI في يناير.
4 يناير 2026 — نُشرت النسخة الأولى.

المراجع

OpenAI، "وثائق API"، platform.openai.com/docs، اطُّلع عليه في مايو 2026.
OpenAI، "أسعار API"، openai.com/api/pricing، اطُّلع عليه في مايو 2026.
"لوحة ترتيب Chatbot Arena"، lmarena.ai, May 2026 snapshot.
OpenAI، "تقديم GPT-5"، openai.com/index/introducing-gpt-5, August 2025.
"لوحة ترتيب SWE-bench Verified"، swebench.com، مايو 2026.