للترجمة اتجاه، والاتجاهان ليسا المهمة نفسها. الترجمة من العربية إلى الإنجليزية هي الأسهل. أما الترجمة من الإنجليزية إلى العربية فهي حيث يثبت النموذج قيمته أو يفقدها، لأن العربية تفرض اختيارات لا تطلبها الإنجليزية أبداً: أي لهجة، ما درجة الرسمية، هل تُضاف علامات التشكيل، وكيف يُنقل الاسم. قد ينجح نموذج في اتجاه ويتعثر في الآخر. لذلك تقسم هذه الصفحة الحكم بحسب الاتجاه. اقرأ الصف الذي يطابق مسار نصك.
هذه هي النسخة المخصصة للترجمة من نظرتنا الأوسع إلى كيفية تعامل خمسة نماذج حدّية مع الفصحى وثلاث لهجات عربية. النتائج متسقة: يتصدر Claude في الفصحى والخليجية، وينجرف GPT نحو المصرية، ولا يجيد أي نموذج العربية الكلاسيكية بطلاقة. الاختيارات هنا من العائلة نفسها لكن بدرجة أحدث. صدر Opus 4.8 في 28 مايو 2026 مع نافذة سياق بحجم 1M رمز وحد أقصى للإخراج 128K، ويحمل قوة السطر 4.7 النغمية إلى إصدار أسهل في الثقة من حيث التكلفة.
من العربية إلى الإنجليزية: اتجاه محلول في الغالب
عند الانتقال من العربية إلى الإنجليزية، تكون النماذج الحدّية متقاربة، والحد الأدنى للأداء مرتفع. أعطِ أيّاً منها خبراً فصيحاً نظيفاً أو بريداً تجارياً معيارياً بالعربية، وستحصل على إنجليزية دقيقة وقابلة للقراءة. تظهر الفروق عند الأطراف لا في المركز.
Opus 4.8 هو الأكثر ثباتاً هنا، والسبب نافذة 1M رمز. ضع عقداً عربياً من 40 صفحة أو مخطوطة كاملة، وسيُبقي المصطلحات متسقة من البند الأول إلى الأخير. يبدأ المنافسون بإدخال تناقضات بعد 15,000 إلى 20,000 كلمة، بينما يحافظ Claude على الخيط. يأتي GPT-5.5 خلفه مباشرة في الدقة ويحقق درجات في أواخر الثمانينات أو أعلى في MMLU العربي المترجم، لذلك لن ترى فارقاً واضحاً بينهما في المقاطع القصيرة والمتوسطة. Gemini 3.1 Pro قوي أيضاً، إذ يحقق 93 في معيار Artificial Analysis العربي، وهو أرخص طريقة لوضع كمية كبيرة من المصادر العربية داخل نافذة واحدة.
العقبة في هذا الاتجاه هي المدخلات اللهجية. أعطِ نموذجاً ملاحظة صوتية تونسية أو محادثة WhatsApp بالدارجة المغربية وسينخفض الحد الأدنى فجأة. تتراوح معدلات أخطاء الترجمة بين 6 و25% عبر النماذج في اللهجات الأقل تمثيلاً، وقد رُصدت نماذج من فئة GPT-4 وهي تعود إلى الإخراج الإنجليزي أو تخمّن ببساطة. المدخلات الخليجية والمصرية والشامية تُعالج جيداً؛ أما المغرب العربي فلا.
من الإنجليزية إلى العربية: هنا تنفصل النماذج
هذا هو الاتجاه الأصعب، وهو الذي يحسم الصفحة. لا تطلب الإنجليزية اختيار لهجة ولا وضع تشكيل. العربية تجبرك على الاختيار، والاختيار الخاطئ يبدو غريباً للجمهور المقصود حتى عندما تكون كل كلمة صحيحة تقنياً.
Claude هو الأكثر موثوقية هنا. ينتج فصحى أكثر طبيعية وسلاسة من نماذج فئة GPT، مع اتساق بنيوي أفضل، ويتعامل مع العربية المصرية والخليجية أفضل من البقية، وقد صُنّف ممتازاً في ترجمة اللهجة المصرية ضمن مقارنات منشورة. اطلب نصاً خليجياً فيبقى خليجياً بدلاً من الانزلاق عائداً إلى الفصحى الرسمية. هذا التحكم في النبرة هو بالضبط ما تتعمق فيه نظرتنا الأقرب إلى التعامل مع اللهجة السعودية والخليجية، وهو السبب نفسه الذي يجعل Opus يتصدر مراجعة Opus 4.8 في النثر متعدد اللغات.
GPT-5.5 هو الوصيف، وهو خيار متين للفصحى. يتجاوز معايير العربية المعيارية ومعايير التحويل من العربية إلى اللهجات بشكل جيد. لكن في الاختبارات ثنائية الاتجاه يُظهر انجرافاً نحو العربية المصرية: استهدف الخليجية، فتتسرب مفردات مصرية. نمط إخفاق Gemini معاكس. إذا تُرك وحده يختار مفردات خاصة بالفصحى بدلاً من مصطلحات ملائمة للهجة، ويحتاج إلى تعليمات إقليمية صريحة ("للمستخدمين في مصر") كي يحافظ على لهجة محلية. أضف التعليمة فيتحسن؛ اتركها وستحصل على عربية مدرسية حيث أردت عربية يومية.
جانب الأوزان المفتوحة يستحق سطراً. يأتي Qwen 3 بمجزئ رموز ذي مفردات 256K يمثّل المفاهيم العربية بكفاءة، ويدعم Qwen-MT، نسخة الترجمة منه، 92 لغة وتفوّق على GPT-4.1-mini وGemini-2.5-Flash في التقييم البشري. إنه خيار حقيقي عندما تريد أوزاناً تتحكم بها. أما Llama 4 فليس كذلك؛ إذ يسجل نتيجة 50.8% في ترجمة الكتب ولا ينافس في العمل العربي الجاد رغم سرعة الاستدلال.
لوحة النتائج بحسب الاتجاه
هذه قراءة نوعية وليست قائمة رقمية، لأن معظم هذه الأعباء لا تملك درجة عامة لكل مهمة. تعكس التقديرات المقارنات المنشورة ولقطات المعايير في المراجع، مع إسقاطها على أحدث نموذج في كل سلسلة.
| عبء العمل | Claude Opus 4.8 | GPT-5.5 | Gemini 3.1 Pro | Qwen 3 | Llama 4 |
|---|---|---|---|---|---|
| الفصحى العربية ← الإنجليزية | قوي | قوي | قوي | قوي | ضعيف |
| الإنجليزية ← الفصحى | الأكثر طبيعية | قوي | قوي، رسمي | قوي | ضعيف |
| الإنجليزية ← اللهجة الخليجية | يحافظ على اللهجة | انجراف مصري | انجراف إلى الفصحى | جيد | ضعيف |
| عقد طويل، في الاتجاهين | متسق حتى النهاية | ينجرف متأخراً | ينجرف متأخراً | مقبول | ضعيف |
| مدخلات باللهجات المغاربية | ضعيف | ضعيف | ضعيف | ضعيف | ضعيف |
| نص كلاسيكي / قرآني | تحقق بشرياً | تحقق بشرياً | تحقق بشرياً | تحقق بشرياً | ضعيف |
أين تخفق
العربية الكلاسيكية والقرآنية. تختلف المصطلحات ما قبل الحديثة والقرآنية بحدة عن الفصحى، ولا يُظهر أي نموذج مختبر قدرة قوية تتجاوز ما تستطيع الفصحى حمله. استخدم الفصحى للعقود الدولية والعمل الرسمي؛ واترك التعامل الكلاسيكي للنصوص التي يتوفر لديك خبير لمراجعة مخرجاتها.
المصطلحات القانونية. مصطلحات مثل طلاق (talaq، divorce)، وحضانة (hadanah، custody)، وشركة (sharika، company) تحمل وزناً قانونياً دقيقاً. غالباً ما تفوّت الترجمة العامة المقابل الرسمي ما لم تُسمّه في الأمر. صرّح بالمجال، وإلا بدا العقد خاطئاً بطرق مؤثرة.
الأسماء والتشكيل. يُولّد التشكيل (علامات الضبط) بلا اتساق، وتنزلق النماذج إلى أنماط تشكيل لهجية في أسماء الأعلام والعربية غير المعيارية. الأسماء المكتوبة بحروف أجنبية عند نقلها إلى العربية، والأسماء العربية المشكولة عند إخراجها، كلاهما هش. راجع كل اسم يدوياً.
اللهجات الأقل تمثيلاً وأمثلة few-shot. التونسية والدارجة المغربية والجزائرية أدنى بكثير من الخليجية والمصرية عبر كل نموذج، وينجرف Gemini وGPT نحو المصرية من دون وسم صريح للهجة. ملاحظة مخالفة للحدس: قد تفشل أوامر few-shot أو حتى تُضعف نتائج اللهجات، مع عودة نماذج من فئة GPT-4 إلى الإنجليزية رغم أمثلة عربية فقط. المزيد من الأمثلة ليس الحل هنا.
العربية لغة منخفضة الموارد لهذه النماذج رغم أن متحدثيها يتجاوزون 400 مليون، لأن بيانات التدريب تَشح بسرعة بمجرد مغادرة الفصحى.
تصنيف انخفاض الموارد هو القصة الكاملة خلف الإخفاقات. تفتقر العربية إلى إملاء موحد عبر اللهجات، والنص المكتوب عادةً يحذف التشكيل، والبيانات التي تدعم اللهجات جزء ضئيل مما يدعم الفصحى. تكون النماذج جيدة حيث تكون البيانات كثيفة ومرتبكة في كل مكان آخر. إذا أردت معالجة أطول للصوت والسجل تتجاوز الترجمة الخام، فإن دليلنا إلى أفضل ذكاء اصطناعي للكتابة الطويلة يشرح كيف تحافظ النماذج نفسها على النبرة عبر النص.