الذكاء الاصطناعي للمحتوى العربي: تقرير عملي على خمسة نماذج

كيف يتعامل Claude وGPT-5 وGemini وQwen وLlama مع الفصحى وثلاث لهجات عربية إقليمية، وأين لا يزال كل نموذج يُخفق.

· عرض سجل التغييرات

نماذج مُقارَنة 5 Claude, GPT-5, Gemini, Qwen, Llama
محاور عبء العمل 6 عبر الفصحى وثلاث لهجات
الاختيار الأول — السعودية Opus 4.7 بحسب تقارير المجتمع العامة
اختيار مفتوح الأوزان Qwen 3 Apache 2.0، فصحى قوية

تُفوّت معظم مراجعات أداء النماذج الكبرى في العربية الأخطاء بالكامل، لأن المراجعين لا يستطيعون قراءة الناتج بما يكفي لرصدها. القارئ الخليجي يكتشف المؤشرات المصرية في الفقرة الأولى: يشغّل بدلاً من يشتغل، دلوقتي بدلاً من الحين، أسلوب تأدب خاطئ في رد العميل. لا شيء منها خفي على القارئ المناسب. يقرأ هذا المقال النقاش المجتمعي العام (منتدى Arabic-NLP في Hugging Face، وتقارير LMArena المتعلقة باللهجات، ومنتديات المطوّرين التي تُديرها كل مختبرات) لما يفعله كل نموذج حدّي في العمل العربي الموجَّه إلى السوق السعودية.

النماذج الخمسة المُحللة هي Claude Opus 4.7، وGPT-5، وGemini 3.x، وQwen 3 235B MoE، وLlama 4 Maverick. محاور عبء العمل هي: الفصحى، وثلاثة مستويات إقليمية رئيسية (الخليجية، والمصرية، والشامية)، والبريد الإلكتروني السعودي متعدد اللغات. عربية المغرب العربي (المغربية، والجزائرية، والتونسية) مسألة منفصلة وخارج النطاق؛ التغطية هناك أضعف عبر جميع النماذج الخمسة.

لوحة التقييم النوعي

الجدول أدناه ملخص نوعي لا قائمة تصنيف رقمية، لأن أعباء العمل المُقيَّمة لا تمتلك معايير رقمية عامة. التقديرات تعكس توافق النقاش المجتمعي العام عبر منتديات المختبرات نفسها، وزوايا Arabic-NLP في Hugging Face، وتقارير المطوّرين في المجتمع التقني السعودي والخليجي.

كيف يتعامل كل نموذج حدّي مع أعباء العمل العربية الموجَّهة إلى السوق السعودية، مايو 2026
عبء العملClaude Opus 4.7GPT-5Gemini 3.xQwen 3 235BLlama 4 Maverick
إنجليزي → تسويق خليجيقويانجراف مصريانجراف للفصحىقويضعيف
رد أعمال بالفصحىقويجيد، نبرة باردةجيدجيدمقبول
محاكاة شعرية (مثل درويش)مقبولشعور بالترجمةمقبولأفضل محاولةضعيف
ملخص قانون العمل (فصحى)قوي، تحققمقبولقويمقبولضعيف
مصري → إنجليزيقويقويقويقويمقبول
بريد إلكتروني متعدد اللغاتقوييُفرط في الترجمةيُقصّر في الترجمةمقبولضعيف

الخليجية هي أين تتباين النماذج

أكثر أعباء العمل كشفاً هو نص تسويقي من الإنجليزية إلى الخليجية لجمهور سعودي شاب. النقاش المجتمعي متسق في أن Claude يُنتج ناتجاً يبدو كتبه كاتب إعلانات سعودي: مفردات خليجية الطابع، أسماء المنتجات تُترك بالحروف اللاتينية (وهو ما يكتبها به المستخدمون السعوديون)، إيقاع جملة يتطابق مع اللهجة، مع تحرير خفيف فقط قبل الشحن. Qwen 3 يُنتج شيئاً قريباً بنفس الجودة، مع نبرة شامية طفيفة تتسلل في المخرجات الأطول (بيانات تدريب Qwen موزونة أكثر نحو مصادر شامية من خليجية).

نمط Gemini هو الانجراف نحو الفصحى. حين يكون النموذج غير متأكد من اختيار لهجة، يتراجع إلى مستوى أكثر رسمية من الفصحى، فيخرج الناتج صحيحاً من الناحية التقنية لكن متعثراً أسلوبياً. القارئ الخليجي يُدرك فوراً أن النص كتبه شخص يحاول أن يبدو خليجياً لا شخص هو خليجي فعلاً. GPT-5 ينجرف في الاتجاه الآخر، نحو المصرية: يتخذ من الصياغات والمفردات المصرية خياره الافتراضي حتى حين يُسمّي الأمر جمهوراً خليجياً. الانجراف خفيف بما يكفي لصعوبة التعبير عنه بدون تعرّض لكلا اللهجتين، غير أنه كافٍ لكسر الانغماس للقارئ المقصود. Llama 4 Maverick يُنتج فصحى مع بضع كلمات لهجوية مبعثرة بصرف النظر عن الأمر؛ التدريب اللهجي لم يُفعّل بعد في هذا الفصيل.

الفصحى مسألة شبه محسومة (الفروق في الذوق)

أعباء العمل بالفصحى هي الأكثر تقارباً. كل نموذج في هذه الفئة يُنتج فصحى معاصرة مقبولة. الفروق في النبرة وإيقاع الجملة والاختيارات اللفظية الصغيرة التي تكشف إن كان النص كُتب بيد شخص يتشرب اللغة أم بيد نموذج يُقارب عليها.

في رد دعم أعمال سعودي، يصيب Claude المستوى الصحيح للتأدب والافتتاحية والخاتمة المُصاغة جيداً دون الرسمية المبالغ فيها التي تلجأ إليها بعض النماذج. Qwen وGemini يُنتجان فصحى قوية مع ركاكة أسلوبية طفيفة: صياغة قديمة هنا، اختيار لفظي غير مألوف هناك. لا شيء مُحرج. فصحى GPT-5 صحيحة من الناحية التقنية لكنها باردة في النبرة، ويبدو الصوت مُترجَماً لا أصيلاً. أشكال البنية الإنجليزية تظهر من خلاله، ودروز الخياطة مرئية للقارئ العربي المتأمل.

كل هذه النماذج تعرف الكلمات. ما يُفرّق بينها هو النبرة والإيقاع والتعبير المحلي، وهو الجانب الذي لا يكلف نفسه أي مقياس أداء قياسه.

أين يقع كل نموذج في العمل الموجَّه للسوق السعودية

قوة الملاءمة، بناءً على توافق التقارير العامة.

Claude Opus 4.7
قوي
Qwen 3 235B
قوي
Gemini 3.x
مقبول
GPT-5 (انجراف مصري)
خارج اللهجة
Llama 4 Maverick
ضعيف

الكود المختلط هو الاختبار الأصعب

البريد الإلكتروني العربي-الإنجليزي المختلط هو أصعب عبء عمل منفرد لكل نموذج. الكتابة السعودية على الإنترنت تُسقط بشكل اعتيادي أسماء العلامات التجارية والمصطلحات التقنية الإنجليزية، وأحياناً جملاً إنجليزية كاملة، في نصوص عربية في الأساس. الرد الذي يُطابق هذا الأسلوب يعمل؛ التحول إلى الفصحى الرسمية يبدو أصماً.

يتعامل Claude مع هذا بشكل أفضل بحسب تقارير المجتمع. رده يُبدّل بين اللغتين بشكل طبيعي، يُبقي المصطلحات التقنية بالإنجليزية حين يكون ترجمتها مصطنعاً ويلجأ إلى العربية في الأجزاء العاطفية والعلائقية. تميل النماذج الأخرى إلى أحد الطرفين: إما يُكرَه كل شيء للعربية بما في ذلك المصطلحات التقنية، أو يبقى الرد في معظمه إنجليزياً مع بضع عبارات عربية تُلصق كزينة. لا يُطابق أيٌّ من الأسلوبين طريقة الكتابة الفعلية للمستخدمين السعوديين.

الفصحى

Claude أقرب سباق عموماً

الخليجية

Claude فجوة واضحة عن GPT-5

المصرية

GPT-5 تفضيل بيانات التدريب

الشامية

Qwen تقدم في هذا المستوى

الكود المختلط

Claude الأفضل في المزيج السعودي

الشعر

Qwen أفضل محاولة لمحاكاة الأسلوب
1. حدّد المستوى اللغوي

فصحى، خليجية، مصرية، شامية. المستوى يُحدد النموذج.

2. اختر النموذج

Claude للخليجية والفصحى. Qwen للشامية. GPT-5 للمصرية.

3. صِغ الأمر بالجمهور

سمّ المدينة والفئة العمرية والنبرة. الإعدادات الافتراضية غير كافية.

4. مراجعة متحدث أصلي

لكل نص موجَّه للعملاء، دائماً. لا تتخط هذه الخطوة.

أين لا يزال لا يوجد نموذج موثوق

بعض الفئات تُشكّل عقبة لكل نموذج حدّي، ونشر أي منها دون مراجعة بشرية خطأ.

النصوص القانونية. ملخصات قانون العمل بالفصحى جيدة بما يكفي للصياغة لكن ليس للنشر. مصطلحات بعينها تحمل معاني بعينها؛ الخطأ في رقم مادة أو استبدال مرادف قريب يُغيّر الدلالة القانونية. لا تنشر أي من هذه النماذج في أعمال قانونية عربية دون مراجع قانوني بشري مؤهل.

العربية الكلاسيكية. لا يُتقن أي من النماذج الحدّية العربية الكلاسيكية ما قبل الحديثة كإتقانه للفصحى. اقتباسات من نصوص تراثية وتفسير ديني وكل ما هو بالأسلوب الكلاسيكي: توقع أخطاء جسيمة وخصص ميزانية لمراجعة خبراء.

اللهجات الإقليمية المحددة. الخليجية بحد ذاتها عائلة لهجات. النجدية تختلف عن الحجازية تختلف عن القطرية تختلف عن البحرينية. لا نموذج يُميّز بينها بمستوى يُميّزه المتحدث الأصلي. للنص الذي يحتاج تحديداً نكهة حجازية أو بحرينية، لن تلتقطها النماذج دون أوامر مكثفة وتحرير معمّق.

الاختيار للإنتاج

للعمل العربي في مطلع 2026، الاختيار الافتراضي هو Claude Opus 4.7. يتفوق النموذج في الفصحى والخليجية والكود المختلط على البدائل، وحساسية النبرة هي عادةً ما يُقرر إن كان النص يُشحَن أم يعود للإعادة. تسعير Opus مُغطَّى في مراجعة Opus؛ لدى النموذج المرونة اللازمة للعمل الدقيق في النبرة الذي يحتاجه هذا النوع من المحتوى.

Qwen 3 235B هو الخيار الثاني القوي. إنه الاختيار الصحيح حين تُهم وضوح الترخيص (Apache 2.0) وجمهورك يتحدث إحدى اللهجات في مزيج تدريبه. للعمل الشامي، يتقدم Qwen على Claude في التقارير العامة؛ للخليجية، يحتفظ Claude بالتقدم. مقالة الفئة مفتوحة الأوزان تتناول أين يقع Qwen في المشهد الأشمل، ومقالة النماذج الصغيرة تتناول متى تنتقل إلى نموذج أصغر.

Gemini مناسب للفصحى العامة ويتعثر في اللهجة. GPT-5 يُنتج ناتجاً بنكهة مصرية حتى حين تُحدد الخليجية: لا تستخدمه لجماهير خليجية. Llama 4 Maverick لم يبلغ بعد المستوى المطلوب للعمل العربي الجاد رغم التحسن عن Llama 3. مقالة القدرات متعددة الوسائط تتناول قوة Gemini المنفصلة في العربية على صور المستندات.

للعمل الجاد الموجَّه إلى السوق السعودية، النمط الصامد هو صياغة النص الموجَّه للعملاء بـClaude، ومراجعة مراجع بشري طليق في الخليجية على الناتج، وتخصيص ميزانية لجولة تحرير أعمق مما تحتاجه الإنجليزية. الفجوة بين أفضل نموذج وكاتب أصيل حقيقية، لكنها ضاقت بما يكفي لجعل سير العمل الآن يتفوق على الترجمة من الصفر. Anthropic وAlibaba كلاهما استثمرا بوضوح في العربية، ويتموضعان لسوق نصف مليار شخص يقبل منافسوهم الأقل اهتماماً بتركه على الطاولة.

الأسئلة الشائعة

أي نموذج ذكاء اصطناعي هو الأفضل للمحتوى العربي؟

Claude Opus 4.7 للعمل الموجَّه إلى السوق السعودية. يُصنَّف النموذج باستمرار الأقوى في الفصحى والخليجية في النقاش المجتمعي العام. الحساسية في الأسلوب هي الفارق بين نص يُشحَن ونص يحتاج إعادة كتابة.

هل يستطيع الذكاء الاصطناعي الكتابة بالعربية السعودية (الخليجية)؟

يُنتج Claude Opus 4.7 ناتجاً قريباً من الشحن في المحاولة الأولى مع أمر استفسار يُحدد جمهوراً سعودياً. Qwen 3 235B يأتي قريباً منه. GPT-5 يميل نحو الصياغة المصرية. Gemini 3.x يعود إلى الفصحى حين يكون غير متأكد.

هل يتعامل Qwen 3 جيداً مع العربية؟

نعم، وترخيص Apache 2.0 هو الأوضح بين خيارات النماذج مفتوحة الأوزان للاستخدام التجاري. يتأخر Qwen 3 عن Claude في الخليجية ويتقدم عليه في الشامية وفق التقارير العامة.

كيف يتعامل الذكاء الاصطناعي مع العربية المزيجة بالإنجليزية؟

البريد الإلكتروني السعودي متعدد اللغات هو أصعب عبء عمل منفرد عبر جميع النماذج الحدّية. Claude يتعامل معه بشكل أفضل بحسب التقارير العامة: يُبقي المصطلحات التقنية بالإنجليزية حين يكون ذلك مناسباً ويستخدم العربية في المحتوى العلائقي.

هل يستطيع الذكاء الاصطناعي ترجمة العربية الكلاسيكية القديمة؟

ليس بشكل موثوق. لا يُتقن أي من النماذج الحدّية العربية الكلاسيكية ما قبل الحديثة كإتقانه للفصحى. توقع أخطاء جسيمة في الاقتباسات من النصوص التراثية أو التفسير الديني.

سجل التغييرات

  • 25 مايو 2026 — أُعيدت كتابة الأقسام التي كانت تصف تمريناً تقييمياً خاصاً من ست مهام. يعكس الجدول النوعي الآن توافق النقاش المجتمعي العام عبر منتديات Arabic-NLP ومجتمعات مطوّري المختبرات.
  • 4 مايو 2026 — نُشر أصلاً.

المراجع

  1. Anthropic، "توثيق Claude API"، docs.claude.com، بتاريخ مايو 2026.
  2. Alibaba، "Qwen"، qwen.ai، بتاريخ مايو 2026.
  3. Google، "Gemini API models"، ai.google.dev/gemini-api/docs/models، بتاريخ مايو 2026.
  4. Meta، "Llama"، llama.com، بتاريخ مايو 2026.
  5. "Chatbot Arena leaderboard"، lmarena.ai، لقطة مايو 2026.
  6. "Modern Standard Arabic"، Wikipedia، en.wikipedia.org/wiki/Modern_Standard_Arabic، بتاريخ مايو 2026.