أفضل ذكاء اصطناعي للعربية المحلية

أين تحافظ النماذج على العربية المحلية وأين تعود إلى الفصحى أو تنجرف نحو سجل عربي آخر.

· عرض سجل التغييرات · تم التحقق من الأرقام مقابل المصادر الرسمية، 30 مايو 2026

نقطة يجب توضيحها قبل أي اختيار. هذه الصفحة ليست عن الترجمة بين العربية والإنجليزية. تلك مهمة مختلفة بفائزين مختلفين، ولها دليلها الخاص. هذه الصفحة عن السجل: تكتب أو تتحدث بالعربية المحلية، وتريد من النموذج أن يجيبك بالعربية المحلية، لا بعربية نشرة الأخبار المسطّحة التي تعود إليها كل النماذج حين تتوتر.

لذلك السلوك الافتراضي مهم. كل نموذج حدّي مدرَّب على قدر من الفصحى، السجل المكتوب الرسمي، أكبر بكثير من بيانات التعبير المحلي المنطوق. لذا فالفصحى هي موضع قوته، والتعبير المحلي هو موضع تذبذبه. ويظهر التذبذب على هيئة انجراف: تسأل بصياغة محلية، فيأتي الرد بالفصحى، أو بأسلوب عربي آخر أكثر حضوراً في بيانات التدريب. الحفاظ على السجل هو الاختبار كله هنا.

لماذا تعود النماذج إلى الفصحى

ابدأ بالأرقام، لأنها تفسّر كل ما يأتي بعدها. في المهام العربية الأكاديمية، تستقر النماذج حول 85 إلى 92 بالمئة. انزل إلى العربية المحلية فتهبط الدقة إلى نحو 75 إلى 85 بالمئة. تصمد السجلات الأكثر حضوراً في البيانات أفضل قليلاً، وتتراجع السجلات الأقل حضوراً. النمط يتبع حجم بيانات التدريب، لا أي شيء خاص بالسجلات المحلية نفسها.

32% تسرّب الفصحى في نموذج محلي أساسي قبل الضبط الدقيق. خفّضه ضبط LoRA المتخصص إلى 6.21%.

رقم التسرّب ذاك هو أوضح قياس نشره أحد عن الانجراف المحلي. نموذج متخصص يُدعى ALLaM المحلي، مُدرَّب على بيانات محلية، كان يُسرّب الفصحى 32.63 بالمئة من الوقت قبل الضبط. وبعد ضبط LoRA على 5,466 زوجاً تعليمياً اصطناعياً، هبط التسرّب إلى 6.21 بالمئة وبلغ معدل حفظه للسجل المحلي 84.21 بالمئة. الدرس للنماذج الحدّية صريح: لا يُضبط أي منها على هذا النحو، فكلها تُسرّب. والسؤال الوحيد هو كم، ونحو ماذا.

دقة السجل، نموذجاً نموذجاً

لا توجد مواجهة مضبوطة تضع Claude وGPT وGemini وQwen أمام بعضها على العربية المحلية. لذا فالأشرطة أدناه استنتاج، مستمدّ من السلوك المحلي الموثّق لكل نموذج ودرجاته العربية الأكاديمية، لا من تشغيل معياري واحد. اقرأها كترتيب لاحتمال أن يحافظ كل نموذج على سجلك، مع التحفظ بأن الأرضية تتحرك تحتها جميعاً.

إلى أي مدى يحافظ كل نموذج على السجل المحلي

دقة محلية مستنتجة، الأعلى أفضل في البقاء محلياً بدل الانجراف إلى الفصحى أو سجل عربي آخر. مبنية على السلوك المحلي الموثّق والدرجات العربية الأكاديمية، لا على معيار مواجهة واحد. مايو 2026.

Claude Opus 4.7
يحافظ الأفضل
Qwen 3
واسع، غير مثبت محلياً
GPT-5.5
ينجرف لسجل آخر
Gemini 3 Pro
يجيب بالفصحى

Claude Opus 4.7 يتصدّر. تضع ملاحظات Anthropic متعددة اللغات، مدعومةً باختبار مقارن، أفضليةً طفيفة في العربية المحلية، على الأرجح من مزيج بيانات التدريب. وفي اختبارات عمياء على تلخيص عربي أكاديمي سجّل 9.5 من 10، متقدّماً بوضوح على GPT بـ 8.5 وGemini بـ 7.5، وينتج عربية أكثر تنوعاً وطبيعية حيث يميل GPT إلى مفردات متكررة وصياغة أكثر تيبّساً. أما السمة الأهم لعمل السجل فهي نمط الإخفاق: حين لا يكون Claude متأكداً، يبقى أقرب إلى سجلك بدلاً من الهرب إلى الفصحى. وللقراءة الأوسع عن موقعه مقابل الميدان في المحتوى العربي، يضع تقرير benchr العملي عن الذكاء الاصطناعي للمحتوى العربي درجات لخمسة نماذج عبر الفصحى وعدة سجلات محلية.

Qwen 3 هو الوصيف، والوصيف الصادق. يدعم 119 لغة وتنويعاً بنافذة سياق 128K، اتساع لغوي أكبر من أي منافس هنا، وهو الأقوى في المجموعة على التبديل بين العربية والإنجليزية في منتصف الجملة. لكن الاتساع ليس عمقاً. لا يوجد معيار عام يثبت إخراج Qwen المحلي مقابل Claude، فاختياره رهان على التغطية لا نتيجة محلية مُتحقَّقة. إن كان عملك مكثّف الخلط اللغوي، فإن Qwen يستحق النظر؛ وإن كان يعتمد على سجل محلي دقيق جداً، فالحجة أضعف.

GPT-5.5 جيد في العربية وسيئ في هذه المهمة تحديداً. هو أقوى في السجلات التي تحضر بكثافة في بيانات التدريب، وتنزلق دقته في السجلات الأنحف. والمشكلة لمستخدمي العربية المحلية هي اتجاه الانزلاق: قد يعود الرد بأسلوب عربي آخر يعرفه النموذج أكثر. وتلك نتيجة أسوأ من الفصحى أحياناً، لأنها خاطئة بطريقة تبدو واثقة.

Gemini 3 Pro يفهم المدخل المحلي جيداً؛ يُقال إنه يحلّل أكثر من 16 سجلاً عربياً عند الدخول. المشكلة في المخرج. يوحّد Gemini ردوده إلى الفصحى عبر كل صيغة إقليمية، فتسأل بالعربية المحلية وتحصل على عربية رسمية في كل مرة. للفهم لا بأس بذلك. أما لردٍّ يبدو محلياً فهو غير صالح، ويغطي تقييم benchr لـ Gemini 3 Pro بقية ما يصل إليه هذا النموذج.

التنويعات المحلية الأقل تمثيلاً: أين تنهار الدقة

كلما دخلت في تفاصيل التعبير المحلي، أصبحت الأرض أنحف. "العربية المحلية" في أي معيار تعني عادةً متوسطاً ممزوجاً، لا التزاماً دقيقاً بكل تنويع. بعض التنويعات المحلية متمايز جداً، ونادر في البيانات العامة إلى حدٍّ يمنع أي نموذج حدّي من الوعد به. والأدبيات متسقة هنا: تبقى النماذج الكبيرة مهيمَنة بالفصحى بدعم محدود للسجلات المحلية الدقيقة، وتميل إلى دمجها في سجل محلي عام أو مباشرةً في الفصحى.

قد يعرف النموذج "العربية المحلية" كفئة ومع ذلك يسطّح التنويعات المحلية الأقل تمثيلاً إلى العربية الباهتة نفسها.

هنا تكسب النماذج المضبوطة مكانها. إن كان منتجك يحيا أو يموت على دقة السجل الفرعية المحلية، فالنموذج الحدّي الأساسي ليس الجواب؛ نموذج محلي مضبوط بـ LoRA هو الجواب، ومعدل ALLaM المحلي البالغ 84 بالمئة محلية هو إثبات المفهوم. ومن بين النماذج الجاهزة، يدمج Claude Opus 4.7 التنويعات المحلية أقل من غيره، لكن "أقل" ليست "جيداً". اضبط توقعاتك بناءً على ذلك.

لوحة النتائج

الخلاصة المختصرة، بحسب ما تحاول فعله. اعثر على صفّك وخذ الاختيار.

محادثة محلية عامة

Claude Opus 4.7 يحافظ على السجل، أقل انجراف للفصحى

خلط عربي-إنجليزي

Qwen 3 119 سجل، الأفضل في التبديل

دقة التنويعات المحلية

نموذج مضبوط من فئة ALLaM، لا نموذج حدّي أساسي

إخراج فصحى رسمي

أي منها Gemini يعود إليها مجاناً

الصوت / النسخ

Speechmatics 6.3% خطأ كلمات على صوت مختلط

الأقل ملاءمةً للرد المحلي

Gemini 3 Pro يفهم، ويجيب بالفصحى

ملاحظة على صفّ الصوت ذاك، لأنه يسهل المبالغة في قراءته. يحقق نموذج Speechmatics ثنائي اللغة العربي-الإنجليزي معدل خطأ كلمات 6.3 بالمئة على التبديل اللغوي، أقل بنحو 35 بالمئة من 9.7 بالمئة لجوجل. نتيجة قوية، لكنها تحويل كلام إلى نص. لا تخبرك بشيء عن كيفية توليد نموذج محادثة لسجل، فلا تنقلها إلى عمل النص. وإن كنت توازن الجانب المنطوق على نطاق أوسع، ففي مقارنة benchr للنماذج الصوتية الصورة الأشمل.

إن كانت حاجتك الحقيقية نقل النص بنظافة بين اللغتين بدلاً من الحفاظ على سجل واحد، فتلك أرض الدليل الشقيق: يرتّب دليل benchr للترجمة بين العربية والإنجليزية النماذج بحسب جودة الاتجاه في الطريقين، وهو سؤال منفصل عن دقة السجل. وإن كانت المهمة الأساس مجرد إنتاج نثر عربي طويل متين، فإن دليل الذكاء الاصطناعي للكتابة المحايد لغوياً نقطة بداية أفضل، إذ يصادف أن متصدّر جودة الكتابة ومتصدّر السجل من العائلة نفسها.

احسب تكلفتك ←·قارن هذا النموذج ←·اعثر على نموذجك ←

أسئلة شائعة

هل يتعامل Claude مع العربية المحلية أفضل من بقية النماذج؟

نعم. يُظهر Claude Opus 4.7 تفوقاً طفيفاً موثّقاً في العربية المحلية، على الأرجح بسبب توزيع بيانات التدريب. ينتج صياغة عربية أكثر طبيعية ويقلل الانجراف نحو الفصحى عندما يصادف مدخلات محلية غير مؤكدة، مقارنةً بـ GPT الذي قد ينجرف إلى سجل عربي آخر، وGemini الذي يوحّد كل شيء إلى الفصحى في ردوده. لا يستند أي من هذا إلى معيار مباشر، فاعتبره مؤشراً لا نتيجة محسومة.

ما الفرق بين أداء الفصحى وأداء العربية المحلية في النماذج اللغوية الكبيرة؟

تؤدي النماذج أفضل بكثير في الفصحى، نحو 85 إلى 92 بالمئة في المعايير الأكاديمية، مقارنةً بالعربية المحلية، نحو 75 إلى 85 بالمئة، لأن بيانات التدريب تميل نحو العربية المكتوبة الرسمية. عندما يصادف النموذج مدخلاً محلياً فإنه غالباً ينجرف عائداً إلى الفصحى أو إلى سجل أكثر شيوعاً، ويكون الأثر أسوأ كلما كان السجل المحلي أقل تمثيلاً في البيانات.

كيف تؤدي التنويعات المحلية الأقل تمثيلاً في النماذج الحديثة؟

التنويعات المحلية الأقل تمثيلاً ضعيفة الحضور في كل نموذج حدّي كبير. لا تفصل النماذج الأساسية مثل Claude وGPT وQwen وGemini هذه التنويعات ولا تُحسّن لها صراحةً، وتميل إلى دمجها نحو الفصحى أو نحو سجل محلي عام. ويسد الضبط الدقيق المتخصص الفجوة: نموذج ALLaM المحلي، المضبوط بطريقة LoRA على 5,466 زوجاً تعليمياً اصطناعياً، بلغ معدل حفظ السجل المحلي 84.21 بالمئة وخفض تسرّب الفصحى من 32.63 بالمئة إلى 6.21 بالمئة.

هل ينافس Qwen 3 نموذج Claude في العربية المحلية؟

يدعم Qwen 3 عدد 119 لغة وسجل بنافذة سياق 128K، وهو اتساع أكبر من أي منافس كبير، ويتعامل مع التبديل بين العربية والإنجليزية أفضل من معظم نظرائه. لكن لا يوجد معيار منشور يقارن إخراج Qwen المحلي مباشرةً بـ Claude Opus 4.7، فالمقارنة مفتوحة. الاتساع متعدد اللغات لا يضمن العمق المحلي.

أي نموذج يتعامل أفضل مع التبديل بين العربية والإنجليزية؟

في تحويل الكلام إلى نص، تتصدر Speechmatics بمعدل خطأ كلمات 6.3 بالمئة على التبديل بين العربية والإنجليزية مقابل 9.7 بالمئة لجوجل، أي أقل بنحو 35 بالمئة. هذه النتيجة للنسخ الصوتي لا لتوليد النص، فلا تنتقل إلى نماذج المحادثة مباشرةً. ومن بين نماذج النص الحدّية، يتعامل Qwen 3 مع التبديل أفضل من Claude أو GPT أو Gemini، رغم أنه ليس مُقيّماً رسمياً على أزواج العربية المحلية.

سجل التغييرات

  • 30 مايو 2026 — نُشر أول مرة. يغطي Claude Opus 4.7 وQwen 3 وGPT-5.5 وGemini 3 Pro على السجل المحلي والانجراف نحو الفصحى؛ مع ملاحظات التنويعات المحلية والضبط الدقيق من الأبحاث الحالية.

المراجع

  1. Truescho, "Claude vs ChatGPT: Which Is Better for Arabic Content? (2026)," truescho.com, اطُّلع عليه في مايو 2026.
  2. Anthropic، "دعم تعدد اللغات"، platform.claude.com, اطُّلع عليه في مايو 2026.
  3. "ALLaM المحلي: ضبط LoRA لتوليد العربية المحلية"، arxiv.org, اطُّلع عليه في مايو 2026.
  4. "تطوير التحليل اللغوي المدعوم بالذكاء الاصطناعي: مدونات عربية محلية"، mdpi.com, اطُّلع عليه في مايو 2026.
  5. "الترجمة بين السجلات المحلية العربية: تحليل مقارن على النماذج اللغوية الكبيرة"، frontiersin.org, اطُّلع عليه في مايو 2026.
  6. Speechmatics، "تحويل الكلام العربي-الإنجليزي ثنائي اللغة إلى نص"، speechmatics.com, اطُّلع عليه في مايو 2026.