أي نموذج AI API هو الأرخص لكل مليون رمز؟

DeepSeek V4-Flash هو أرخص مزود API حالياً، بسعر $0.14 لكل مليون رمز إدخال و$0.28 لكل مليون رمز إخراج. أما النماذج مفتوحة الأوزان ذاتية الاستضافة مثل Llama 4 Scout وPhi-4، فرخصتها مجانية لكنها تحتاج بنية GPU سحابية.

ما تخزين المطالبات مؤقتاً وهل يوفر المال؟

يسمح تخزين المطالبات مؤقتاً لمزودي API بحفظ تعليمات النظام أو النصوص الافتتاحية كثيرة الاستخدام. يقدم مزودون مثل Anthropic وOpenAI وDeepSeek خصومات تصل إلى 90% على رموز الإدخال المخبأة، ما يخفض التكلفة بدرجة كبيرة في التطبيقات الوكيلية طويلة السياق.

مقارنة·يونيو 2026

مقارنة أسعار نماذج الذكاء الاصطناعي 2026: التكلفة لكل مليون رمز

مقارنة كاملة لتسعير رموز API (الإدخال، الإخراج، التخزين المخبأ) عبر OpenAI وAnthropic Claude وGoogle Gemini وDeepSeek والنماذج مفتوحة الأوزان، مباشرة من الوثائق الرسمية.

تمت المراجعة في 6 يونيو 2026 · تم التحقق من الأرقام من مصادر رسمية في 6 يونيو 2026 · عرض سجل التغييرات

تحول تسعير API لنماذج اللغة الكبيرة إلى سلعة بسرعة، لكن هياكل التسعير أصبحت أعقد. بين الإدخال والإخراج وتخزين المطالبات والدفعات والحالات ذاتية الاستضافة، يجب على المطورين حساب الأسعار بعناية لتقدير أعبائهم الشهرية. أدناه جدول المقارنة الديناميكي، المتزامن بدقة مع فهرس النماذج الرئيسي.

النموذج	المزود	الإدخال / 1M	الإخراج / 1M	الإدخال المخبأ / 1M
Qwen3.6-27B	Alibaba	استضافة ذاتية	استضافة ذاتية	—
Llama 4 Maverick	Meta	استضافة ذاتية	استضافة ذاتية	—
Llama 4 Scout	Meta	استضافة ذاتية	استضافة ذاتية	—
Phi-4	Microsoft	استضافة ذاتية	استضافة ذاتية	—
DeepSeek V4-Flash	DeepSeek	$0.140	$0.280	$0.0028
GPT-5 Mini	OpenAI	$0.250	$2.00	$0.025
DeepSeek V4-Pro	DeepSeek	$0.435	$0.870	$0.0036
Mistral Large 3	Mistral	$0.500	$1.50	—
Kimi K2.6	Moonshot AI	$0.950	$4.00	$0.160
Claude Haiku 4.5	Anthropic	$1.00	$5.00	$0.100
GPT-5	OpenAI	$1.25	$10.00	—
Grok 4.3	xAI	$1.25	$2.50	$0.200
Gemini 3.5 Flash	Google	$1.50	$9.00	$0.150
Mistral Medium 3.5	Mistral	$1.50	$7.50	—
Gemini 3.1 Pro	Google	$2.00	$12.00	$0.200
Claude Sonnet 4.6	Anthropic	$3.00	$15.00	$0.300
Claude Opus 4.8	Anthropic	$5.00	$25.00	$0.500
Claude Opus 4.7	Anthropic	$5.00	$25.00	$0.500
GPT-5.5	OpenAI	$5.00	$30.00	$0.500

طبقات التسعير: متقدمة مقابل متوسطة مقابل صغيرة

عند تحليل التكاليف، تقع النماذج عموماً في ثلاث طبقات:

الطبقة المتقدمة ($5.00+ إدخال / $15.00+ إخراج): مخصصة لأعلى مستويات الذكاء مثل Claude Opus 4.8 وGPT-5.5. هذه النماذج مثالية للقرارات المعمارية المعقدة وحلقات الوكلاء عالية المخاطر، لكنها مكلفة جداً للمهام اليومية عالية الحجم.
الطبقة المتوسطة ($1.25 - $3.00 إدخال / $2.50 - $15.00 إخراج): نماذج مثل Claude Sonnet 4.6 وGPT-5 وGemini 3.5 Flash تمثل نقطة التوازن لتطبيقات الإنتاج، إذ تمزج قدرة عالية بسعر معتدل.
طبقة النماذج الصغيرة ومفتوحة الأوزان (أقل من $1.00 إدخال): نماذج مثل DeepSeek V4-Flash وGPT-5 Mini وLlama 4 Scout ذاتية الاستضافة. تقدم استجابات سريعة وتكاليف شبه معدومة، ما يجعلها مثالية للتوجيه والتصنيف والتلخيص عالي الحجم.

لمزيد من التفاصيل عن ترتيبات الأداء العامة، راجع ترتيب نماذج الذكاء الاصطناعي أو احسب تكلفتك الشهرية الدقيقة عبر حاسبة التكلفة.

كيف تتجنب الدقة الوهمية

تسعير كل مليون رمز يبدو رقماً دقيقاً، لكن الفاتورة الفعلية تعتمد على شكل العمل. روبوت دعم لديه مطالبة سياسة طويلة وإجابات قصيرة سيدفع غالباً على الإدخال، أما مساعد كتابة بمطالبات قصيرة ومسودات طويلة فسيدفع غالباً على الإخراج. النموذج نفسه قد يكون رخيصاً في مسار ومكلفاً في مسار آخر.

استخدم الجدول كخط أساس موحد، ثم احسب مزيجك أنت: متوسط رموز الإدخال، متوسط رموز الإخراج، معدل الاستفادة من التخزين المخبأ، نسبة الدفعات، معدل الإعادة، ونسبة المخرجات المقبولة. هذه الأرقام الستة أهم من سعر المزود في سطر واحد عند اتخاذ قرار إنتاجي.

راجع صفحة المزود قبل الالتزام بإنفاق سنوي. صفحات الأسعار قد تتغير بهدوء، وبعض العقود المؤسسية تتضمن خصومات أو حدّاً أدنى أو رسوماً للمنصة لا تظهر في الوثائق العامة.

أسئلة شائعة

كيف يوفر تخزين المطالبات المال؟

يسمح تخزين المطالبات لمزودي API مثل Anthropic وOpenAI وDeepSeek بإعادة استخدام أجزاء ثابتة من سعة السياق، مثل مطالبات النظام الكبيرة أو سياقات النظام. ينتج عن ذلك خصومات تصل إلى 90% من أسعار رموز الإدخال القياسية، وهو أمر حاسم للمعماريات الوكيلية.

هل النماذج مفتوحة الأوزان ذاتية الاستضافة مجانية تماماً؟

رغم أن نماذج مثل Llama 4 Scout وMaverick وPhi-4 تكلف $0 للترخيص تحت رخص مفتوحة، يجب أن تدفع لبنية GPU السحابية مثل AWS أوGCP أوRunPod أوLambda Labs لاستضافتها. إذا كانت إنتاجيتك منخفضة، تكون واجهات API المُدارة غالباً أرخص من إبقاء GPU نشطاً 24/7.

سجل التغييرات

6 يونيو 2026 — نُشرت النسخة الأولى. كل الأسعار مأخوذة من وثائق المزودين الرسمية وتمت مطابقتها مع ملف benchr model-figures.json.

المصادر

وثائق API الرسمية للمزودين: Anthropic وOpenAI وGoogle وDeepSeek وxAI وMistral وMeta وMoonshot AI وMicrosoft وAlibaba (تم التحقق من الكل في 3 يونيو 2026)
benchr model-figures.json — مصدر الحقيقة الوحيد، تم التحقق في 3 يونيو 2026