تحول تسعير API لنماذج اللغة الكبيرة إلى سلعة بسرعة، لكن هياكل التسعير أصبحت أعقد. بين الإدخال والإخراج وتخزين المطالبات والدفعات والحالات ذاتية الاستضافة، يجب على المطورين حساب الأسعار بعناية لتقدير أعبائهم الشهرية. أدناه جدول المقارنة الديناميكي، المتزامن بدقة مع فهرس النماذج الرئيسي.
| النموذج | المزود | الإدخال / 1M | الإخراج / 1M | الإدخال المخبأ / 1M |
|---|---|---|---|---|
| Qwen3.6-27B | Alibaba | استضافة ذاتية | استضافة ذاتية | — |
| Llama 4 Maverick | Meta | استضافة ذاتية | استضافة ذاتية | — |
| Llama 4 Scout | Meta | استضافة ذاتية | استضافة ذاتية | — |
| Phi-4 | Microsoft | استضافة ذاتية | استضافة ذاتية | — |
| DeepSeek V4-Flash | DeepSeek | $0.140 | $0.280 | $0.0028 |
| GPT-5 Mini | OpenAI | $0.250 | $2.00 | $0.025 |
| DeepSeek V4-Pro | DeepSeek | $0.435 | $0.870 | $0.0036 |
| Mistral Large 3 | Mistral | $0.500 | $1.50 | — |
| Kimi K2.6 | Moonshot AI | $0.950 | $4.00 | $0.160 |
| Claude Haiku 4.5 | Anthropic | $1.00 | $5.00 | $0.100 |
| GPT-5 | OpenAI | $1.25 | $10.00 | — |
| Grok 4.3 | xAI | $1.25 | $2.50 | $0.200 |
| Gemini 3.5 Flash | $1.50 | $9.00 | $0.150 | |
| Mistral Medium 3.5 | Mistral | $1.50 | $7.50 | — |
| Gemini 3.1 Pro | $2.00 | $12.00 | $0.200 | |
| Claude Sonnet 4.6 | Anthropic | $3.00 | $15.00 | $0.300 |
| Claude Opus 4.8 | Anthropic | $5.00 | $25.00 | $0.500 |
| Claude Opus 4.7 | Anthropic | $5.00 | $25.00 | $0.500 |
| GPT-5.5 | OpenAI | $5.00 | $30.00 | $0.500 |
طبقات التسعير: متقدمة مقابل متوسطة مقابل صغيرة
عند تحليل التكاليف، تقع النماذج عموماً في ثلاث طبقات:
- الطبقة المتقدمة ($5.00+ إدخال / $15.00+ إخراج): مخصصة لأعلى مستويات الذكاء مثل Claude Opus 4.8 وGPT-5.5. هذه النماذج مثالية للقرارات المعمارية المعقدة وحلقات الوكلاء عالية المخاطر، لكنها مكلفة جداً للمهام اليومية عالية الحجم.
- الطبقة المتوسطة ($1.25 - $3.00 إدخال / $2.50 - $15.00 إخراج): نماذج مثل Claude Sonnet 4.6 وGPT-5 وGemini 3.5 Flash تمثل نقطة التوازن لتطبيقات الإنتاج، إذ تمزج قدرة عالية بسعر معتدل.
- طبقة النماذج الصغيرة ومفتوحة الأوزان (أقل من $1.00 إدخال): نماذج مثل DeepSeek V4-Flash وGPT-5 Mini وLlama 4 Scout ذاتية الاستضافة. تقدم استجابات سريعة وتكاليف شبه معدومة، ما يجعلها مثالية للتوجيه والتصنيف والتلخيص عالي الحجم.
لمزيد من التفاصيل عن ترتيبات الأداء العامة، راجع ترتيب نماذج الذكاء الاصطناعي أو احسب تكلفتك الشهرية الدقيقة عبر حاسبة التكلفة.
كيف تتجنب الدقة الوهمية
تسعير كل مليون رمز يبدو رقماً دقيقاً، لكن الفاتورة الفعلية تعتمد على شكل العمل. روبوت دعم لديه مطالبة سياسة طويلة وإجابات قصيرة سيدفع غالباً على الإدخال، أما مساعد كتابة بمطالبات قصيرة ومسودات طويلة فسيدفع غالباً على الإخراج. النموذج نفسه قد يكون رخيصاً في مسار ومكلفاً في مسار آخر.
استخدم الجدول كخط أساس موحد، ثم احسب مزيجك أنت: متوسط رموز الإدخال، متوسط رموز الإخراج، معدل الاستفادة من التخزين المخبأ، نسبة الدفعات، معدل الإعادة، ونسبة المخرجات المقبولة. هذه الأرقام الستة أهم من سعر المزود في سطر واحد عند اتخاذ قرار إنتاجي.
راجع صفحة المزود قبل الالتزام بإنفاق سنوي. صفحات الأسعار قد تتغير بهدوء، وبعض العقود المؤسسية تتضمن خصومات أو حدّاً أدنى أو رسوماً للمنصة لا تظهر في الوثائق العامة.