تصف Anthropic نموذج Sonnet 4.6 بأنه "أفضل مزيج بين السرعة والذكاء"، وهذه مرة تنطبق فيها العبارة التسويقية على طريقة استخدامه فعلًا. هذه هي الطبقة المتوازنة. سريعة، ورخيصة بما يكفي لتشغيلها على حجم كبير، وذكية بما يكفي بحيث نادرًا ما تشعر بالفجوة بينها وبين Opus في العمل اليومي. بنية الأسعار كلها تفترض أنك ستعيش هنا وتزور الطبقات الأخرى عند الحاجة.
المواصفات تدعم هذا التموضع، بحسب وثائق نماذج Claude: نافذة سياق 1M مثل Opus 4.8، وحتى 64k رمز إخراج، ورؤية، واستدعاء دوال، ومخرجات منظمة، وتخزين مؤقت للمطالبات، وتفكير ممتد وتكيفي. مجموعة الميزات ليست نسخة مقصوصة من النموذج الرائد. أنت تتنازل عن أعلى طرف في منحنى الاستدلال، وتقريبًا لا تتنازل عن شيء آخر.
لذلك السؤال الحقيقي ليس هل Sonnet 4.6 جيد. نعم، جيد. السؤال هو: أي مهام تنتمي إليه، وأيها ينبغي أن تنزل طبقة لتوفير المال، وأيها يستحق الدفع مقابل Opus. هذا قرار توجيه، وإتقانه أهم من اختيار نموذج واحد.
متى يكون Sonnet هو الافتراضي الصحيح
معظم ما يفعله تطبيق إنتاجي يستطيع Sonnet تنفيذه بلا عناء. الدردشة والأسئلة والأجوبة. الصياغة وإعادة الكتابة. البرمجة الروتينية، أي نوع "اشحن هذه الميزة" لا "أعد تصميم هذه البنية". استدعاء الأدوات وتوجيه الدوال، حيث يكون اتباع التعليمات أهم من القوة الخام. والاستخراج المنظم عندما يكون المخطط هو ما يقوم بالعبء الثقيل. ضع كل ذلك على Sonnet وستدفع سعرًا عادلًا مقابل مخرجات لا تحتاج إلى التشكيك بها باستمرار.
سبب البدء من هنا بدل Opus اقتصادي بحت. إدخال Sonnet يساوي 60% من إدخال Opus، وإخراجه يساوي 60% أيضًا، لذلك كل طلب توجهه إلى الأسفل بدل الأعلى يوفر مالًا حقيقيًا عند الحجم الكبير. الخطأ الشائع هو جعل النموذج الرائد افتراضيًا ثم لمس الطبقة الوسطى بالكاد، وبعدها الاستغراب من الفاتورة. تفصيل السعر حسب حالة الاستخدام يوضح كيف يتراكم ذلك بسرعة عبر الدردشة وRAG والوكلاء.
| عبء العمل | أفضل طبقة | السبب |
|---|---|---|
| تصنيف بالجملة، توجيه الطلبات، استخراج الحقول | Haiku 4.5 | بسيط وعالي الحجم؛ استدلال Sonnet لا يُستعمل |
| الدردشة، المسودات، الكود الروتيني، استخدام الأدوات، معظم زيارات الإنتاج | Sonnet 4.6 | الافتراضي المتوازن: ذكي بما يكفي ومُسعّر للحجم |
| كود إنتاجي معقد، وكلاء طويلو المدى، مستندات كثيفة، استدلال صعب | Opus 4.8 | يستحق الزيادة فقط عندما تكون إعادة إصلاح الخطأ مكلفة |
متى تنزل إلى Haiku
كثير من أعباء العمل لا يحتاج ما يجلبه Sonnet أصلًا. إذا كنت تضع وسومًا لتذاكر الدعم، أو توجه الطلب إلى الطابور الصحيح، أو تستخرج حقولًا من مستند، أو تلخص بالجملة، فإن الاستدلال الذي تدفع مقابله في Sonnet يبقى عاطلًا. هذه منطقة Haiku 4.5، وبثلث سعر Sonnet.
الحيلة أن تكون صريحًا بشأن عدد المهام البسيطة لديك. كثير من "ميزات الذكاء الاصطناعي" ليست إلا تصنيفًا يرتدي معطفًا طويلًا، وتعمل جيدًا على الطبقة الرخيصة. مراجعة Haiku 4.5 تشرح أين يصمد أرخص نموذج وأين يبدأ هبوط الجودة في تكليفك أكثر مما وفرت.
متى تصعد إلى Opus
يظهر سقف Sonnet في المهام الصعبة. فك خطأ يمتد عبر عشرات الملفات. تشغيل وكيل طويل حيث يفسد منعطف خاطئ مبكر كل ما بعده. تحليل قانوني أو مالي كثيف حيث تفويت تفصيل واحد له ثمن. هنا يكسب Opus 4.8 علاوة الإدخال التي تقارب 1.67× بفضل استدلاله ومكاسبه الأحدث في الأمانة عند التقاط أخطائه هو نفسه.
صعّد إلى النموذج الأغلى مهمةً بمهمة، لا النظام كله دفعة واحدة.
النمط الصحيح هو التصعيد حسب المهمة. أبقِ Sonnet كأرضية، اكتشف الحالات الصعبة، ووجّه هذه فقط إلى Opus. مراجعة Opus 4.8 تغطي ما يشتريه لك النموذج الرائد، وبنفس الأهمية، المعيار الوحيد الذي لا يزال يتأخر فيه عن منافس. لا تحتاج إلى ربط خط الإنتاج كله بطبقة واحدة. المزيج هو اللعب الأرخص غالبًا.
حساب السعر ببساطة
شكل الحساب كالتالي. إخراج Sonnet يكلّف خمسة أضعاف إدخاله، وهي النسبة نفسها التي تستخدمها Anthropic في كل طبقة، لذلك أسرع طريقة لخفض فاتورة Sonnet هي تقصير الاستجابات لا المدخلات. الإدخال المخزن مؤقتًا ينخفض إلى نحو عُشر السعر القياسي، وBatch API تخصم 50% في الاتجاهين لأي عمل لا تحتاج إجابته في الوقت الحقيقي. اجمع التخزين المؤقت والدُفعات على عبء متكرر، وسينخفض السعر الفعلي بقوة.
للمفاتيح التي تخفض فاتورة الرموز بغض النظر عن الطبقة، يتعمق دليل benchr لخفض إنفاق الرموز في التخزين المؤقت والدُفعات والتوجيه. الخلاصة الخاصة بـSonnet: هذه هي الطبقة التي تتضاعف فيها الوفورات، لأنها الطبقة التي ينبغي أن يمر عبرها معظم زياراتك.
الحكم
Claude Sonnet 4.6 هو النموذج الذي تبني عليه. إنه الافتراضي الصحيح للغالبية الساحقة مما يطلبه نظام إنتاجي من LLM، وتسعيره مصمم ليكافئك على إبقائه كذلك. المهارة ليست في اختيار Sonnet. المهارة في معرفة القلة من المهام التي ينبغي أن تنزل إلى Haiku للتوفير، والقلة التي ينبغي أن تدفع مقابل Opus لأن تكلفة الخطأ هناك أكبر بكثير من رسوم النموذج.
اجعل Sonnet أرضيتك، ووجّه بوعي في الاتجاهين، وستنفق أقل من فريق يجعل كل شيء على النموذج الرائد، بينما تحصل على مخرجات لا تقل جودة في العمل الذي يملأ يومك.
أسئلة شائعة
كم تكلفة Claude Sonnet 4.6؟
بحسب صفحة أسعار Anthropic، التكلفة $3 لكل مليون رمز إدخال و$15 لكل مليون رمز إخراج. ينخفض الإدخال المخزن مؤقتًا إلى نحو عُشر سعر الإدخال، وتمنح Batch API خصمًا قدره 50% في الاتجاهين للمهام غير المتزامنة.
هل Claude Sonnet 4.6 كافٍ للإنتاج؟
نعم، لمعظم أعباء الإنتاج. هذه طبقة Anthropic المتوازنة، مصممة للبرمجة واستخدام الأدوات واتباع التعليمات بسعر يعادل 60% من سعر إدخال Opus. تدعم نافذة سياق 1M، والرؤية، والمخرجات المنظمة، والتفكير الممتد والتكيفي. اترك Opus لأصعب مهام الاستدلال.
متى تستخدم Haiku 4.5 بدل Sonnet 4.6؟
انزل إلى Haiku 4.5 للمهام البسيطة عالية الحجم: وسم التذاكر، وتوجيه الطلبات، واستخراج الحقول من النماذج. Haiku يكلّف ثلث سعر Sonnet، وفي الأعمال التي لا تحتاج استدلال Sonnet يختفي فرق الجودة بينما تبقى الوفورات.
متى يستحق Opus 4.8 القفز من Sonnet 4.6؟
اصعد عندما تكون كلفة الخطأ ملموسة: كود إنتاجي في قاعدة كود معقدة، تشغيل وكلاء طويل المدى، تحليل مستندات كثيفة، أو استدلال صعب. سعر إدخال Opus يقارب 1.67× سعر Sonnet، لذلك صعّد حسب المهمة لا بأن تجعل كل النظام عليه.
ما سعة السياق في Claude Sonnet 4.6؟
1M رمز، وهي نفس سقف Opus 4.8، مع ما يصل إلى 64k رمز إخراج في الاستجابة الواحدة على API القياسي. تعامل مع النافذة الطويلة كسطح لاسترجاع الحقائق، لا كمخزن تلخيص ضخم بضربة واحدة.
سجل التغييرات
- 30 مايو 2026 — نُشرت أول مرة. تم التحقق من السعر وسعة السياق وحد الإخراج ودعم الميزات مقابل صفحة أسعار Anthropic ووثائق نماذج Claude.
المراجع
- Anthropic، "Models overview"، platform.claude.com، اطُّلع عليه في مايو 2026.
- Anthropic، "Pricing"، platform.claude.com، اطُّلع عليه في مايو 2026.
- Anthropic، "Claude Pricing"، claude.com/pricing، اطُّلع عليه في مايو 2026.
- Anthropic، "Prompt caching"، platform.claude.com، اطُّلع عليه في مايو 2026.