مراجعة Kimi K2.6

نموذج مفتوح الأوزان بحجم تريليون معلمة يشغّل مجموعة وكلاء فرعيين عبر آلاف الخطوات. مجاني للتنزيل ورخيص عبر API.

· عرض سجل التغييرات · تُحقّقت الأرقام من المصادر الرسمية في 30 مايو 2026

Agent Swarm 300 وكيل حتى نحو 300 وكيل فرعي عبر نحو 4,000 خطوة في تشغيل واحد
SWE-Bench Verified 80.2 رقم من Moonshot، ومتقدم في البرمجة مفتوحة الأوزان
سعة السياق 256K 262,144 رمزاً. طويلة، لكنها ليست مليوناً
ترخيص الأوزان $0 Modified MIT، مجاني للتنزيل والاستضافة الذاتية

معظم النماذج تمنحك مساعداً واحداً يفكر في مسار مستقيم. طرح Kimi K2.6 هو أنك تستطيع إعطاءه مهمة كبيرة وفوضوية فيقسم العمل على مجموعة. تسمي Moonshot AI هذا الوضع Agent Swarm: يمكن لتشغيل ذاتي واحد أن يشغّل نحو 300 وكيل فرعي متخصص ويُبقيهم منسقين عبر ما يصل إلى 4,000 خطوة، مقسماً مهمة بحث أو برمجة بين عاملين بدلاً من دفعها كلها في سلسلة تفكير واحدة. في العمل الوكيلي الطويل، هذا شكل مختلف من القدرة عن مجرد سعة سياق أكبر أو توليد أسرع، وهو سبب يستحق معه هذا النموذج نظرة منفصلة عن بقية النماذج مفتوحة الأوزان.

النقطة الداعمة هي أن النموذج تحت هذه المجموعة قوي بذاته. Kimi K2.6 نموذج MoE مفتوح الأوزان بحجم تريليون معلمة ويدعم تعدد الوسائط أصلاً، نشرته Moonshot AI على Hugging Face بترخيص Modified MIT. أعلنت عنه Moonshot في منتداها الرسمي في 21 أبريل 2026 (تذكر بعض الكتابات الخارجية 20 أبريل). نتائج البرمجة التي جاء بها، وفي مقدمتها 80.2 على SWE-Bench Verified، تضعه في النقاش مع نماذج البرمجة الرائدة المدفوعة مع أنه لا يكلف شيئاً للتنزيل. لذلك سؤال هذه المراجعة ليس “هل هو جيد؟” بل “ما فائدة المجموعة، وما الذي يجب الخصم منه؟”.

ملاحظة يجب قراءتها قبل أي رقم: كل رقم رئيسي أدناه من Moonshot نفسها، من بطاقة النموذج ومدونته، وليس من لوحة مستقلة. أعمدة المقارنة أمام GPT-5.4 وClaude Opus 4.6 وGemini 3.1 Pro أجرتها Moonshot، وبعضها يحمل علامات لظروف غير قياسية. هذه إشارة قوية، لا حقيقة محسومة.

أي إصدار نقصد هنا

إصدار Kimi الذي يهم هنا هو K2.6. فهو يتجاوز خطوط Kimi K2 وK2 Thinking وK2.5 السابقة، وحتى أواخر مايو 2026 لم يصدر ما هو أحدث منه (آخر تعديل على بطاقة النموذج كان في 19 مايو). في API معرّف النموذج هو kimi-k2.6؛ أما الأوزان المفتوحة فهي في moonshotai/Kimi-K2.6 على Hugging Face، عامة وغير محجوبة، مع نسخة على ModelScope. تفصيل صغير يربك البعض: نوع النموذج الداخلي في المستودع model_type لا يزال kimi_k25، مشتركاً مع فئة معمارية K2.5، فلا تقرأ الإصدار من ملف الإعداد. اقرأه من الاسم.

ما فائدة Agent Swarm

بُنيت المجموعة للمهام الأكبر أو الأكثر تفرعاً من أن ينهيها مسار وكيل واحد بنظافة: بحث ويب عميق يتفرع عبر مئات الصفحات، أو إعادة هيكلة متعددة الملفات، أو أي عمل ينتصر فيه الاستكشاف المتوازي على أثر تسلسلي طويل. أوضح دليل على أنها تفعل شيئاً هو BrowseComp، معيار Moonshot لأبحاث الويب، حيث ترتفع النتيجة من 83.2 إلى 86.3 عند تشغيل Agent Swarm. هذا فرق حقيقي، وهو الرقم الذي تشير إليه عندما يسأل أحدهم هل المجموعة تسويق أم آلية.

وهي أيضاً الميزة الأسهل في المبالغة، لذلك كن دقيقاً في حدودها. “حتى نحو 300 وكيل فرعي” و“حتى نحو 4,000 خطوة” سقوف لا ما يستخدمه التشغيل المعتاد، وزيادة الوكلاء تعني رموزاً أكثر تُفوتر وطرقاً أكثر لكي يتيه التشغيل الطويل. مكسب المعيار مذكور على مهمة بحث اختارتها Moonshot؛ قد ترى إعادة الهيكلة لديك أقل من ذلك. تعامل مع المجموعة كأداة لفئة محددة من المشكلات الطويلة القابلة للتوازي، لا كترقية مجانية تتركها مفعلة لكل شيء.

يبرمج مثل نموذج مدفوع، وفق أرقام Moonshot نفسها

حالة البرمجة هي ما يمنح Kimi K2.6 وصف “بديل مفتوح للطبقة الرائدة”. في بطاقة النموذج الرسمية يسجل 80.2 على SWE-Bench Verified و76.7 على SWE-Bench Multilingual و58.6 على SWE-Bench Pro الأصعب، إلى جانب 89.6 على LiveCodeBench v6 و66.7 على Terminal-Bench 2.0. وتدعمه أرقام الاستدلال والوكلاء: 96.4 على AIME 2026 و90.5 على GPQA-Diamond و73.1 على OSWorld-Verified لاستخدام الكمبيوتر و54.0 على Humanity’s Last Exam مع الأدوات. بالنسبة لنموذج يمكن تنزيله مجاناً، هذه ورقة قوية.

للمقارنة عند الاختيار، هذا أقوى مدخل برمجي في طبقة النماذج مفتوحة الأوزان حالياً، ومن المفيد رؤية موقعه أمام بقية الحقل المجاني للتنزيل. يغطي مسح benchr لطبقة النماذج مفتوحة الأوزان الآن كيف يقف Kimi أمام الخيارات المفتوحة الأخرى، ومراجعة DeepSeek-V4 هي المقارنة الطبيعية إذا كنت تختار بين نماذج برمجة مفتوحة. وإذا أردت أن ترى كيف يبدو أمام النموذج مفتوح الأوزان ذي الميزانية التسويقية الأكبر، فـ مراجعة Llama 4 هي المقارنة الواضحة الأخرى.

سعة السياق: طويلة، لا هائلة

يحمل Kimi K2.6 سعة سياق 256K رمز، مذكورة كـ “256K” في بطاقة النموذج ومثبتة بدقة عند 262,144 رمزاً (256 × 1,024) في صفحة أسعار API. الرقمان متطابقان، وهذا أكثر مما يمكن قوله عن كثير من ادعاءات السياق. 256K تكفي لاحتواء قاعدة كود معتبرة أو أثر وكيل طويل أو مجموعة مستندات في مطالبة واحدة بلا حيل استرجاع، وتتلاءم مع زاوية الوكلاء لأن التشغيل الذاتي الطويل ينتج كثيراً من السياق الوسيط الذي يحتاج البقاء.

ما ليست عليه: ليست سعة مليون رمز، وهذا الفرق مهم عند تقدير حجم المهمة. لا تخطط لإطعامها مستودعاً كاملاً أو corpus بطول كتاب في دفعة واحدة؛ 256K هو السقف الصلب. للتفكير في حجم السعة مقابل ما ستستخدمه فعلاً، تضع مقارنة benchr لسعات السياق بين النماذج المقياس، ومقالة كيف تُسوّق أرقام سياق المليون رمز هي التصحيح المفيد إذا أغراك رقم كبير في ورقة مواصفات. سعة Kimi البالغة 256K صادقة ومفيدة بالضبط لأنها غير منفوخة.

كم يكلف وكيف تشغّله

هناك ثلاث طرق لاستخدام Kimi K2.6، ولكل منها اقتصاد مختلف جداً. الأولى مجانية: تنزيل الأوزان المفتوحة بترخيص Modified MIT والاستضافة الذاتية. الثانية هي Kimi API المستضاف في platform.kimi.ai، حيث يُفوّتَر kimi-k2.6 عند $0.16 لكل مليون رمز إدخال عند إصابة التخزين المؤقت، و$0.95 لكل مليون إدخال عند عدم الإصابة، و$4.00 لكل مليون إخراج. الثالثة هي أوضاع الدردشة والوكلاء في kimi.com، إضافة إلى “Kimi Code” في kimi.com/code كوكيل برمجة CLI؛ تطبيق الويب لديه طبقة وصول مجانية، لكن Moonshot لا تنشر حدودها الدقيقة.

بالنسبة إلى معظم الناس، API المستضاف هو الخيار الصحيح. $4.00 لكل مليون رمز إخراج رخيص مقارنة بالدولارات لكل مليون التي تتقاضاها نماذج البرمجة الرائدة المغلقة، ويتجنب عبء التشغيل بالكامل. استضافة نموذج MoE بحجم تريليون معلمة ذاتياً مشروع حقيقي: خادم متعدد الـGPU مع هندسة إبقاء الخدمة تعمل، ولا يؤتي أكله إلا عند حجم عالٍ ومستقر أو عندما لا تستطيع البيانات مغادرة شبكتك قانونياً. يشرح دليل benchr لـ تشغيل النماذج على جهازك الخاص أين يقع هذا الخط، ومع نموذج بهذا الحجم يقع أعلى مما يتوقعه كثيرون. ولتقدير القرار حسب عبء العمل لا حسب سعر الملصق، فإن تفصيل السعر حسب حالة الاستخدام هو الأداة: مجموعات الوكلاء تحرق رموزاً، والتشغيل الطويل متعدد الوكلاء قد ينقلك من “سنتات” إلى “مال حقيقي” أسرع من محادثة واحدة.

الحكم النهائي

Kimi K2.6 هو أكثر إصدار مفتوح الأوزان إثارة في الربيع لأنه ينافس على محور مختلف عن معظم النماذج: ليس أطول سياق ولا أرخص رمز، بل أكثر سلوك وكيلي قدرة يمكنك تنزيله مجاناً. Agent Swarm فارق حقيقي في العمل الطويل القابل للتوازي، ونتائج البرمجة قريبة من الطبقة الرائدة المدفوعة، وترخيص Modified MIT يعني أنك غير محبوس. تقييم 4.3 هنا يعكس ذلك: علامات عالية يحدها شيء واحد، وهو أن كل رقم رئيسي من Moonshot نفسها وأن سقوف المجموعة سهلة القراءة بأكثر مما تحتمل.

استخدم API المستضاف إذا أردت قوة الوكلاء والبرمجة بلا بناء عتاد. أدخل الأوزان إلى الداخل فقط عندما تتطلب قواعد الخصوصية ذلك أو يكون حجمك ثابتاً بما يكفي لتبرير خادم GPU. تجاهل المجموعة إذا لم تكن مهمتك تتفرع إلى عمل متوازٍ؛ في المهمة التسلسلية الضيقة، مسار وكيل واحد أرخص وأسهل للفهم. والزم نموذجاً رائداً مغلقاً عندما تحتاج دقة اختبرها طرف غير البائع، لأن ورقة قوية من البائع ليست مثل نتيجة مستقلة معاد إنتاجها. لكن في القدرة مقابل الدولار لأعمال الوكلاء والبرمجة، فهذا هو النموذج المفتوح الذي يجب تجاوزه.

الأسئلة الشائعة

ما هو Agent Swarm في Kimi K2.6؟

Agent Swarm هو وضع Kimi K2.6 للأعمال الذاتية الطويلة. تصفه Moonshot بأنه يتسع إلى نحو 300 وكيل فرعي متخصص ينسقون عبر ما يصل إلى قرابة 4,000 خطوة في تشغيل واحد، بحيث تُقسّم المهمة الكبيرة بين عاملين بدلاً من دفعها كلها عبر سلسلة تفكير واحدة. أوضح إشارة إلى أنه يفعل شيئاً فعلياً هي نتيجة BrowseComp في أبحاث الويب، إذ تقول Moonshot إنها ترتفع من 83.2 إلى 86.3 عند تشغيل Agent Swarm. هذه أرقام Moonshot نفسها، لذلك تعامل معها كسقف واختبر الوضع على مهمتك قبل الاعتماد عليه.

هل Kimi K2.6 مجاني، وما ترخيصه؟

الأوزان مجانية للتنزيل. ينشر Kimi K2.6 على Hugging Face بترخيص Modified MIT، من السلالة مفتوحة الأوزان نفسها مثل Kimi K2 السابق، لذا يمكنك استضافته ذاتياً بلا تكلفة ترخيص. توجد أيضاً طبقة دردشة مجانية في kimi.com، لكن حدودها الدقيقة غير مذكورة في مصدر رسمي. ما يكلف المال هو API المستضاف، المفوتر بالرموز، والعتاد اللازم لتشغيل نموذج بحجم تريليون معلمة بنفسك.

ما مدى جودة Kimi K2.6 في البرمجة؟

قوي وفق أرقام Moonshot نفسها. بطاقة النموذج تذكر 80.2 على SWE-Bench Verified و76.7 على SWE-Bench Multilingual و58.6 على SWE-Bench Pro الأصعب و89.6 على LiveCodeBench v6 و66.7 على Terminal-Bench 2.0. هذا يضعه في النقاش مع نماذج البرمجة الرائدة المغلقة كخيار مفتوح الأوزان متقدم. كل رقم صادر عن البائع من بطاقة النموذج والمدونة الرسمية، وليس من لوحة مستقلة، لذلك اختبره على مستودعك قبل الالتزام.

ما سعة السياق في Kimi K2.6؟

256K رمز. تذكر بطاقة النموذج الرسمية سعة سياق 256K، وتحدد صفحة أسعار API الرقم بدقة عند 262,144 رمزاً (256 ضرب 1,024). هذه سعة طويلة فعلاً، تكفي لقاعدة كود كبيرة أو أثر وكيل طويل في مطالبة واحدة، لكنها ليست سعة مليون رمز. تعامل مع 256K كسقف صلب ولا تخطط لما يتجاوز ذلك.

هل أستضيف Kimi K2.6 ذاتياً أم أستخدم API؟

بالنسبة لمعظم الفرق، API المستضاف هو الخيار الأفضل: kimi-k2.6 يكلف نحو $0.95 لكل مليون رمز إدخال عند عدم إصابة التخزين المؤقت و$4.00 لكل مليون رمز إخراج، وهو رخيص مقارنة بنماذج البرمجة الرائدة المغلقة، بلا خوادم تحتاج متابعة. تشغيل نموذج MoE بحجم تريليون معلمة داخلياً يحتاج صندوقاً متعدد الـGPU وهندسة تقديم حقيقية، ولا يستحق إلا عند حجم مرتفع ثابت أو عندما لا تستطيع البيانات مغادرة بيئتك قانونياً. وانتبه للمجموعة: تشغيل من 4,000 خطوة يتفرع إلى رموز كثيرة، فقِس تكلفة المهمة الوكيلية قبل إطلاقها.

سجل التغييرات

  • 30 مايو 2026 — نُشر أول مرة. تم التحقق من الإصدار والترخيص والأسعار وسعة السياق ونتائج الوكلاء والبرمجة مقابل بطاقة نموذج Hugging Face الرسمية من Moonshot AI، ومدونة kimi.com، وإعلان forum.moonshot.ai، وصفحة أسعار platform.kimi.ai. كل أرقام المعايير موسومة بأنها مبلّغة من Moonshot وغير معاد إنتاجها استقلالياً؛ وسعة 256K مؤكدة كـ 262,144 رمزاً، وليست سعة مليون رمز.

المراجع

  1. Moonshot AI, "Kimi-K2.6 model card," huggingface.co/moonshotai/Kimi-K2.6, آخر تعديل في 19 مايو 2026.
  2. Moonshot AI, "Meet Kimi K2.6: Advancing Open-Source Coding," forum.moonshot.ai, 21 أبريل 2026.
  3. Moonshot AI, "Kimi K2.6 blog," kimi.com/blog/kimi-k2-6, اطُّلع عليه في مايو 2026.
  4. Moonshot AI, "Chat pricing (kimi-k2.6)," platform.kimi.ai/docs/pricing/chat-k26, اطُّلع عليه في مايو 2026.
  5. Moonshot AI, home, moonshot.ai, اطُّلع عليه في مايو 2026.