المصادر الأولية
تستند ادعاءات الأسعار والقدرات وتواريخ الإصدار والإهمال إلى توثيق المزوّد الرسمي نفسه. حين لا يمكن إسناد ادعاء إلى وثيقة أولية، يُحذف الادعاء أو يُوسَم بعدم اليقين.
الاستقلالية
لا يقبل benchr المحتوى المموّل ولا التوظيف المدفوع ولا عمولات الشراكة من مزوّدي الذكاء الاصطناعي. لا يحصل أي نموذج على تغطية إيجابية في مقابل تعويض مادي. الموقع مستقل تمام الاستقلالية عن أي مزوّد.
قابلية التحقق
كل ادعاء رقمي في المقال يجب أن يكون قابلاً للتتبع إلى مصدر أولي. تستند ادعاءات الأسعار إلى صفحة التسعير لدى المزوّد. ترتبط نتائج معايير الأداء بالقائمين على تلك المعايير — بما فيها LMSYS Arena وSWE-bench Verified وARC-AGI وSimpleBench. تستند تواريخ الإصدار إلى إعلان المزوّد. حين يكون الادعاء تحليلاً خاصاً بالموقع لا حقيقةً مصدَّقة، يُقدَّم صراحةً بوصفه تحليلاً.
استخدام الذكاء الاصطناعي في الإنتاج
benchr مستقل — لا يموّله أي مزوّد ذكاء اصطناعي ولا يأخذ عمولات شراكة منهم. تُستخدم أدوات الذكاء الاصطناعي في صياغة المقالات وتحديثها؛ وكل ادعاء واقعي (أسعار، معايير أداء، تواريخ) يُتحقق منه مقابل المصدر الأولي للمزوّد قبل النشر.
ما يندرج في نطاق التغطية وما لا يندرج
في النطاق: الأسعار ومعايير الأداء ومقارنات القدرات وسعات السياق وحالة الإهمال وتوصيات حالات الاستخدام وتحليل أسواق النماذج المغلقة والمفتوحة.
خارج النطاق: نماذج توليد الصور، ونقاشات سياسات الذكاء العام الاصطناعي والسلامة، وأبحاث تدريب النماذج، والذكاء الاصطناعي بوصفه ظاهرةً اجتماعية.
التصحيحات
راجع صفحة التصحيحات للاطلاع على قائمة التصحيحات الجوهرية وسجل التغييرات على مستوى المقال في أسفل كل قطعة للتاريخ التفصيلي.