هل تعمل كواشف نصوص الذكاء الاصطناعي فعلاً؟

مشكلة الإيجابيات الكاذبة، ومن يُتّهم خطأً، وما العمل بدلاً من ذلك.

· عرض سجل التغييرات · تم التحقق من الأرقام مقابل المصادر الرسمية، 30 مايو 2026

تخيّل طالبة دولية كتبت مقالتها بنفسها، بلغتها الثانية، في الليلة السابقة لموعد التسليم. لم تمررها على أي أداة، سلّمتها كما هي، وبعد أسبوع جلست أمام أستاذها تشرح لماذا يرى برنامج ما، بنسبة 98%، أن آلة كتبت عملها. هي لم تغش. الكاشف فقط لا يستسيغ أسلوب كتابتها.

هذه ليست حالة هامشية افتراضية. إنها أكثر أنماط فشل هذه الأدوات توثيقاً، ومن يتضررون منها أكثر هم الأقل قدرة على الدفاع عن أنفسهم. لذلك، قبل أن توجه أي مدرسة كاشفاً نحو طالب، فهذا ما تُظهره الأبحاث فعلاً.

الشركة التي بنت الذكاء الاصطناعي لم تستطع بناء الكاشف

ابدأ بالحقيقة الأكثر دلالة في النقاش كله. OpenAI، الشركة وراء النموذج الذي يقلق الجميع منه، بنت مصنف AI Text Classifier الخاص بها، وطرحته كتجربة مجانية في يناير 2023، ثم أوقفته بهدوء في 20 يوليو 2023 بسبب انخفاض معدل الدقة. ألغوا أداتهم هم.

الأرقام تشرح السبب. مصنف OpenAI حدد بشكل صحيح 26% فقط من النصوص المكتوبة بالذكاء الاصطناعي على أنها محتملة. أي أنه فاته نحو ثلاثة من كل أربعة نصوص. كما وسم خطأً 9% من النصوص البشرية الحقيقية على أنها مكتوبة بآلة. وكان غير موثوق أيضاً في أي نص دون 1,000 حرف، وهذا يشمل معظم الواجبات القصيرة. إذا كان أكثر الناس معرفة بطريقة كتابة هذه النماذج لم يتجاوزوا كشف واحد من كل أربعة، فينبغي أن تشك في أي أداة خارجية تعدك بيقين شبه كامل.

ما كشفه26%من نصوص الذكاء الاصطناعي وسمها مصنف OpenAI نفسه كمحتملة
إنذارات كاذبة9%من النصوص البشرية وسمها خطأً كمكتوبة بآلة
مدة العمل6 أشهرمن إطلاق يناير حتى الإيقاف في 20 يوليو 2023

هذه ليست ضربة موجهة إلى OpenAI تحديداً، بل إلى الفكرة نفسها. ذهب بحث Sadasivan وزملائه أبعد من ذلك وأثبت نتيجة نظرية: كلما أصبحت نماذج اللغة أفضل في محاكاة البشر، ضاقت الفجوة بين الكتابة البشرية وكتابة الذكاء الاصطناعي، واقترب حتى أفضل كاشف ممكن من التخمين العشوائي. الشيء الذي تقيسه الكواشف يتلاشى عمداً. يمكنك قراءة المزيد عن تراجع موثوقية مخرجات النماذج نفسها في تحليل benchr لما إذا كانت هلوسات الذكاء الاصطناعي قد عولجت فعلاً، لأن الفجوة نفسها التي تجعل النص صعب الكشف تجعله صعب الثقة.

حساب الإيجابيات الكاذبة الذي لا يجريه أحد

هنا تظهر الكلفة البشرية. Turnitin، أداة فحص الانتحال التي تدفع لها معظم المدارس أصلاً، أطلقت كاشف كتابة الذكاء الاصطناعي مع ادعاء أن معدل الإيجابيات الكاذبة 1%. تبدو نسبة واحد في المئة كخطأ تقريبي صغير. لكنها ليست كذلك.

أجرت Vanderbilt الحساب بصوت واضح. قدمت الجامعة نحو 75,000 ورقة إلى Turnitin في 2022. ومع معدل إيجابيات كاذبة 1%، فهذا يعني قرابة 750 ورقة طالب وُسمت خطأً بأنها تحتوي كتابة ذكاء اصطناعي في عام واحد، داخل جامعة واحدة. سبعمئة وخمسون طالباً قد يضطرون للدفاع عن عمل أنجزوه فعلاً. هذا الرقم، مع التحيز الموثق ورفض Turnitin شرح آلية قرار الأداة، هو سبب تعطيل Vanderbilt للكاشف، وفق إرشادات نُشرت في 16 أغسطس 2023.

~750 طلاب Vanderbilt قد يُتهمون خطأً في عام واحد إذا أصاب معدل إيجابيات كاذبة «صغير» قدره 1% نحو 75,000 ورقة.

معدل خطأ 1% مقبول لمرشح بريد مزعج. لكنه غير مقبول عندما تكون كل نتيجة إيجابية كاذبة شخصاً جالساً أمام لجنة مخالفات. مشكلة بيع الكاشف على أساس معدل الدقة أن المعدل يخفي عدد الناس، وعدد الناس هو ما يدمّر فصلاً دراسياً لشخص ما.

من يُتّهم خطأً

الإيجابيات الكاذبة لا تتوزع بالتساوي أيضاً. إنها تقع على فئة محددة، وهذا هو الجزء الذي يجب أن يقلقك أكثر.

الآلية مهمة لأنها تخبرك أن المشكلة لن تُرقع بسهولة. معظم الكواشف تقيس «perplexity»، أي تقريباً مدى قابلية كل كلمة تالية للتنبؤ. يميل الذكاء الاصطناعي إلى اختيار كلمات شائعة ومتوقعة، فتُقرأ قيمة perplexity المنخفضة كآلة. لكن الكاتب الذي يعمل بلغة ثانية يميل أيضاً إلى استخدام مفردات أبسط وأكثر توقعاً، لا لأن نموذجاً كتب النص، بل لأن هذا هو النطاق المتاح له. الكاشف لا يميز بين بساطة الأسلوب والقرص الصلب. يعاقب المفردات الأصغر كما لو كانت دليلاً على الغش.

ما تدعيه الكواشف مقابل ما توثقه الأبحاث، مايو 2026
الأداة أو الادعاءتُسوَّق على أنهاالواقع الموثق
OpenAI AI Text Classifierمصنف لاكتشاف نصوص الذكاء الاصطناعيكشف 26% من نصوص الذكاء الاصطناعي، ووسم 9% من النصوص البشرية خطأً؛ أُوقف في 20 يوليو 2023 لقلة الدقة
كاشف Turnitin للذكاء الاصطناعيمعدل إيجابيات كاذبة بنحو 1%قد تُوسم نحو 750 من أصل 75,000 ورقة في Vanderbilt خطأً بهذا المعدل؛ عطّلته Vanderbilt في 16 أغسطس 2023
سبعة كواشف GPT (Liang وآخرون)كشف موثوق للذكاء الاصطناعيمتوسط إيجابيات كاذبة 61.22% في مقالات TOEFL لكتّاب الإنجليزية كلغة ثانية؛ 97.80% وُسمت بواسطة كاشف واحد على الأقل
الكواشف عموماً (Sadasivan وآخرون)تكشف كتابة الذكاء الاصطناعيإعادة صياغة خفيفة تهزم العلامات المائية والكواشف العصبية وطرق zero-shot وحتى الكواشف القائمة على الاسترجاع

حتى الغشاشين لا تكشفهم

هذه هي الخلاصة التي ينبغي أن تنهي النقاش. بينما تنشغل الكواشف باتهام كتّاب صادقين من غير المتحدثين الأصليين، يجد الطلاب الذين يستخدمون الذكاء الاصطناعي للغش مخرجاً سهلاً. لا تحتاج حتى إلى أداة خاصة.

أظهر Sadasivan وزملاؤه أن إضافة إعادة صياغة خفيفة إلى مخرجات الذكاء الاصطناعي تكسر طيفاً واسعاً من الكواشف: العلامات المائية، ومصنفات الشبكات العصبية، وطرق zero-shot، وحتى الكواشف القائمة على الاسترجاع تسقط أمام إعادة الصياغة المتكررة. وجد فريق Stanford الشيء نفسه مع طلب واحد من نوع «أعد صياغة هذا»، فيمر نص الذكاء الاصطناعي مباشرة عبر الكواشف نفسها التي وسمت للتو مقالة TOEFL. التهرب من الكشف أسهل بكثير من الثقة به.

الإشارة تعاقب الطالب الذي يكتب ببساطة، وتسمح بمرور من يعيد الصياغة. هذا مقلوب.

تعترف Turnitin بالمشكلة إلى حد بعيد. قالت الشركة إن كاشفها يتعمد تفويت نحو 15% من النص المولد بالذكاء الاصطناعي داخل المستند، قصداً، لتجنب وسم الكتابة البشرية خطأً. تأمل ذلك. لتقليل اتهام الناس خطأً، تسمح الأداة عمداً بمرور بعض الغش، ومع ذلك تواصل وسم كتّاب الإنجليزية كلغة ثانية خطأً بمعدلات مرتفعة. أنت تدفع ثمن كاشف دخان قيل له أن يتجاهل بعض الدخان ويفزع من المحمصة.

ما الذي ينبغي للمعلمين فعله بدلاً من ذلك

لذلك لا تستخدم الكاشف كحكم. إن شغّلته أصلاً، فتعامل مع نتيجته كتلميح ضعيف يفتح محادثة، لا كدليل ينهيها. الإشارة درجة احتمالية تنتجها أداة لم يستطع حتى من بنوا النموذج الأساسي جعلها تعمل.

الخطوة الأفضل هي بناء الواجبات حول عملية يمكنك رؤيتها. اطلب المسودات وسجل النسخ. اجعل بعض الكتابة داخل الصف. اطلب من الطلاب شرح حججهم بصوت مسموع. محادثة قصيرة عن العمل تخبرك أكثر من أي درجة perplexity، ولا يهمها ما اللغة الأولى للطالب. إذا كان قلقك أن كتابة الذكاء الاصطناعي عامة، فالحل هو تعليمات تقييم ومهام تكافئ المحدد بدلاً من الجاهز، وهي الغريزة نفسها التي تجعل هندسة الأوامر الجيدة مهمة للحصول على مخرجات مفيدة أساساً.

في الصورة الأكبر، يشبه الدرس هنا ما حدث لمعايير الذكاء الاصطناعي. رقم رئيسي واحد يُسوّق كحقيقة، ثم ينهار لحظة تنظر إلى من قيس عليه ومدى سهولة التحايل عليه، وهي بالضبط المشكلة التي يواصل benchr ملاحظتها في لماذا لم تعد المعايير تخبرك بالكثير. درجة الكاشف معيار أداء مرتبط بسجل شخص. عاملها بقدر من الشك لا يقل عن ذلك.

اختر التقييم القائم على العملية إن كنت تهتم بالإنصاف. تجاهل درجات الكواشف كدليل، نقطة. وإذا كنت طالباً يواجه اتهاماً كاذباً، فالسجل البحثي كله في صفك: اطلب من المؤسسة أن تشرح كيف تقرر الأداة، وأشر إلى معدل الإيجابيات الكاذبة البالغ 61.22% في كتابة غير المتحدثين الأصليين، وتذكر أن OpenAI نفسها لم تستطع جعل هذا ينجح.

الأسئلة الشائعة

هل كواشف نصوص الذكاء الاصطناعي دقيقة؟

ليست دقيقة بما يكفي لاعتمادها كدليل. مصنف OpenAI نفسه لم يحدد إلا 26% من النصوص المكتوبة بالذكاء الاصطناعي، ووسم 9% من النصوص البشرية خطأً، ثم أوقفته OpenAI في 20 يوليو 2023 بسبب انخفاض دقته. كما أوضح Sadasivan وآخرون (2023) أن أفضل كاشف ممكن يقترب من التخمين العشوائي كلما تحسنت النماذج.

هل تعطي كواشف الذكاء الاصطناعي نتائج إيجابية كاذبة على كتابة بشرية؟

أكثر مما يعترف التسويق. قالت Turnitin إن معدل الإيجابيات الكاذبة لديها 1%، لكن Vanderbilt أوضحت أن هذا الرقم، عند تطبيقه على نحو 75,000 ورقة قدمتها الجامعة في 2022، يعني قرابة 750 طالباً قد يُتهمون خطأً. كان هذا الحساب جزءاً من سبب تعطيل الجامعة للأداة، وفق الإرشادات المنشورة في 16 أغسطس 2023.

هل تضع كواشف الذكاء الاصطناعي علامات على كتّاب الإنجليزية كلغة ثانية؟

بشدة. في دراسة نشرتها Patterns عام 2023، شغّل Liang وآخرون سبعة كواشف GPT على 91 مقالة TOEFL كتبها متحدثون لا يستخدمون الإنجليزية كلغة أم، وعلى 88 مقالة لطلاب صف ثامن في الولايات المتحدة. كانت الكواشف شبه مثالية مع مقالات المتحدثين الأصليين، لكنها وسمت 97.80% من مقالات TOEFL كذكاء اصطناعي بواسطة كاشف واحد على الأقل، ووسمت 19.78% منها بالإجماع من الكواشف السبعة. بلغ متوسط معدل الإيجابيات الكاذبة في تلك المقالات 61.22%. السبب هو قياس perplexity، الذي يعاقب الاختيارات الأبسط والأكثر قابلية للتنبؤ.

هل يستطيع الطالب مواجهة اتهام كاذب باستخدام الذكاء الاصطناعي؟

نعم، والبحث العلمي في صف الطالب. إشارة الكاشف درجة احتمالية لا دليل. أوقفت OpenAI مصنفها لقلة الدقة، وعطلت Vanderbilt أداة Turnitin جزئياً لأنها لا تشرح كيف تقرر أن النص مكتوب بالذكاء الاصطناعي، وتقر Turnitin بأنها تتعمد تفويت نحو 15% من كتابة الذكاء الاصطناعي لتقليل الاتهامات الخاطئة. اطلب سجل النسخ، والمسودات، ومحادثة عن العمل بدلاً من التعامل مع الدرجة كحكم نهائي.

ماذا ينبغي للمعلمين فعله بدلاً من تشغيل كاشف ذكاء اصطناعي؟

عامل نتيجة الكاشف كإشارة ضعيفة في أفضل الأحوال، لا كدليل. أظهر Sadasivan وآخرون (2023) أن إعادة صياغة خفيفة تكسر عملياً كل أنواع الكواشف، فتُعاقب الأداة الطلاب الصادقين بينما يمر الغشاشون الحقيقيون بإعادة الصياغة. صمموا الواجبات حول العملية: المسودات، سجل النسخ، الكتابة داخل الصف، الدفاع الشفهي، والمحادثات حول العمل تصمد حيث لا تصمد الدرجة.

سجل التغييرات

  • 30 مايو 2026 — نُشر أول مرة. تم التحقق من أرقام الدقة والإيجابيات الكاذبة والتحيز مقابل إشعار مصنف OpenAI، ودراسة Liang وآخرين في Patterns، وإرشادات Vanderbilt، وبحث Sadasivan وآخرين.

المراجع

  1. OpenAI, "New AI classifier for indicating AI-written text," openai.com, اطُّلع عليه في مايو 2026.
  2. TechCrunch, "OpenAI scuttles AI-written text detector over low rate of accuracy," techcrunch.com, اطُّلع عليه في مايو 2026.
  3. Liang et al., "GPT detectors are biased against non-native English writers," cell.com, Patterns، اطُّلع عليه في مايو 2026.
  4. Cell Press, press release for Liang et al., eurekalert.org, اطُّلع عليه في مايو 2026.
  5. Vanderbilt University, "Guidance on AI detection and why we're disabling Turnitin's AI detector," vanderbilt.edu, اطُّلع عليه في مايو 2026.
  6. University of San Diego Legal Research Center, "AI detection guide" (citing Turnitin), lawlibguides.sandiego.edu, اطُّلع عليه في مايو 2026.
  7. Sadasivan, Kumar, Balasubramanian, Wang & Feizi, "Can AI-Generated Text be Reliably Detected?," arxiv.org, اطُّلع عليه في مايو 2026.