باختصار: لا تُثبت برامج الكشف بالذكاء الاصطناعي هوية كاتب النص، بل تُقدّر مدى تطابق النص مع أنماط نماذج اللغة المألوفة. وتعتمد معظم هذه البرامج على مزيج من المصنفات، وإشارات التنبؤ (مثل التعقيد/التكرار)، وقياس الأسلوب، وفي حالات نادرة، فحص العلامات المائية. عندما يكون النص قصيرًا، أو رسميًا للغاية، أو تقنيًا، أو مكتوبًا من قِبل شخص يتعلم اللغة الإنجليزية كلغة ثانية، اعتبر النتيجة مؤشرًا للمراجعة، وليست حكمًا نهائيًا.
أهم النقاط المستفادة:
الاحتمالية، وليس الدليل : تعامل مع النسب المئوية على أنها إشارات خطر "تشابه الذكاء الاصطناعي"، وليست يقيناً.
النتائج الإيجابية الخاطئة : غالبًا ما يتم تصنيف الكتابة الرسمية أو التقنية أو القائمة على القوالب أو غير الأصلية بشكل خاطئ.
مزيج الأساليب : تجمع الأدوات بين المصنفات، والتعقيد/الانفجار، والأسلوبية، وفحوصات العلامات المائية غير الشائعة.
الشفافية : فضل أجهزة الكشف التي تعرض النطاقات والميزات وعدم اليقين - وليس مجرد رقم واحد.
قابلية الطعن : احتفظ بالمسودات/الملاحظات وأدلة العملية في متناول اليد للنزاعات والاستئنافات.

مقالات قد ترغب في قراءتها بعد هذه المقالة:
🔗 ما هو أفضل برنامج كشف الذكاء الاصطناعي؟
مقارنة أفضل أدوات الكشف بالذكاء الاصطناعي من حيث الدقة والميزات وحالات الاستخدام.
🔗 هل أجهزة الكشف التي تعمل بالذكاء الاصطناعي موثوقة؟
يشرح هذا المقال الموثوقية، والنتائج الإيجابية الخاطئة، ولماذا تختلف النتائج في كثير من الأحيان.
🔗 هل يستطيع برنامج Turnitin اكتشاف الذكاء الاصطناعي؟
دليل شامل لكشف برامج الذكاء الاصطناعي في برنامج Turnitin، وحدودها، وأفضل الممارسات.
🔗 هل جهاز QuillBot المزود بتقنية الذكاء الاصطناعي دقيق؟
مراجعة تفصيلية للدقة، ونقاط القوة، ونقاط الضعف، والاختبارات الواقعية.
1) الفكرة السريعة - ما الذي يفعله كاشف الذكاء الاصطناعي حقًا ⚙️
معظم أجهزة كشف الذكاء الاصطناعي لا "تصطاد الذكاء الاصطناعي" كما تصطاد الشبكة السمك. إنها تقوم بشيء أكثر واقعية:
-
يُقدّرون احتمالية أن تبدو فقرة نصية وكأنها ناتجة عن نموذج لغوي (أو أنها خضعت لمساعدة كبيرة من قِبله). ( دراسة استقصائية حول اكتشاف النصوص المُولّدة بواسطة نماذج اللغة ؛ OpenAI )
-
يقارنون النص الذي تكتبه بالأنماط الموجودة في بيانات التدريب (الكتابة البشرية مقابل الكتابة المولدة بواسطة النموذج). ( دراسة استقصائية حول اكتشاف النصوص المولدة بواسطة نماذج التعلم الآلي )
-
يُخرج البرنامج نتيجة (غالباً نسبة مئوية) تبدو نهائية... ولكنها في الغالب ليست كذلك. ( دليل Turnitin )
لنكن صريحين - ستظهر لك واجهة المستخدم عبارة مثل "92% ذكاء اصطناعي"، وسيقول عقلك "حسنًا، يبدو أن هذه حقيقة". لكنها ليست حقيقة. إنها مجرد تخمين من نموذج لبصمات أصابع نموذج آخر. وهذا أمر مضحك نوعًا ما، مثل كلاب تشم كلابًا أخرى 🐕🐕
2) كيف تعمل أجهزة الكشف بالذكاء الاصطناعي: أكثر "محركات الكشف" شيوعًا 🔍
تستخدم أجهزة الكشف عادةً أحد هذه الأساليب (أو مزيجًا منها): ( دراسة استقصائية حول الكشف عن النصوص المولدة بواسطة LLM )
أ) نماذج التصنيف (الأكثر شيوعاً)
يتم تدريب المصنف على أمثلة مصنفة:
-
نماذج مكتوبة من قبل البشر
-
عينات مولدة بالذكاء الاصطناعي
-
أحيانًا عينات "هجينة" (نص تم تحريره بواسطة الذكاء الاصطناعي بواسطة الإنسان)
ثم يتعلم أنماطًا تفصل بين المجموعات. هذا هو النهج الكلاسيكي للتعلم الآلي، وقد يكون جيدًا بشكلٍ مدهش... إلى أن يصبح غير ذلك. ( دراسة استقصائية حول اكتشاف النصوص باستخدام نماذج التعلم الآلي )
ب) تقييم الحيرة و"الانفجارية" 📈
تقوم بعض أجهزة الكشف بحساب مدى "إمكانية التنبؤ" بالنص.
-
الحيرة : باختصار، مدى دهشة نموذج اللغة من الكلمة التالية. ( جامعة بوسطن - منشورات حول الحيرة )
-
انخفاض مستوى الحيرة قد يشير إلى أن النص قابل للتنبؤ بدرجة كبيرة (وهو ما قد يحدث مع مخرجات الذكاء الاصطناعي). ( DetectGPT )
-
يحاول مصطلح "التقطيع" قياس مدى التباين في تعقيد الجملة وإيقاعها. ( GPTZero )
هذا الأسلوب بسيط وسريع، ولكنه قد يُسبب التباساً أيضاً، لأن البشر قادرون على الكتابة بطريقة متوقعة (كما هو الحال في رسائل البريد الإلكتروني الرسمية للشركات). ( OpenAI )
ج) علم أسلوب الكتابة (بصمة الكتابة) ✍️
يدرس علم الأنماط أنماطًا مثل:
-
متوسط طول الجمل
-
أسلوب الترقيم
-
تكرار الكلمات الوظيفية (الـ، و، لكن...)
-
تنوع المفردات
-
درجات سهولة القراءة
يشبه الأمر "تحليل الخط"، لكنه خاص بالنصوص. أحيانًا يكون مفيدًا، وأحيانًا أخرى يكون أشبه بتشخيص نزلة برد من خلال النظر إلى حذاء شخص ما. ( علم الأسلوب وعلم الأدلة الجنائية: مراجعة أدبية ؛ الكلمات الوظيفية في تحديد هوية المؤلف )
د) اكتشاف العلامة المائية (عند وجودها) 🧩
يمكن لبعض مزودي النماذج تضمين أنماط دقيقة ("علامات مائية") في النصوص المُولَّدة. إذا كان برنامج الكشف يعرف مخطط العلامة المائية، فيمكنه محاولة التحقق منه. ( علامة مائية لنماذج اللغة الكبيرة ؛ SynthID Text )
لكن... لا تُضيف جميع النماذج علامات مائية، ولا تحتفظ جميع المخرجات بالعلامة المائية بعد التعديلات، ولا تمتلك جميع أدوات الكشف إمكانية الوصول إلى هذه التقنية السرية. لذا، فهي ليست حلاً شاملاً. ( حول موثوقية العلامات المائية لنماذج اللغة الكبيرة ؛ OpenAI )
3) ما الذي يجعل نسخة جيدة من كاشف الذكاء الاصطناعي؟ ✅
إنّ الكاشف "الجيد" (بحسب تجربتي في اختبار العديد منها جنبًا إلى جنب في سير العمل التحريري) ليس هو الكاشف الذي يُصدر أعلى صوت تنبيه، بل هو الكاشف الذي يتصرف بمسؤولية.
إليك ما يجعل كاشف الذكاء الاصطناعي متيناً:
-
الثقة المُعايرة : نسبة 70% يجب أن تعني شيئًا متسقًا، لا مجرد كلام عابر. ( دراسة استقصائية حول اكتشاف النصوص المُولّدة بواسطة نموذج LLM )
-
انخفاض معدل النتائج الإيجابية الخاطئة : لا ينبغي أن يصنف النظام النصوص الإنجليزية غير الأصلية، أو النصوص القانونية، أو الأدلة التقنية على أنها "ذكاء اصطناعي" لمجرد أنها خالية من الأخطاء. ( ستانفورد HAI ؛ ليانغ وآخرون (arXiv) )
-
حدود شفافة : ينبغي أن يعترف النظام بعدم اليقين وأن يُظهر النطاقات، لا أن يتظاهر بأنه كلي العلم. ( OpenAI ؛ Turnitin )
-
الوعي بالمجال : غالبًا ما تواجه أدوات الكشف المدربة على المدونات غير الرسمية صعوبة في التعامل مع النصوص الأكاديمية، والعكس صحيح. ( دراسة استقصائية حول الكشف عن النصوص المولدة بواسطة نماذج التعلم الآلي )
-
معالجة النصوص القصيرة : تتجنب الأدوات الجيدة إعطاء نتائج مفرطة الثقة بناءً على عينات صغيرة (فالفقرة ليست عالماً كاملاً). ( OpenAI ؛ Turnitin )
-
حساسية المراجعة : ينبغي أن يتعامل مع التحرير البشري دون أن يؤدي فورًا إلى نتائج غير منطقية. ( دراسة استقصائية حول اكتشاف النصوص المولدة بواسطة LLM )
أفضل من رأيتهم يميلون إلى التواضع. أما أسوأهم فيتصرفون وكأنهم يقرؤون الأفكار 😬
4) جدول مقارنة - أنواع كاشفات الذكاء الاصطناعي الشائعة ومواطن تميزها 🧾
فيما يلي مقارنة عملية. هذه ليست أسماء علامات تجارية، بل هي الفئات الرئيسية التي ستصادفها. ( دراسة استقصائية حول اكتشاف النصوص المُولَّدة بواسطة LLM )
| نوع الأداة (تقريبًا) | أفضل جمهور | شعور السعر | لماذا ينجح الأمر (أحيانًا) |
|---|---|---|---|
| مدقق الحيرة الخفيف | أيها المعلمون، افحصوا أنفسكم سريعاً | شبه مجاني | إشارة سريعة بشأن إمكانية التنبؤ - ولكنها قد تكون متقلبة.. |
| برنامج Classifier Scanner Pro | المحررون، الموارد البشرية، الامتثال | الاشتراك | يتعلم الأنماط من البيانات المصنفة - جيد في النصوص متوسطة الطول |
| محلل أسلوب الكتابة | الباحثون، خبراء الطب الشرعي | $$$ أو مجال متخصص | يقارن بين كتابة بصمات الأصابع - أمر غريب ولكنه مفيد في الكتابة المطولة |
| أداة البحث عن العلامات المائية | المنصات، والفرق الداخلية | غالباً ما يتم تجميعها | قويٌّ بوجود العلامة المائية - أما إذا لم تكن موجودة، فهو ببساطة لا يُبالي |
| مجموعة حلول المؤسسات الهجينة | المنظمات الكبيرة | لكل مقعد، عقود | يجمع إشارات متعددة - تغطية أفضل، ومزيد من المقابض للضبط (ومزيد من الطرق لتكوينها بشكل خاطئ، عفواً) |
لاحظ عمود "الشعور بالسعر". نعم، هذا ليس علميًا. لكنه صريح 😄
5) الإشارات الأساسية التي تبحث عنها أجهزة الكشف - "المؤشرات" 🧠
إليكم ما تحاول العديد من أجهزة الكشف قياسه من الداخل:
إمكانية التنبؤ (احتمالية الرمز المميز)
تُنشئ نماذج اللغة النصوص من خلال التنبؤ بالكلمات التالية المحتملة. وهذا ما يؤدي عادةً إلى:
-
انتقالات أكثر سلاسة
-
خيارات كلمات أقل إثارة للدهشة
-
تقليل الانحرافات الغريبة (إلا إذا طُلب ذلك)
-
نبرة متسقة ( جامعة بوسطن - منشورات الحيرة ؛ DetectGPT )
أما البشر، من ناحية أخرى، فغالباً ما يتسمون بالتناقض. فنحن نتناقض مع أنفسنا، ونضيف تعليقات جانبية عشوائية، ونستخدم استعارات غير دقيقة - مثل تشبيه جهاز كشف الذكاء الاصطناعي بمحمصة خبز تُقيّم الشعر. هذه الاستعارة سيئة، لكنك تفهم المقصود.
أنماط التكرار والبنية
يمكن أن تُظهر الكتابة بالذكاء الاصطناعي تكرارًا دقيقًا:
-
جمل متكررة ("في الختام..."، "بالإضافة إلى ذلك..."، "علاوة على ذلك...")
-
أطوال فقرات متقاربة
-
وتيرة ثابتة ( دراسة استقصائية حول اكتشاف النصوص المولدة بواسطة LLM )
لكن أيضاً، يكتب الكثير من البشر بهذه الطريقة، خاصة في المدارس أو بيئات العمل. لذا فالتكرار دليل وليس برهاناً قاطعاً.
وضوح مفرط ونثر "نظيف للغاية" ✨
هذا أمر غريب. بعض أجهزة الكشف تتعامل ضمنيًا مع "الكتابة الواضحة جدًا" على أنها مشبوهة. ( OpenAI )
وهذا أمر محرج لأن:
-
يوجد كتّاب جيدون
-
يوجد محررون
-
يوجد مدقق إملائي
إذا كنت تتساءل عن كيفية عمل أجهزة الكشف بالذكاء الاصطناعي ، فإن جزءًا من الإجابة هو: أنها أحيانًا تكافئ الخشونة. وهذا... أمرٌ معكوس نوعًا ما.
الكثافة الدلالية والصياغة العامة
قد تقوم أجهزة الكشف بتحديد النصوص التي تبدو:
-
عام للغاية
-
يفتقر إلى تفاصيل محددة عن الحياة اليومية
-
يركز بشكل كبير على العبارات المتوازنة والمحايدة ( دراسة استقصائية حول اكتشاف النصوص المولدة بواسطة LLM )
غالباً ما ينتج الذكاء الاصطناعي محتوى يبدو معقولاً ولكنه مُنمّق بشكل مفرط. مثل غرفة فندق تبدو جميلة ولكنها تفتقر إلى الشخصية 🛏️
6) أسلوب التصنيف - كيفية تدريبه (ولماذا يفشل) 🧪
يتم تدريب كاشف المصنفات عادةً على النحو التالي:
-
قم بتجميع مجموعة بيانات من النصوص البشرية (مقالات، مقالات رأي، منتديات، إلخ)
-
إنشاء نص بالذكاء الاصطناعي (مطالبات متعددة، أنماط، أطوال)
-
قم بتسمية العينات
-
قم بتدريب نموذج لفصلها باستخدام الميزات أو التضمينات
-
تحقق من ذلك باستخدام بيانات محجوزة
-
أرسلها... ثم يصدمها الواقع ( دراسة استقصائية حول اكتشاف النصوص المولدة بواسطة LLM )
لماذا يصدمنا الواقع؟
-
تحول المجال : بيانات التدريب لا تتطابق مع كتابة المستخدم الحقيقي
-
تغيير النموذج : لا تتصرف نماذج الجيل الجديد مثل تلك الموجودة في مجموعة البيانات
-
تأثيرات التحرير : يمكن للتعديلات البشرية إزالة الأنماط الواضحة مع الحفاظ على الأنماط الدقيقة.
-
تنوع اللغة : اللهجات، وكتابة اللغة الإنجليزية كلغة ثانية، والأساليب الرسمية تُقرأ بشكل خاطئ ( دراسة استقصائية حول اكتشاف النصوص المولدة بواسطة LLM ؛ ليانغ وآخرون (arXiv) )
لقد رأيت أجهزة كشف غش كانت "ممتازة" في عرضها التجريبي، ثم فشلت فشلاً ذريعاً عند استخدامها في بيئة عمل حقيقية. الأمر أشبه بتدريب كلب بوليسي على نوع واحد فقط من البسكويت وتوقع أن يعثر على كل أنواع الحلوى في العالم 🍪
7) الحيرة والانفجار - الاختصار الرياضي 📉
تعتمد هذه المجموعة من أدوات الكشف عادةً على تقييم نموذج اللغة:
-
يقومون بتحليل النص الخاص بك من خلال نموذج يقدر مدى احتمالية كل رمز تالٍ.
-
يحسبون مستوى "المفاجأة" (الحيرة) الإجمالي. ( جامعة بوسطن - منشورات الحيرة )
-
قد يضيفون مقاييس التباين ("النبضات") لمعرفة ما إذا كان الإيقاع يبدو طبيعيًا. ( GPTZero )
لماذا تنجح أحياناً؟
-
يمكن أن يكون النص الخام الناتج عن الذكاء الاصطناعي سلسًا للغاية وقابلًا للتنبؤ إحصائيًا ( DetectGPT ).
لماذا يفشل؟
-
العينات القصيرة تكون مشوشة
-
الكتابة الرسمية قابلة للتنبؤ
-
الكتابة التقنية قابلة للتنبؤ
-
يمكن أن تكون الكتابة غير الأصلية متوقعة
-
يمكن أن تبدو النصوص التي تم تحريرها بشكل كبير بواسطة الذكاء الاصطناعي شبيهة بالنصوص البشرية ( OpenAI ؛ Turnitin )
لذا، فإن آلية عمل أجهزة الكشف بالذكاء الاصطناعي تشبه أحيانًا جهاز قياس السرعة الذي يخلط بين الدراجات الهوائية والنارية. نفس الطريق، محركات مختلفة 🚲🏍️
٨) العلامات المائية - فكرة "بصمة الإصبع في الحبر" 🖋️
يبدو أن استخدام العلامات المائية هو الحل الأمثل: وضع علامة على نص الذكاء الاصطناعي أثناء إنشائه، ثم اكتشافها لاحقًا. ( علامة مائية لنماذج اللغة الكبيرة ؛ SynthID Text )
عملياً، يمكن أن تكون العلامات المائية هشة:
-
قد يؤدي إعادة الصياغة إلى إضعافها
-
قد يؤدي الترجمة إلى إفسادها
-
يمكن إزالة الاقتباسات الجزئية
-
قد يؤدي خلط مصادر متعددة إلى تشويش النمط ( حول موثوقية العلامات المائية لنماذج اللغة الكبيرة )
كذلك، لا يعمل نظام كشف العلامات المائية إلا في الحالات التالية:
-
يتم استخدام علامة مائية
-
يعرف جهاز الكشف كيفية فحصه
-
لم يتم تحويل النص كثيراً ( OpenAI ؛ SynthID Text )
نعم، يمكن أن تكون العلامات المائية قوية، لكنها ليست شارة شرطة عالمية.
9) النتائج الإيجابية الخاطئة وأسباب حدوثها (الجزء المؤلم) 😬
هذا الموضوع يستحق قسماً خاصاً به لأنه المكان الذي تكثر فيه معظم الجدالات.
المحفزات الشائعة للنتائج الإيجابية الخاطئة:
-
أسلوب رسمي للغاية (كتابة أكاديمية، قانونية، متعلقة بالامتثال)
-
اللغة الإنجليزية لغير الناطقين بها (قد تبدو تراكيب الجمل الأبسط "كأنها نماذج").
-
الكتابة باستخدام القوالب الجاهزة (رسائل التغطية، إجراءات التشغيل القياسية، تقارير المختبر)
-
عينات نصية قصيرة (إشارة غير كافية)
-
قيود الموضوع (بعض المواضيع تفرض صياغة متكررة) ( Liang et al. (arXiv) ; Turnitin )
إذا سبق لك أن رأيت شخصًا يُعاقب بسبب كتابته الجيدة جدًا... نعم، هذا يحدث. وهو أمر قاسٍ.
ينبغي التعامل مع نتيجة الكاشف على النحو التالي:
-
جهاز إنذار دخان، وليس حكماً قضائياً 🔥
فهو يُخبرك "ربما عليك التحقق"، وليس "انتهت القضية". ( OpenAI ؛ Turnitin )
10) كيفية تفسير نتائج أجهزة الكشف كشخص بالغ 🧠🙂
إليك طريقة عملية لقراءة النتائج:
إذا أعطت الأداة نسبة مئوية واحدة
اعتبرها إشارة تقريبية للمخاطر:
-
0-30%من المحتمل أن يكون بشريًا أو خضع لتعديلات كبيرة
-
30-70%منطقة غامضة - لا تفترض أي شيء
-
70-100% : أنماط تشبه الذكاء الاصطناعي على الأرجح، لكنها ليست دليلاً قاطعاً ( أدلة Turnitin )
حتى الدرجات العالية قد تكون خاطئة، خاصة بالنسبة لما يلي:
-
الكتابة الموحدة
-
أنواع معينة (ملخصات، تعريفات)
-
كتابة اللغة الإنجليزية كلغة ثانية ( ليانغ وآخرون (arXiv) )
ابحث عن التفسيرات، وليس مجرد الأرقام
توفر أجهزة الكشف الأفضل ما يلي:
-
تم تسليط الضوء على الامتدادات
-
ملاحظات حول الميزات (القدرة على التنبؤ، التكرار، إلخ)
-
فترات الثقة أو لغة عدم اليقين ( دراسة استقصائية حول اكتشاف النصوص المولدة بواسطة LLM )
إذا رفضت أداة ما شرح أي شيء واكتفت بوضع رقم على جبينك... فأنا لا أثق بها. ولا ينبغي لك أن تثق بها أيضاً.
11) كيف تعمل أجهزة الكشف بالذكاء الاصطناعي: نموذج ذهني بسيط 🧠🧩
إذا كنت ترغب في الحصول على وجبة نظيفة جاهزة، فاستخدم هذا النموذج الذهني:
-
تبحث أنظمة الكشف المدعومة بالذكاء الاصطناعي عن الأنماط الإحصائية والأسلوبية الشائعة في النصوص المولدة آلياً. ( دراسة استقصائية حول الكشف عن النصوص المولدة بواسطة نماذج التعلم الآلي )
-
يقارنون تلك الأنماط بما تعلموه من أمثلة التدريب. ( دراسة استقصائية حول اكتشاف النصوص المولدة بواسطة نموذج التعلم الآلي )
-
إنها تُنتج تخمينًا احتماليًا ، وليس قصة أصلية واقعية. ( OpenAI )
-
تتأثر دقة التخمين بنوع النص وموضوعه وطوله وتعديلاته وبيانات تدريب الكاشف . ( دراسة استقصائية حول الكشف عن النصوص المولدة بواسطة نموذج التعلم الخطي )
بمعنى آخر، تعمل أجهزة الكشف بالذكاء الاصطناعي على "تقييم التشابه"، وليس تحديد هوية المؤلف. كأن نقول إن شخصًا ما يشبه ابن عمنا. هذا ليس كاختبار الحمض النووي... وحتى اختبارات الحمض النووي لها حالات استثنائية.
١٢) نصائح عملية لتقليل الإبلاغات غير المقصودة (بدون لعب ألعاب) ✍️✅
ليس "كيفية خداع أجهزة الكشف". بل هو أقرب إلى كيفية الكتابة بطريقة تعكس التأليف الحقيقي وتتجنب القراءات الخاطئة الغريبة.
-
أضف تفاصيل محددة: أسماء المفاهيم التي استخدمتها فعلياً، والخطوات التي اتخذتها، والمفاضلات التي أخذتها في الاعتبار
-
استخدم التنوع الطبيعي: امزج بين الجمل القصيرة والطويلة (كما يفعل البشر عندما يفكرون)
-
أدرج القيود الحقيقية: الحدود الزمنية، والأدوات المستخدمة، وما حدث من أخطاء، وما الذي كنت ستفعله بشكل مختلف
-
تجنب استخدام عبارات جاهزة أكثر من اللازم: استبدل كلمة "علاوة على ذلك" بكلمة أخرى تقولها فعلاً
-
احتفظ بالمسودات والملاحظات: في حال نشوب أي خلاف، فإن الأدلة العملية أهم من الحدس
في الحقيقة، أفضل دفاع هو ببساطة... أن تكون صادقاً. صادقاً بشكل غير كامل، وليس صادقاً كما في الكتيبات الإعلانية.
ملاحظات ختامية 🧠✨
قد تكون أدوات الكشف المدعومة بالذكاء الاصطناعي مفيدة، لكنها ليست أدوات تحقق الحقيقة المطلقة. إنها أدوات لمطابقة الأنماط، مُدرَّبة على بيانات غير كاملة، وتعمل في بيئة تتداخل فيها أنماط الكتابة باستمرار. ( OpenAI ؛ دراسة استقصائية حول الكشف عن النصوص المُولَّدة بواسطة نماذج التعلم الآلي )
باختصار:
-
تعتمد أدوات الكشف على المصنفات، والتعقيد/الاندفاع، والأسلوبية، وأحيانًا العلامات المائية 🧩 ( دراسة استقصائية حول الكشف عن النصوص المولدة بواسطة LLM )
-
إنهم يقدرون "التشابه مع الذكاء الاصطناعي"، وليس اليقين ( OpenAI )
-
تحدث النتائج الإيجابية الخاطئة بكثرة في الكتابة الرسمية أو التقنية أو غير الأصلية 😬 ( Liang et al. (arXiv) ; Turnitin )
-
استخدم نتائج برنامج الكشف كحافز للمراجعة، وليس كحكم نهائي ( Turnitin ).
أجل... إذا سأل أحدهم مجدداً: كيف تعمل أجهزة الكشف بالذكاء الاصطناعي ؟ يمكنك أن تجيبه: "إنها تخمن بناءً على أنماط - ذكية أحياناً، وغبية أحياناً أخرى، ومحدودة دائماً." 🤖
التعليمات
كيف تعمل أجهزة الكشف بالذكاء الاصطناعي عملياً؟
لا تُثبت معظم برامج كشف النصوص المدعومة بالذكاء الاصطناعي هوية الكاتب. بل تُقدّر مدى تشابه النص مع الأنماط الشائعة التي تُنتجها نماذج اللغة، ثم تُخرج نتيجةً تُشبه الاحتمالية. وقد تستخدم هذه البرامج نماذج تصنيف، أو نظام تقييم قابلية التنبؤ، أو خصائص الأسلوب، أو فحص العلامات المائية. لذا، يُفضّل التعامل مع النتيجة كإشارة تحذيرية، لا كحكم نهائي.
ما هي الإشارات التي تبحث عنها أنظمة الكشف بالذكاء الاصطناعي في الكتابة؟
تشمل المؤشرات الشائعة قابلية التنبؤ (مدى "دهشة" النموذج من كلماتك التالية)، والتكرار في بنية الجمل، والإيقاع المتسق بشكل غير معتاد، والصياغة العامة ذات التفاصيل الملموسة القليلة. كما تفحص بعض الأدوات مؤشرات الأسلوب مثل طول الجملة، وعلامات الترقيم، وتكرار الكلمات الوظيفية. قد تتداخل هذه المؤشرات مع الكتابة البشرية، لا سيما في الأنواع الرسمية أو الأكاديمية أو التقنية.
لماذا تصنف أجهزة الكشف عن الذكاء الاصطناعي الكتابة البشرية على أنها كتابة ذكاء اصطناعي؟
تحدث النتائج الإيجابية الخاطئة عندما تبدو الكتابة البشرية "سلسة" إحصائيًا أو نمطية. فالأسلوب الرسمي، والصياغة التي تُراعي الامتثال، والشروحات التقنية، والعينات القصيرة، واللغة الإنجليزية غير الأصلية، كلها عوامل قد تُفسَّر خطأً على أنها من صنع الذكاء الاصطناعي لأنها تُقلل من التباين. ولهذا السبب، قد تُؤدي فقرة نظيفة ومُحرَّرة جيدًا إلى الحصول على درجة عالية. فالكاشف يُقارن التشابه، لا يُؤكد المصدر.
هل أجهزة الكشف عن الحيرة و"الاندفاع" موثوقة؟
قد تنجح الأساليب القائمة على مقياس الحيرة عندما يكون النص خامًا، أي ناتجًا عن الذكاء الاصطناعي ويمكن التنبؤ به بدرجة كبيرة. لكنها هشة: فالمقاطع القصيرة مليئة بالتشويش، والعديد من أنواع النصوص البشرية المشروعة يمكن التنبؤ بها بطبيعتها (الملخصات، والتعريفات، ورسائل البريد الإلكتروني للشركات، والأدلة). كما أن التحرير والتنقيح قد يُغيران النتيجة بشكل كبير. هذه الأدوات مناسبة للتقييم السريع، وليست كافية لاتخاذ قرارات مصيرية بمفردها.
ما الفرق بين كاشفات التصنيف وأدوات قياس الأسلوب؟
تتعلم أدوات الكشف عن التصنيفات من مجموعات بيانات مصنفة لنصوص بشرية وأخرى مُصنّفة بواسطة الذكاء الاصطناعي (وأحيانًا نصوص هجينة)، وتتنبأ بالفئة التي يُشبهها نصك أكثر. أما أدوات قياس الأسلوب، فتركز على "بصمات" الكتابة، مثل أنماط اختيار الكلمات، والكلمات الوظيفية، وإشارات سهولة القراءة، والتي قد تكون أكثر فائدة في تحليل النصوص الطويلة. ويعاني كلا النهجين من مشكلة اختلاف المجال، وقد يواجهان صعوبة عندما يختلف أسلوب الكتابة أو الموضوع عن بيانات التدريب.
هل تُحلّ العلامات المائية مشكلة الكشف عن الذكاء الاصطناعي بشكل نهائي؟
تُعدّ العلامات المائية فعّالة عندما يستخدمها النموذج ويتعرف نظام الكشف على نمطها. في الواقع، لا يستخدم جميع مزودي المحتوى العلامات المائية، وقد تُضعف التحويلات الشائعة - كإعادة الصياغة والترجمة والاقتباس الجزئي أو دمج المصادر - النمط أو تُفسده. يُعدّ الكشف عن العلامات المائية فعّالاً في الحالات النادرة التي تتطابق فيها السلسلة بأكملها، ولكنه ليس شاملاً.
كيف أفسر نتيجة "X% AI"؟
اعتبر النسبة المئوية الواحدة مؤشرًا تقريبيًا على مدى "تشابه" البرنامج مع الذكاء الاصطناعي، وليس دليلًا قاطعًا على أنه من تأليفه. تُعدّ الدرجات المتوسطة غامضة للغاية، وحتى الدرجات العالية قد تكون خاطئة في الكتابة المعيارية أو الرسمية. توفر الأدوات الأفضل شروحات مثل النطاقات المميزة، وملاحظات حول الميزات، ولغة توضح عدم اليقين. إذا لم يُقدّم البرنامج شرحًا ذاتيًا، فلا تعتمد على الرقم كدليل قاطع.
ما الذي يجعل نظام كشف الذكاء الاصطناعي جيدًا للمدارس أو سير العمل التحريري؟
يتميز الكاشف الموثوق بمعايرته الدقيقة، وتقليله للنتائج الإيجابية الخاطئة، ووضوحه التام في توضيح حدوده. كما ينبغي أن يتجنب المبالغة في الثقة عند الاعتماد على عينات صغيرة، وأن يتعامل مع مختلف المجالات (الأكاديمية، والمدونات، والتقنية)، وأن يظل مستقرًا عند مراجعة النصوص من قِبل البشر. أما الأدوات الأكثر فعالية، فتتسم بالتواضع: فهي تقدم الأدلة والشكوك بدلًا من محاولة قراءة الأفكار.
كيف يمكنني تقليل حالات الإنذارات العرضية للذكاء الاصطناعي دون "التلاعب" بالنظام؟
ركّز على مؤشرات الكتابة الأصيلة بدلاً من الحيل. أضف تفاصيل ملموسة (الخطوات التي اتخذتها، القيود، المفاضلات)، ونوّع إيقاع الجمل بشكل طبيعي، وتجنّب الانتقالات الجاهزة التي لا تستخدمها عادةً. احتفظ بالمسودات والملاحظات وسجل المراجعات - فغالباً ما تكون أدلة العملية أهم من نتيجة اختبار الكشف في النزاعات. الهدف هو الوضوح بأسلوب شخصي، وليس كتابة نص مثاليّ أشبه بكتيّب دعائي.
مراجع
-
رابطة اللغويات الحاسوبية (مختارات ACL) - دراسة استقصائية حول اكتشاف النصوص المولدة بواسطة LLM - aclanthology.org
-
OpenAI - مصنف ذكاء اصطناعي جديد لتحديد النصوص المكتوبة بواسطة الذكاء الاصطناعي - openai.com
-
دليل Turnitin - خاصية الكشف عن الكتابة بالذكاء الاصطناعي في عرض التقرير الكلاسيكي - guides.turnitin.com
-
دليل Turnitin - نموذج الذكاء الاصطناعي للكشف عن الكتابة - guides.turnitin.com
-
Turnitin - فهم النتائج الإيجابية الخاطئة ضمن قدراتنا في مجال كشف الكتابة بالذكاء الاصطناعي - turnitin.com
-
arXiv - DetectGPT - arxiv.org
-
جامعة بوسطن - منشورات الحيرة - cs.bu.edu
-
GPTZero - الحيرة والاندفاع: ما هما؟ - gptzero.me
-
PubMed Central (NCBI) - علم قياس الأسلوب وعلم الأدلة الجنائية: مراجعة أدبية - ncbi.nlm.nih.gov
-
رابطة اللغويات الحاسوبية (مختارات ACL) - الكلمات الوظيفية في إسناد التأليف - aclanthology.org
-
arXiv - علامة مائية لنماذج اللغة الكبيرة - arxiv.org
-
الذكاء الاصطناعي من جوجل للمطورين - نص SynthID - ai.google.dev
-
arXiv - حول موثوقية العلامات المائية لنماذج اللغة الكبيرة - arxiv.org
-
أوبن إيه آي - فهم مصدر ما نراه ونسمعه عبر الإنترنت - openai.com
-
ستانفورد HAI - كاشفات الذكاء الاصطناعي متحيزة ضد الكتاب غير الناطقين باللغة الإنجليزية - hai.stanford.edu
-
arXiv - ليانغ وآخرون - arxiv.org