أحيانًا يبدو الذكاء الاصطناعي أشبه بخدعة سحرية. تكتب سؤالًا عشوائيًا، وفجأة - تظهر إجابة أنيقة ومُتقنة في ثوانٍ. ولكن إليكم المفاجأة: وراء كل آلة "عبقرية"، هناك أشخاص حقيقيون يُرشدونها ويُصححونها ويُشكلونها على طول الطريق. يُطلق على هؤلاء الأشخاص اسم مُدرّبي الذكاء الاصطناعي ، وعملهم أغرب وأطرف، بل وأكثر إنسانية مما يظنه معظم الناس.
دعونا نستعرض سبب أهمية هؤلاء المدربين، وكيف يبدو يومهم في الواقع، ولماذا ينتشر هذا الدور بشكل أسرع مما توقعه أي شخص.
مقالات قد ترغب في قراءتها بعد هذه المقالة:
🔗 ما هو التحكيم في الذكاء الاصطناعي: الحقيقة وراء هذه الكلمة الطنانة
يوضح التحكيم في الذكاء الاصطناعي ومخاطره وفوائده والمفاهيم الخاطئة الشائعة.
🔗 متطلبات تخزين البيانات للذكاء الاصطناعي: ما تحتاج إلى معرفته حقًا
يغطي احتياجات التخزين وقابلية التوسع والكفاءة لأنظمة الذكاء الاصطناعي.
🔗 من هو أبو الذكاء الاصطناعي؟
يستكشف رواد الذكاء الاصطناعي وأصول الذكاء الاصطناعي.
ما الذي يجعل مدرب الذكاء الاصطناعي قويًا؟ 🏆
إنها ليست مهمة شاقة. أفضل المدربين يعتمدون على مزيج غريب من المواهب:
-
الصبر (الكثير منه) - لا يتعلم العارضون دفعة واحدة. يُكرر المدربون نفس التصحيحات حتى يتقنوها.
-
اكتشاف الفروق الدقيقة - إن اكتشاف السخرية أو السياق الثقافي أو التحيز هو ما يعطي ردود الفعل البشرية ميزتها [1].
-
التواصل المباشر - نصف المهمة هو كتابة تعليمات واضحة لا يمكن للذكاء الاصطناعي قراءتها بشكل خاطئ.
-
الفضول + الأخلاق - يتساءل المدرب الجيد عما إذا كانت الإجابة "صحيحة فعليًا" ولكنها غير متوافقة اجتماعيًا - وهو موضوع رئيسي في الإشراف على الذكاء الاصطناعي [2].
ببساطة: المدرب هو جزء من المعلم، وجزء من المحرر، وجزء من الأخلاق.
نظرة عامة على أدوار مدرب الذكاء الاصطناعي (مع بعض الميزات الغريبة 😉)
نوع الدور | من هو الأنسب؟ | الأجر النموذجي | لماذا يعمل (أو لا يعمل) |
---|---|---|---|
مُصنِّف البيانات | الأشخاص الذين يحبون التفاصيل الدقيقة | منخفض إلى متوسط $$ | أمر بالغ الأهمية؛ إذا كانت التسميات غير دقيقة، فسوف يعاني النموذج بأكمله [3] 📊 |
أخصائي RLHF | الكتاب والمحررين والمحللين | متوسط إلى مرتفع $$ | يقوم بتصنيف وإعادة كتابة الاستجابات لمواءمة النبرة والوضوح مع التوقعات البشرية [1] |
مدرب المجال | المحامون والأطباء والخبراء | في جميع أنحاء الخريطة 💼 | يتعامل مع المصطلحات المتخصصة والحالات الحدية للأنظمة الخاصة بالصناعة |
مراجع السلامة | الناس المهتمين بالأخلاق | متوسط $$ | تطبيق الإرشادات حتى تتجنب الذكاء الاصطناعي المحتوى الضار [2][5] |
مدرب إبداعي | الفنانون ورواة القصص | غير متوقع 💡 | يساعد الذكاء الاصطناعي على محاكاة الخيال مع البقاء ضمن الحدود الآمنة [5] |
(نعم، التنسيق فوضوي بعض الشيء - مثل الوظيفة نفسها.)
يوم في حياة مدرب الذكاء الاصطناعي
إذًا، كيف يبدو العمل الفعلي؟ فكّر في برمجة أقلّ بريقًا وأكثر:
-
تصنيف الإجابات المكتوبة بواسطة الذكاء الاصطناعي من الأسوأ إلى الأفضل (خطوة RLHF الكلاسيكية) [1].
-
إصلاح الأخطاء (مثل عندما ينسى النموذج أن الزهرة ليست المريخ).
-
إعادة كتابة ردود الدردشة الآلية لتبدو أكثر طبيعية.
-
وضع العلامات على كميات كبيرة من النصوص والصور أو الصوت - حيث تكون الدقة مهمة حقًا [3].
-
مناقشة ما إذا كان "الصحيح من الناحية الفنية" جيدًا بما فيه الكفاية أو ما إذا كانت إرشادات السلامة يجب أن تتغلب [2].
إنه مزيج من الإرهاق والألغاز. بصراحة، تخيّل تعليم ببغاء ليس فقط التحدث، بل التوقف عن استخدام الكلمات الخاطئة قليلاً - هذا هو جوهر الأمر. 🦜
لماذا تعتبر الأحذية الرياضية أكثر أهمية مما تعتقد
بدون توجيه البشر، فإن الذكاء الاصطناعي سوف يقوم بما يلي:
-
صوت جامد وروبوتي.
-
انتشار التحيز دون رادع (فكرة مخيفة).
-
أفتقد الفكاهة والتعاطف تمامًا.
-
كن أقل أمانًا في السياقات الحساسة.
المدربون هم الذين يتسللون إلى "الأشياء البشرية الفوضوية" - المصطلحات العامية والدفء والاستعارات الخرقاء العرضية - بينما يطبقون أيضًا حواجز واقية للحفاظ على الأشياء آمنة [2] [5].
المهارات التي لها أهمية فعلية
انسَ خرافة حاجتك إلى شهادة الدكتوراه. ما يُساعدك أكثر هو:
-
مهارات الكتابة والتحرير - نص مصقول ولكنه يبدو طبيعيًا [1].
-
التفكير التحليلي - اكتشاف الأخطاء المتكررة في النموذج وتعديلها.
-
الوعي الثقافي - معرفة متى قد تكون العبارة خاطئة [2].
-
الصبر - لأن الذكاء الاصطناعي لا يدرك الأمر على الفور.
نقاط إضافية للمهارات المتعددة اللغات أو الخبرة المتخصصة.
أين يظهر المدربون 🌍
لا تقتصر هذه الوظيفة على روبوتات الدردشة فحسب - بل إنها تتسلل إلى كل قطاع:
-
الرعاية الصحية - كتابة قواعد التعليق التوضيحي للحالات الحدية (المذكورة في إرشادات الذكاء الاصطناعي الصحي) [2].
-
التمويل - تدريب أنظمة كشف الاحتيال دون إغراق الناس بالإنذارات الكاذبة [2].
-
التجزئة - مساعدو التدريس للحصول على لغة المتسوق العامية مع الالتزام بنبرة العلامة التجارية [5].
-
التعليم - تشكيل روبوتات التدريس لتكون مشجعة بدلاً من أن تكون متعجرفة [5].
في الأساس: إذا كان للذكاء الاصطناعي مقعد على الطاولة، فسيكون هناك مدرب مختبئ في الخلفية.
الجزء المتعلق بالأخلاقيات (لا يمكن تخطي هذا)
هنا تبرز خطورة الأمر. إذا تُرك الذكاء الاصطناعي دون رادع، فإنه يُكرر الصور النمطية والمعلومات المضللة، أو ما هو أسوأ. يُوقف المدربون ذلك باستخدام أساليب مثل RLHF أو القواعد الدستورية التي تُوجِّه النماذج نحو إجابات مفيدة وغير ضارة [1][5].
مثال: إذا نشر روبوت توصيات وظيفية متحيزة، يُبلغ عنه المدرب، ويُعيد صياغة دليل القواعد، ويتأكد من عدم تكراره. هذا يُمثل إهمالًا عمليًا [2].
الجانب غير الممتع
ليس كل شيء لامعًا. يتعامل المدربون مع:
-
الرتابة - وضع العلامات التي لا نهاية لها يصبح قديمًا.
-
الإرهاق العاطفي - إن مراجعة المحتوى الضار أو المزعج قد يكون له أثر سلبي؛ وتعتبر أنظمة الدعم أمرًا بالغ الأهمية [4].
-
عدم التعرف - نادرًا ما يدرك المستخدمون وجود المدربين.
-
التغيير المستمر - تتطور الأدوات بلا توقف، مما يعني أن المدربين يجب أن يواكبوا هذا التطور.
ومع ذلك، بالنسبة للعديد من الناس، فإن التشويق الناتج عن تشكيل "عقول" التكنولوجيا يبقيهم مدمنين عليها.
أبرز الشخصيات المختبئة في عالم الذكاء الاصطناعي
إذن، من هم مدربو الذكاء الاصطناعي؟ إنهم حلقة الوصل بين الخوارزميات الخام والأنظمة التي تعمل لصالح البشر. بدونهم، سيكون الذكاء الاصطناعي أشبه بمكتبة بلا أمناء مكتبة - أكوام من المعلومات، لكن استخدامها شبه مستحيل.
في المرة القادمة التي يُضحكك فيها روبوت محادثة أو يُشعرك بتناغم مفاجئ، اشكر مدربك. إنهم الشخصيات الهادئة التي تُمكّن الآلات من التواصل ليس فقط [1][2][5].
مراجع
[1] Ouyang, L. et al. (2022). تدريب نماذج اللغة على اتباع التعليمات مع التغذية الراجعة البشرية (InstructGPT). NeurIPS. الرابط
[2] المعهد الوطني للمعايير والتكنولوجيا (2023). إطار عمل إدارة مخاطر الذكاء الاصطناعي (AI RMF 1.0). الرابط
[3] نورثكوت، س. وآخرون (2021). أخطاء التسمية المنتشرة في مجموعات الاختبار تُزعزع استقرار معايير التعلم الآلي. مجموعات بيانات ومعايير NeurIPS. رابط
[4] منظمة الصحة العالمية/منظمة العمل الدولية (2022). إرشادات حول الصحة النفسية في العمل. الرابط
[5] باي، ي. وآخرون (2022). الذكاء الاصطناعي الدستوري: عدم الضرر من ردود فعل الذكاء الاصطناعي. arXiv. الرابط