ما هو مدرب الذكاء الاصطناعي؟

يبدو الذكاء الاصطناعي أحيانًا أشبه بالسحر. تكتب سؤالًا عشوائيًا، وفجأة - تظهر إجابة متقنة وواضحة في ثوانٍ. لكن المفاجأة تكمن في أن وراء كل آلة "عبقرية"، هناك أشخاص حقيقيون يوجهونها ويصححونها ويطورونها باستمرار. يُطلق على هؤلاء الأشخاص اسم مدربي الذكاء الاصطناعي، وعملهم أغرب وأكثر طرافة، وبصراحة أكثر إنسانية مما يتصوره معظم الناس.

دعونا نستعرض لماذا يُعد هؤلاء المدربون مهمين، وكيف يبدو عملهم اليومي في الواقع، ولماذا يتزايد هذا الدور بشكل أسرع مما توقعه أي شخص.

مقالات قد ترغب في قراءتها بعد هذه المقالة:

🔗 ما هي المراجحة بالذكاء الاصطناعي: الحقيقة وراء المصطلح الرائج
يشرح هذا المقال موضوع المراجحة باستخدام الذكاء الاصطناعي، ومخاطرها، وفوائدها، والمفاهيم الخاطئة الشائعة عنها.

🔗 متطلبات تخزين البيانات للذكاء الاصطناعي: ما تحتاج حقًا إلى معرفته
يغطي احتياجات التخزين وقابلية التوسع والكفاءة لأنظمة الذكاء الاصطناعي.

🔗 من هو أبو الذكاء الاصطناعي؟
يستكشف هذا الكتاب رواد الذكاء الاصطناعي وأصوله.

ما الذي يجعل مدرب الذكاء الاصطناعي قويًا؟ 🏆

الأمر لا يقتصر على الضغط العشوائي على الأزرار. يعتمد أفضل المدربين على مزيج غريب من المواهب:

الصبر (الكثير منه) - لا تتعلم النماذج من أول مرة. يستمر المدربون في تكرار نفس التصحيحات حتى ترسخ.
إن اكتشاف الفروق الدقيقة - إن التقاط السخرية أو السياق الثقافي أو التحيز هو ما يمنح التعليقات البشرية ميزتها [1].
التواصل المباشر - نصف المهمة هو كتابة تعليمات واضحة لا يمكن للذكاء الاصطناعي أن يسيء فهمها.
الفضول + الأخلاق - المدرب الجيد يتساءل عما إذا كانت الإجابة "صحيحة من الناحية الواقعية" ولكنها غير مراعية للحساسية الاجتماعية - وهو موضوع رئيسي في الإشراف على الذكاء الاصطناعي [2].

ببساطة: المدرب هو جزء من معلم، وجزء من محرر، وقليل من الأخلاقي.

لمحة سريعة عن أدوار مدرب الذكاء الاصطناعي (مع بعض الخصائص المميزة 😉)

نوع الدور	من هو الأنسب؟	الأجر النموذجي	لماذا ينجح (أو لا ينجح)
مُصنِّف البيانات	الأشخاص الذين يعشقون التفاصيل الدقيقة	منخفض - متوسط	أمر بالغ الأهمية؛ فإذا كانت التصنيفات غير دقيقة، فإن النموذج بأكمله سيتأثر سلبًا [3] 📊
أخصائي RLHF	كتاب، محررون، محللون	متوسط إلى مرتفع $$	يقوم بترتيب وإعادة صياغة الردود لمواءمة النبرة والوضوح مع التوقعات البشرية [1]
مدرب المجال	محامون، أطباء، خبراء	في كل مكان 💼	يتعامل مع المصطلحات المتخصصة والحالات الاستثنائية للأنظمة الخاصة بالصناعة
مراجع السلامة	أصحاب الضمائر الحية	متوسط السعر	يطبق إرشادات حتى يتجنب الذكاء الاصطناعي المحتوى الضار [2][5]
مدرب إبداعي	فنانون، رواة قصص	غير متوقع 💡	يساعد الذكاء الاصطناعي على محاكاة الخيال مع البقاء ضمن الحدود الآمنة [5]

(نعم، التنسيق فوضوي بعض الشيء - يشبه إلى حد ما العمل نفسه.)

يوم في حياة مدرب الذكاء الاصطناعي

إذن، كيف يبدو العمل الفعلي؟ فكّر في الأمر بشكل أقل بريقاً من مجرد كتابة أكواد جذابة، وأكثر من ذلك:

ترتيب الإجابات المكتوبة بواسطة الذكاء الاصطناعي من الأسوأ إلى الأفضل (خطوة RLHF الكلاسيكية) [1].
إصلاح الأخطاء (مثل عندما ينسى النموذج أن كوكب الزهرة ليس المريخ).
إعادة صياغة ردود روبوت الدردشة بحيث تبدو أكثر طبيعية.
تصنيف كميات هائلة من النصوص والصور والصوت - حيث تكون الدقة مهمة حقًا [3].
مناقشة ما إذا كان "الصحيح تقنياً" كافياً أم أن إرشادات السلامة يجب أن تتجاوز [2].

الأمر مزيج من الجهد والتحدي. تخيل أن تُعلّم ببغاءً ليس فقط الكلام، بل التوقف عن استخدام الكلمات بشكل خاطئ قليلاً - هذا هو جوهر الأمر. 🦜

لماذا يُعدّ المدربون أكثر أهمية مما تعتقد

بدون توجيه بشري، سيقوم الذكاء الاصطناعي بما يلي:

صوته جامد وآلي.
نشر التحيز دون رادع (فكرة مخيفة).
أفتقد تماماً روح الدعابة والتعاطف.
كن أقل أمانًا في السياقات الحساسة.

المدربون هم من يتسللون إلى "الأمور البشرية الفوضوية" - اللغة العامية، والدفء، والاستعارة الركيكة العرضية - مع وضع ضوابط للحفاظ على سلامة الأمور [2][5].

المهارات التي تُحدث فرقًا حقيقيًا

انسَ الخرافة القائلة بأنك تحتاج إلى شهادة دكتوراه. ما يُفيد أكثر هو:

مهارات الكتابة والتحرير - نص مصقول ولكنه يبدو طبيعياً [1].
التفكير التحليلي - اكتشاف الأخطاء المتكررة في النموذج وتعديلها.
الوعي الثقافي - معرفة متى قد يكون التعبير غير مناسب [2].
الصبر - لأن الذكاء الاصطناعي لا يستوعب الأمور على الفور.

نقاط إضافية للمهارات اللغوية المتعددة أو الخبرة المتخصصة.

أماكن تواجد المدربين 🌍

لا تقتصر هذه الوظيفة على برامج الدردشة الآلية فحسب، بل إنها تتسلل إلى كل قطاع:

الرعاية الصحية - كتابة قواعد التعليق للحالات الحدية (كما ورد في إرشادات الذكاء الاصطناعي الصحي) [2].
التمويل - تدريب أنظمة كشف الاحتيال دون إغراق الناس بالإنذارات الكاذبة [2].
البيع بالتجزئة - تعليم المساعدين كيفية استخدام لغة المتسوقين العامية مع الالتزام بنبرة العلامة التجارية [5].
التعليم - تشكيل روبوتات التدريس لتكون مشجعة بدلاً من أن تكون متعالية [5].

باختصار: إذا كان للذكاء الاصطناعي مقعد على الطاولة، فهناك مدرب يختبئ في الخلفية.

الجزء المتعلق بالأخلاقيات (لا يمكن تخطيه)

وهنا تكمن الأهمية. فإذا تُرك الذكاء الاصطناعي دون رقابة، فإنه سيكرر الصور النمطية والمعلومات المضللة، أو ما هو أسوأ من ذلك. ويوقف المدربون ذلك باستخدام أساليب مثل RLHF أو القواعد الدستورية التي توجه النماذج نحو إجابات مفيدة وغير ضارة [1][5].

مثال: إذا قام برنامج آلي بنشر توصيات وظيفية متحيزة، يقوم المدرب بالإبلاغ عن ذلك، وإعادة كتابة قواعد العمل، والتأكد من عدم تكرار ذلك. هذا هو الإشراف الفعال [2].

الجانب غير الممتع

ليست الأمور كلها براقة. يتعامل المدربون مع:

الرتابة - يصبح وضع العلامات بلا نهاية أمراً مملاً.
الإرهاق العاطفي - يمكن أن يؤدي استعراض المحتوى الضار أو المزعج إلى إرهاق نفسي؛ أنظمة الدعم ضرورية [4].
عدم التقدير - نادراً ما يدرك المستخدمون وجود المدربين.
التغيير المستمر - تتطور الأدوات باستمرار، مما يعني أن على المدربين مواكبة هذا التطور.

ومع ذلك، بالنسبة للكثيرين، فإن متعة تشكيل "عقول" التكنولوجيا هي ما يبقيهم متعلقين بها.

أهم الشخصيات الخفية في مجال الذكاء الاصطناعي

إذن، من هم مدربو الذكاء الاصطناعي؟ إنهم حلقة الوصل بين الخوارزميات المجردة والأنظمة التي تُفيد البشر فعلاً. بدونهم، سيكون الذكاء الاصطناعي أشبه بمكتبة بلا أمناء - معلومات غزيرة، لكن استخدامها شبه مستحيل.

في المرة القادمة التي يجعلك فيها برنامج دردشة آلي تضحك أو تشعر بأنه "متناغم" معك بشكل مدهش، فاشكر المدرب. إنهم الشخصيات الهادئة التي تجعل الآلات لا تقوم بالحساب فحسب، بل تتواصل أيضًا [1][2][5].

مراجع

[1] أويانغ، ل. وآخرون (2022). تدريب نماذج اللغة على اتباع التعليمات مع التغذية الراجعة البشرية (InstructGPT). مؤتمر NeurIPS. رابط

[2] المعهد الوطني للمعايير والتكنولوجيا (2023). إطار إدارة مخاطر الذكاء الاصطناعي (AI RMF 1.0). رابط

[3] نورثكوت، سي. وآخرون (2021). أخطاء التصنيف المنتشرة في مجموعات الاختبار تُزعزع استقرار معايير التعلم الآلي. مجموعات بيانات ومعايير NeurIPS. رابط

[4] منظمة الصحة العالمية/منظمة العمل الدولية (2022). إرشادات بشأن الصحة النفسية في مكان العمل. رابط

[5] باي، ي. وآخرون (2022). الذكاء الاصطناعي الدستوري: عدم الضرر الناتج عن التغذية الراجعة للذكاء الاصطناعي. arXiv. رابط

اكتشف أحدث تقنيات الذكاء الاصطناعي في متجر مساعدي الذكاء الاصطناعي الرسمي

معلومات عنا

العودة إلى المدونة