هل تساءلت يومًا عما يخفيه مصطلح "مهندس الذكاء الاصطناعي"؟ أنا أيضًا. قد يبدو الأمر جذابًا من الخارج، لكنه في الواقع مزيج من التصميم، ومعالجة البيانات المعقدة، وربط الأنظمة، والتحقق الدقيق من عملها. باختصار: يحوّلون المشكلات الغامضة إلى أنظمة ذكاء اصطناعي فعّالة لا تنهار عند استخدام المستخدمين الحقيقيين. أما التفاصيل الأكثر تفصيلًا وتعقيدًا، فستجدها أدناه. استعدّ بفنجان قهوة. ☕
مقالات قد ترغب في قراءتها بعد هذه المقالة:
🔗 أدوات الذكاء الاصطناعي للمهندسين: تعزيز الكفاءة والابتكار
اكتشف أدوات الذكاء الاصطناعي القوية التي تعزز إنتاجية وإبداع المهندسين.
🔗 هل سيتم استبدال مهندسي البرمجيات بالذكاء الاصطناعي؟
استكشف مستقبل هندسة البرمجيات في عصر الأتمتة.
🔗 تطبيقات الذكاء الاصطناعي الهندسية تُحدث تحولاً في الصناعات
تعرّف على كيفية قيام الذكاء الاصطناعي بإعادة تشكيل العمليات الصناعية ودفع عجلة الابتكار.
🔗 كيف تصبح مهندس ذكاء اصطناعي
دليل خطوة بخطوة لبدء رحلتك نحو مهنة في هندسة الذكاء الاصطناعي.
باختصار: ما يفعله مهندس الذكاء الاصطناعي فعلاً 💡
بأبسط صورة، يقوم مهندس الذكاء الاصطناعي بتصميم وبناء وشحن وصيانة أنظمة الذكاء الاصطناعي. وتشمل مهامه اليومية عادةً ما يلي:
-
ترجمة احتياجات المنتج أو العمل الغامضة إلى شيء يمكن للنماذج التعامل معه فعلياً.
-
جمع البيانات وتصنيفها وتنظيفها، وإعادة فحصها - وهو أمر لا مفر منه - عندما تبدأ في الانحراف.
-
اختيار النماذج وتدريبها، وتقييمها باستخدام المقاييس الصحيحة، وتدوين مواطن ضعفها.
-
تغليف كل شيء في مسارات MLOps بحيث يمكن اختباره ونشره ومراقبته.
-
مشاهدته في الواقع: الدقة، والسلامة، والإنصاف... والتكيف قبل أن ينحرف عن مساره.
إذا كنت تفكر "إذن هو هندسة برمجيات بالإضافة إلى علم البيانات مع رشة من التفكير في المنتج" - نعم، هذا هو شكلها تقريبًا.
ما الذي يميز المتميزين عن غيرهم؟ ✅
يمكنك الاطلاع على جميع الأبحاث المعمارية المنشورة منذ عام ٢٠١٧، ومع ذلك قد تبني مشروعًا هشًا وغير متقن. عادةً ما يكون الأشخاص الذين يزدهرون في هذا الدور:
-
فكروا في الأنظمة. إنهم يرون الحلقة بأكملها: البيانات الداخلة، والقرارات الخارجة، وكل شيء قابل للتتبع.
-
لا تسعى وراء الحلول السحرية أولاً. ابدأ بالأساسيات والفحوصات البسيطة قبل إضافة التعقيد.
-
أدرج الملاحظات في التصميم. إعادة التدريب والتراجع ليسا إضافات، بل هما جزء من التصميم.
-
دوّن كل شيء. المفاضلات، والافتراضات، والقيود - قد تبدو مملة، لكنها ستكون ثمينة لاحقاً.
-
تعامل مع الذكاء الاصطناعي المسؤول بجدية. فالمخاطر لا تختفي بالتفاؤل، بل يتم تسجيلها وإدارتها.
قصة قصيرة: بدأ أحد فرق الدعم بقاعدة بيانات بسيطة تعتمد على القواعد والاسترجاع. وقد وفر لهم ذلك اختبارات قبول واضحة، لذا عندما استبدلوها بنموذج كبير لاحقًا، كانت لديهم مقارنات دقيقة - وخيار بديل سهل عندما حدث خطأ ما.
دورة الحياة: واقع فوضوي مقابل مخططات أنيقة 🔁
-
حدد المشكلة. حدد الأهداف والمهام وما هو "الجيد بما فيه الكفاية".
-
قم بمعالجة البيانات بشكل مكثف. نظّفها، صنّفها، قسّمها، وحدّد إصداراتها. تحقّق من صحتها باستمرار لاكتشاف أي انحراف في المخطط.
-
قم بإجراء تجارب نموذجية. جرب أشياء بسيطة، واختبر الخطوط الأساسية، وكرر العملية، ووثقها.
-
قم بنشرها. خطوط أنابيب التكامل المستمر/التسليم المستمر/الاختبار المستمر، عمليات النشر الآمنة، الاختبارات التجريبية، عمليات التراجع.
-
راقب باستمرار. راقب الدقة، وزمن الاستجابة، والانحراف، والإنصاف، ونتائج المستخدم. ثم أعد التدريب.
على الشريحة، يبدو هذا كدائرة أنيقة. أما في الواقع، فهو أشبه بمحاولة التلاعب بالمعكرونة باستخدام مكنسة.
الذكاء الاصطناعي المسؤول عندما يحين وقت الجد 🧭
الأمر لا يتعلق بعروض تقديمية جذابة. يعتمد المهندسون على الأطر البرمجية لجعل المخاطر واقعية
-
للمعهد الوطني للمعايير والتكنولوجيا هيكلًا لاكتشاف المخاطر وقياسها والتعامل معها عبر مراحل التصميم والنشر [1].
-
مبادئ منظمة التعاون الاقتصادي والتنمية بشكل أشبه بالبوصلة - وهي عبارة عن مبادئ توجيهية عامة تلتزم بها العديد من المنظمات [2].
كما تقوم العديد من الفرق بإنشاء قوائم التحقق الخاصة بها (مراجعات الخصوصية، وبوابات التدخل البشري) التي يتم ربطها بدورات الحياة هذه.
مستندات لا غنى عنها: بطاقات النماذج وجداول البيانات 📝
ورقتان ستشكر نفسك عليهما لاحقاً:
-
بطاقات النموذج ← توضح الاستخدام المقصود، وسياقات التقييم، والتحذيرات. مكتوبة بحيث يمكن لمسؤولي المنتج/الشؤون القانونية اتباعها أيضًا [3].
-
أوراق البيانات لمجموعات البيانات → تشرح سبب وجود البيانات، وما تحتويه، والتحيزات المحتملة، والاستخدامات الآمنة مقابل غير الآمنة [4].
أنت في المستقبل (وزملائك في الفريق في المستقبل) ستتبادلون التحية بصمت لكتابتك هذه الرسائل.
نظرة معمقة: مسارات البيانات، والعقود، والتحكم في الإصدارات 🧹📦
تصبح البيانات غير منظمة. يقوم مهندسو الذكاء الاصطناعي الأذكياء بفرض العقود، وتضمين عمليات التحقق، والحفاظ على الإصدارات مرتبطة بالبرنامج حتى تتمكن من الرجوع إليها لاحقًا.
-
التحقق من الصحة ← ترميز المخطط والنطاقات والحداثة؛ إنشاء المستندات تلقائيًا.
-
التحكم في الإصدارات → قم بمحاذاة مجموعات البيانات والنماذج مع عمليات الالتزام في Git، بحيث يكون لديك سجل تغييرات يمكنك الوثوق به بالفعل.
مثال بسيط: قام أحد تجار التجزئة بإضافة فحوصات للمخطط لحظر بيانات الموردين المليئة بالقيم الفارغة. وقد أدى هذا الإجراء البسيط إلى إيقاف عمليات الاستدعاء المتكررة في قاعدة البيانات قبل أن يلاحظها العملاء.
نظرة معمقة: الشحن والتوسع 🚢
لا يقتصر تشغيل نموذج في بيئة الإنتاج على استخدام دالة model.fit() . بل تتضمن مجموعة الأدوات اللازمة لذلك ما يلي:
-
Docker لتغليف متسق.
-
Kubernetes للتنسيق والتوسع وعمليات النشر الآمنة.
-
أطر عمل MLOps للاختبارات التجريبية، وتقسيمات A/B، واكتشاف القيم الشاذة.
خلف الكواليس، تجري فحوصات صحية، وتتبع، وجدولة بين وحدة المعالجة المركزية ووحدة معالجة الرسومات، وضبط مهلة الانتظار. ليس الأمر جذابًا، ولكنه ضروري للغاية.
نظرة معمقة: أنظمة الذكاء الاصطناعي من الجيل الأول وRAG 🧠📚
تُضيف الأنظمة التوليدية بُعداً آخر - وهو ترسيخ الاسترجاع.
-
البحث عن التشابه باستخدام التضمينات والمتجهات بسرعة.
-
التنسيق لربط عمليات الاسترجاع واستخدام الأدوات والمعالجة اللاحقة.
الخيارات في تقسيم البيانات، وإعادة ترتيبها، وتقييمها - هذه القرارات الصغيرة تحدد ما إذا كنت ستحصل على روبوت محادثة غير سلس أو مساعد طيار مفيد.
المهارات والأدوات: ما هي الأدوات الموجودة فعلياً في المجموعة 🧰
مجموعة متنوعة من معدات التعلم الآلي الكلاسيكية والتعلم العميق:
-
الأطر البرمجية: PyTorch، TensorFlow، scikit-learn.
-
خطوط الأنابيب: تدفق الهواء، وما إلى ذلك، للوظائف المجدولة.
-
الإنتاج: Docker، K8s، أطر العمل الخاصة بالخدمة.
-
إمكانية المراقبة: أجهزة مراقبة الانحراف، وأجهزة تتبع زمن الاستجابة، وفحوصات الإنصاف.
لا أحد يستخدم كل شيء . السر يكمن في معرفة ما يكفي خلال دورة حياة المنتج للتفكير بشكل منطقي.
جدول الأدوات: ما يستخدمه المهندسون فعلاً 🧪
| أداة | جمهور | سعر | لماذا هو مفيد؟ |
|---|---|---|---|
| بايتورش | باحثون ومهندسون | المصادر المفتوحة | مرن، متوافق مع لغة بايثون، مجتمع ضخم، شبكات مخصصة. |
| TensorFlow | فرق التعلم المنتج | المصادر المفتوحة | عمق النظام البيئي، وخدمة TF، و Lite لعمليات النشر. |
| مكتبة سايكيت ليرن | مستخدمو التعلم الآلي الكلاسيكي | المصادر المفتوحة | خطوط أساسية رائعة، واجهة برمجة تطبيقات منظمة، معالجة مسبقة مدمجة. |
| MLflow | فرق لديها العديد من التجارب | المصادر المفتوحة | يحافظ على تنظيم عمليات التشغيل والنماذج والقطع الأثرية. |
| تدفق الهواء | يا جماعة خطوط الأنابيب | المصادر المفتوحة | الرسوم البيانية الموجهة غير الدورية، والجدولة، والمراقبة جيدة بما فيه الكفاية. |
| عامل ميناء | الجميع تقريباً | قلب حر | نفس البيئة (في الغالب). عدد أقل من المشاحنات حول "العمل فقط على جهاز الكمبيوتر المحمول الخاص بي". |
| Kubernetes | فرق تعتمد بشكل كبير على البنية التحتية | المصادر المفتوحة | التوسع التلقائي، وعمليات النشر، وقوة على مستوى المؤسسات. |
| نموذج يعمل على K8s | مستخدمو نموذج K8s | المصادر المفتوحة | خدمة قياسية، خطافات جر، قابلة للتوسيع. |
| مكتبات البحث عن المتجهات | بناة RAG | المصادر المفتوحة | تشابه سريع، متوافق مع وحدة معالجة الرسومات. |
| مخازن المتجهات المُدارة | فرق RAG المؤسسية | مستويات مدفوعة | الفهارس بدون خوادم، والتصفية، والموثوقية على نطاق واسع. |
نعم، تبدو الصياغة غير متناسقة. عادةً ما تكون خيارات الأدوات غير متناسقة.
قياس النجاح دون الغرق في الأرقام 📏
تعتمد المقاييس المهمة على السياق، ولكنها عادةً ما تكون مزيجًا مما يلي:
-
جودة التنبؤ: الدقة، الاستدعاء، F1، المعايرة.
-
النظام + المستخدم: زمن الاستجابة، النسبة المئوية 95/99، معدل التحويل، معدلات الإنجاز.
-
مؤشرات العدالة: التكافؤ، التأثير المتباين - تستخدم بعناية [1][2].
توجد المقاييس لكشف المفاضلات. إذا لم تفعل ذلك، فاستبدلها.
أنماط التعاون: إنها رياضة جماعية 🧑🤝🧑
عادةً ما يجلس مهندسو الذكاء الاصطناعي عند نقطة التقاء مع:
-
فريق المنتج والمجال (تحديد النجاح، والضوابط).
-
مهندسو البيانات (المصادر، المخططات، اتفاقيات مستوى الخدمة).
-
الأمن/الشؤون القانونية (الخصوصية، الامتثال).
-
التصميم/البحث (اختبار المستخدم، وخاصة للذكاء الاصطناعي العام).
-
العمليات/هندسة موثوقية الموقع (وقت التشغيل والتدريبات على مكافحة الحرائق).
توقع وجود سبورات بيضاء مغطاة بالخربشات ومناقشات حادة بين الحين والآخر حول المقاييس - إنه أمر صحي.
المخاطر: مستنقع الديون التقنية 🧨
تجذب أنظمة التعلم الآلي ديونًا خفية: إعدادات متشابكة، تبعيات هشة، نصوص ربط مهملة. يقوم المحترفون بوضع ضوابط وقائية - اختبارات البيانات، إعدادات مكتوبة، عمليات التراجع - قبل أن تتفاقم المشكلة. [5]
ممارسات للحفاظ على سلامة العقل: ممارسات تساعد 📚
-
ابدأ بخطوات صغيرة. أثبت أن خط الأنابيب يعمل قبل تعقيد النماذج.
-
خطوط أنابيب MLOps. التكامل المستمر للبيانات/النماذج، والنشر المستمر للخدمات، والاختبار المستمر لإعادة التدريب.
-
قوائم التحقق الخاصة بالذكاء الاصطناعي المسؤول. مرتبطة بمؤسستك، مع وثائق مثل بطاقات النموذج وجداول البيانات [1][3][4].
إعادة صياغة سريعة للأسئلة الشائعة: إجابة من جملة واحدة 🥡
يقوم مهندسو الذكاء الاصطناعي ببناء أنظمة شاملة مفيدة وقابلة للاختبار والنشر وآمنة إلى حد ما - مع توضيح المقايضات حتى لا يكون أحد في الظلام.
باختصار شديد 🎯
-
إنهم يحوّلون المشكلات الغامضة إلى أنظمة ذكاء اصطناعي موثوقة من خلال العمل على البيانات، والنمذجة، وعمليات التعلم الآلي، والمراقبة.
-
الأفضل هو البدء بالبساطة، والقياس بلا هوادة، وتوثيق الافتراضات.
-
الذكاء الاصطناعي للإنتاج = خطوط الأنابيب + المبادئ (التكامل المستمر/التسليم المستمر/الاختبار المستمر، والإنصاف عند الحاجة، والتفكير في المخاطر بشكل متكامل).
-
الأدوات مجرد أدوات. استخدم الحد الأدنى الذي يمكّنك من إتمام المهمة: التدريب ← التتبع ← الخدمة ← المراقبة.
روابط مرجعية
-
إطار إدارة المخاطر للذكاء الاصطناعي الصادر عن المعهد الوطني للمعايير والتكنولوجيا (NIST) (1.0). رابط
-
مبادئ الذكاء الاصطناعي لمنظمة التعاون الاقتصادي والتنمية. رابط
-
بطاقات النموذج (ميتشل وآخرون، 2019). رابط
-
جداول بيانات مجموعات البيانات (Gebru et al., 2018/2021). رابط
-
الديون التقنية الخفية (سكولي وآخرون، 2015). رابط