هل تساءلت يومًا ما هو سرّ مصطلح "مهندس الذكاء الاصطناعي"؟ أنا أيضًا تساءلت. ظاهريًا، يبدو الأمر براقًا، لكنه في الواقع مزيج من التصميم، ومعالجة البيانات غير المترابطة، وربط الأنظمة ببعضها، والتحقق بشكل مهووس مما إذا كانت الأمور تعمل كما ينبغي. إذا كنت ترغب في نسخة مختصرة: فهم يحولون المشاكل الضبابية إلى أنظمة ذكاء اصطناعي فعّالة لا تنهار عند ظهور المستخدمين الحقيقيين. أما النسخة الأطول والأكثر فوضوية - حسنًا، هذا ما ستجده أدناه. ☕
مقالات قد ترغب في قراءتها بعد هذه المقالة:
🔗 أدوات الذكاء الاصطناعي للمهندسين: تعزيز الكفاءة والابتكار
اكتشف أدوات الذكاء الاصطناعي القوية التي تعمل على تعزيز إنتاجية الهندسة والإبداع.
🔗 هل سيتم استبدال مهندسي البرمجيات بالذكاء الاصطناعي؟
اكتشف مستقبل هندسة البرمجيات في عصر الأتمتة.
🔗 تطبيقات الذكاء الاصطناعي الهندسية في تحويل الصناعات
تعرف على كيفية إعادة تشكيل الذكاء الاصطناعي للعمليات الصناعية وتحفيز الابتكار.
🔗 كيف تصبح مهندس ذكاء اصطناعي
دليل خطوة بخطوة لبدء رحلتك نحو مهنة في هندسة الذكاء الاصطناعي.
نظرة سريعة: ما يفعله مهندس الذكاء الاصطناعي حقًا 💡
في أبسط مستوياته، يقوم مهندس الذكاء الاصطناعي بتصميم وبناء وشحن وصيانة أنظمة الذكاء الاصطناعي. وتشمل مهامه اليومية عادةً ما يلي:
-
ترجمة احتياجات المنتج أو العمل الغامضة إلى شيء يمكن للنماذج التعامل معه بالفعل.
-
جمع البيانات ووضع العلامات عليها وتنظيفها وإعادة فحصها - حتمًا - عندما تبدأ في الانحراف عن المسار.
-
اختيار النماذج وتدريبها، والحكم عليها باستخدام المقاييس الصحيحة، وتدوين مواطن الفشل فيها.
-
تغليف كل شيء في خطوط أنابيب MLOps حتى يمكن اختباره ونشره ومراقبته.
-
مشاهدته في البرية: الدقة، والسلامة، والإنصاف... والتعديل قبل أن يخرج عن مساره.
إذا كنت تفكر "إنها إذن هندسة برمجيات بالإضافة إلى علم البيانات مع قليل من التفكير في المنتج" - نعم، هذا هو شكل الأمر تقريبًا.
ما الذي يميز الجيدين عن الباقي ✅
يمكنك الاطلاع على كل ورقة بحثية في الهندسة المعمارية نُشرت منذ عام ٢٠١٧، ومع ذلك تُنشئ فوضى هشة. عادةً ما يكون الأشخاص الذين ينجحون في هذا الدور:
-
فكّر في الأنظمة. إنهم يرون الحلقة بأكملها: البيانات الداخلة، والقرارات الخارجة، وكل شيء قابل للتتبع.
-
لا تطارد السحر أولًا. حدّد الخطوط الأساسية واختبرها ببساطة قبل أن تُكثّف التعقيد.
-
أضف ملاحظاتك. إعادة التدريب والتراجع ليسا إضافات، بل هما جزء من التصميم.
-
دوّن كل شيء. التنازلات، والافتراضات، والقيود - مُملّة، لكنها ستُصبح ذهبًا لاحقًا.
-
تعامل مع الذكاء الاصطناعي المسؤول بجدية. المخاطر لا تختفي بالتفاؤل، بل تُسجَّل وتُدار.
قصة قصيرة: بدأ أحد فرق الدعم بقواعد بسيطة وخط أساس للاسترجاع. هذا منحهم اختبارات قبول واضحة، لذا عندما استبدلوا نموذجًا كبيرًا لاحقًا، كانت لديهم مقارنات واضحة، وطريقة سهلة للرجوع إليها عند حدوث أي خطأ.
دورة الحياة: الواقع الفوضوي مقابل المخططات الأنيقة 🔁
-
حدّد المشكلة. حدّد الأهداف والمهام، وما هو "الجيد بما فيه الكفاية".
-
نظّف البيانات ، صنّفها، قسّمها، نسّقها. تحقق منها باستمرار لاكتشاف أي انحراف في المخطط.
-
نظّم تجارب نموذجية. جرّب تجارب بسيطة، اختبر النتائج الأساسية، كرّرها، وثّقها.
-
شحنها. خطوط أنابيب CI/CD/CT، والنشر الآمن، والكناري، والتراجعات.
-
راقب. راقب الدقة، وزمن الوصول، والانحراف، والإنصاف، ونتائج المستخدمين. ثم أعد التدريب.
على الشريحة، يبدو هذا كدائرة مرتبة. عمليًا، يشبه الأمر رمي المعكرونة بالمكنسة.
الذكاء الاصطناعي المسؤول عندما يصل المطاط إلى الطريق 🧭
الأمر لا يتعلق بعروض تقديمية جذابة. يعتمد المهندسون على الأطر لجعل المخاطر حقيقية:
-
عمل إدارة المخاطر للذكاء الاصطناعي التابع للمعهد الوطني للمعايير والتكنولوجيا (NIST) هيكلًا لتحديد المخاطر وقياسها ومعالجتها عبر التصميم من خلال النشر [1].
-
مبادئ منظمة التعاون الاقتصادي والتنمية مثل البوصلة - وهي مبادئ توجيهية واسعة النطاق تتوافق معها العديد من المنظمات [2].
كما تقوم العديد من الفرق أيضًا بإنشاء قوائم التحقق الخاصة بها (مراجعات الخصوصية، وبوابات الحلقة البشرية) المرتبطة بهذه الدورات الحياتية.
المستندات التي لا تبدو اختيارية: بطاقات النماذج وبيانات المواصفات 📝
قطعتان من الأوراق التي ستشكر نفسك عليها لاحقًا:
-
بطاقات نموذجية ← توضح الاستخدام المقصود، وسياقات التقييم، والتحذيرات. كُتبت بحيث يمكن للمسؤولين عن المنتج/الشؤون القانونية متابعتها أيضًا [3].
-
أوراق البيانات الخاصة بمجموعات البيانات → شرح سبب وجود البيانات، وما تحتويه، والتحيزات المحتملة، والاستخدامات الآمنة مقابل غير الآمنة [4].
في المستقبل - أنت (وزملائك في الفريق في المستقبل) سوف تحييك بصمت على كتابتها.
الغوص العميق: خطوط أنابيب البيانات والعقود والإصدارات 🧹📦
تصبح البيانات جامحة. يُطبّق مهندسو الذكاء الاصطناعي الأذكياء العقود، ويُجرّبون عمليات التحقق، ويُحافظون على إصدارات مرتبطة بالشيفرة البرمجية لتتمكن من إرجاعها لاحقًا.
-
التحقق من الصحة → ترميز المخطط والنطاقات والنضارة؛ إنشاء المستندات تلقائيًا.
-
الإصدارات → قم بترتيب مجموعات البيانات والنماذج مع عمليات الالتزام الخاصة بـ Git، حتى يكون لديك سجل تغييرات يمكنك الوثوق به بالفعل.
مثال بسيط: قام أحد تجار التجزئة بتعطيل عمليات التحقق من المخططات لمنع تدفقات الموردين المليئة بالبيانات الفارغة. أدى هذا العطل البسيط إلى إيقاف الانخفاضات المتكررة في معدل الاستدعاء @ k قبل أن يلاحظها العملاء.
الغوص العميق: الشحن والتوسع 🚢
تشغيل نموذج في prod لا يقتصر على model.fit() . تتضمن مجموعة الأدوات هنا:
-
Docker للتعبئة والتغليف المتسقة.
-
Kubernetes للتنسيق والتوسع والطرح الآمن.
-
أطر عمل MLOps للكناري، وتقسيمات A/B، واكتشاف القيم المتطرفة.
خلف الكواليس، هناك فحوصات صحة، وتتبع، وجدولة وحدة المعالجة المركزية مقابل وحدة معالجة الرسومات، وضبط مهلة الانتظار. ليس أمرًا جذابًا، ولكنه ضروري للغاية.
الغوص العميق: أنظمة GenAI وRAG 🧠📚
تقدم الأنظمة التوليدية تطوراً آخر - التأريض الاسترجاعي.
-
البحث عن التضمينات + المتجهات للبحث عن عمليات التشابه بسرعة.
-
تنسيق المكتبات لاسترجاع السلسلة، واستخدام الأدوات، ومرحلة ما بعد المعالجة.
الاختيارات في التقسيم وإعادة التصنيف والتقييم - هذه المكالمات الصغيرة تقرر ما إذا كنت ستحصل على روبوت محادثة غير فعال أو مساعد طيار مفيد.
المهارات والأدوات: ما هو موجود بالفعل في المجموعة 🧰
حقيبة مختلطة من أدوات التعلم الآلي الكلاسيكية والتعلم العميق:
-
الأطر: PyTorch، TensorFlow، scikit-learn.
-
خطوط الأنابيب: تدفق الهواء، وما إلى ذلك، للوظائف المجدولة.
-
الإنتاج: Docker، K8s، أطر الخدمة.
-
إمكانية المراقبة: أجهزة مراقبة الانجراف، ومتتبعات زمن الوصول، وفحوصات العدالة.
لا أحد يستخدم كل شيء . تكمن الحيلة في معرفة ما يكفي من المعلومات حول دورة حياة المنتج للتفكير بشكل منطقي.
جدول الأدوات: ما الذي يبحث عنه المهندسون حقًا 🧪
| أداة | جمهور | سعر | لماذا هو مفيد |
|---|---|---|---|
| باي تورش | الباحثون والمهندسون | مفتوح المصدر | شبكات مرنة، بايثونية، مجتمع ضخم، مخصصة. |
| تينسور فلو | الفرق التي تميل إلى المنتج | مفتوح المصدر | عمق النظام البيئي، وخدمة TF وLite للنشر. |
| scikit-learn | مستخدمو ML الكلاسيكيون | مفتوح المصدر | خطوط أساسية رائعة، وواجهة برمجة تطبيقات أنيقة، ومعالجة مسبقة مدمجة. |
| إم إل فلو | فرق لديها العديد من التجارب | مفتوح المصدر | يحافظ على تنظيم التشغيلات والنماذج والتحف. |
| تدفق الهواء | أهل خطوط الأنابيب | مفتوح المصدر | DAGs، والجدولة، والقدرة على الملاحظة جيدة بما فيه الكفاية. |
| عامل ميناء | اساسا الجميع | النواة الحرة | نفس البيئة (في الغالب). مشاكل أقل تتعلق بـ "يعمل فقط على جهاز الكمبيوتر المحمول". |
| كوبيرنيتس | فرق البنية التحتية الثقيلة | مفتوح المصدر | التوسع التلقائي، وعمليات الطرح، والقوة على مستوى المؤسسة. |
| نموذج يخدم على K8s | مستخدمو طراز K8s | مفتوح المصدر | خدمة قياسية، خطافات الانجراف، قابلة للتطوير. |
| مكتبات البحث عن المتجهات | بناة RAG | مفتوح المصدر | تشابه سريع، صديق لوحدة معالجة الرسومات. |
| مخازن المتجهات المُدارة | فرق Enterprise RAG | المستويات المدفوعة | الفهرس بدون خادم، والتصفية، والموثوقية على نطاق واسع. |
نعم، يبدو أن الصياغة غير متوازنة. عادةً ما تكون اختيارات الأدوات غير متوازنة.
قياس النجاح دون الغرق في الأرقام 📏
تعتمد المقاييس المهمة على السياق، ولكنها عادةً ما تكون مزيجًا من:
-
جودة التنبؤ: الدقة، التذكير، F1، المعايرة.
-
النظام + المستخدم: زمن الوصول، p95/p99، رفع التحويل، معدلات الإكمال.
-
مؤشرات العدالة: التكافؤ، التأثير غير المتساوي - تستخدم بعناية [1][2].
المقاييس موجودة لإظهار التنازلات. إذا لم تكن كذلك، فاستبدلها.
أنماط التعاون: إنها رياضة جماعية 🧑🤝🧑
يجلس مهندسو الذكاء الاصطناعي عادةً عند التقاطع مع:
-
الأشخاص المسؤولون عن المنتج والمجال (تعريف النجاح، الحواجز الواقية).
-
مهندسو البيانات (المصادر، المخططات، اتفاقيات مستوى الخدمة).
-
الأمن/القانوني (الخصوصية، الامتثال).
-
التصميم/البحث (اختبار المستخدم، وخاصة بالنسبة لـ GenAI).
-
عمليات/ تدريبات الاستعداد للطوارئ ومكافحة الحرائق.
توقع وجود لوحات بيضاء مغطاة بالكتابات العشوائية ومناقشات حادة حول القياسات المترية من حين لآخر - فهذا أمر صحي.
المزالق: مستنقع الديون الفنية 🧨
تجتذب أنظمة التعلم الآلي ديونًا خفية: تكوينات متشابكة، وتبعيات هشة، ونصوص برمجية منسية. يُنشئ المحترفون حواجز أمان - اختبارات البيانات، وتكوينات مكتوبة، وعمليات استعادة - قبل أن يتفاقم الوضع. [5]
حُماة العقل: ممارسات تُساعد 📚
-
ابدأ بخطوات صغيرة. أثبت نجاح خط الأنابيب قبل تعقيد النماذج.
-
خطوط أنابيب MLOps. CI للبيانات/النماذج، CD للخدمات، CT لإعادة التدريب.
-
قوائم مرجعية للذكاء الاصطناعي المسؤول. مُصممة خصيصًا لمؤسستك، مع مستندات مثل بطاقات النماذج وأوراق البيانات [1][3][4].
إعادة سريعة للأسئلة الشائعة: إجابة من جملة واحدة 🥡
يقوم مهندسو الذكاء الاصطناعي ببناء أنظمة شاملة مفيدة وقابلة للاختبار وقابلة للنشر وآمنة إلى حد ما - مع جعل المقايضات واضحة حتى لا يظل أحد في الظلام.
ملخص 🎯
-
إنهم يأخذون المشاكل الغامضة → أنظمة الذكاء الاصطناعي الموثوقة من خلال العمل بالبيانات والنمذجة و MLOps والمراقبة.
-
من الأفضل أن تبقي الأمر بسيطًا أولًا، ثم تقوم بالقياس بلا هوادة، وتوثق الافتراضات.
-
الذكاء الاصطناعي في الإنتاج = خطوط الأنابيب + المبادئ (CI/CD/CT، والعدالة حيثما لزم الأمر، والتفكير في المخاطر).
-
الأدوات مجرد أدوات. استخدم الحد الأدنى الذي يُمكّنك من: التدريب ← المسار ← الخدمة ← المراقبة.
روابط مرجعية
-
NIST AI RMF (1.0). رابط
-
مبادئ منظمة التعاون الاقتصادي والتنمية للذكاء الاصطناعي. الرابط
-
بطاقات النماذج (ميتشل وآخرون، ٢٠١٩). رابط
-
جداول بيانات مجموعات البيانات (Gebru et al., 2018/2021). رابط
-
الديون الفنية المخفية (سكولي وآخرون، 2015). رابط