كان الذكاء الاصطناعي في السابق يعتمد على الخوادم الضخمة ووحدات معالجة الرسومات السحابية. أما الآن، فهو يتقلص حجمه وينتقل إلى جوار أجهزة الاستشعار. الذكاء الاصطناعي للأنظمة المدمجة مجرد وعد بعيد المنال، بل هو يعمل بالفعل داخل الثلاجات والطائرات المسيّرة والأجهزة القابلة للارتداء... حتى في الأجهزة التي لا تبدو "ذكية" على الإطلاق.
إليكم سبب أهمية هذا التحول، وما الذي يجعله صعباً، وما هي الخيارات التي تستحق وقتكم.
مقالات قد ترغب في قراءتها بعد هذه المقالة:
🔗 أفضل أدوات حوكمة الذكاء الاصطناعي لضمان أنظمة ذكاء اصطناعي متوافقة مع المعايير الأخلاقية وشفافة
دليل للأدوات التي تساعد في الحفاظ على الذكاء الاصطناعي الأخلاقي والمتوافق مع المعايير والشفاف.
🔗 تخزين الكائنات للذكاء الاصطناعي: خيارات، خيارات، خيارات
مقارنة خيارات تخزين الكائنات المصممة خصيصًا لأحمال عمل الذكاء الاصطناعي.
🔗 متطلبات تخزين البيانات للذكاء الاصطناعي: ما تحتاج حقًا إلى معرفته
العوامل الرئيسية التي يجب مراعاتها عند التخطيط لتخزين بيانات الذكاء الاصطناعي.
الذكاء الاصطناعي للأنظمة المدمجة 🌱
الأجهزة المدمجة صغيرة الحجم، وغالبًا ما تعمل بالبطارية، ومحدودة الموارد. ومع ذلك، يحقق الذكاء الاصطناعي مكاسب كبيرة:
-
اتخاذ القرارات في الوقت الفعلي دون الحاجة إلى عمليات نقل البيانات عبر السحابة.
-
الخصوصية بالتصميم - يمكن أن تبقى البيانات الأولية على الجهاز.
-
تقليل زمن الاستجابة عندما تكون أجزاء الثانية مهمة.
-
الاستدلال الواعي باستهلاك الطاقة من خلال اختيار دقيق للنموذج والأجهزة.
هذه ليست فوائد غير مفهومة: إن دفع الحوسبة إلى الحافة يقلل من الاعتماد على الشبكة ويعزز الخصوصية للعديد من حالات الاستخدام [1].
لا يكمن السر في القوة الغاشمة، بل في استخدام الموارد المحدودة بذكاء. تخيل أنك تجري ماراثوناً حاملاً حقيبة ظهر... ويستمر المهندسون في إزالة الطوب.
جدول مقارنة سريع لتقنيات الذكاء الاصطناعي للأنظمة المدمجة 📝
| أداة / إطار عمل | الجمهور المثالي | السعر (تقريبي) | لماذا ينجح الأمر (ملاحظات طريفة) |
|---|---|---|---|
| TensorFlow Lite | المطورون والهواة | حر | خفيف الوزن، محمول، وحدة تحكم مركزية رائعة → تغطية جوالة |
| نبضة الحافة | للمبتدئين والشركات الناشئة | مستويات مجانية | سير عمل يعتمد على السحب والإفلات - مثل "ليغو الذكاء الاصطناعي" |
| منصة Nvidia Jetson | مهندسون بحاجة إلى الطاقة | $$$ (ليس رخيصاً) | وحدة معالجة الرسومات + مسرعات لمعالجة أحمال العمل/الرؤية الثقيلة |
| TinyML (عبر أردوينو) | المعلمون، وصانعو النماذج الأولية | تكلفة منخفضة | ودود؛ مدفوع بالمجتمع ❤️ |
| محرك كوالكوم للذكاء الاصطناعي | مصنعي المعدات الأصلية، ومصنعي الهواتف المحمولة | يختلف | مُسرّع بواسطة وحدة المعالجة العصبية على سنابدراغون - سرعة فائقة |
| ExecuTorch (PyTorch) | مطورو تطبيقات الجوال والحوسبة الطرفية | حر | بيئة تشغيل PyTorch على الجهاز للهواتف/الأجهزة القابلة للارتداء/الأنظمة المدمجة [5] |
(أجل، غير متساوٍ. وكذلك الواقع.)
لماذا يُعدّ الذكاء الاصطناعي على الأجهزة المدمجة مهمًا للصناعة؟ 🏭
ليس مجرد دعاية: ففي خطوط الإنتاج، تكشف النماذج الصغيرة العيوب؛ وفي الزراعة، تحلل العقد منخفضة الطاقة التربة في الحقل؛ وفي المركبات، لا تستطيع ميزات السلامة "الاتصال بالخادم" قبل الكبح. عندما يكون زمن الاستجابة والخصوصية أمرين لا غنى عنهما ، يصبح نقل الحوسبة إلى الحافة أداة استراتيجية [1].
TinyML: البطل الصامت للذكاء الاصطناعي المدمج 🐜
TinyML نماذج على وحدات تحكم دقيقة بذاكرة وصول عشوائي تتراوح من كيلوبايتات إلى بضعة ميغابايتات، ومع ذلك يُنجز مهامًا مثل تحديد الكلمات المفتاحية، والتعرف على الإيماءات، واكتشاف الحالات الشاذة، وغير ذلك الكثير. إنه أشبه بمشاهدة فأر يرفع طوبة. أمر مُرضٍ بشكلٍ غريب.
نموذج ذهني سريع:
-
بصمات البيانات : مدخلات استشعار صغيرة ومتدفقة.
-
النماذج : الشبكات العصبية التلافيفية/الشبكات العصبية المتكررة المدمجة، أو التعلم الآلي الكلاسيكي، أو الشبكات المتفرقة/المكممة.
-
الميزانيات : ملي واط، وليس واط؛ كيلوبايت - ميجابايت، وليس جيجابايت.
خيارات الأجهزة: التكلفة مقابل الأداء ⚔️
يُعد اختيار الأجهزة نقطة ضعف العديد من المشاريع:
-
فئة Raspberry Pi : وحدة معالجة مركزية سهلة الاستخدام ومتعددة الأغراض؛ مناسبة للنماذج الأولية.
-
NVIDIA Jetson : وحدات الذكاء الاصطناعي الطرفية المصممة خصيصًا (مثل Orin) التي توفر عشرات إلى مئات من TOPS للرؤية الكثيفة أو مجموعات النماذج المتعددة - رائعة، ولكنها أغلى ثمناً وأكثر استهلاكًا للطاقة [4].
-
Google Coral (Edge TPU) : مسرع ASIC يوفر ~4 TOPS عند حوالي 2 واط (~2 TOPS/W) للنماذج الكمية - أداء رائع لكل واط عندما يتناسب نموذجك مع القيود [3].
-
معالجات النظام على شريحة الهاتف الذكي (Snapdragon) : تأتي مزودة بوحدات معالجة عصبية ومجموعات تطوير البرامج لتشغيل النماذج بكفاءة على الجهاز.
قاعدة عامة: وازن بين التكلفة، والحرارة، وقدرات الحوسبة. غالبًا ما يكون "جيد بما فيه الكفاية في كل مكان" أفضل من "متطور للغاية، ولكن لا يوجد في أي مكان".
التحديات الشائعة في الذكاء الاصطناعي للأنظمة المدمجة 🤯
يواجه المهندسون بانتظام ما يلي:
-
ذاكرة محدودة : لا تستطيع الأجهزة الصغيرة استضافة نماذج ضخمة.
-
ميزانيات البطارية : كل مللي أمبير مهم.
-
تحسين النموذج:
-
التكميم ← أوزان/تنشيطات int8/float16 أصغر وأسرع.
-
التقليم ← إزالة الأوزان غير المهمة لتحقيق التباعد.
-
التجميع/مشاركة الأوزان ← ضغط إضافي.
هذه تقنيات قياسية لتحسين كفاءة الجهاز [2].
-
-
التوسع : عرض توضيحي لـ Arduino في الفصل الدراسي لا يساوي نظام إنتاج سيارات مع مراعاة السلامة والأمان وقيود دورة الحياة.
تصحيح الأخطاء؟ تخيل أنك تقرأ كتابًا من خلال ثقب المفتاح... وأنت ترتدي قفازات.
تطبيقات عملية ستشاهدون المزيد منها قريباً 🚀
-
أجهزة ذكية قابلة للارتداء تقدم رؤى صحية مباشرة على الجهاز.
-
كاميرات إنترنت الأشياء ترصد الأحداث دون بث لقطات خام مباشرة.
-
مساعدون صوتيون يعملون دون اتصال بالإنترنت للتحكم بدون استخدام اليدين - لا يعتمدون على السحابة.
-
طائرات بدون طيار ذاتية القيادة لأغراض التفتيش والتوصيل والزراعة الدقيقة.
باختصار: الذكاء الاصطناعي يقترب حرفياً - إلى معاصمنا، ومطابخنا، وعبر بنيتنا التحتية.
كيف يمكن للمطورين البدء 🛠️
-
ابدأ باستخدام TensorFlow Lite للحصول على أدوات واسعة وتغطية MCU→الأجهزة المحمولة؛ قم بتطبيق التكميم/التقليم مبكرًا [2].
-
استكشف ExecuTorch إذا كنت تعيش في بيئة PyTorch وتحتاج إلى وقت تشغيل خفيف على الجهاز عبر الأجهزة المحمولة والمدمجة [5].
-
جرّب مجموعات Arduino + TinyML لإنشاء نماذج أولية سريعة وممتعة.
-
هل تفضل استخدام مسارات البيانات المرئية؟ خدمة Edge Impulse على تقليل العوائق من خلال جمع البيانات والتدريب والنشر.
-
تعامل مع الأجهزة كمواطن من الدرجة الأولى - قم بإنشاء نموذج أولي على وحدات المعالجة المركزية، ثم تحقق من صحة النموذج على مسرعك المستهدف (Edge TPU، Jetson، NPU) لتأكيد زمن الوصول، والحرارة، واختلافات الدقة.
مقطع قصير: يقوم فريق بشحن كاشف شذوذ الاهتزازات على مستشعر خلية زر. نموذج float32 لا يفي بميزانية الطاقة؛ يقلل تكميم int8 من الطاقة لكل استدلال، ويقلل التقليم من الذاكرة، وينهي دورة تشغيل وحدة التحكم الدقيقة المهمة - لا حاجة إلى شبكة [2،3].
الثورة الهادئة للذكاء الاصطناعي في الأنظمة المدمجة 🌍
تتعلم المعالجات الصغيرة منخفضة التكلفة كيفية الاستشعار والتفكير والتنفيذ محليًا. سيظل عمر البطارية مصدر قلق دائم، لكن المسار واضح: نماذج أكثر دقة، ومترجمات أفضل، ومسرعات أكثر ذكاءً. والنتيجة؟ تقنية تبدو أكثر شخصية واستجابة لأنها لا تكتفي بالاتصال فحسب، بل تُولي اهتمامًا حقيقيًا.
مراجع
[1] معهد معايير الاتصالات الأوروبي (ETSI) (الحوسبة الطرفية متعددة الوصول) - فوائد زمن الاستجابة/الخصوصية وسياق الصناعة.
نظرة عامة على الورقة البيضاء الجديدة لمعهد معايير الاتصالات الأوروبي (ETSI) حول الحوسبة الطرفية
[2] مجموعة أدوات تحسين نماذج TensorFlow من جوجل - التكميم، والتقليم، والتجميع لتحسين كفاءة الجهاز.
دليل تحسين نماذج TensorFlow
[3] وحدة معالجة الحوسبة الطرفية (TPU) من جوجل كورال إيدج - قياسات الأداء/الاستهلاك لتسريع الحوسبة الطرفية.
معايير أداء وحدة معالجة الحوسبة الطرفية (TPU).
[4] NVIDIA Jetson Orin (رسمي) - وحدات الذكاء الاصطناعي الطرفية ونطاقات الأداء.
نظرة عامة على وحدات Jetson Orin
[5] PyTorch ExecuTorch (الوثائق الرسمية) - بيئة تشغيل PyTorch على الجهاز للأجهزة المحمولة والحافة.
نظرة عامة على ExecuTorch