ما هو Edge AI؟

ما هو Edge AI؟

يُعزز الذكاء الاصطناعي الحافة الذكاء الاصطناعي في أماكن توليد البيانات. قد يبدو الأمر مُبهرًا، لكن الفكرة الأساسية بسيطة: فكّر مباشرةً بجوار المستشعر، بحيث تظهر النتائج الآن، لا لاحقًا. ستحصل على السرعة والموثوقية وخصوصية مُرضية دون أن تُراقب السحابة كل قرار. لنبدأ بشرحها - بما في ذلك الاختصارات والمهام الجانبية. 😅

مقالات قد ترغب في قراءتها بعد هذه المقالة:

🔗 ما هو الذكاء الاصطناعي التوليدي
شرح واضح للذكاء الاصطناعي التوليدي، وكيفية عمله، واستخداماته العملية.

🔗 ما هو الذكاء الاصطناعي الوكيل
نظرة عامة على الذكاء الاصطناعي الوكيل والسلوكيات المستقلة وأنماط التطبيق في العالم الحقيقي.

🔗 ما هي قابلية التوسع للذكاء الاصطناعي
تعرف على كيفية توسيع نطاق أنظمة الذكاء الاصطناعي بشكل موثوق وفعال وبتكلفة فعالة.

🔗 ما هو إطار عمل البرمجيات للذكاء الاصطناعي؟
تفصيل أطر عمل برمجيات الذكاء الاصطناعي، وفوائد بنيتها، وأساسيات التنفيذ.

ما هو الذكاء الاصطناعي الحافة؟ تعريف سريع 🧭

الذكاء الاصطناعي الطرفي (Edge AI) هو ممارسة تشغيل نماذج تعلم آلي مُدرَّبة مباشرةً على الأجهزة التي تجمع البيانات أو بالقرب منها، مثل الهواتف والكاميرات والروبوتات والسيارات والأجهزة القابلة للارتداء وأجهزة التحكم الصناعية، وغيرها. بدلاً من إرسال البيانات الخام إلى خوادم بعيدة لتحليلها، يُعالج الجهاز المُدخلات محليًا ويُرسل ملخصات فقط أو لا شيء على الإطلاق. رحلات ذهاب وعودة أقل، وتأخير أقل، وتحكم أكبر. إذا كنت ترغب في شرح واضح ومحايد للمورد، فابدأ من هنا. [1]

 

الذكاء الاصطناعي الطرفي

ما الذي يجعل الذكاء الاصطناعي الحافة مفيدًا حقًا؟ 🌟

  • زمن انتقال منخفض - تحدث القرارات على الجهاز، لذا فإن الاستجابات تبدو فورية لمهام الإدراك مثل اكتشاف الكائنات، أو تحديد كلمات التنبيه، أو تنبيهات الشذوذ. [1]

  • الخصوصية حسب الموقع - يمكن أن تبقى البيانات الحساسة على الجهاز، مما يقلل من التعرض ويساعد في مناقشات تقليل البيانات. [1]

  • توفير النطاق الترددي - إرسال الميزات أو الأحداث بدلاً من التدفقات الخام. [1]

  • المرونة - تعمل أثناء الاتصال غير المستقر.

  • التحكم في التكاليف - دورات حوسبة سحابية أقل وخروج أقل.

  • الوعي بالسياق - الجهاز "يشعر" بالبيئة ويتكيف معها.

حكاية سريعة: استبدل برنامج تجريبي في مجال البيع بالتجزئة عمليات تحميل الكاميرات الثابتة بتصنيف الأشخاص مقابل الأشياء على الجهاز، ونشر فقط إحصاءات كل ساعة ومقاطع الاستثناءات. النتيجة: تنبيهات أقل من 200 مللي ثانية عند حافة الرف، وانخفاض بنسبة 90% تقريبًا في حركة البيانات الصاعدة - دون تغيير عقود شبكة WAN الخاصة بالمتجر. (الطريقة: الاستدلال المحلي، تجميع الأحداث، الشذوذ فقط).

الذكاء الاصطناعي الحافة مقابل الذكاء الاصطناعي السحابي - المقارنة السريعة 🥊

  • أين تحدث عملية الحوسبة: الحافة = على الجهاز/بالقرب من الجهاز؛ السحابة = مراكز البيانات البعيدة.

  • زمن الاستجابة: الحافة ≈ الوقت الحقيقي؛ السحابة لديها رحلات ذهاب وإياب.

  • نقل البيانات: تقوم الحافة بتصفية/ضغط البيانات أولاً؛ تحب السحابة عمليات التحميل ذات الدقة الكاملة.

  • الموثوقية: تظل الحافة تعمل دون اتصال بالإنترنت؛ وتحتاج السحابة إلى الاتصال.

  • الحوكمة: تدعم الحافة تقليل البيانات؛ وتعمل السحابة على مركزية الإشراف. [1]

ليس الأمر إما هذا أو ذاك. تجمع الأنظمة الذكية بين الأمرين: قرارات سريعة محليًا، وتحليلات أعمق، وتعلم الأسطول مركزيًا. الحل الهجين ممل، ولكنه صحيح.

كيف تعمل تقنية Edge AI في الواقع تحت الغطاء 🧩

  1. أجهزة الاستشعار بالتقاط الإشارات الخام - إطارات الصوت، وبكسلات الكاميرا، وصنابير وحدة قياس القصور الذاتي، وآثار الاهتزاز.

  2. تعمل المعالجة المسبقة على إعادة تشكيل هذه الإشارات إلى ميزات صديقة للنموذج.

  3. وقت تشغيل الاستدلال بتنفيذ نموذج مضغوط على الجهاز باستخدام المسرعات عند توفرها.

  4. عملية ما بعد المعالجة بتحويل المخرجات إلى أحداث أو علامات أو إجراءات تحكم.

  5. بيانات القياس عن بعد بتحميل سوى ما هو مفيد: الملخصات، والشذوذات، أو التعليقات الدورية.

تتضمن بيئات التشغيل على الأجهزة الشائعة الاستخدام: LiteRT (المعروفة سابقًا باسم TensorFlow Lite)، و ONNX Runtime، و OpenVINO. تعمل هذه الأدوات على تحسين الإنتاجية بشكل كبير مع تقليل استهلاك الطاقة والذاكرة باستخدام تقنيات مثل التكميم ودمج العمليات. إذا كنت مهتمًا بالتفاصيل التقنية، فستجد وثائقها شاملة ومفيدة. [3][4]

أين يظهر - حالات الاستخدام الحقيقية التي يمكنك الإشارة إليها 🧯🚗🏭

  • الرؤية على الحافة: كاميرات جرس الباب (الأشخاص مقابل الحيوانات الأليفة)، ومسح الرفوف في متاجر التجزئة، والطائرات بدون طيار لاكتشاف العيوب.

  • الصوت على الجهاز: كلمات الاستيقاظ، الإملاء، اكتشاف التسرب في النباتات.

  • إنترنت الأشياء الصناعي: مراقبة المحركات والمضخات بحثًا عن أي تشوهات اهتزازية قبل الفشل.

  • السيارات: مراقبة السائق، واكتشاف المسار، ومساعدة ركن السيارة في أقل من ثانية أو أقل من ثانية.

  • الرعاية الصحية: الأجهزة القابلة للارتداء تحدد عدم انتظام ضربات القلب محليًا؛ مزامنة الملخصات لاحقًا.

  • الهواتف الذكية: تحسين الصور، والكشف عن المكالمات المزعجة، ولحظات "كيف فعل هاتفي ذلك دون اتصال بالإنترنت".

بالنسبة للتعريفات الرسمية (وحديث "الضباب مقابل الحافة")، راجع النموذج المفاهيمي للمعهد الوطني للمعايير والتكنولوجيا. [2]

الأجهزة التي تجعلها سريعة 🔌

يتم التحقق من أسماء بعض المنصات كثيرًا:

  • NVIDIA Jetson - وحدات مدعومة بوحدة معالجة الرسوميات للروبوتات/الكاميرات - أجواء Swiss Army Knife للذكاء الاصطناعي المدمج.

  • Google Edge TPU + LiterRT - استدلال صحيح فعال ووقت تشغيل مبسط للمشاريع منخفضة الطاقة للغاية. [3]

  • Apple Neural Engine (ANE) - برنامج تعلم آلي مدمج في الجهاز لأجهزة iPhone وiPad وMac؛ نشرت Apple أعمالًا عملية حول نشر المحولات بكفاءة على ANE. [5]

  • معالجات Intel/وحدات معالجة الرسومات المدمجة/وحدات معالجة الشبكات العصبية مع OpenVINO - "اكتب مرة واحدة، انشر في أي مكان" عبر أجهزة Intel؛ عمليات تحسين مفيدة.

  • وقت تشغيل ONNX في كل مكان - وقت تشغيل محايد مع موفري تنفيذ قابلين للتوصيل عبر الهواتف وأجهزة الكمبيوتر الشخصية والبوابات. [4]

هل تحتاج إلى جميعها؟ ليس بالضرورة. اختر مسارًا واحدًا قويًا يناسب أسطولك والتزم به، فانخفاض عدد الموظفين هو عدو الفرق المدمجة.

مجموعة البرامج - جولة قصيرة 🧰

  • ضغط النموذج: التكميم (غالبًا إلى int8)، التقليم، التقطير.

  • تسريع على مستوى المشغل: نوى مضبوطة على السيليكون الخاص بك.

  • أوقات التشغيل: LiteRT، ONNX Runtime، OpenVINO. [3][4]

  • غلافات النشر: حاويات/حزم تطبيقات؛ في بعض الأحيان خدمات صغيرة على بوابات.

  • MLOps للحافة: تحديثات نموذج OTA، وطرح A/B، وحلقات القياس عن بعد.

  • ضوابط الخصوصية والأمان: التشفير على الجهاز، والتمهيد الآمن، والمصادقة، والمناطق المعزولة.

حالة مصغرة: قام فريق طائرة بدون طيار للتفتيش بتقطير كاشف ثقيل الوزن وتحويله إلى نموذج طلابي مُكمّم لـ LiterRT، ثم دمج نظام NMS على الجهاز. تحسن وقت الطيران بنسبة 15% تقريبًا بفضل انخفاض استهلاك الحوسبة؛ وانكمش حجم التحميل إلى إطارات استثناء. (الطريقة: التقاط مجموعة البيانات في الموقع، ومعايرة ما بعد الكم، ووضع الظل A/B قبل الإطلاق الكامل).

جدول المقارنة - خيارات Edge AI الشائعة 🧪

حديث حقيقي: هذه الطاولة ذات رأي شخصي وفوضوية بعض الشيء - تمامًا مثل العالم الحقيقي.

أداة / منصة أفضل جمهور تقدير السعر لماذا يعمل على الحافة
LiterRT (TFLite سابقًا) أندرويد، صناع، مضمن من $ إلى $$ وقت تشغيل سريع، مستندات قوية، عمليات تركز على الأجهزة المحمولة. يعمل بكفاءة حتى دون اتصال بالإنترنت. [3]
بيئة تشغيل ONNX فرق متعددة المنصات $ تنسيق محايد، وواجهات خلفية قابلة للتوصيل بالأجهزة - صديقة للمستقبل. [4]
أوبن فينو عمليات النشر المرتكزة على Intel $ مجموعة أدوات واحدة، وأهداف إنتل متعددة؛ وتمريرات تحسين سهلة.
إنفيديا جيتسون الروبوتات، الرؤية الثقيلة $$ إلى $$$ تسريع وحدة معالجة الرسوميات في صندوق الغداء؛ نظام بيئي واسع.
أبل ANE تطبيقات iOS/iPadOS/macOS تكلفة الجهاز تكامل وثيق بين الأجهزة والبرامج؛ عمل محول ANE موثق جيدًا. [5]
حافة TPU + LiterRT مشاريع منخفضة الطاقة للغاية $ استنتاج int8 فعال عند الحافة؛ صغير الحجم ولكنه قادر. [3]

كيفية اختيار مسار الذكاء الاصطناعي الحافة - شجرة قرار صغيرة 🌳

  • هل تُعاني من صعوبة في ضبط حياتك؟ ابدأ بالمُسرِّعات والنماذج الكمومية.

  • أنواع الأجهزة كثيرة؟ يُفضّل ONNX Runtime أو OpenVINO لسهولة الحمل. [4]

  • هل ترغب في شحن تطبيق جوال؟ يُعدّ LiterRT الخيار الأسهل. [3]

  • الروبوتات أم تحليلات الكاميرا؟ عمليات Jetson الملائمة لوحدة معالجة الرسومات توفر الوقت.

  • هل لديكم سياسة خصوصية صارمة؟ حافظوا على البيانات محليًا، وتشفيرها عند السكون، وسجلوا البيانات المجمعة، وليس الإطارات الخام.

  • فريق صغير؟ تجنب الأدوات الغريبة، فالممل جميل.

  • هل تتغير النماذج باستمرار؟ خطط للتحديث عبر الهواء (OTA) والقياس عن بُعد منذ اليوم الأول.

المخاطر والحدود والأجزاء المملة ولكن المهمة 🧯

  • انحراف النموذج - تتغير البيئات؛ مراقبة التوزيعات، وتشغيل أوضاع الظل، وإعادة التدريب بشكل دوري.

  • أسقف الحوسبة - الذاكرة الضيقة/قوة الطاقة تفرض نماذج أصغر أو دقة مريحة.

  • الأمان - افتراض الوصول المادي؛ استخدام التمهيد الآمن، والقطع الأثرية الموقعة، والإثبات، والخدمات ذات الامتيازات الأقل.

  • حوكمة البيانات - تساعد المعالجة المحلية، ولكنك لا تزال بحاجة إلى الموافقة والاحتفاظ والقياس عن بعد النطاقي.

  • عمليات الأسطول - تصبح الأجهزة غير متصلة بالإنترنت في أسوأ الأوقات؛ قم بتصميم التحديثات المؤجلة والتحميلات القابلة للاستئناف.

  • مزيج المواهب - المضمن + ML + DevOps هو طاقم متنوع؛ قم بالتدريب المتبادل في وقت مبكر.

خريطة طريق عملية لتوصيل شيء مفيد 🗺️

  1. اختر حالة استخدام واحدة مع اكتشاف عيب القيمة القابلة للقياس على الخط 3، وكلمة التنبيه على مكبر الصوت الذكي، وما إلى ذلك.

  2. جمع مجموعة بيانات مرتبة تعكس البيئة المستهدفة؛ وحقن الضوضاء لتتناسب مع الواقع.

  3. النموذج الأولي على مجموعة أدوات تطوير قريبة من أجهزة الإنتاج.

  4. ضغط النموذج باستخدام التكميم/التقليم؛ قياس فقدان الدقة بصدق. [3]

  5. لف الاستدلال في واجهة برمجة تطبيقات نظيفة مع الضغط الخلفي والمراقبين - لأن الأجهزة تتوقف في الساعة 2 صباحًا

  6. تصميم قياس عن بعد يحترم الخصوصية: إرسال الأعداد، والمخططات البيانية، والميزات المستخرجة من الحافة.

  7. تعزيز الأمان: الملفات الثنائية الموقعة، التمهيد الآمن، والخدمات الدنيا المفتوحة.

  8. خطة OTA: عمليات طرح متدرجة، وإصدارات تجريبية، وتراجع فوري.

  9. قم بتجربة الطائرة في حالة نادرة ومعقدة أولاً - إذا نجحت في تلك الحالة، فستنجح في أي مكان.

  10. التوسع باستخدام دليل العمل: كيف ستضيف النماذج، وتدوير المفاتيح، وأرشفة البيانات - حتى لا يكون المشروع رقم 2 فوضى.

الأسئلة الشائعة - إجابات مختصرة على ماهية الذكاء الاصطناعي على الحافة ❓

هل يقتصر الذكاء الاصطناعي على الحافة على تشغيل نموذج صغير على حاسوب صغير؟
في الغالب، نعم - لكن الحجم ليس كل شيء. فالأمر يتعلق أيضاً بميزانيات زمن الاستجابة، وتعهدات الخصوصية، وتنسيق عمل العديد من الأجهزة محلياً مع تعلمها عالمياً. [1]

هل يُمكنني التدريب على الحافة أيضًا؟
يتوفر تدريب/تخصيص خفيف على الجهاز؛ أما التدريب الأكثر كثافة فيتم مركزيًا. تُوثّق ONNX Runtime خيارات التدريب على الجهاز إذا كنتَ مُغامرًا. [4]

ما الفرق بين الذكاء الاصطناعي الطرفي والحوسبة الضبابية؟
الضباب والحوسبة الحافة قريبان. كلاهما يُقرّب الحوسبة من مصادر البيانات، أحيانًا عبر بوابات قريبة. للاطلاع على التعريفات الرسمية والسياق، انظر المعهد الوطني للمعايير والتكنولوجيا. [2]

هل تُحسّن تقنيات الذكاء الاصطناعي على الحافة الخصوصية دائمًا؟
إنها تُساعد، لكنها ليست سحرًا. ما زلتَ بحاجة إلى تقليل البيانات المُخزّنة، ومسارات تحديث آمنة، وتسجيل دقيق للبيانات. تعامل مع الخصوصية كعادة، لا كخيارٍ مُؤقت.

غوص عميق قد تقرأه بالفعل 📚

1) تحسين النموذج الذي لا يؤثر على الدقة

قد يُقلل التكميم من سعة الذاكرة ويُسرّع العمليات، ولكن معايرته ببيانات تمثيلية قد يُوهم النموذج بوجود سناجب في أماكن وجود مخاريط مرورية. غالبًا ما يُحافظ التكميم - كمعلم يُرشد طالبًا أصغر حجمًا - على الدلالات اللغوية. [3]

2) أوقات تشغيل استنتاج الحافة في الممارسة العملية

مُفسِّر LiterRT يُجري عمدًا عملية تحويل ذاكرة خالية من السكون أثناء التشغيل. يتصل ONNX Runtime بمُسرِّعات مختلفة عبر مُزوِّدي التنفيذ. كلاهما ليس حلاً سحريًا، بل مُثبِّتٌ قوي. [3][4]

3) المتانة في البرية

الحرارة، الغبار، انقطاع الطاقة، وشبكة واي فاي عشوائية: بناء مراقبين يُعيدون تشغيل خطوط الأنابيب، ويخزنون القرارات مؤقتًا، ويُعيدون الاتصال عند عودة الشبكة. مع ذلك، أقل جاذبية من لفت الانتباه، ولكنه أكثر أهمية.

العبارة التي ستكررها في الاجتماعات: ما هو الذكاء الاصطناعي على الحافة ؟ 🗣️

يُقرّب الذكاء الاصطناعي الحافة الذكاء من البيانات لتلبية القيود العملية المتعلقة بزمن الوصول والخصوصية وعرض النطاق الترددي والموثوقية. لا يكمن السر في شريحة واحدة أو إطار عمل واحد، بل في الاختيار الحكيم لما يُحوسب وأين.

ملاحظات ختامية - طويل جدًا، لم أقرأه 🧵

تُشغّل تقنية الذكاء الاصطناعي على الحافة نماذجها بالقرب من البيانات، مما يجعل المنتجات سريعة وآمنة وموثوقة. ستجمع بين الاستدلال المحلي والإشراف السحابي لتحقيق أفضل النتائج. اختر بيئة تشغيل تتناسب مع أجهزتك، واستفد من المعالجات المُسرّعة كلما أمكن، وحافظ على نماذجك مُنظّمة باستخدام الضغط، وصمّم عمليات أسطولك كما لو أن وظيفتك تعتمد عليها - لأنها كذلك بالفعل. إذا سألك أحدهم: ما هو الذكاء الاصطناعي على الحافة؟ قل: قرارات ذكية، تُتخذ محليًا، وفي الوقت المناسب. ثم ابتسم وغيّر الموضوع إلى البطاريات. 🔋🙂


مراجع

  1. IBM - ما هو الذكاء الاصطناعي الحافة؟ (التعريف، الفوائد).
    https://www.ibm.com/think/topics/edge-ai

  2. المعهد الوطني للمعايير والتكنولوجيا - SP 500-325: نموذج مفاهيمي لحوسبة الضباب (السياق الرسمي للضباب/الحافة).
    https://csrc.nist.gov/pubs/sp/500/325/final

  3. Google AI Edge - LiterRT (المعروف سابقًا باسم TensorFlow Lite) (وقت التشغيل، والتكميم، والترحيل).
    https://ai.google.dev/edge/litert

  4. وقت تشغيل ONNX - التدريب على الجهاز (وقت تشغيل محمول + تدريب على أجهزة الحافة).
    https://onnxruntime.ai/docs/get-started/training-on-device.html

  5. بحث في تعلم الآلة من Apple - نشر المحولات على محرك Apple العصبي (ملاحظات حول كفاءة ANE).
    https://machinelearning.apple.com/research/neural-engine-transformers

اكتشف أحدث تقنيات الذكاء الاصطناعي في متجر مساعدي الذكاء الاصطناعي الرسمي

معلومات عنا

العودة إلى المدونة