ما هو Edge AI؟

ما هو Edge AI؟

يُعزز الذكاء الاصطناعي الحافة الذكاء الاصطناعي في أماكن توليد البيانات. قد يبدو الأمر مُبهرًا، لكن الفكرة الأساسية بسيطة: فكّر مباشرةً بجوار المستشعر، بحيث تظهر النتائج الآن، لا لاحقًا. ستحصل على السرعة والموثوقية وخصوصية مُرضية دون أن تُراقب السحابة كل قرار. لنبدأ بشرحها - بما في ذلك الاختصارات والمهام الجانبية. 😅

مقالات قد ترغب في قراءتها بعد هذه المقالة:

🔗 ما هو الذكاء الاصطناعي التوليدي
شرح واضح للذكاء الاصطناعي التوليدي، وكيفية عمله، واستخداماته العملية.

🔗 ما هو الذكاء الاصطناعي الوكيل
نظرة عامة على الذكاء الاصطناعي الوكيل والسلوكيات المستقلة وأنماط التطبيق في العالم الحقيقي.

🔗 ما هي قابلية التوسع للذكاء الاصطناعي
تعرف على كيفية توسيع نطاق أنظمة الذكاء الاصطناعي بشكل موثوق وفعال وبتكلفة فعالة.

🔗 ما هو إطار عمل البرمجيات للذكاء الاصطناعي؟
تفصيل أطر عمل برمجيات الذكاء الاصطناعي، وفوائد بنيتها، وأساسيات التنفيذ.

ما هو الذكاء الاصطناعي الحافة؟ تعريف سريع 🧭

الذكاء الاصطناعي الطرفي (Edge AI) هو ممارسة تشغيل نماذج تعلم آلي مُدرَّبة مباشرةً على الأجهزة التي تجمع البيانات أو بالقرب منها، مثل الهواتف والكاميرات والروبوتات والسيارات والأجهزة القابلة للارتداء وأجهزة التحكم الصناعية، وغيرها. بدلاً من إرسال البيانات الخام إلى خوادم بعيدة لتحليلها، يُعالج الجهاز المُدخلات محليًا ويُرسل ملخصات فقط أو لا شيء على الإطلاق. رحلات ذهاب وعودة أقل، وتأخير أقل، وتحكم أكبر. إذا كنت ترغب في شرح واضح ومحايد للمورد، فابدأ من هنا. [1]

 

الذكاء الاصطناعي الطرفي

ما الذي يجعل الذكاء الاصطناعي الحافة مفيدًا حقًا؟ 🌟

  • زمن انتقال منخفض - تحدث القرارات على الجهاز، لذا فإن الاستجابات تبدو فورية لمهام الإدراك مثل اكتشاف الكائنات، أو تحديد كلمات التنبيه، أو تنبيهات الشذوذ. [1]

  • الخصوصية حسب الموقع - يمكن أن تبقى البيانات الحساسة على الجهاز، مما يقلل من التعرض ويساعد في مناقشات تقليل البيانات. [1]

  • توفير النطاق الترددي - إرسال الميزات أو الأحداث بدلاً من التدفقات الخام. [1]

  • المرونة - تعمل أثناء الاتصال غير المستقر.

  • التحكم في التكاليف - دورات حوسبة سحابية أقل وخروج أقل.

  • الوعي بالسياق - يشعر الجهاز بالبيئة ويتكيف معها.

حكاية سريعة: استبدل برنامج تجريبي في مجال البيع بالتجزئة عمليات تحميل الكاميرات الثابتة بتصنيف الأشخاص مقابل الأشياء على الجهاز، ونشر فقط إحصاءات كل ساعة ومقاطع الاستثناءات. النتيجة: تنبيهات أقل من 200 مللي ثانية عند حافة الرف، وانخفاض بنسبة 90% تقريبًا في حركة البيانات الصاعدة - دون تغيير عقود شبكة WAN الخاصة بالمتجر. (الطريقة: الاستدلال المحلي، تجميع الأحداث، الشذوذ فقط).

الذكاء الاصطناعي الحافة مقابل الذكاء الاصطناعي السحابي - المقارنة السريعة 🥊

  • أين تحدث عملية الحوسبة : الحافة = على الجهاز/بالقرب من الجهاز؛ السحابة = مراكز البيانات البعيدة.

  • زمن الوصول : الحافة ≈ الوقت الحقيقي؛ السحابة لديها رحلات ذهابًا وإيابًا.

  • نقل البيانات : تقوم الحافة بتصفية/ضغط البيانات أولاً؛ تحب السحابة عمليات التحميل ذات الدقة الكاملة.

  • الموثوقية : تظل الحافة تعمل دون اتصال بالإنترنت؛ وتحتاج السحابة إلى الاتصال.

  • الحوكمة : تدعم الحافة تقليل البيانات؛ وتعمل السحابة على مركزية الإشراف. [1]

ليس الأمر إما هذا أو ذاك. تجمع الأنظمة الذكية بين الأمرين: قرارات سريعة محليًا، وتحليلات أعمق، وتعلم الأسطول مركزيًا. الحل الهجين ممل، ولكنه صحيح.

كيف تعمل تقنية Edge AI في الواقع تحت الغطاء 🧩

  1. أجهزة الاستشعار بالتقاط الإشارات الخام - إطارات الصوت، وبكسلات الكاميرا، وصنابير وحدة قياس القصور الذاتي، وآثار الاهتزاز.

  2. تعمل المعالجة المسبقة على إعادة تشكيل هذه الإشارات إلى ميزات صديقة للنموذج.

  3. وقت تشغيل الاستدلال بتنفيذ نموذج مضغوط على الجهاز باستخدام المسرعات عند توفرها.

  4. عملية ما بعد المعالجة بتحويل المخرجات إلى أحداث أو علامات أو إجراءات تحكم.

  5. القياس عن بعد بتحميل ما هو مفيد فقط: الملخصات، أو الشذوذ، أو الملاحظات الدورية.

تتضمن بيئات التشغيل المتاحة على الجهاز، والتي ستراها في الواقع، LiteRT (المعروف سابقًا باسم TensorFlow Lite)، و ONNX Runtime OpenVINO من إنتل . تعمل هذه السلاسل من الأدوات على زيادة الإنتاجية من خلال ميزانيات الطاقة/الذاكرة المحدودة باستخدام حيل مثل التكميم ودمج المشغلات. إذا كنت من محبي التفاصيل الدقيقة، فإن وثائقها فعّالة. [3][4]

أين يظهر - حالات الاستخدام الحقيقية التي يمكنك الإشارة إليها 🧯🚗🏭

  • الرؤية على الحافة : كاميرات جرس الباب (الأشخاص مقابل الحيوانات الأليفة)، ومسح الرفوف في متاجر التجزئة، والطائرات بدون طيار لاكتشاف العيوب.

  • الصوت على الجهاز : كلمات الاستيقاظ، الإملاء، اكتشاف التسرب في النباتات.

  • إنترنت الأشياء الصناعي : مراقبة المحركات والمضخات بحثًا عن أي تشوهات اهتزازية قبل الفشل.

  • السيارات : مراقبة السائق، واكتشاف المسار، ومساعدة ركن السيارة في أقل من ثانية أو أقل من ثانية.

  • الرعاية الصحية : الأجهزة القابلة للارتداء تحدد عدم انتظام ضربات القلب محليًا؛ مزامنة الملخصات لاحقًا.

  • الهواتف الذكية : تحسين الصور، واكتشاف المكالمات غير المرغوب فيها، ولحظات "كيف فعل هاتفي ذلك عندما كنت غير متصل بالإنترنت".

بالنسبة للتعريفات الرسمية (وحديث "الضباب مقابل الحافة")، راجع النموذج المفاهيمي للمعهد الوطني للمعايير والتكنولوجيا. [2]

الأجهزة التي تجعلها سريعة 🔌

يتم التحقق من أسماء بعض المنصات كثيرًا:

  • NVIDIA Jetson - وحدات مدعومة بوحدة معالجة الرسوميات للروبوتات/الكاميرات - أجواء Swiss Army Knife للذكاء الاصطناعي المدمج.

  • Google Edge TPU + LiterRT - استدلال صحيح فعال ووقت تشغيل مبسط للمشاريع منخفضة الطاقة للغاية. [3]

  • Apple Neural Engine (ANE) - برنامج تعلم آلي مدمج في الجهاز لأجهزة iPhone وiPad وMac؛ نشرت Apple أعمالًا عملية حول نشر المحولات بكفاءة على ANE. [5]

  • وحدات المعالجة المركزية/وحدات معالجة الرسومات المتكاملة/وحدات المعالجة العصبية من Intel مع OpenVINO - "الكتابة مرة واحدة، والنشر في أي مكان" عبر أجهزة Intel؛ تمريرات تحسين مفيدة.

  • وقت تشغيل ONNX في كل مكان - وقت تشغيل محايد مع موفري تنفيذ قابلين للتوصيل عبر الهواتف وأجهزة الكمبيوتر الشخصية والبوابات. [4]

هل تحتاج إلى جميعها؟ ليس بالضرورة. اختر مسارًا واحدًا قويًا يناسب أسطولك والتزم به، فانخفاض عدد الموظفين هو عدو الفرق المدمجة.

مجموعة البرامج - جولة قصيرة 🧰

  • ضغط النموذج : التكميم (غالبًا إلى int8)، التقليم، التقطير.

  • تسريع على مستوى المشغل : نوى مضبوطة على السيليكون الخاص بك.

  • أوقات التشغيل : LiteRT، ONNX Runtime، OpenVINO. [3][4]

  • غلافات النشر : حاويات/حزم تطبيقات؛ في بعض الأحيان خدمات صغيرة على بوابات.

  • MLOps للحافة : تحديثات نموذج OTA، وطرح A/B، وحلقات القياس عن بعد.

  • ضوابط الخصوصية والأمان : التشفير على الجهاز، والتمهيد الآمن، والإثبات، والمناطق المعزولة.

حالة مصغرة: قام فريق طائرة بدون طيار للتفتيش بتقطير كاشف ثقيل الوزن وتحويله إلى نموذج طلابي مُكمّم لـ LiterRT، ثم دمج نظام NMS على الجهاز. تحسن وقت الطيران بنسبة 15% تقريبًا بفضل انخفاض استهلاك الحوسبة؛ وانكمش حجم التحميل إلى إطارات استثناء. (الطريقة: التقاط مجموعة البيانات في الموقع، ومعايرة ما بعد الكم، ووضع الظل A/B قبل الإطلاق الكامل).

جدول المقارنة - خيارات Edge AI الشائعة 🧪

حديث حقيقي: هذه الطاولة ذات رأي شخصي وفوضوية بعض الشيء - تمامًا مثل العالم الحقيقي.

أداة / منصة أفضل جمهور تقدير السعر لماذا يعمل على الحافة
LiterRT (TFLite سابقًا) أندرويد، صناع، مضمن من $ إلى $$ وقت تشغيل سريع، مستندات قوية، عمليات تركز على الأجهزة المحمولة. يعمل بكفاءة حتى دون اتصال بالإنترنت. [3]
بيئة تشغيل ONNX فرق متعددة المنصات $ تنسيق محايد، وواجهات خلفية قابلة للتوصيل بالأجهزة - صديقة للمستقبل. [4]
أوبن فينو عمليات النشر المرتكزة على Intel $ مجموعة أدوات واحدة، وأهداف إنتل متعددة؛ وتمريرات تحسين سهلة.
إنفيديا جيتسون الروبوتات، الرؤية الثقيلة $$ إلى $$$ تسريع وحدة معالجة الرسوميات في صندوق الغداء؛ نظام بيئي واسع.
أبل ANE تطبيقات iOS/iPadOS/macOS تكلفة الجهاز تكامل وثيق بين الأجهزة والبرامج؛ عمل محول ANE موثق جيدًا. [5]
حافة TPU + LiterRT مشاريع منخفضة الطاقة للغاية $ استنتاج int8 فعال عند الحافة؛ صغير الحجم ولكنه قادر. [3]

كيفية اختيار مسار الذكاء الاصطناعي الحافة - شجرة قرار صغيرة 🌳

  • هل تُعاني من صعوبة في ضبط حياتك؟ ابدأ بالمُسرِّعات والنماذج الكمومية.

  • أنواع الأجهزة كثيرة؟ يُفضّل ONNX Runtime أو OpenVINO لسهولة الحمل. [4]

  • هل ترغب في شحن تطبيق جوال؟ يُعدّ LiterRT الخيار الأسهل. [3]

  • الروبوتات أم تحليلات الكاميرات؟ عمليات Jetson المتوافقة مع وحدة معالجة الرسومات توفر الوقت.

  • هل لديكم سياسة خصوصية صارمة؟ حافظوا على البيانات محليًا، وتشفيرها عند السكون، وسجلوا البيانات المجمعة، وليس الإطارات الخام.

  • فريق صغير؟ تجنب الأدوات الغريبة، فالممل جميل.

  • هل تتغير النماذج باستمرار؟ خطط للتحديث عبر الهواء (OTA) والقياس عن بُعد منذ اليوم الأول.

المخاطر والحدود والأجزاء المملة ولكن المهمة 🧯

  • انحراف النموذج - تتغير البيئات؛ مراقبة التوزيعات، وتشغيل أوضاع الظل، وإعادة التدريب بشكل دوري.

  • أسقف الحوسبة - الذاكرة الضيقة/قوة الطاقة تفرض نماذج أصغر أو دقة مريحة.

  • الأمان - افتراض الوصول المادي؛ استخدام التمهيد الآمن، والقطع الأثرية الموقعة، والإثبات، والخدمات ذات الامتيازات الأقل.

  • حوكمة البيانات - تساعد المعالجة المحلية، ولكنك لا تزال بحاجة إلى الموافقة والاحتفاظ والقياس عن بعد النطاقي.

  • عمليات الأسطول - تصبح الأجهزة غير متصلة بالإنترنت في أسوأ الأوقات؛ قم بتصميم التحديثات المؤجلة والتحميلات القابلة للاستئناف.

  • مزيج المواهب - المضمن + ML + DevOps هو طاقم متنوع؛ قم بالتدريب المتبادل في وقت مبكر.

خريطة طريق عملية لتوصيل شيء مفيد 🗺️

  1. اختر حالة استخدام واحدة مع اكتشاف عيب القيمة القابلة للقياس على الخط 3، وكلمة التنبيه على مكبر الصوت الذكي، وما إلى ذلك.

  2. جمع مجموعة بيانات مرتبة تعكس البيئة المستهدفة؛ وحقن الضوضاء لتتناسب مع الواقع.

  3. النموذج الأولي على مجموعة أدوات تطوير قريبة من أجهزة الإنتاج.

  4. ضغط النموذج باستخدام التكميم/التقليم؛ قياس فقدان الدقة بصدق. [3]

  5. لف الاستدلال في واجهة برمجة تطبيقات نظيفة مع الضغط الخلفي والمراقبين - لأن الأجهزة تتوقف في الساعة 2 صباحًا

  6. تصميم قياس عن بعد يحترم الخصوصية: إرسال الأعداد، والمخططات البيانية، والميزات المستخرجة من الحافة.

  7. تعزيز الأمان : الملفات الثنائية الموقعة، التمهيد الآمن، والخدمات الدنيا المفتوحة.

  8. خطة OTA : عمليات طرح متدرجة، وإصدارات تجريبية، وتراجع فوري.

  9. قم بقيادة الطائرة في حالة الزاوية الصعبة أولاً - إذا نجا هناك، فسوف ينجو في أي مكان.

  10. التوسع باستخدام دليل التشغيل : كيفية إضافة النماذج، وتدوير المفاتيح، وأرشفة البيانات - حتى لا يتحول المشروع رقم 2 إلى فوضى.

الأسئلة الشائعة - إجابات قصيرة على Edge AI

هل الذكاء الاصطناعي الطرفي مجرد نموذج صغير على حاسوب صغير؟
في الغالب، نعم، لكن الحجم ليس العامل الحاسم. يتعلق الأمر أيضًا بميزانيات زمن الوصول، ووعود الخصوصية، وتنظيم عمل العديد من الأجهزة محليًا مع التعلم عالميًا. [1]

هل يمكنني التدريب على الحافة أيضًا؟
يتوفر تدريب/تخصيص خفيف على الجهاز؛ بينما لا يزال التدريب الأثقل يعمل مركزيًا. يُوثّق ONNX Runtime خيارات التدريب على الجهاز إذا كنت من محبي المغامرة. [4]

ما الفرق بين الذكاء الاصطناعي الطرفي والحوسبة الضبابية؟
الضباب والحوسبة الحافة قريبان. كلاهما يُقرّب الحوسبة من مصادر البيانات، أحيانًا عبر بوابات قريبة. للاطلاع على التعريفات الرسمية والسياق، انظر المعهد الوطني للمعايير والتكنولوجيا. [2]

هل يُحسّن الذكاء الاصطناعي الحافة الخصوصية دائمًا؟
إنه يُساعد، ولكنه ليس سحرًا. ما زلتَ بحاجة إلى تقليل حجم البيانات، ومسارات تحديث آمنة، وتسجيل دقيق. تعامل مع الخصوصية كعادة، لا كخيار اختيار.

غوص عميق قد تقرأه بالفعل 📚

1) تحسين النموذج الذي لا يؤثر على الدقة

قد يُقلل التكميم من سعة الذاكرة ويُسرّع العمليات، ولكن معايرته ببيانات تمثيلية قد يُوهم النموذج بوجود سناجب في أماكن وجود مخاريط مرورية. غالبًا ما يُحافظ التكميم - كمعلم يُرشد طالبًا أصغر حجمًا - على الدلالات اللغوية. [3]

2) أوقات تشغيل استنتاج الحافة في الممارسة العملية

مُفسِّر LiterRT يُجري عمدًا عملية تحويل ذاكرة خالية من السكون أثناء التشغيل. يتصل ONNX Runtime بمُسرِّعات مختلفة عبر مُزوِّدي التنفيذ. كلاهما ليس حلاً سحريًا، بل مُثبِّتٌ قوي. [3][4]

3) المتانة في البرية

الحرارة، الغبار، انقطاع الطاقة، وشبكة واي فاي عشوائية: بناء مراقبين يُعيدون تشغيل خطوط الأنابيب، ويخزنون القرارات مؤقتًا، ويُعيدون الاتصال عند عودة الشبكة. مع ذلك، أقل جاذبية من لفت الانتباه، ولكنه أكثر أهمية.

العبارة التي ستكررها في الاجتماعات - ما هو Edge AI 🗣️

يُقرّب الذكاء الاصطناعي الحافة الذكاء من البيانات لتلبية القيود العملية المتعلقة بزمن الوصول والخصوصية وعرض النطاق الترددي والموثوقية. لا يكمن السر في شريحة واحدة أو إطار عمل واحد، بل في الاختيار الحكيم لما يُحوسب وأين.

ملاحظات ختامية - طويل جدًا، لم أقرأه 🧵

يُشغّل الذكاء الاصطناعي الحافة نماذج قريبة من البيانات، مما يجعل المنتجات سريعة، وخاصة، ومتينة. ستدمج الاستدلال المحلي مع الإشراف السحابي لتحقيق أفضل النتائج. اختر وقت تشغيل يناسب أجهزتك، واعتمد على المُسرّعات كلما أمكن، وحافظ على دقة النماذج من خلال الضغط، وصمّم عمليات الأسطول كما لو أن عملك يعتمد عليها - لأنه، حسنًا، قد يعتمد عليها. إذا سأل أحدهم: " ما هو الذكاء الاصطناعي الحافة؟" ، قل: قرارات ذكية، تُتخذ محليًا، وفي الوقت المحدد. ثم ابتسم وغير الموضوع إلى البطاريات. 🔋🙂


مراجع

  1. IBM - ما هو الذكاء الاصطناعي الحافة؟ (التعريف، الفوائد).
    https://www.ibm.com/think/topics/edge-ai

  2. المعهد الوطني للمعايير والتكنولوجيا - SP 500-325: نموذج مفاهيمي لحوسبة الضباب (السياق الرسمي للضباب/الحافة).
    https://csrc.nist.gov/pubs/sp/500/325/final

  3. Google AI Edge - LiterRT (المعروف سابقًا باسم TensorFlow Lite) (وقت التشغيل، والتكميم، والترحيل).
    https://ai.google.dev/edge/litert

  4. وقت تشغيل ONNX - التدريب على الجهاز (وقت تشغيل محمول + تدريب على أجهزة الحافة).
    https://onnxruntime.ai/docs/get-started/training-on-device.html

  5. بحث في تعلم الآلة من Apple - نشر المحولات على محرك Apple العصبي (ملاحظات حول كفاءة ANE).
    https://machinelearning.apple.com/research/neural-engine-transformers

اكتشف أحدث تقنيات الذكاء الاصطناعي في متجر مساعدي الذكاء الاصطناعي الرسمي

معلومات عنا

العودة إلى المدونة