باختصار: لبناء وكيل ذكاء اصطناعي فعال، تعامل معه كحلقة مُتحكَّم بها: يستقبل المدخلات، ويُحدد الإجراء التالي، ويستدعي أداة مُحددة النطاق، ويُراقب النتيجة، ويُكرر العملية حتى يتم اجتياز فحص "تم" واضح. يُصبح الوكيل فعالاً عندما تكون المهمة متعددة الخطوات وتعتمد على الأدوات؛ أما إذا تم حلها برسالة واحدة، فلا داعي لاستخدامه. أضف مخططات أدوات صارمة، وحدودًا للخطوات، وتسجيلًا للمخرجات، ومُدقِّقًا/ناقدًا بحيث عندما تفشل الأدوات أو تكون المدخلات غامضة، ينتقل الوكيل إلى مرحلة أعلى بدلاً من الدخول في حلقة مُفرغة.
أهم النقاط المستفادة:
حلقة التحكم : تنفيذ التكرار من الإدخال إلى الفعل ثم الملاحظة مع شروط توقف صريحة وخطوات قصوى.
تصميم الأدوات : حافظ على الأدوات ضيقة ومحددة النوع ومرخصة ومُدققة لمنع الفوضى الناتجة عن "فعل أي شيء".
نظافة الذاكرة : استخدم حالة قصيرة المدى مضغوطة بالإضافة إلى استرجاع طويل المدى؛ تجنب تفريغ النصوص الكاملة.
مقاومة سوء الاستخدام : أضف قوائم السماح، وحدود المعدل، والتكرار، و"التجربة الجافة" للإجراءات الخطرة.
قابلية الاختبار : احتفظ بمجموعة من السيناريوهات (حالات الفشل، والغموض، والحقن) وأعد تشغيلها عند كل تغيير.

🔗 كيفية قياس أداء الذكاء الاصطناعي
تعلم المقاييس العملية لتقييم السرعة والدقة والموثوقية.
🔗 كيفية التحدث إلى الذكاء الاصطناعي
استخدم التوجيهات والسياق والمتابعات للحصول على إجابات أفضل.
🔗 كيفية تقييم نماذج الذكاء الاصطناعي
قارن النماذج باستخدام الاختبارات، ومعايير التقييم، ونتائج المهام الواقعية.
🔗 كيفية تحسين نماذج الذكاء الاصطناعي
تحسين الجودة والتكلفة من خلال الضبط والتقليم والمراقبة.
1) ما هو وكيل الذكاء الاصطناعي، بمصطلحات الشخص العادي 🧠
وكيل الذكاء الاصطناعي عبارة عن حلقة. وثائق LangChain "الوكلاء"
هذا كل شيء. حلقة مع دماغ في المنتصف.
المدخلات ← التفكير ← الفعل ← الملاحظة ← التكرار . ورقة ReAct (السبب + الفعل)
أين:
-
المدخلات عبارة عن طلب من المستخدم أو حدث (بريد إلكتروني جديد، تذكرة دعم، إشارة استشعار).
-
Think هو نموذج لغوي يفكر في الخطوة التالية.
-
Act باستدعاء أداة (البحث في الوثائق الداخلية، تشغيل التعليمات البرمجية، إنشاء تذكرة، كتابة رد). دليل استدعاء وظائف OpenAI
-
خاصية المراقبة بقراءة مخرجات الأداة.
-
التكرار هو ما يجعله يبدو "آليًا" بدلًا من "ثرثارًا". وثائق LangChain "الوكلاء"
بعض البرامج عبارة عن وحدات ماكرو ذكية. بينما يعمل البعض الآخر كموظف مبتدئ قادر على إدارة المهام المتعددة والتعافي من الأخطاء. وكلاهما مهم.
أيضًا، لستَ بحاجة إلى استقلالية كاملة. في الواقع... ربما لا ترغب بها 🙃
٢) متى يجب عليك إنشاء وكيل (ومتى لا يجب عليك ذلك) 🚦
قم بإنشاء وكيل عندما:
-
العمل متعدد الخطوات ويتغير تبعاً لما يحدث في منتصفه.
-
تتطلب الوظيفة استخدام أدوات (قواعد البيانات، وأنظمة إدارة علاقات العملاء، وتنفيذ التعليمات البرمجية، وإنشاء الملفات، والمتصفحات، وواجهات برمجة التطبيقات الداخلية). راجع وثائق "الأدوات" الخاصة بـ LangChain.
-
أنت تريد نتائج قابلة للتكرار مع وجود ضوابط، وليس مجرد إجابات لمرة واحدة.
-
يمكنك تعريف "الانتهاء" بطريقة يمكن للكمبيوتر التحقق منها، حتى لو كان ذلك بشكل فضفاض.
لا تقم بإنشاء وكيل عندما:
-
يكفي إرسال طلب بسيط واستجابة لحل المشكلة (لا تبالغ في التعقيد، ستندم على ذلك لاحقاً).
-
أنت بحاجة إلى حتمية تامة (يمكن أن تكون العوامل متسقة إلى حد ما، ولكن ليس بشكل آلي).
-
إذا لم تكن لديك أي أدوات أو بيانات للاتصال، فإن الأمر في الغالب مجرد إحساسات.
لنكن صريحين: نصف "مشاريع وكلاء الذكاء الاصطناعي" قد تكون مجرد سير عمل مع بعض القواعد المتفرعة. لكن مهلاً، أحيانًا يكون للجو العام أهمية أيضًا 🤷♂️
3) ما الذي يجعل نسخة جيدة من وكيل الذكاء الاصطناعي؟ ✅
إليك قسم "ما الذي يجعل النسخة جيدة من" الذي طلبته، إلا أنني سأكون صريحًا بعض الشيء:
إنّ النسخة الجيدة من نظام الذكاء الاصطناعي ليست تلك التي تُفكّر بجهدٍ أكبر، بل هي تلك التي:
-
يعرف ما هو مسموح له بفعله (حدود النطاق)
-
يستخدم الأدوات بشكل موثوق (المكالمات المنظمة، وإعادة المحاولات، والمهلات) دليل استدعاء وظائف OpenAI، AWS "المهلات، وإعادة المحاولات، والتراجع مع التذبذب"
-
يحافظ على حالة الذاكرة نظيفة (ذاكرة لا تتلف) LangChain "نظرة عامة على الذاكرة"
-
يشرح إجراءاته (سجلات التدقيق، وليس عمليات الاستدلال السرية) NIST AI RMF 1.0 (الموثوقية والشفافية)
-
التوقف بشكل مناسب (فحوصات الإكمال، الحد الأقصى للخطوات، التصعيد) وثائق LangChain "الوكلاء"
-
يفشل بأمان (يطلب المساعدة، ولا يتوهم وجود سلطة) NIST AI RMF 1.0
-
قابل للاختبار (يمكنك تشغيله على سيناريوهات جاهزة وتقييم النتائج)
إذا لم يكن بالإمكان اختبار وكيلك، فهو أشبه بآلة قمار واثقة جدًا. ممتع في الحفلات، ومرعب في الإنتاج 😬
4) المكونات الأساسية للعامل (التشريح 🧩)
معظم العملاء الموثوقين يمتلكون هذه العناصر:
أ) حلقة التحكم 🔁
هذا هو المنسق:
-
سدد الهدف
-
اطلب من النموذج القيام بالخطوة التالية
-
تشغيل الأداة
-
إضافة ملاحظة
-
كرر حتى الانتهاء. وثائق LangChain "Agents"
ب) الأدوات (أو القدرات) 🧰
الأدوات هي ما يجعل الوكيل فعالاً: وثائق "الأدوات" الخاصة بـ LangChain
-
استعلامات قاعدة البيانات
-
إرسال رسائل البريد الإلكتروني
-
سحب الملفات
-
تشغيل الكود
-
استدعاء واجهات برمجة التطبيقات الداخلية
-
الكتابة إلى جداول البيانات أو أنظمة إدارة علاقات العملاء
ج) الذاكرة 🗃️
هناك نوعان مهمان:
-
الذاكرة قصيرة المدى : سياق التشغيل الحالي، والخطوات الأخيرة، والخطة الحالية
-
الذاكرة طويلة المدى : تفضيلات المستخدم، وسياق المشروع، والمعرفة المسترجعة (غالبًا عبر تضمينات + مخزن متجهي) ورقة RAG
د) سياسة التخطيط واتخاذ القرارات 🧭
حتى لو لم تسمّها "تخطيطاً"، فأنت بحاجة إلى طريقة:
-
قوائم المراجعة
-
أداة "فكر ثم فكر" على غرار ReAct، ورقة ReAct
-
مخططات المهام
-
أنماط العلاقة بين المشرف والعامل
-
أنماط المشرف والعامل في Microsoft AutoGen (إطار عمل متعدد الوكلاء)
هـ) الضوابط والتقييم 🧯
-
الأذونات
-
مخططات الأدوات الآمنة، مخرجات OpenAI المهيكلة
-
التحقق من صحة المخرجات
-
حدود الخطوات
-
تسجيل الدخول
-
اختبارات NIST AI RMF 1.0
نعم، الأمر يتعلق بالهندسة أكثر من التلقين. وهذا هو... الهدف.
5) جدول المقارنة: الطرق الشائعة لبناء وكيل 🧾
فيما يلي "جدول مقارنة" واقعي - مع بعض الاختلافات الطفيفة، لأن الفرق الحقيقية لها خصائصها المميزة 😄
| أداة / إطار عمل | جمهور | سعر | لماذا ينجح؟ | ملاحظات (فوضى صغيرة) | |
|---|---|---|---|---|---|
| لانغ تشين | البناة الذين يحبون مكونات تشبه قطع الليغو | مجاني إلى حد ما + البنية التحتية | نظام بيئي ضخم للأدوات والذاكرة والسلاسل | قد يصبح الأمر معقداً للغاية إذا لم تُسمِّ الأشياء بوضوح | |
| مؤشر اللاما | فرق تعتمد بشكل كبير على نظام RAG | مجاني إلى حد ما + البنية التحتية | أنماط استرجاع قوية، وفهرسة، وروابط | رائع عندما يكون وكيلك ببساطة "بحث + فعل"... وهو أمر شائع | |
| نهج مشابه لنهج مساعدي OpenAI | الفرق التي ترغب في إعداد أسرع | يعتمد على الاستخدام | أنماط استدعاء الأدوات المدمجة وحالة التشغيل | أقل مرونة في بعض الجوانب، ولكنه مناسب للعديد من التطبيقات | تشغيل واجهة برمجة تطبيقات OpenAI، استدعاء وظائف مساعدي OpenAI |
| النواة الدلالية | المطورون الذين يرغبون في تنسيق منظم | شبه مجاني | تجريد أنيق للمهارات/الوظائف | يبدو المكان "مرتباً ومنظماً" - أحياناً يكون ذلك مدحاً 😉 | |
| أوتوجين | مجرّبون متعددون العوامل | شبه مجاني | أنماط التعاون بين الوكلاء | قد يكثر الكلام؛ ضع قواعد صارمة لإنهاء المكالمات | |
| كرواي | معجبو "فرق العملاء" | شبه مجاني | يسهل التعبير عن الأدوار والمهام وعمليات التسليم | يكون الأداء أفضل عندما تكون المهام واضحة ومحددة، وليست مبهمة | |
| كومة قش | البحث + خطوط الأنابيب الأشخاص | شبه مجاني | خطوط أنابيب صلبة، استرجاع، مكونات | أقل "مسرحية وكيل"، وأكثر "مصنع عملي" | |
| لفها بنفسك (حلقة مخصصة) | المهووسون بالسيطرة (بشكل عاطفي) | وقتك | أقل قدر من السحر، وأقصى قدر من الوضوح | عادةً ما يكون الأفضل على المدى الطويل... إلى أن تُعيد ابتكار كل شيء 😅 |
لا يوجد فائز واحد. يعتمد الخيار الأفضل على ما إذا كانت المهمة الرئيسية للوكيل هي الاسترجاع ، أو تنفيذ الأدوات ، تنسيق الوكلاء المتعددين ، أو أتمتة سير العمل .
٦) كيفية بناء وكيل ذكاء اصطناعي خطوة بخطوة (الوصفة الفعلية) 🍳🤖
هذا هو الجزء الذي يتجاهله معظم الناس، ثم يتساءلون لماذا يتصرف الوكيل مثل حيوان الراكون في مخزن المؤن.
الخطوة الأولى: عرّف الوظيفة في جملة واحدة 🎯
أمثلة:
-
"قم بصياغة رد على العميل باستخدام السياسة وسياق التذكرة، ثم اطلب الموافقة."
-
"قم بالتحقيق في تقرير الخطأ، وإعادة إنتاجه، واقترح حلاً له."
-
"حوّل ملاحظات الاجتماعات غير الكاملة إلى مهام، ومسؤولين عنها، ومواعيد نهائية."
إذا لم تستطع تعريفها ببساطة، فلن يستطيع وكيلك ذلك أيضاً. أعني أنه يستطيع، لكنه سيرتجل، والارتجال هو ما يؤدي إلى فشل الميزانيات.
الخطوة الثانية: تحديد مستوى الاستقلالية (منخفض، متوسط، حار) 🌶️
-
مستوى منخفض من الاستقلالية : يقترح خطوات، ويقوم المستخدمون بالنقر على "موافقة".
-
الوسيط : يُشغّل الأدوات، ويُعدّ المسودات، ويُصعّد الأمور عند وجود غموض
-
مستوى عالٍ : ينفذ العملية من البداية إلى النهاية، ولا يُرسل تنبيهات للبشر إلا في حالات الاستثناء.
ابدأ بمستوى أقل مما تريد. يمكنك رفعه لاحقاً.
الخطوة الثالثة: اختر استراتيجية النموذج الخاصة بك 🧠
عادةً ما تختار:
-
نموذج واحد قوي لكل شيء (بسيط)
-
نموذج قوي واحد + نموذج أصغر للخطوات الرخيصة (التصنيف، التوجيه)
-
نماذج متخصصة (الرؤية، والترميز، والكلام) عند الحاجة
قرر أيضاً:
-
الحد الأقصى للرموز
-
درجة حرارة
-
ما إذا كنت تسمح بتتبعات الاستدلال الطويلة داخليًا (يمكنك ذلك، ولكن لا تعرض سلسلة الأفكار الخام للمستخدمين النهائيين)
الخطوة الرابعة: تحديد الأدوات ذات المخططات الصارمة 🔩
ينبغي أن تكون الأدوات كالتالي:
-
ضيق
-
مكتوب
-
بإذن
-
مخرجات OpenAI المهيكلة المعتمدة
بدلاً من أداة تسمى do_anything(input: string) ، قم بإنشاء:
-
search_kb(query: string) -> results[] -
إنشاء_تذكرة(العنوان: سلسلة نصية، النص: سلسلة نصية، الأولوية: تعداد) -> معرف_التذكرة -
إرسال_البريد_الإلكتروني(إلى: سلسلة نصية، الموضوع: سلسلة نصية، نص الرسالة: سلسلة نصية) -> الحالةدليل استدعاء دالة OpenAI
إذا أعطيت الوكيل منشارًا كهربائيًا، فلا تنصدم عندما يقوم بتقليم السياج بإزالة السور أيضًا.
الخطوة 5: بناء حلقة التحكم 🔁
الحد الأدنى من الحلقات:
-
ابدأ بالهدف + السياق الأولي
-
اسأل النموذج: "الخطوة التالية؟"
-
إذا استدعى الأمر أداةً، فقم بتنفيذها
-
أضف الملاحظة
-
تحقق من حالة التوقف
-
كرر (بأقصى عدد من الخطوات) وثائق LangChain "Agents"
يضيف:
-
مهلة زمنية
-
إعادة المحاولات (انتبه - قد تتكرر عمليات إعادة المحاولات) AWS "مهلات، وإعادة محاولات، وتراجع مع تذبذب"
-
تنسيق أخطاء الأداة (واضح، منظم)
الخطوة السادسة: أضف الذاكرة بحرص 🗃️
على المدى القصير: احتفظ بملخص حالة موجز يتم تحديثه في كل خطوة. نظرة عامة على ذاكرة LangChain.
على المدى الطويل: خزّن الحقائق الدائمة (تفضيلات المستخدم، وقواعد المؤسسة، والوثائق الثابتة).
قاعدة عامة:
-
إذا كان يتغير كثيراً، فاجعله قصير الأجل
-
إذا كان مستقرًا - يُخزن على المدى الطويل
-
إذا كان حساساً - خزّنه في أقل قدر ممكن (أو لا تخزّنه على الإطلاق)
الخطوة 7: أضف التحقق من الصحة و"التقييم" 🧪
نمط عملي ورخيص:
-
يقوم الوكيل بإنتاج النتيجة
-
يقوم المدقق بفحص البنية والقيود
-
مراجعات اختيارية لنموذج النقد للكشف عن الخطوات المفقودة أو انتهاكات السياسة NIST AI RMF 1.0
ليس مثالياً، ولكنه يكشف كمية صادمة من الهراء.
الخطوة 8: سجّل كل ما ستندم على عدم تسجيله 📜
سجل:
-
استدعاءات الأدوات + المدخلات + المخرجات
-
القرارات المتخذة
-
أخطاء
-
المخرجات النهائية
-
الرموز وزمن الاستجابة: دليل أساسيات مراقبة OpenTelemetry
ستشكر نفسك في المستقبل، وستنسى في الحاضر. هذه هي الحياة 😵💫
7) استدعاء الأدوات الذي لا يُرهق روحك 🧰😵
يُعد استدعاء الأدوات هو المكان الذي يصبح فيه "كيفية بناء وكيل ذكاء اصطناعي" هندسة برمجيات حقيقية.
اجعل الأدوات موثوقة (الموثوقية أمر جيد)
الأدوات الموثوقة هي:
-
حتمية
-
نطاق ضيق
-
سهل الاختبار
-
من الآمن إعادة تشغيل طلبات Stripe المتكررة (Idempotent requests).
أضف ضوابط حماية على مستوى الأدوات، وليس مجرد توجيهات
التوجيهات مجرد اقتراحات مهذبة. التحقق من صحة الأداة أشبه بباب مغلق. مخرجات OpenAI المنظمة
يفعل:
-
القوائم المسموح بها (الأدوات التي يمكن تشغيلها)
-
التحقق من صحة المدخلات
-
حدود معدل OpenAI دليل حدود معدل
-
عمليات التحقق من الأذونات لكل مستخدم/مؤسسة
-
"وضع التجربة الجافة" للإجراءات الخطرة
تصميم لتحمل الفشل الجزئي
تتعطل الأدوات. تتذبذب الشبكات. تنتهي صلاحية التفويض. يجب على الوكيل:
-
تفسير الأخطاء
-
إعادة المحاولة مع التراجع عند الاقتضاء، استراتيجية إعادة المحاولة في Google Cloud (التراجع + التذبذب)
-
اختر أدوات بديلة
-
تصعيد الأمور عند التعثر
حيلة فعالة بهدوء: إرجاع أخطاء منظمة مثل:
-
النوع: خطأ في المصادقة -
النوع: غير موجود -
النوع: معدل_محدود
حتى يتمكن النموذج من الاستجابة بذكاء بدلاً من الذعر.
8) ذكرى تُساعدك بدلاً من أن تُطاردك 👻🗂️
الذاكرة قوية، لكنها قد تتحول أيضاً إلى درج للخردة.
الذاكرة قصيرة المدى: اجعلها مختصرة
يستخدم:
-
آخر N خطوة
-
ملخص متجدد (يتم تحديثه في كل دورة)
-
الخطة الحالية
-
القيود الحالية (الميزانية، الوقت، السياسات)
إذا وضعت كل شيء في سياقه، فستحصل على:
-
تكلفة أعلى
-
زمن استجابة أبطأ
-
مزيد من الارتباك (نعم، حتى في ذلك الحين)
الذاكرة طويلة الأمد: الاسترجاع بدلاً من "الحشو"
معظم "الذاكرة طويلة المدى" أشبه بما يلي:
-
التضمينات
-
متجر المتجهات
-
تقنية التوليد المعزز للاسترجاع (RAG) ورقة بحثية حول تقنية
لا يحفظ البرنامج المعلومات، بل يسترجع أكثر الأجزاء صلةً أثناء التشغيل. LlamaIndex "مقدمة إلى RAG"
قواعد الذاكرة العملية
-
قم بتخزين "التفضيلات" كحقائق صريحة: "المستخدم يحب الملخصات النقطية ويكره الرموز التعبيرية" (هههه، ليس هنا على الرغم من ذلك 😄)
-
قم بتخزين "القرارات" مع الطوابع الزمنية أو الإصدارات (وإلا ستتراكم التناقضات)
-
لا تحتفظ بالأسرار إلا إذا كنت مضطراً لذلك حقاً
وإليكم استعارتي غير الكاملة: الذاكرة أشبه بالثلاجة. إذا لم تنظفها أبداً، فسيصبح طعم شطيرتك في النهاية كالبصل والندم.
٩) أنماط التخطيط (من البسيطة إلى الفاخرة) 🧭✨
التخطيط ليس إلا عملية تفكيك مُنظّمة. لا تجعله غامضاً.
النمط أ: مخطط قائمة المهام ✅
-
يُخرج النموذج قائمة بالخطوات
-
ينفذ خطوة بخطوة
-
تحديث حالة قائمة التحقق
مثالي لتدريب الموظفين الجدد. بسيط وقابل للاختبار.
النمط ب: حلقة ReAct (السبب + الفعل) 🧠→🧰
-
يحدد النموذج استدعاء الأداة التالية
-
يراقب المخرجات
-
يكرر ورقة بحثية من ReAct
هذا هو الشعور الكلاسيكي للعميل.
النمط ج: مشرف-عامل 👥
-
يقوم المشرف بتقسيم الهدف إلى مهام
-
يقوم العمال بتنفيذ مهام متخصصة
-
يقوم المشرف بدمج النتائج في Microsoft AutoGen (إطار عمل متعدد الوكلاء)
يُعد هذا الأمر ذا قيمة عندما تكون المهام قابلة للتوازي، أو عندما تريد "أدوارًا" مختلفة مثل:
-
الباحث
-
مبرمج
-
محرر
-
مدقق ضمان الجودة
النمط د: التخطيط ثم التنفيذ مع إعادة التخطيط 🔄
-
وضع خطة
-
ينفذ
-
إذا غيّرت نتائج الأداة الواقع، فأعد التخطيط
يمنع هذا العامل من الإصرار على اتباع خطة سيئة. يفعل البشر ذلك أيضاً، إلا إذا كانوا متعبين، فحينها يتبعون خططاً سيئة أيضاً.
10) السلامة، والموثوقية، وعدم التعرض للفصل 🔐😅
إذا كان بإمكان وكيلك اتخاذ إجراءات، فأنت بحاجة إلى تصميم أمان. ليس مجرد ميزة إضافية، بل ضرورة. معيار إدارة مخاطر الذكاء الاصطناعي NIST AI RMF 1.0
حدود صارمة
-
الحد الأقصى للخطوات لكل جولة
-
الحد الأقصى لعدد استدعاءات الأدوات في الدقيقة
-
الحد الأقصى للإنفاق لكل جلسة (ميزانية الرموز المميزة)
-
أدوات مقيدة، موافقة المسؤولين
معالجة البيانات
-
قم بتنقيح المدخلات الحساسة قبل تسجيل الدخول
-
بيئات منفصلة (التطوير مقابل الإنتاج)
-
أذونات أدوات أقل الامتيازات
القيود السلوكية
-
إجبار العميل على الاستشهاد بمقتطفات من الأدلة الداخلية (وليس الروابط الخارجية، بل المراجع الداخلية فقط)
-
يتطلب الأمر وضع علامات عدم اليقين عندما تكون الثقة منخفضة
-
يتطلب الأمر "طرح سؤال توضيحي" إذا كانت المدخلات غامضة
ليس الوكيل الموثوق هو الأكثر ثقة، بل هو الذي يعرف متى يخمن... ويقول ذلك صراحةً.
11) الاختبار والتقييم (الجزء الذي يتجنبه الجميع) 🧪📏
لا يمكنك تحسين ما لا يمكنك قياسه. نعم، هذه العبارة مبتذلة، لكنها صحيحة بشكل مزعج.
قم ببناء مجموعة سيناريوهات
أنشئ من 30 إلى 100 حالة اختبار:
-
مسارات سعيدة
-
الحالات الحدية
-
حالات "فشل الأداة"
-
طلبات غامضة
-
محاولات حقن الرسائل (محاولات حقن الرسائل) - قائمة OWASP لأهم 10 ثغرات أمنية لتطبيقات برامج الماجستير في القانون - OWASP LLM01 حقن الرسائل
نتائج التقييم
استخدم مقاييس مثل:
-
معدل نجاح المهمة
-
الوقت اللازم للإنجاز
-
معدل استعادة أداة تصحيح الأخطاء
-
معدل الهلوسة (ادعاءات بدون دليل)
-
معدل موافقة الإنسان (في حالة الوضع الخاضع للإشراف)
اختبارات الانحدار للمطالبات والأدوات
في أي وقت تقوم فيه بالتغيير:
-
مخطط الأداة
-
تعليمات النظام
-
منطق الاسترجاع
-
بتهيئة الذاكرة
. أعد تشغيل البرنامج.
الوكلاء كائنات حساسة. مثل نباتات الزينة المنزلية، لكنها أغلى ثمناً.
12) أنماط النشر التي لا تُرهق ميزانيتك 💸🔥
ابدأ بخدمة واحدة
-
واجهة برمجة تطبيقات وحدة تحكم الوكيل
-
خدمات الأدوات التي تدعمها
-
التسجيل والمراقبة: دليل أساسيات مراقبة OpenTelemetry
أضف ضوابط التكاليف مبكراً
-
تخزين نتائج الاسترجاع مؤقتًا
-
ضغط حالة المحادثة مع ملخصات
-
استخدام نماذج أصغر للتوجيه والاستخراج
-
حصر "وضع التفكير العميق" في أصعب الخطوات
خيار معماري شائع
-
وحدة تحكم عديمة الحالة + مخزن حالة خارجي (قاعدة بيانات/ريديس)
-
تكون استدعاءات الأدوات متكررة قدر الإمكان، وذلك وفقًا لـ Stripe "طلبات متكررة".
-
قم بإنشاء قائمة انتظار للمهام الطويلة (حتى لا يبقى طلب الويب مفتوحًا إلى الأبد)
أيضًا: اصنع "مفتاح إيقاف تشغيل". لن تحتاجه إلا عندما تحتاجه بشدة 😬
١٣) ملاحظات ختامية - النسخة المختصرة حول كيفية بناء وكيل ذكاء اصطناعي 🎁🤖
إذا لم تتذكر شيئاً آخر، فتذكر هذا:
-
كيفية بناء وكيل ذكاء اصطناعي تتعلق في الغالب ببناء حلقة آمنة حول نموذج. وثائق LangChain "الوكلاء"
-
ابدأ بهدف واضح، واستقلالية محدودة، وأدوات صارمة. مخرجات OpenAI المهيكلة
-
أضف الذاكرة عبر الاسترجاع، وليس عبر حشو السياق بلا نهاية. ورقة RAG
-
يمكن أن يكون التخطيط بسيطاً - فقوائم المراجعة وإعادة التخطيط تُحقق نتائج جيدة.
-
تُحوّل عمليات التسجيل والاختبارات فوضى البرامج الوسيطة إلى منتج جاهز للإطلاق. دليل أساسي لمراقبة OpenTelemetry
-
يجب أن تكون الضوابط موجودة في الكود، وليس فقط في التنبيهات. قائمة OWASP لأهم 10 مخاطر لتطبيقات ماجستير القانون
ليس الوكيل سحراً. إنه نظام يتخذ قرارات صائبة بشكل متكرر بما يكفي ليكون ذا قيمة... ويعترف بالهزيمة قبل أن تتسبب في ضرر. أمرٌ مُريحٌ نوعاً ما 😌
نعم، إذا صممته بشكل صحيح، فستشعر وكأنك توظف متدربًا رقميًا صغيرًا لا ينام أبدًا، ويصاب بالذعر أحيانًا، ويحب الأعمال الورقية. باختصار، متدرب.
التعليمات
ما هو وكيل الذكاء الاصطناعي، بعبارات بسيطة؟
يُمثل وكيل الذكاء الاصطناعي حلقةً متكررة: يستقبل المدخلات، ويُحدد الخطوة التالية، ويستخدم أداةً ما، ويقرأ النتيجة، ثم يُكرر العملية حتى يُنجزها. ويكمن جوهر "الوكيل" في قدرته على الفعل والملاحظة، وليس مجرد التواصل. العديد من الوكلاء عبارة عن أنظمة أتمتة ذكية مزودة بإمكانية الوصول إلى الأدوات، بينما يتصرف البعض الآخر كعامل مبتدئ قادر على تصحيح الأخطاء.
متى يجب عليّ بناء وكيل ذكاء اصطناعي بدلاً من مجرد استخدام موجه الأوامر؟
يُنصح بإنشاء وكيل عندما يكون العمل متعدد الخطوات، ويتغير بناءً على النتائج الوسيطة، ويتطلب استخدام أدوات موثوقة (واجهات برمجة التطبيقات، قواعد البيانات، نظام التذاكر، تنفيذ التعليمات البرمجية). كما يُعدّ الوكلاء مفيدين عندما ترغب في الحصول على نتائج قابلة للتكرار مع ضوابط وطريقة للتحقق من اكتمال العملية. إذا كان الرد السريع البسيط كافيًا، فإن الوكيل عادةً ما يُمثّل عبئًا إضافيًا غير ضروري وحالات فشل إضافية.
كيف يمكنني بناء وكيل ذكاء اصطناعي لا يعلق في حلقات مفرغة؟
استخدم شروط إيقاف صارمة: الحد الأقصى للخطوات، والحد الأقصى لعدد استدعاءات الأدوات، ومسح عمليات التحقق من الإكمال. أضف مخططات أدوات منظمة، ومهلات زمنية، ومحاولات إعادة لا تُعاد إلى ما لا نهاية. سجّل القرارات ومخرجات الأدوات لتحديد مواطن الخلل. يُعدّ التصعيد آلية أمان شائعة: فإذا كان النظام غير متأكد أو كرّر الأخطاء، فعليه طلب المساعدة بدلاً من الارتجال.
ما هو الحد الأدنى من البنية المطلوبة لبناء وكيل ذكاء اصطناعي؟
كحد أدنى، أنت بحاجة إلى حلقة تحكم تُزوّد النموذج بالهدف والسياق، وتطلب الإجراء التالي، وتُنفّذ الأداة عند الحاجة، وتُضيف الملاحظة، وتُكرّر العملية. كما تحتاج إلى أدوات ذات أشكال إدخال/إخراج صارمة، وفحص "اكتمال". حتى حلقة مُصممة خصيصًا يُمكن أن تُؤدي الغرض بكفاءة إذا حافظت على نظافة الحالة وفرضت حدودًا للخطوات.
كيف يمكنني تصميم استدعاء الأدوات بحيث يكون موثوقًا به في بيئة الإنتاج؟
اجعل الأدوات محدودة النطاق، ومحددة النوع، ومرخصة، ومُدققة - تجنب الأدوات العامة التي تُنفذ أي شيء. فضّل استخدام مخططات صارمة (مثل المخرجات المهيكلة/استدعاء الدوال) حتى لا يتمكن النظام من تجاهل المدخلات. أضف قوائم السماح، وحدود المعدل، وفحوصات صلاحيات المستخدم/المؤسسة على مستوى الأداة. صمم الأدوات بحيث يمكن إعادة تشغيلها بأمان كلما أمكن، باستخدام أنماط التكرار.
ما هي أفضل طريقة لإضافة ذاكرة دون أن يؤدي ذلك إلى تدهور أداء البرنامج؟
قسّم الذاكرة إلى جزأين: حالة التشغيل قصيرة المدى (الخطوات الأخيرة، الخطة الحالية، القيود) والاسترجاع طويل المدى (التفضيلات، القواعد الثابتة، المستندات ذات الصلة). حافظ على اختصار حالة التشغيل قصيرة المدى باستخدام ملخصات سريعة، وليس نصوصًا كاملة. أما بالنسبة للذاكرة طويلة المدى، فإن الاسترجاع (التضمينات + تخزين المتجهات/أنماط RAG) عادةً ما يكون أفضل من حشر كل شيء في السياق وإرباك النموذج.
أي نمط تخطيط يجب أن أستخدم: قائمة التحقق، أو ReAct، أو المشرف-العامل؟
يُعدّ مخطط قائمة المهام مثاليًا عندما تكون المهام قابلة للتنبؤ وترغب في شيء سهل الاختبار. وتتألق حلقات ReAct عندما تُغيّر نتائج الأداة مسارك التالي. وتُفيد أنماط المشرف والعامل (مثل فصل الأدوار في AutoGen) عندما يُمكن تنفيذ المهام بالتوازي أو عندما تستفيد من أدوار مُحددة (باحث، مُبرمج، مُختبر جودة). ويُمثل التخطيط ثم التنفيذ مع إعادة التخطيط حلاً وسطًا عمليًا لتجنب الخطط السيئة المُستعصية.
كيف أجعل العميل آمناً إذا كان بإمكانه اتخاذ إجراءات حقيقية؟
استخدم نظام الصلاحيات الأقل امتيازًا، وقيد الوصول إلى الأدوات الخطرة بموافقة المستخدم أو عبر وضع "التجربة". حدد ميزانيات وحدودًا قصوى: الحد الأقصى للخطوات، والحد الأقصى للإنفاق، وحدود استدعاء الأدوات في الدقيقة. احجب البيانات الحساسة قبل تسجيلها، وافصل بيئات التطوير عن بيئات الإنتاج. اطلب تنبيهات بشأن عدم اليقين أو أسئلة توضيحية عند وجود غموض في المدخلات، بدلًا من الاعتماد على الثقة بدلًا من الأدلة.
كيف يمكنني اختبار وتقييم وكيل الذكاء الاصطناعي بحيث يتحسن بمرور الوقت؟
أنشئ مجموعة سيناريوهات تتضمن مسارات ناجحة، وحالات استثنائية، وأعطال الأدوات، وطلبات غامضة، ومحاولات حقن المطالبات (على غرار OWASP). قيّم النتائج مثل نجاح المهمة، ووقت الإنجاز، والتعافي من أخطاء الأدوات، والادعاءات غير المدعومة بأدلة. في كل مرة تُجري فيها تغييرات على مخططات الأدوات، أو المطالبات، أو الاسترجاع، أو تهيئة الذاكرة، أعد تشغيل مجموعة السيناريوهات. إذا لم تتمكن من اختبارها، فلن تتمكن من طرحها بشكل موثوق.
كيف يمكنني نشر وكيل دون زيادة زمن الاستجابة والتكاليف بشكل كبير؟
يُعدّ نمط وحدة التحكم عديمة الحالة، المزودة بمخزن حالة خارجي (قاعدة بيانات/Redis)، وخدمات أدوات داعمة، ونظام تسجيل/مراقبة قوي (غالبًا OpenTelemetry)، نمطًا شائعًا. يمكن التحكم في التكاليف من خلال التخزين المؤقت للاسترجاع، وملخصات الحالة المختصرة، ونماذج أصغر للتوجيه/الاستخراج، وحصر التفكير العميق في أصعب الخطوات. استخدم قوائم الانتظار للمهام الطويلة لتجنب إبقاء طلبات الويب مفتوحة. احرص دائمًا على تضمين مفتاح إيقاف تلقائي.
مراجع
-
المعهد الوطني للمعايير والتكنولوجيا (NIST) - إطار إدارة مخاطر الذكاء الاصطناعي NIST 1.0 (الموثوقية والشفافية) - nvlpubs.nist.gov
-
OpenAI - المخرجات المنظمة - platform.openai.com
-
OpenAI - دليل استدعاء الدوال - platform.openai.com
-
OpenAI - دليل حدود المعدل - platform.openai.com
-
OpenAI - يدير واجهة برمجة التطبيقات - Platform.openai.com
-
OpenAI - استدعاء وظائف المساعدين - platform.openai.com
-
LangChain - وثائق الوكلاء (جافا سكريبت) - docs.langchain.com
-
LangChain - وثائق الأدوات (بايثون) - docs.langchain.com
-
LangChain - نظرة عامة على الذاكرة - docs.langchain.com
-
arXiv - ورقة بحثية بعنوان ReAct (السبب + الفعل) - arxiv.org
-
arXiv - ورقة بحثية RAG - arxiv.org
-
مكتبة أدوات بناء خدمات أمازون السحابية (AWS) - مهلات الانتظار، وإعادة المحاولات، والتراجع مع التذبذب - aws.amazon.com
-
OpenTelemetry - مقدمة في قابلية المراقبة - opentelemetry.io
-
Stripe - الطلبات المتكررة - docs.stripe.com
-
جوجل كلاود - استراتيجية إعادة المحاولة (التراجع + التذبذب) - docs.cloud.google.com
-
OWASP - أهم 10 تطبيقات لنماذج اللغة الكبيرة - owasp.org
-
OWASP - LLM01 حقن موجه الأوامر - genai.owasp.org
-
لاما إندكس - مقدمة إلى نظام RAG - developers.llamaindex.ai
-
مايكروسوفت - النواة الدلالية - learn.microsoft.com
-
Microsoft AutoGen متعدد الوكلاء (الوثائق) - microsoft.github.io
-
CrewAI - مفاهيم الوكلاء - docs.crewai.com
-
Haystack (deepset) - وثائق أدوات الاسترجاع - docs.haystack.deepset.ai