باختصار: نماذج الأساس هي نماذج ذكاء اصطناعي ضخمة ومتعددة الأغراض، تُدرَّب على مجموعات بيانات واسعة النطاق، ثم تُكيَّف مع العديد من المهام (الكتابة، البحث، البرمجة، الصور) من خلال التوجيه، والضبط الدقيق، والأدوات، أو الاسترجاع. إذا كنتَ بحاجة إلى إجابات موثوقة، فاربطها بأسس راسخة (مثل RAG)، وقيود واضحة، وفحوصات، بدلاً من تركها ترتجل.
أهم النقاط المستفادة:
التعريف : نموذج أساسي واحد مدرب على نطاق واسع يتم إعادة استخدامه عبر العديد من المهام، وليس مهمة واحدة لكل نموذج.
التكيف : استخدم التوجيه، والضبط الدقيق، وLoRA/المحولات، وRAG، والأدوات لتوجيه السلوك.
التوافق التوليدي : فهي تدعم توليد النصوص والصور والصوت والرموز والمحتوى متعدد الوسائط.
إشارات الجودة : إعطاء الأولوية للتحكم، وتقليل الهلوسة، والقدرة متعددة الوسائط، والاستدلال الفعال.
ضوابط المخاطر : التخطيط للهلوسة والتحيز وتسريب الخصوصية والحقن الفوري من خلال الحوكمة والاختبار.

مقالات قد ترغب في قراءتها بعد هذه المقالة:
🔗 ما هي شركة الذكاء الاصطناعي
افهم كيف تقوم شركات الذكاء الاصطناعي ببناء المنتجات والفرق ونماذج الإيرادات.
🔗 كيف يبدو كود الذكاء الاصطناعي
اطلع على أمثلة لبرامج الذكاء الاصطناعي، بدءًا من نماذج بايثون وصولًا إلى واجهات برمجة التطبيقات (APIs).
🔗 ما هي خوارزمية الذكاء الاصطناعي؟
تعرّف على ماهية خوارزميات الذكاء الاصطناعي وكيف تتخذ القرارات.
🔗 ما هي تقنية الذكاء الاصطناعي؟
استكشف تقنيات الذكاء الاصطناعي الأساسية التي تدعم الأتمتة والتحليلات والتطبيقات الذكية.
1) نماذج الأساس - تعريف واضح لا لبس فيه 🧠
النموذج الأساسي هو نموذج ذكاء اصطناعي كبير وعام الأغراض يتم تدريبه على بيانات واسعة النطاق (عادةً ما تكون أطنانًا منها) بحيث يمكن تكييفه مع العديد من المهام، وليس مهمة واحدة فقط ( NIST ، Stanford CRFM ).
بدلاً من بناء نموذج منفصل لـ:
-
كتابة رسائل البريد الإلكتروني
-
الإجابة على الأسئلة
-
تلخيص ملفات PDF
-
توليد الصور
-
تصنيف تذاكر الدعم
-
ترجمة اللغات
-
تقديم اقتراحات برمجية
...تقوم بتدريب نموذج أساسي كبير واحد "يتعلم العالم" بطريقة إحصائية ضبابية، ثم تقوم بتكييفه مع وظائف محددة من خلال المطالبات أو الضبط الدقيق أو الأدوات المضافة ( بوماساني وآخرون، 2021 ).
بمعنى آخر: إنه محرك عام يمكنك توجيهه.
نعم، الكلمة المفتاحية هي "عام". هذه هي الحيلة بأكملها.
٢) ما هي النماذج الأساسية في الذكاء الاصطناعي التوليدي؟ (وكيف تتناسب تحديدًا) 🎨📝
إذن، ما هي النماذج الأساسية في الذكاء الاصطناعي التوليدي؟ إنها النماذج الأساسية التي تدعم الأنظمة التي يمكنها توليد محتوى جديد - نص، صور، صوت، كود، فيديو، وبشكل متزايد ... مزيج من كل ذلك ( NIST ، ملف تعريف الذكاء الاصطناعي التوليدي NIST ).
لا يقتصر الذكاء الاصطناعي التوليدي على التنبؤ بتصنيفات مثل "بريد مزعج / ليس بريدًا مزعجًا". بل يتعلق الأمر بإنتاج مخرجات تبدو وكأنها من صنع شخص.
-
فقرات
-
قصائد
-
وصف المنتج
-
الرسوم التوضيحية
-
ألحان
-
نماذج أولية للتطبيقات
-
أصوات اصطناعية
-
وأحيانًا كلام فارغ واثق بشكل غير معقول 🙃
تُعد نماذج المؤسسات بشكل خاص هنا للأسباب التالية:
-
لقد استوعبوا أنماطًا واسعة من مجموعات البيانات الضخمة ( بوماساني وآخرون، 2021 )
-
ويمكنهم التعميم على مطالبات جديدة (حتى تلك الغريبة) ( براون وآخرون، 2020 )
-
يمكن إعادة استخدامها لعشرات المخرجات دون الحاجة إلى إعادة التدريب من الصفر ( بوماساني وآخرون، 2021 ).
إنها "الطبقة الأساسية" - مثل عجينة الخبز. يمكنك خبزها على شكل رغيف فرنسي، أو بيتزا، أو لفائف قرفة... ليس تشبيهًا مثاليًا، لكنك تفهم قصدي 😄
3) لماذا غيّروا كل شيء (ولماذا لا يتوقف الناس عن الحديث عنهم) 🚀
قبل ظهور النماذج الأساسية، كان الكثير من الذكاء الاصطناعي مخصصًا لمهام محددة:
-
تدريب نموذج لتحليل المشاعر
-
قم بتدريب شخص آخر على الترجمة
-
قم بتدريب برنامج آخر لتصنيف الصور
-
قم بتدريب برنامج آخر للتعرف على الكيانات المسماة
لقد نجح ذلك، لكنه كان بطيئاً ومكلفاً وهشاً نوعاً ما.
لقد قلبت نماذج المؤسسة الأمور رأسًا على عقب:
-
التدريب المسبق مرة واحدة (جهد كبير)
-
إعادة الاستخدام في كل مكان (مكافأة كبيرة) ( بوماساني وآخرون، 2021 )
إن إعادة الاستخدام هذه هي العامل المضاعف. يمكن للشركات بناء 20 ميزة على أساس عائلة نماذج واحدة، بدلاً من إعادة اختراع العجلة 20 مرة.
كما أصبحت تجربة المستخدم أكثر سلاسة:
-
أنت لا "تستخدم مصنفًا"
-
تتحدث إلى النموذج كما لو كان زميلًا متعاونًا لا ينام أبدًا ☕🤝
أحيانًا يكون الأمر أشبه بزميل عمل يسيء فهم كل شيء بثقة، ولكن مهلاً، إنه النمو.
4) الفكرة الأساسية: التدريب المسبق + التكيف 🧩
تتبع جميع نماذج الأساس تقريبًا نمطًا معينًا ( ستانفورد CRFM ، المعهد الوطني للمعايير والتكنولوجيا ):
مرحلة ما قبل التدريب (مرحلة "استيعاب المعلومات عبر الإنترنت") 📚
يتم تدريب النموذج على مجموعات بيانات ضخمة وواسعة النطاق باستخدام التعلم الذاتي ( NIST ). بالنسبة لنماذج اللغة، يعني ذلك عادةً التنبؤ بالكلمات المفقودة أو الرمز التالي ( Devlin et al., 2018 , Brown et al., 2020 ).
ليس الهدف تعليمه مهمة واحدة، بل تعليمه تمثيلات عامة .
-
قواعد اللغة
-
حقائق (نوعاً ما)
-
أنماط التفكير (أحيانًا)
-
أساليب الكتابة
-
بنية الكود
-
النية الإنسانية المشتركة
التكييف (مرحلة "جعلها عملية") 🛠️
ثم تقوم بتعديله باستخدام واحد أو أكثر مما يلي:
-
التوجيه (التعليمات بلغة بسيطة)
-
ضبط التعليمات (تدريبها على اتباع التعليمات) ( Wei et al., 2021 )
-
الضبط الدقيق (التدريب على بيانات المجال الخاص بك)
-
LoRA / المحولات (طرق الضبط الخفيفة) ( هو وآخرون، 2021 )
-
RAG (التوليد المعزز بالاسترجاع - يستشير النموذج مستنداتك) ( Lewis et al., 2020 )
-
استخدام الأدوات (استدعاء الوظائف، تصفح الأنظمة الداخلية، إلخ).
لهذا السبب يستطيع نفس النموذج الأساسي كتابة مشهد رومانسي... ثم المساعدة في تصحيح استعلام SQL بعد خمس ثوانٍ 😭
5) ما الذي يجعل نموذج الأساس جيدًا؟ ✅
هذا هو القسم الذي يتجاهله الناس، ثم يندمون عليه لاحقاً.
لا يقتصر نموذج الأساس "الجيد" على كونه "أكبر" حجماً فحسب. صحيح أن الحجم الأكبر يساعد، لكنه ليس العامل الوحيد. عادةً ما يتضمن النموذج الجيد للأساس ما يلي:
تعميم قوي 🧠
يؤدي أداءً جيدًا في العديد من المهام دون الحاجة إلى إعادة تدريب خاصة بكل مهمة ( بوماساني وآخرون، 2021 ).
التوجيه والتحكم 🎛️
يمكنه اتباع التعليمات بشكل موثوق، مثل:
-
"كن موجزًا"
-
استخدم النقاط
-
"اكتب بأسلوب ودود"
-
"لا تكشف عن معلومات سرية"
بعض النماذج ذكية لكنها زلقة. كأنك تحاول تثبيت قطعة صابون في الحمام. مفيدة، لكنها غير مستقرة 😅
انخفاض الميل إلى الهلوسة (أو على الأقل عدم اليقين الصريح) 🧯
لا يوجد نموذج محصن ضد الهلوسة، إلا النماذج الجيدة منها:
-
الهلوسة أقل
-
اعترف بعدم اليقين بشكل متكرر
-
البقاء أقرب إلى السياق المقدم عند استخدام الاسترجاع ( Ji et al., 2023 , Lewis et al., 2020 )
قدرة جيدة على استخدام الوسائط المتعددة (عند الحاجة) 🖼️🎧
إذا كنت تقوم ببناء مساعدين يقرؤون الصور، أو يفسرون المخططات، أو يفهمون الصوت، فإن الوسائط المتعددة مهمة للغاية ( رادفورد وآخرون، 2021 ).
استدلال فعال ⚡
يُعدّ كلٌّ من زمن الاستجابة والتكلفة أمراً بالغ الأهمية. فالنموذج القويّ ولكنه بطيء يشبه سيارة رياضية ذات إطار مثقوب.
سلوك السلامة والمحاذاة 🧩
ليس فقط "رفض كل شيء"، بل:
-
تجنب التعليمات الضارة
-
الحد من التحيز
-
التعامل مع المواضيع الحساسة بحذر
-
مقاومة محاولات اختراق النظام الأساسية (إلى حد ما...) ( NIST AI RMF 1.0 ، ملف تعريف الذكاء الاصطناعي التوليدي من NIST )
التوثيق + النظام البيئي 🌱
قد يبدو هذا الكلام جافاً، لكنه حقيقي:
-
أدوات
-
أحزمة التقييم
-
خيارات النشر
-
ضوابط المؤسسة
-
دعم الضبط الدقيق
نعم، كلمة "نظام بيئي" كلمة غامضة. أكرهها أيضاً. لكنها مهمة.
6) جدول مقارنة - خيارات نماذج الأساس الشائعة (وما هي استخداماتها) 🧾
فيما يلي جدول مقارنة عملي، وإن لم يكن مثالياً تماماً. إنه ليس "القائمة الصحيحة الوحيدة"، بل هو أقرب إلى: ما يختاره الناس في الواقع.
| نوع الأداة / النموذج | جمهور | سعره تقريبًا | لماذا ينجح ذلك |
|---|---|---|---|
| برنامج ماجستير القانون الخاص (بأسلوب المحادثة) | الفرق التي ترغب في السرعة والإتقان | قائم على الاستخدام / الاشتراك | اتباع التعليمات بشكل ممتاز، وأداء عام قوي، وعادةً ما يكون الأفضل "مباشرةً بعد إخراجه من العلبة" 😌 |
| ماجستير في القانون مفتوح الوزن (يمكن استضافته ذاتيًا) | المقاولون الذين يرغبون في السيطرة | تكلفة البنية التحتية (والمتاعب) | قابل للتخصيص، يحافظ على الخصوصية، ويمكن تشغيله محليًا... إذا كنت من هواة التعديل والتجريب في منتصف الليل |
| مولد صور الانتشار | المبدعون وفرق التصميم | من مجاني إلى مدفوع | توليف صور ممتاز، وتنوع في الأساليب، وسير عمل تكراري (أيضًا: قد تكون الأصابع غير دقيقة) ✋😬 ( هو وآخرون، 2020 ، رومباخ وآخرون، 2021 ) |
| نموذج "الرؤية واللغة" متعدد الوسائط | تطبيقات تقرأ الصور والنصوص | يعتمد على الاستخدام | يتيح لك طرح أسئلة حول الصور ولقطات الشاشة والرسوم البيانية - وهو أمر مفيد بشكل مدهش ( رادفورد وآخرون، 2021 ) |
| نموذج أساس التضمين | البحث + أنظمة RAG | تكلفة منخفضة لكل مكالمة | يحول النص إلى متجهات للبحث الدلالي والتجميع والتوصية - طاقة MVP هادئة ( Karpukhin et al., 2020 , Douze et al., 2024 ) |
| نموذج أساسي لتحويل الكلام إلى نص | مراكز الاتصال، المبدعون | الاستخدام المحلي | نسخ سريع، دعم متعدد اللغات، جودة كافية للصوت المشوش (عادةً) 🎙️ ( همس ) |
| نموذج أساسي لتحويل النص إلى كلام | فرق المنتجات، وسائل الإعلام | يعتمد على الاستخدام | توليد الصوت الطبيعي، وأنماط الصوت، والسرد - يمكن أن يصبح الأمر مخيفًا وواقعيًا ( شين وآخرون، 2017 ) |
| ماجستير في القانون يركز على القانون | المطورين | قائم على الاستخدام / الاشتراك | أجيد أنماط البرمجة، وتصحيح الأخطاء، وإعادة هيكلة الكود... لكنني لست قارئ أفكار مع ذلك 😅 |
لاحظ كيف أن "النموذج الأساسي" لا يعني فقط "برنامج الدردشة الآلي". يمكن أن تكون عمليات التضمين ونماذج الكلام أساسية أيضًا، لأنها واسعة وقابلة لإعادة الاستخدام عبر المهام ( بوماساني وآخرون، 2021 ، المعهد الوطني للمعايير والتكنولوجيا ).
٧) نظرة أقرب: كيف تتعلم نماذج تأسيس اللغة (نسخة فايب) 🧠🧃
تُدرَّب نماذج أساس اللغة (التي تُسمى غالبًا نماذج LLM) عادةً على مجموعات ضخمة من النصوص. وتتعلم هذه النماذج من خلال التنبؤ بالرموز ( براون وآخرون، 2020 ). هذا كل شيء. لا توجد أي أسرار خفية.
لكن السحر يكمن في أن التنبؤ بالرموز يجبر النموذج على تعلم البنية ( CSET ):
-
القواعد النحوية والنحوية
-
العلاقات الموضوعية
-
أنماط شبيهة بالمنطق (أحيانًا)
-
تسلسلات التفكير الشائعة
-
كيف يشرح الناس الأمور، ويتجادلون، ويعتذرون، ويتفاوضون، ويعلّمون
يشبه الأمر تعلم تقليد ملايين المحادثات دون "فهم" طريقة فهم البشر لها. وهذا يبدو غير منطقي... ومع ذلك، يستمر في النجاح.
مبالغة بسيطة: الأمر أشبه بضغط الكتابة البشرية في دماغ احتمالي عملاق.
مع ذلك، هذا التشبيه فيه شيء من النحس. لكننا نمضي قدمًا 😄
٨) نظرة فاحصة: نماذج الانتشار (لماذا تعمل الصور بشكل مختلف) 🎨🌀
غالباً ما تستخدم نماذج أساس الصورة أساليب الانتشار هو وآخرون، 2020 ، رومباخ وآخرون، 2021 ).
الفكرة العامة:
-
أضف تشويشًا إلى الصور حتى تصبح أشبه بتشويش التلفاز
-
قم بتدريب نموذج لعكس هذا التشويش خطوة بخطوة
-
في وقت الإنشاء، ابدأ بالضوضاء وقم بإزالة الضوضاء من الصورة بتوجيه من موجه ( هو وآخرون، 2020 )
لهذا السبب يبدو توليد الصور أشبه بـ"تحميض" صورة فوتوغرافية، إلا أن الصورة عبارة عن تنين يرتدي حذاءً رياضيًا في ممر سوبر ماركت 🛒🐉
تُعد نماذج الانتشار جيدة للأسباب التالية:
-
فهي تُنتج صورًا عالية الجودة
-
يمكن توجيههم بقوة من خلال النصوص
-
وهي تدعم التحسين التكراري (الاختلافات، والترميم، والتوسيع) ( رومباخ وآخرون، 2021 )
كما أنهم يواجهون أحيانًا صعوبة في:
-
عرض النصوص داخل الصور
-
تفاصيل تشريحية دقيقة
-
الحفاظ على هوية الشخصية ثابتة عبر المشاهد (الأمر يتحسن، لكنه لا يزال كذلك)
9) نظرة أقرب: نماذج أساسية متعددة الوسائط (نص + صور + صوت) 👀🎧📝
تهدف نماذج الأساس متعددة الوسائط إلى فهم وإنشاء البيانات عبر أنواع متعددة من البيانات:
-
نص
-
صور
-
صوتي
-
فيديو
-
أحيانًا مدخلات تشبه المستشعرات ( ملف تعريف الذكاء الاصطناعي التوليدي التابع للمعهد الوطني للمعايير والتكنولوجيا )
لماذا يُعد هذا الأمر مهمًا في الحياة الواقعية؟
-
بإمكان فريق دعم العملاء تفسير لقطات الشاشة
-
يمكن لأدوات إمكانية الوصول وصف الصور
-
يمكن لتطبيقات التعليم شرح الرسوم البيانية
-
يمكن للمبدعين إعادة مزج التنسيقات بسرعة
-
يمكن لأدوات الأعمال "قراءة" لقطة شاشة لوحة المعلومات وتلخيصها
في جوهرها، تقوم الأنظمة متعددة الوسائط غالبًا بمواءمة التمثيلات:
-
تحويل صورة إلى تضمينات
-
تحويل النص إلى تضمينات
-
تعلم مساحة مشتركة حيث تتطابق كلمة "قطة" مع بكسلات القطط 😺 ( رادفورد وآخرون، 2021 )
ليس الأمر أنيقاً دائماً. أحياناً يكون مخيطاً معاً مثل لحاف. لكنه يؤدي الغرض.
10) الضبط الدقيق مقابل التوجيه مقابل RAG (كيفية تعديل النموذج الأساسي) 🧰
إذا كنت تحاول جعل نموذج أساسي عمليًا لمجال معين (قانوني، طبي، خدمة عملاء، معرفة داخلية)، فلديك بعض الأدوات:
الحث 🗣️
الأسرع والأبسط.
-
المزايا: لا حاجة للتدريب، وإمكانية التكرار الفوري
-
السلبيات: قد يكون غير متسق، ومحدود السياق، وهشاشة الرسائل الفورية
ضبط دقيق 🎯
قم بتدريب النموذج بشكل أكبر على أمثلتك.
-
المزايا: سلوك أكثر اتساقًا، لغة مجال أفضل، إمكانية تقليل طول التعليمات
-
السلبيات: التكلفة، متطلبات جودة البيانات، خطر التخصيص الزائد، الصيانة
ضبط خفيف الوزن (LoRA / محولات) 🧩
نسخة أكثر كفاءة من الضبط الدقيق ( هو وآخرون، 2021 ).
-
المزايا: أرخص، قابل للتعديل، أسهل في الاستبدال
-
السلبيات: لا يزال بحاجة إلى مسار تدريبي وتقييم
RAG (الجيل المعزز بالاسترجاع) 🔎
يقوم النموذج بجلب المستندات ذات الصلة من قاعدة المعرفة الخاصة بك ويجيب باستخدامها ( Lewis et al., 2020 ).
-
المزايا: معرفة حديثة، وإمكانية الاستشهاد داخليًا (إذا تم تطبيق ذلك)، وتقليل الحاجة إلى إعادة التدريب
-
السلبيات: جودة الاسترجاع عامل حاسم، ويتطلب الأمر تقسيمًا جيدًا للبيانات وتضمينها
بصراحة: العديد من الأنظمة الناجحة تجمع بين التوجيه والتنسيق التلقائي. الضبط الدقيق فعال، لكنه ليس ضروريًا دائمًا. يلجأ إليه الناس بسرعة كبيرة لأنه يبدو مثيرًا للإعجاب 😅
11) المخاطر والقيود وقسم "يرجى عدم استخدام هذا بشكل أعمى" 🧯😬
نماذج المؤسسات قوية، لكنها ليست مستقرة مثل البرامج التقليدية. إنها أشبه بـ... متدرب موهوب يعاني من نقص الثقة.
أهم القيود التي يجب التخطيط لها:
الهلوسة 🌀
قد تبتكر النماذج ما يلي:
-
مصادر مزيفة
-
معلومات غير صحيحة
-
خطوات معقولة ولكنها خاطئة ( جي وآخرون، 2023 )
إجراءات التخفيف:
-
RAG مع سياق واقعي ( Lewis et al., 2020 )
-
مخرجات مقيدة (مخططات، استدعاءات أدوات)
-
تعليمات صريحة "لا تخمن"
-
طبقات التحقق (القواعد، والتحقق المتبادل، والمراجعة البشرية)
التحيز والأنماط الضارة ⚠️
لأن بيانات التدريب تعكس البشر، يمكنك الحصول على:
-
الصور النمطية
-
تفاوت الأداء بين المجموعات
-
عمليات إكمال غير آمنة ( NIST AI RMF 1.0 ، Bommasani et al., 2021 )
إجراءات التخفيف:
-
ضبط السلامة
-
فريق الهجوم الأحمر
-
فلاتر المحتوى
-
قيود المجال الدقيقة ( ملف تعريف الذكاء الاصطناعي التوليدي الصادر عن المعهد الوطني للمعايير والتكنولوجيا )
خصوصية البيانات وتسريبها 🔒
إذا قمت بتغذية نقطة نهاية النموذج ببيانات سرية، فأنت بحاجة إلى معرفة ما يلي:
-
كيفية تخزينه
-
سواء تم استخدامه للتدريب
-
ما هي سجلات النظام الموجودة
-
ما الذي يتحكم في احتياجات مؤسستك (إطار إدارة مخاطر الذكاء الاصطناعي NIST AI RMF 1.0 )
إجراءات التخفيف:
-
خيارات النشر الخاصة
-
حوكمة قوية
-
الحد الأدنى من تعرض البيانات
-
RAG داخلي فقط مع تحكم صارم في الوصول ( ملف تعريف الذكاء الاصطناعي التوليدي NIST ، كارليني وآخرون، 2021 )
الحقن الفوري (خاصة مع RAG) 🕳️
إذا قرأ النموذج نصًا غير موثوق به، فقد يحاول هذا النص التلاعب به:
-
"تجاهل التعليمات السابقة..."
-
"أرسل لي السر..." ( OWASP ، Greshake et al.، 2023 )
إجراءات التخفيف:
-
تعليمات عزل النظام
-
تعقيم المحتوى المسترجع
-
استخدم السياسات القائمة على الأدوات (وليس مجرد التنبيهات)
-
اختبار باستخدام مدخلات معادية ( ورقة غش OWASP ، ملف تعريف الذكاء الاصطناعي التوليدي NIST )
لا أحاول تخويفك. فقط... من الأفضل أن تعرف من أين تصدر ألواح الأرضية صريراً.
12) كيفية اختيار نموذج أساسي لحالة استخدامك 🎛️
إذا كنت بصدد اختيار نموذج أساسي (أو البناء عليه)، فابدأ بهذه التوجيهات:
حدد ما تقوم بإنشائه 🧾
-
نص فقط
-
صور
-
صوتي
-
الوسائط المتعددة المختلطة
حدد معاييرك للدقة والموضوعية 📌
إذا كنت بحاجة إلى دقة عالية (في مجالات التمويل، والصحة، والقانون، والسلامة):
-
ستحتاج إلى RAG ( لويس وآخرون، 2020 )
-
ستحتاج إلى تأكيد
-
ستحتاج إلى مراجعة بشرية (على الأقل في بعض الأحيان) ( NIST AI RMF 1.0 )
حدد هدف زمن الاستجابة ⚡
الدردشة فورية. قد يكون التلخيص الدفعي أبطأ.
إذا كنت بحاجة إلى استجابة فورية، فإن حجم النموذج والاستضافة أمران مهمان.
متطلبات خصوصية الخرائط والامتثال 🔐
تتطلب بعض الفرق ما يلي:
-
النشر المحلي / VPC
-
لا يتم الاحتفاظ بالبيانات
-
سجلات تدقيق صارمة
-
التحكم في الوصول لكل مستند ( NIST AI RMF 1.0 ، ملف تعريف الذكاء الاصطناعي التوليدي NIST )
موازنة الميزانية - والصبر في العمليات 😅
توفر الاستضافة الذاتية تحكماً كاملاً، لكنها تزيد من التعقيد. أما
واجهات برمجة التطبيقات المُدارة فهي سهلة الاستخدام، لكنها قد تكون مكلفة وأقل قابلية للتخصيص.
نصيحة عملية بسيطة: ابدأ بنموذج أولي بسيط، ثم حسّنه لاحقاً. البدء بإعداد "مثالي" عادةً ما يُبطئ كل شيء.
١٣) ما هي النماذج الأساسية في الذكاء الاصطناعي التوليدي؟ (النموذج الذهني السريع) 🧠✨
لنعد إلى الموضوع. ما هي النماذج الأساسية في الذكاء الاصطناعي التوليدي؟
وهم:
-
نماذج عامة كبيرة تم تدريبها على بيانات واسعة النطاق ( NIST ، Stanford CRFM )
-
قادر على توليد المحتوى (نصوص، صور، صوت، إلخ) ( ملف تعريف الذكاء الاصطناعي التوليدي التابع للمعهد الوطني للمعايير والتكنولوجيا )
-
قابل للتكيف مع العديد من المهام من خلال التوجيهات والضبط الدقيق والاسترجاع ( بوماساني وآخرون، 2021 )
-
الطبقة الأساسية التي تدعم معظم منتجات الذكاء الاصطناعي التوليدي الحديثة
إنها ليست بنية واحدة أو علامة تجارية واحدة. إنها فئة من النماذج التي تعمل كمنصة.
إنّ نموذج الأساس أشبه بمطبخ منه بآلة حاسبة. يمكنك طهي الكثير من الوجبات فيه. وقد تحرق الخبز المحمص إن لم تنتبه... لكن المطبخ يبقى مفيدًا للغاية 🍳🔥
14) ملخص واستنتاجات ✅🙂
تُعدّ النماذج الأساسية بمثابة المحركات القابلة لإعادة الاستخدام للذكاء الاصطناعي التوليدي. يتم تدريبها على نطاق واسع، ثم تُكيّف مع مهام محددة من خلال التوجيه والضبط الدقيق والاسترجاع ( المعهد الوطني للمعايير والتكنولوجيا ، مركز ستانفورد لأبحاث النماذج الأساسية ). يمكن أن تكون هذه النماذج مذهلة، وغير منظمة، وقوية، وأحيانًا سخيفة - كل ذلك في آن واحد.
خلاصة:
-
النموذج الأساسي = نموذج أساسي للأغراض العامة ( المعهد الوطني للمعايير والتكنولوجيا )
-
الذكاء الاصطناعي التوليدي = إنشاء المحتوى، وليس مجرد تصنيفه ( ملف تعريف الذكاء الاصطناعي التوليدي الصادر عن المعهد الوطني للمعايير والتكنولوجيا )
-
أساليب التكيف (التوجيه، RAG، الضبط) تجعلها عملية ( Lewis et al., 2020 ، Hu et al., 2021 ).
-
إن اختيار النموذج يتعلق بالمفاضلات: الدقة، والتكلفة، وزمن الاستجابة، والخصوصية، والسلامة ( NIST AI RMF 1.0 )
إذا كنت تبني أي شيء باستخدام الذكاء الاصطناعي التوليدي، فإن فهم نماذج الأساس ليس اختيارياً. إنها الأساس الذي يقوم عليه المبنى بأكمله... ونعم، أحياناً قد يهتز الأساس قليلاً 😅
التعليمات
نماذج المؤسسات، بعبارات بسيطة
النموذج الأساسي هو نموذج ذكاء اصطناعي كبير ومتعدد الأغراض، يتم تدريبه على بيانات واسعة النطاق بحيث يمكن إعادة استخدامه في العديد من المهام. فبدلاً من بناء نموذج واحد لكل مهمة، تبدأ بنموذج "أساسي" قوي، ثم تُعدّله حسب الحاجة. ويتم هذا التعديل غالبًا من خلال التوجيه، أو الضبط الدقيق، أو الاسترجاع (RAG)، أو الأدوات. والفكرة الأساسية هي الجمع بين الشمولية وقابلية التوجيه.
كيف تختلف النماذج الأساسية عن نماذج الذكاء الاصطناعي التقليدية الخاصة بالمهام؟
تعتمد تقنيات الذكاء الاصطناعي التقليدية عادةً على تدريب نموذج منفصل لكل مهمة، مثل تحليل المشاعر أو الترجمة. أما نماذج البنية التحتية، فتعكس هذا النمط: إذ تُدرَّب مسبقًا مرة واحدة، ثم يُعاد استخدامها في العديد من الميزات والمنتجات. وهذا من شأنه أن يقلل من الجهد المكرر ويسرّع من طرح إمكانيات جديدة. لكن في المقابل، قد تكون هذه النماذج أقل قابلية للتنبؤ من البرامج التقليدية ما لم تُضَف إليها قيود واختبارات.
نماذج أساسية في الذكاء الاصطناعي التوليدي
في الذكاء الاصطناعي التوليدي، تُعدّ النماذج الأساسية الأنظمة الرئيسية القادرة على إنتاج محتوى جديد كالنصوص والصور والصوت والبرمجيات والمخرجات متعددة الوسائط. ولا تقتصر وظيفتها على التصنيف والوسم، بل تُنتج استجابات تُحاكي الأعمال البشرية. وبفضل قدرتها على تعلّم أنماط عامة خلال التدريب المسبق، تستطيع هذه النماذج التعامل مع أنواع وتنسيقات مُتعددة من المُدخلات. إنها تُشكّل "الطبقة الأساسية" التي تقوم عليها معظم التجارب التوليدية الحديثة.
كيف تتعلم النماذج الأساسية أثناء التدريب المسبق
تتعلم معظم نماذج بناء اللغة من خلال التنبؤ بالرموز، مثل الكلمة التالية أو الكلمات المفقودة في النص. يدفعها هذا الهدف البسيط إلى استيعاب البنية اللغوية كالقواعد والأسلوب وأنماط الشرح الشائعة. كما يمكنها استيعاب قدر كبير من المعرفة العامة، وإن لم يكن ذلك دائمًا بدقة. والنتيجة هي تمثيل عام قوي يمكن توجيهه لاحقًا نحو مهام محددة.
الفرق بين التوجيه، والضبط الدقيق، وLoRA، وRAG
يُعدّ التوجيه أسرع طريقة لضبط السلوك باستخدام التعليمات، ولكنه قد يكون غير دقيق. أما الضبط الدقيق فيُدرّب النموذج بشكل أكبر على الأمثلة المُقدّمة للحصول على سلوك أكثر اتساقًا، ولكنه يزيد من التكلفة والصيانة. تُعتبر LoRA/المحولات أسلوبًا أبسط للضبط الدقيق، وغالبًا ما يكون أقل تكلفة وأكثر مرونة. يسترجع RAG المستندات ذات الصلة، ويُجيب النموذج باستخدام هذا السياق، مما يُساعد على تحديث البيانات وترسيخها.
متى يُنصح باستخدام RAG بدلاً من الضبط الدقيق؟
يُعدّ نظام RAG خيارًا قويًا في كثير من الأحيان عندما تحتاج إلى إجابات تستند إلى مستنداتك الحالية أو قاعدة معارفك الداخلية. فهو يُقلّل من التخمين من خلال تزويد النموذج بالسياق ذي الصلة أثناء عملية الإنشاء. أما الضبط الدقيق فهو أنسب عندما تحتاج إلى أسلوب متسق، أو صياغة خاصة بالمجال، أو سلوك لا يُمكن لنظام التوجيه إنتاجه بدقة. وتجمع العديد من الأنظمة العملية بين التوجيه ونظام RAG قبل اللجوء إلى الضبط الدقيق.
كيفية تقليل الهلوسة والحصول على إجابات أكثر موثوقية
يتمثل أحد الأساليب الشائعة في ربط النموذج بالاسترجاع (RAG) لضمان بقائه قريبًا من السياق المُقدّم. كما يُمكنك تقييد المخرجات باستخدام المخططات، واشتراط استدعاء الأدوات للخطوات الرئيسية، وإضافة تعليمات صريحة لتجنب التخمين. تُعدّ طبقات التحقق مهمة أيضًا، مثل فحص القواعد، والتحقق المتبادل، والمراجعة البشرية لحالات الاستخدام ذات الأهمية البالغة. تعامل مع النموذج كأداة مساعدة احتمالية، وليس كمصدر موثوق للحقيقة بشكل افتراضي.
أكبر المخاطر المتعلقة بنماذج الأساسات في الإنتاج
تشمل المخاطر الشائعة الهلوسة، والأنماط المتحيزة أو الضارة في بيانات التدريب، وتسريب البيانات الحساسة في حال سوء التعامل معها. كما قد تكون الأنظمة عرضةً لهجمات حقن الرسائل، خاصةً عندما يقرأ النموذج نصوصًا غير موثوقة من المستندات أو محتوى الويب. وتشمل إجراءات التخفيف عادةً الحوكمة، واختبارات الاختراق، وضوابط الوصول، وأنماط الرسائل الآمنة، والتقييم المنظم. لذا، يُنصح بالتخطيط لهذه المخاطر مبكرًا بدلًا من محاولة إصلاحها لاحقًا.
الحقن الفوري وأهميته في أنظمة RAG
يحدث حقن التعليمات عندما يحاول نص غير موثوق به تجاوز التعليمات، مثل "تجاهل التوجيهات السابقة" أو "كشف الأسرار". في RAG، قد تحتوي المستندات المسترجعة على هذه التعليمات الخبيثة، وقد يتبعها النموذج إذا لم تكن حذرًا. يتمثل أحد الأساليب الشائعة في عزل تعليمات النظام، وتنظيف المحتوى المسترجع، والاعتماد على سياسات الأدوات بدلًا من التعليمات وحدها. يساعد الاختبار باستخدام مدخلات معادية في الكشف عن نقاط الضعف.
كيفية اختيار نموذج أساسي لحالة استخدامك
ابدأ بتحديد ما تحتاج إلى إنشائه: نصوص، صور، ملفات صوتية، أكواد، أو مخرجات متعددة الوسائط. ثم حدد معايير الدقة لديك - فالمجالات عالية الدقة غالبًا ما تتطلب ترسيخًا (RAG)، وتحققًا، وأحيانًا مراجعة بشرية. ضع في اعتبارك زمن الاستجابة والتكلفة، لأن النموذج القوي البطيء أو المكلف قد يصعب نشره. أخيرًا، اربط احتياجات الخصوصية والامتثال بخيارات النشر وضوابطه.
مراجع
-
المعهد الوطني للمعايير والتكنولوجيا (NIST) - النموذج الأساسي (مصطلح من المسرد) - csrc.nist.gov
-
المعهد الوطني للمعايير والتكنولوجيا (NIST) - NIST AI 600-1: ملف تعريف الذكاء الاصطناعي التوليدي - nvlpubs.nist.gov
-
المعهد الوطني للمعايير والتكنولوجيا (NIST) - NIST AI 100-1: إطار إدارة مخاطر الذكاء الاصطناعي (AI RMF 1.0) - nvlpubs.nist.gov
-
مركز ستانفورد لأبحاث نماذج المؤسسات (CRFM) - تقرير - crfm.stanford.edu
-
arXiv - حول فرص ومخاطر نماذج الأساس (بوماساني وآخرون، 2021) - arxiv.org
-
arXiv - نماذج اللغة هي متعلمون بعدد قليل من الأمثلة (براون وآخرون، 2020) - arxiv.org
-
arXiv - توليد مُعزز بالاسترجاع لمهام معالجة اللغة الطبيعية كثيفة المعرفة (لويس وآخرون، 2020) - arxiv.org
-
arXiv - LoRA: تكييف النماذج اللغوية الكبيرة ذات الرتبة المنخفضة (هو وآخرون، 2021) - arxiv.org
-
arXiv - BERT: التدريب المسبق لنماذج التحويل ثنائية الاتجاه العميقة لفهم اللغة (ديفلين وآخرون، 2018) - arxiv.org
-
arXiv - نماذج اللغة المُحسَّنة هي متعلمون بدون تدريب مسبق (Wei et al., 2021) - arxiv.org
-
مكتبة ACM الرقمية - دراسة استقصائية حول الهلوسة في توليد اللغة الطبيعية (جي وآخرون، 2023) - dl.acm.org
-
arXiv - تعلم نماذج بصرية قابلة للنقل من خلال الإشراف باللغة الطبيعية (رادفورد وآخرون، 2021) - arxiv.org
-
arXiv - إزالة التشويش من نماذج الانتشار الاحتمالية (هو وآخرون، 2020) - arxiv.org
-
arXiv - توليف الصور عالية الدقة باستخدام نماذج الانتشار الكامنة (رومباخ وآخرون، 2021) - arxiv.org
-
arXiv - استرجاع المقاطع الكثيفة للإجابة على الأسئلة في المجال المفتوح (كاربوخين وآخرون، 2020) - arxiv.org
-
arXiv - مكتبة فايس (Douze et al., 2024) - arxiv.org
-
أوبن إيه آي - تقديم ويسبر - openai.com
-
arXiv - توليف تحويل النص إلى كلام طبيعي عن طريق تكييف WaveNet على تنبؤات مخططات ميل الطيفية (شين وآخرون، 2017) - arxiv.org
-
مركز الأمن والتكنولوجيا الناشئة (CSET)، جامعة جورجتاون - القوة المذهلة للتنبؤ بالكلمة التالية: شرح نماذج اللغة الكبيرة (الجزء 1) - cset.georgetown.edu
-
USENIX - استخراج بيانات التدريب من نماذج اللغة الكبيرة (كارليني وآخرون، 2021) - usenix.org
-
OWASP - LLM01: حقن فوري - genai.owasp.org
-
arXiv - أكثر مما طلبت: تحليل شامل لتهديدات حقن المطالبات الجديدة لنماذج اللغة الكبيرة المدمجة في التطبيقات (غريشاك وآخرون، 2023) - arxiv.org
-
سلسلة أوراق الغش الخاصة بـ OWASP - ورقة غش للوقاية من الحقن الفوري - cheatsheetseries.owasp.org