كيف تعمل تقنية رفع مستوى الذكاء الاصطناعي

كيف تعمل تقنية رفع مستوى الذكاء الاصطناعي؟

باختصار: تعمل تقنية تكبير الصور بالذكاء الاصطناعي عن طريق تدريب نموذج على صور متطابقة منخفضة وعالية الدقة، ثم استخدامه للتنبؤ ببكسلات إضافية واقعية أثناء عملية التكبير. إذا كان النموذج قد شاهد أنسجة أو وجوهًا مشابهة أثناء التدريب، فإنه يستطيع إضافة تفاصيل مقنعة؛ وإلا فقد يُظهر تشوهات بصرية مثل الهالات أو مظهر الجلد الشمعي أو الوميض في الفيديو.

أهم النقاط المستفادة:

التوقع : يُنتج النموذج تفاصيل معقولة، وليس إعادة بناء مضمونة للواقع.

اختيار النموذج : تميل الشبكات العصبية الالتفافية إلى أن تكون أكثر استقرارًا؛ يمكن أن تبدو الشبكات التوليدية الخصومية أكثر وضوحًا ولكنها تخاطر باختراع ميزات جديدة.

فحص القطع الأثرية : انتبه للهالات، والقوام المتكرر، و"الحروف شبه الحقيقية"، والوجوه البلاستيكية.

استقرار الفيديو : استخدم الطرق الزمنية وإلا سترى تذبذبًا وانحرافًا من إطار إلى آخر.

الاستخدام عالي المخاطر : إذا كانت الدقة مهمة، فيجب الكشف عن المعالجة ومعاملة النتائج على أنها توضيحية.

كيف تعمل تقنية رفع مستوى الذكاء الاصطناعي؟ رسم بياني.

ربما رأيت ذلك من قبل: صورة صغيرة مشوشة تتحول إلى صورة واضحة بما يكفي للطباعة أو البث أو إضافتها إلى عرض تقديمي دون أي مشكلة. يبدو الأمر وكأنه غش. وهو كذلك بالفعل - وهذا في أفضل الأحوال 😅

إذن، فإن آلية عمل تقنية تحسين دقة الصور بالذكاء الاصطناعي تتجاوز مجرد "تحسين الكمبيوتر للتفاصيل" (وهو مصطلح عام)، وتعتمد على "نموذج يتنبأ ببنية عالية الدقة محتملة بناءً على أنماط تعلمها من أمثلة عديدة" ( التعلم العميق لتحسين دقة الصور: دراسة استقصائية ). إن خطوة التنبؤ هذه هي جوهر العملية، وهي السبب في أن تحسين دقة الصور بالذكاء الاصطناعي قد يبدو مذهلاً... أو يبدو مصطنعاً بعض الشيء... أو كأن قطتك نمت لها شوارب إضافية.

مقالات قد ترغب في قراءتها بعد هذه المقالة:

🔗 كيف يعمل الذكاء الاصطناعي
تعلم أساسيات النماذج والبيانات والاستدلال في الذكاء الاصطناعي.

🔗 كيف يتعلم الذكاء الاصطناعي
تعرف على كيفية تحسين أداء النموذج بمرور الوقت من خلال بيانات التدريب والتعليقات.

🔗 كيف يكتشف الذكاء الاصطناعي الحالات الشاذة
فهم الأنماط الأساسية وكيفية قيام الذكاء الاصطناعي بتحديد السلوك غير المعتاد بسرعة.

🔗 كيف يتنبأ الذكاء الاصطناعي بالاتجاهات
استكشف أساليب التنبؤ التي ترصد الإشارات وتتوقع الطلب المستقبلي.


كيف تعمل تقنية رفع مستوى الذكاء الاصطناعي: الفكرة الأساسية، بكلمات بسيطة 🧩

تعني عملية تكبير الصورة زيادة الدقة: المزيد من البكسلات، صورة أكبر. تعتمد تقنيات تكبير الصورة التقليدية (مثل التكعيبية الثنائية) على تمديد البكسلات وتنعيم الانتقالات ( الاستيفاء التكعيبي الثنائي ). وهي تقنية جيدة، لكنها لا تستطيع إضافة جديدة ، بل تقوم فقط بالاستيفاء.

الذكاء الاصطناعي في تحسين دقة الصور تجربة شيء أكثر جرأة (يُعرف أيضًا باسم "الدقة الفائقة" في عالم البحث) ( التعلم العميق لتحسين دقة الصور: دراسة استقصائية ):

  • ينظر إلى المدخلات منخفضة الدقة

  • يتعرف على الأنماط (الحواف، والقوام، وملامح الوجه، وخطوط الكتابة، ونسيج القماش...)

  • يجب أن تبدو عليه النسخة ذات الدقة الأعلى

  • يقوم بتوليد بيانات بكسل إضافية تتناسب مع تلك الأنماط

ليس المقصود "استعادة الواقع بشكل مثالي"، بل أقرب إلى "تقديم تخمين مقنع للغاية" ( تحسين دقة الصور باستخدام الشبكات العصبية التلافيفية العميقة (SRCNN) ). إذا بدا هذا الأمر مثيرًا للريبة بعض الشيء، فأنت محق - ولكن هذا هو السبب في نجاحه الباهر 😄

نعم، هذا يعني أن ترقية الذكاء الاصطناعي هي في الأساس هلوسة متحكم بها ... ولكن بطريقة منتجة تحترم البكسل.


ما الذي يجعل نسخة الذكاء الاصطناعي من تقنية الترقية جيدة؟ ✅🛠️

إذا كنت تقيّم مُحسِّن دقة الصورة بالذكاء الاصطناعي (أو إعدادًا مسبقًا)، فإليك ما يهم أكثر:

  • استعادة التفاصيل دون الإفراط في المعالجة:
    تحسين الدقة يضيف وضوحًا وبنية، وليس ضوضاء مقرمشة أو مسامًا مزيفة.

  • انضباط الحواف:
    الخطوط النظيفة تبقى نظيفة. النماذج الرديئة تجعل الحواف تتذبذب أو تظهر عليها هالات.

  • فرشاة
    ، ولا ينبغي أن يتحول الطوب إلى نقش متكرر.

  • معالجة التشويش والضغط:
    تُعالج الكثير من الصور اليومية بصيغة JPEG بشكل مفرط. لا يُضخّم مُحسِّن الدقة الجيد هذا الضرر ( Real-ESRGAN ).

  • الوعي بالوجوه والنصوص:
    تُعدّ الوجوه والنصوص أسهل الأماكن لاكتشاف الأخطاء. وتتعامل النماذج الجيدة معها بلطف (أو تحتوي على أوضاع خاصة).

  • الاتساق بين الإطارات (للفيديو):
    إذا تذبذبت التفاصيل من إطار لآخر، فسوف تُصاب عيناك بالإجهاد. يعتمد نجاح أو فشل تحسين جودة الفيديو على الثبات الزمني ( BasicVSR (CVPR 2021) ).

  • عناصر تحكم منطقية.
    أنت تريد أشرطة تمرير تتوافق مع نتائج حقيقية: إزالة الضوضاء، وإزالة التشويش، وإزالة القطع الأثرية، والحفاظ على الحبيبات، والحدة... الأشياء العملية.

قاعدةٌ هادئةٌ لا تزال قائمة: غالبًا ما تكون أفضل عملية تحسين للصور هي تلك التي بالكاد تلاحظها. يبدو الأمر وكأن لديك كاميرا أفضل من البداية 📷✨


جدول مقارنة: خيارات تحسين جودة الصور بالذكاء الاصطناعي الشائعة (وما هي استخداماتها) 📊🙂

فيما يلي مقارنة عملية. الأسعار تقريبية عمداً لأن الأدوات تختلف باختلاف الترخيص والحزم وتكاليف الحوسبة وكل تلك الأمور.

الأداة / النهج الأفضل لـ أجواء السعر لماذا ينجح الأمر (تقريبًا)
أجهزة ترقية الصور المكتبية على غرار توباز ( توباز فوتو ، توباز فيديو ) صور، فيديو، سير عمل سهل مدفوع الأجر تقريبًا نماذج عامة قوية مع الكثير من التعديلات، تميل إلى أن "تعمل ببساطة"... في الغالب
ميزات من نوع "الدقة الفائقة" من Adobe ( تحسين Adobe > الدقة الفائقة ) المصورون الموجودون بالفعل في هذا النظام البيئي اشتراك-ي إعادة بناء بتفاصيل دقيقة، وعادة ما تكون محافظة (أقل دراما)
Real-ESRGAN / متغيرات ESRGAN ( Real-ESRGAN ، ESRGAN ) افعلها بنفسك، مطورون، وظائف معالجة الدفعات مجاني (لكنه يستغرق وقتاً طويلاً) ممتاز في إظهار تفاصيل الملمس، لكنه قد يكون قاسياً على الوجوه إذا لم تكن حذراً
أنماط التوسيع القائمة على الانتشار ( SR3 ) عمل إبداعي، نتائج منمقة مختلط يستطيع ابتكار تفاصيل رائعة، كما يستطيع اختلاق هراء، لذا... أجل
مُحسِّنات دقة الألعاب (نمط DLSS/FSR) ( NVIDIA DLSS ، AMD FSR 2 ) الألعاب والعرض في الوقت الفعلي حزمة يستخدم بيانات الحركة والمعلومات المسبقة المكتسبة - أداء سلس وفعال 🕹️
خدمات ترقية الحوسبة السحابية الراحة، المكاسب السريعة الدفع حسب الاستخدام سريع وقابل للتوسع، لكنك تتنازل عن التحكم وأحيانًا عن الدقة
مُحسِّنات جودة الفيديو التي تعمل بالذكاء الاصطناعي ( BasicVSR ، Topaz Video ) لقطات قديمة، أنمي، أرشيفات مدفوع الأجر تقريبًا حيل زمنية لتقليل الوميض + نماذج فيديو متخصصة
ترقية الصور في الهواتف الذكية/معارض الصور الاستخدام العادي مشمول نماذج خفيفة الوزن مصممة لتحقيق أداء مُرضٍ، وليس مثالياً (لكنها لا تزال مفيدة)

اعتراف بخصوص تنسيق الجدول: كلمة "مدفوع الأجر تقريبًا" تُستخدم بكثرة في هذا الجدول. لكن الفكرة واضحة 😅


السر الكبير: تتعلم النماذج عملية تحويل البيانات من دقة منخفضة إلى دقة عالية 🧠➡️🖼️

يكمن جوهر معظم عمليات تحسين دقة الصور باستخدام الذكاء الاصطناعي في إعداد التعلم الخاضع للإشراف ( تحسين دقة الصور باستخدام الشبكات العصبية التلافيفية العميقة (SRCNN) ):

  1. ابدأ بالصور عالية الدقة (الحقيقة)

  2. قم بتقليل دقة الصور إلى إصدارات منخفضة الدقة (المدخلات)

  3. قم بتدريب نموذج لإعادة بناء الصورة الأصلية عالية الدقة من الصورة منخفضة الدقة

بمرور الوقت، يتعلم النموذج علاقات مثل:

  • "عادةً ما يكون هذا النوع من الضبابية حول العين ناتجًا عن الرموش"

  • "غالباً ما تشير هذه المجموعة من البكسلات إلى نص ذي حروف مزخرفة"

  • "يبدو هذا التدرج الحافي كخط سطح مبنى، وليس ضوضاء عشوائية."

لا يتعلق الأمر بحفظ صور محددة (بالمعنى البسيط)، بل بتعلم البنية الإحصائية ( التعلم العميق لتحسين دقة الصور: دراسة استقصائية ). تخيل الأمر كتعلم قواعد النسيج والحواف. ليس قواعد الشعر، بل أشبه بـ... قواعد دليل استخدام منتجات إيكيا 🪑📦 (استعارة غير دقيقة، لكنها قريبة).


التفاصيل الدقيقة: ما يحدث أثناء الاستدلال (عند زيادة الدقة) ⚙️✨

عندما تقوم بإدخال صورة إلى مُحسِّن الصورة بالذكاء الاصطناعي، فعادةً ما يكون هناك مسار عمل كهذا:

  • المعالجة المسبقة

    • تحويل مساحة اللون (أحيانًا)

    • قم بتطبيع قيم البكسل

    • قسّم الصورة إلى أجزاء إذا كانت كبيرة (تحقق من واقع ذاكرة الوصول العشوائي للفيديو 😭) ( مستودع Real-ESRGAN (خيارات التجزئات) )

  • استخلاص الميزات

    • تكتشف الطبقات المبكرة الحواف والزوايا والتدرجات

    • تكشف الطبقات الأعمق عن الأنماط: الأنسجة، والأشكال، ومكونات الوجه

  • إعادة الإعمار

    • يقوم النموذج بإنشاء خريطة ميزات ذات دقة أعلى

    • ثم يحول ذلك إلى مخرج بكسل فعلي

  • المعالجة اللاحقة

    • شحذ اختياري

    • خيار إزالة الضوضاء

    • إمكانية إزالة التشوهات (الرنين، الهالات، التكتل)

تفصيل دقيق: تقوم العديد من الأدوات بتكبير الصورة على شكل مربعات، ثم تدمج الحواف. الأدوات الممتازة تخفي حدود المربعات. أما الأدوات المتوسطة فتترك علامات شبكية باهتة إذا دققت النظر. نعم، ستدقق النظر، لأن البشر يحبون فحص أدق العيوب عند تكبير الصورة بنسبة 300% كما لو كانوا مخلوقات صغيرة غريبة 🧌


أهم عائلات النماذج المستخدمة في تحسين أداء الذكاء الاصطناعي (ولماذا تبدو مختلفة) 🤖📚

1) تقنية تحسين الدقة الفائقة القائمة على الشبكات العصبية التلافيفية (التقنية الكلاسيكية الأكثر استخداماً)

تُعد الشبكات العصبية الالتفافية رائعة في الأنماط المحلية: الحواف، والنسيج، والهياكل الصغيرة ( تحسين دقة الصور باستخدام الشبكات الالتفافية العميقة (SRCNN) ).

  • المزايا: سريع نسبياً، مستقر، أقل عرضة للمفاجآت

  • العيوب: قد تبدو الصورة "معالجة" بعض الشيء إذا تم الضغط عليها بشدة

2) رفع مستوى الصورة باستخدام الشبكات التوليدية الخصومية (على غرار ESRGAN) 🎭

تقوم شبكات الخصومة التوليدية (GANs) بتدريب مولد لإنتاج صور عالية الدقة لا يستطيع المميز تمييزها عن الصور الحقيقية ( شبكات الخصومة التوليدية ).

  • المزايا: تفاصيل دقيقة، ملمس رائع

  • السلبيات: يمكنه اختلاق تفاصيل لم تكن موجودة - أحيانًا خاطئة، وأحيانًا غريبة ( SRGAN ، ESRGAN )

يمكن لشبكة GAN أن تمنحك تلك الحدة المذهلة. كما يمكنها أن تضيف حاجبًا إضافيًا لشخصية الصورة. لذا... اختر معاركك بحكمة 😬

3) الترقية القائمة على الانتشار (الخيار الإبداعي غير المتوقع) 🌫️➡️🖼️

تقوم نماذج الانتشار بإزالة الضوضاء خطوة بخطوة ويمكن توجيهها لإنتاج تفاصيل عالية الدقة ( SR3 ).

  • المزايا: يمكن أن يكون بارعًا بشكل لا يصدق في التفاصيل المعقولة، خاصة في الأعمال الإبداعية

  • السلبيات: قد ينحرف عن الهوية/البنية الأصلية إذا كانت الإعدادات عدوانية ( SR3 )

هنا يبدأ مفهوم "الترقية" بالتداخل مع مفهوم "إعادة التصور". أحياناً يكون هذا هو المطلوب تماماً، وأحياناً لا يكون كذلك.

4) تحسين جودة الفيديو مع الحفاظ على التناسق الزمني 🎞️

غالباً ما تتضمن عملية تحسين جودة الفيديو إضافة منطق يراعي الحركة:

  • يستخدم الإطارات المجاورة لتثبيت التفاصيل ( BasicVSR (CVPR 2021) )

  • يحاول تجنب الوميض والتشوهات الناتجة عن الحركة

  • غالباً ما يجمع بين الدقة الفائقة وإزالة التشويش وإزالة التشابك ( توباز فيديو )

إذا كانت عملية تحسين جودة الصور أشبه بترميم لوحة فنية، فإن تحسين جودة الفيديو أشبه بترميم كتاب متحرك دون تغيير شكل أنف الشخصية في كل صفحة. وهذا... أصعب مما يبدو.


لماذا تبدو تقنية تكبير الصور بالذكاء الاصطناعي مزيفة أحيانًا (وكيفية اكتشافها) 👀🚩

تفشل تقنية تحسين الصور بالذكاء الاصطناعي بطرقٍ واضحة. بمجرد أن تتعرف على هذه الأنماط، ستراها في كل مكان، تمامًا كشراء سيارة جديدة وملاحظة هذا الطراز فجأة في كل شارع 😵💫

يُخبرنا الشائع بما يلي:

  • إزالة الشعر بالشمع من الوجه (إزالة التشويش المفرطة + التنعيم)

  • هالات حادة للغاية حول الحواف (منطقة "التجاوز" الكلاسيكية) ( استيفاء ثنائي التكعيب )

  • تكرار الأنسجة (تتحول جدران الطوب إلى أنماط نسخ ولصق)

  • تباين دقيق مقرمش يصرخ "خوارزمية"

  • تشويه النصوص حيث تصبح الحروف شبه حروف (أسوأ أنواع التشويه)

  • انحراف التفاصيل حيث تتغير الميزات الصغيرة بشكل طفيف، خاصة في سير عمل الانتشار ( SR3 )

الجزء الصعب: أحيانًا تبدو هذه القطع الأثرية "أفضل" للوهلة الأولى. يحب دماغك الوضوح. لكن بعد لحظة، تشعر... بعدم الارتياح.

من الأساليب الجيدة تصغير الصورة والتحقق مما إذا كانت تبدو طبيعية عند المشاهدة من مسافة عادية. إذا بدت جيدة فقط عند تكبيرها بنسبة 400%، فهذا ليس إنجازًا، بل مجرد هواية 😅


كيف تعمل تقنية رفع مستوى الذكاء الاصطناعي: جانب التدريب، بدون تعقيدات الرياضيات 📉🙂

يتضمن تدريب نماذج الدقة الفائقة عادةً ما يلي:

أنواع الخسائر الشائعة:

هناك صراع مستمر:

  • اجعله مطابقًا للأصل
    مقابل

  • اجعله جذابًا بصريًا

تختلف الأدوات في مواقعها على هذا الطيف. وقد تفضل إحداها بناءً على ما إذا كنت تقوم بترميم صور عائلية أو تجهيز ملصق حيث يكون المظهر الجيد أهم من الدقة الجنائية.


سير العمل العملي: الصور، والمسح الضوئي القديم، والأنمي، والفيديو 📸🧾🎥

صور (صور شخصية، مناظر طبيعية، صور منتجات)

أفضل الممارسات عادة ما تكون كالتالي:

  • قم بإزالة الضوضاء بشكل طفيف أولاً (إذا لزم الأمر)

  • راقٍ ذو طابع محافظ

  • أضف المزيد من الحبوب إذا شعرت أن الأمور ناعمة للغاية (نعم، حقاً)

الحبوب مثل الملح. الإكثار منها يُفسد العشاء، لكن عدم وجودها على الإطلاق قد يجعل الطعم باهتًا بعض الشيء 🍟

صور قديمة ممسوحة ضوئياً وصور مضغوطة بشدة

هذه أصعب لأن النموذج قد يتعامل مع كتل الضغط على أنها "نسيج".
جرب:

  • إزالة القطع الأثرية أو فك الحجب

  • ثم قم بالترقية

  • ثمّ شحذ خفيف (ليس كثيراً... أعلم أن الجميع يقول ذلك، ولكن مع ذلك)

أنمي ورسم خطي

يستفيد الرسم الخطي من:

  • نماذج تحافظ على حواف نظيفة

  • يُقلل تحسين جودة الصور في الأنمي من تشويش الملمس،
    وغالبًا ما تبدو النتائج رائعة لأن الأشكال أبسط وأكثر اتساقًا. (لحسن الحظ).

فيديو

الفيديو يضيف خطوات إضافية:

  • إزالة الضوضاء

  • إزالة التشابك (لبعض المصادر)

  • راقٍ

  • التنعيم الزمني أو التثبيت ( BasicVSR (CVPR 2021) )

  • إعادة إدخال الحبوب اختيارياً لتحسين التماسك

إذا تجاهلتَ التناسق الزمني، فسترى ذلك الوميض المتلألئ في التفاصيل. بمجرد أن تلاحظه، لن تستطيع تجاهله. تمامًا كصوت كرسي يُصدر صريرًا في غرفة هادئة 😖


اختيار الإعدادات دون تخمين عشوائي (دليل مختصر) 🎛️😵💫

إليك طريقة تفكير جيدة للبدء:

  • إذا بدت الوجوه مصطنعة،
    قلل التشويش، قلل الحدة، جرب نموذجًا أو وضعًا يحافظ على الوجه.

  • إذا بدت الأنسجة شديدة الكثافة،
    فقم بخفض مستوى "تحسين التفاصيل" أو "استعادة التفاصيل"، ثم أضف حبيبات دقيقة بعد ذلك.

  • إذا كانت الحواف متوهجة،
    فقم بتقليل حدة الصورة، وتحقق من خيارات كبح الهالة.

  • إذا بدت الصورة وكأنها مُصممة بتقنية الذكاء الاصطناعي،
    فاعتمد أسلوباً أكثر تحفظاً. أحياناً يكون الخيار الأمثل هو ببساطة... التقليل.

أيضًا: لا تُكبّر الصورة ٨ أضعاف لمجرد أنك تستطيع. غالبًا ما يكون التكبير النظيف ٢ أو ٤ أضعاف هو الخيار الأمثل. بعد ذلك، أنت تطلب من النموذج كتابة قصص خيالية عن بكسلاتك 📖😂


الأخلاق، والأصالة، وسؤال "الحقيقة" المحرج 🧭😬

تقنية الذكاء الاصطناعي لرفع مستوى الصورة تُطمس الحدود:

  • الترميم يعني استعادة ما كان موجودًا

  • التحسين يعني إضافة ما لم يكن موجودًا

عادةً ما يكون الأمر مقبولاً (بل وجميلاً) فيما يتعلق بالصور الشخصية. أما في مجال الصحافة، أو الأدلة القانونية، أو التصوير الطبي، أو أي مجال آخر تتطلب فيه الدقة والوضوح، فيجب توخي الحذر ( OSAC/NIST: الدليل القياسي لإدارة الصور الرقمية الجنائية ، SWGDE: إرشادات تحليل الصور الجنائية ).

قاعدة بسيطة:

  • إذا كانت المخاطر عالية، فتعامل مع رفع مستوى الذكاء الاصطناعي على أنه توضيحي وليس نهائياً.

كذلك، يُعدّ الإفصاح أمراً بالغ الأهمية في السياقات المهنية. ليس لأن الذكاء الاصطناعي شرير، بل لأن الجمهور يستحق أن يعرف ما إذا كانت التفاصيل قد أُعيد بناؤها أو تم التقاطها. هذا ببساطة... احترامٌ له.


ملاحظات ختامية وملخص سريع 🧡✅

إذن، آلية عمل تقنية رفع دقة الصور بالذكاء الاصطناعي ارتباط التفاصيل عالية الدقة بالأنماط منخفضة الدقة، ثم تتنبأ بعدد البكسلات الإضافية المعقولة أثناء عملية رفع الدقة ( التعلم العميق لرفع دقة الصور: دراسة استقصائية ). وبحسب نوع النموذج (الشبكة العصبية الالتفافية، الشبكة التوليدية الخصومية، الانتشار، الفيديو الزمني)، قد يكون هذا التنبؤ متحفظًا ودقيقًا... أو جريئًا وأحيانًا غير منطقي 😅

ملخص سريع

إذا أردت، أخبرني بما تقوم بتحسينه (وجوه، صور قديمة، فيديو، أنمي، مسح ضوئي للنصوص)، وسأقترح عليك استراتيجية إعدادات تتجنب عادةً عيوب "مظهر الذكاء الاصطناعي" الشائعة 🎯🙂


التعليمات

تحسين الأداء باستخدام الذكاء الاصطناعي وكيفية عمله

تعمل تقنية رفع الدقة بالذكاء الاصطناعي (والتي تُعرف غالبًا باسم "الدقة الفائقة") على زيادة دقة الصورة من خلال التنبؤ بالتفاصيل عالية الدقة المفقودة بناءً على أنماط مُكتسبة أثناء التدريب. فبدلاً من مجرد تمديد وحدات البكسل كما في الاستيفاء ثنائي التكعيب، يدرس النموذج الحواف والنسيج والوجوه والخطوط الشبيهة بالنصوص، ثم يُنشئ بيانات بكسل جديدة تتوافق مع تلك الأنماط المُكتسبة. إنها أقرب إلى "التخمين المنطقي" الذي يبدو طبيعيًا منها إلى "استعادة الواقع".

الترقية باستخدام الذكاء الاصطناعي مقابل تغيير الحجم ثنائي التكعيب أو تغيير الحجم التقليدي

تعتمد طرق تكبير الصورة التقليدية (مثل التكعيب الثنائي) بشكل أساسي على الاستيفاء بين البكسلات الموجودة، مما يُنعّم الانتقالات دون إنشاء تفاصيل جديدة حقيقية. أما تكبير الصورة بالذكاء الاصطناعي فيهدف إلى إعادة بناء بنية معقولة من خلال التعرف على المؤشرات البصرية والتنبؤ بالشكل الذي تبدو عليه النسخ عالية الدقة من هذه المؤشرات. ولهذا السبب تبدو نتائج الذكاء الاصطناعي أكثر وضوحًا بشكل ملحوظ، ولهذا السبب أيضًا قد تُدخل تشوهات أو "تخترع" تفاصيل لم تكن موجودة في المصدر.

لماذا قد تبدو الوجوه شمعية أو ناعمة بشكل مفرط

تنتج الوجوه الشمعية عادةً عن إزالة التشويش المفرطة والتنعيم المصحوب بزيادة في الحدة، مما يُزيل نسيج البشرة الطبيعي. تتعامل العديد من الأدوات مع التشويش والنسيج الدقيق بطريقة متشابهة، لذا فإن "تنظيف" الصورة قد يُخفي المسام والتفاصيل الدقيقة. يتمثل أحد الأساليب الشائعة في تقليل التشويش والحدة، واستخدام وضع الحفاظ على ملامح الوجه إن وُجد، ثم إضافة لمسة من الحبيبات لجعل النتيجة تبدو أقل اصطناعية وأقرب إلى الواقع.

عيوب شائعة في تحسين جودة الصور باستخدام الذكاء الاصطناعي يجب الانتباه إليها

تشمل العلامات النموذجية هالات حول الحواف، وأنماط نسيج متكررة (مثل نسخ ولصق الطوب)، وتباين دقيق حاد، ونص يتحول إلى ما يشبه الأحرف. في عمليات المعالجة القائمة على الانتشار، يمكنك أيضًا ملاحظة انحراف التفاصيل حيث تتغير الميزات الصغيرة بشكل طفيف. بالنسبة للفيديو، يُعدّ الوميض وتلاشي التفاصيل عبر الإطارات من العلامات التحذيرية الواضحة. إذا كان الفيديو يبدو جيدًا فقط عند التكبير الشديد، فمن المحتمل أن تكون الإعدادات مفرطة في التشدد.

كيف تختلف نتائج شبكات GAN وCNN وشبكات التكبير الانتشارية

تتميز تقنية تحسين الدقة الفائقة القائمة على الشبكات العصبية التلافيفية (CNN) بثباتها وقابليتها للتنبؤ، ولكنها قد تبدو مصطنعة عند استخدامها بكثافة. أما الخيارات القائمة على الشبكات التوليدية الخصومية (على غرار ESRGAN) فتُنتج غالبًا نسيجًا أكثر وضوحًا ودقةً، ولكنها قد تُظهر تفاصيل غير دقيقة، خاصةً في الوجوه. بينما يُمكن لتقنية الترقية القائمة على الانتشار أن تُنتج تفاصيل جميلة وواقعية، إلا أنها قد تنحرف عن البنية الأصلية إذا كانت إعدادات التوجيه أو القوة مُفرطة.

استراتيجية عملية لإعدادات تجنب المظهر "المعتمد بشكل مفرط على الذكاء الاصطناعي"

ابدأ بشكل متحفظ: قم بزيادة الدقة بمقدار 2× أو 4× قبل اللجوء إلى عوامل مبالغ فيها. إذا بدت الوجوه مصطنعة، قلل من تقليل التشويش والحدة، وجرّب وضعًا مُراعيًا للوجوه. إذا أصبحت تفاصيل الملمس شديدة الوضوح، قلل من تحسين التفاصيل، وفكّر في إضافة حبيبات خفيفة لاحقًا. إذا كانت الحواف متوهجة، قلل من الحدة، وتحقق من خاصية إزالة الهالات أو التشوهات. في العديد من عمليات الإنتاج، يُعدّ "التقليل" هو الأفضل لأنه يحافظ على واقعية مقنعة.

معالجة عمليات المسح الضوئي القديمة أو الصور المضغوطة بشدة بصيغة JPEG قبل تكبيرها

تُعدّ الصور المضغوطة معقدة لأن النماذج قد تتعامل مع التشوهات الناتجة عن الكتل على أنها نسيج حقيقي وتُضخّمها. تتمثل آلية العمل الشائعة في إزالة هذه التشوهات أو إزالة الكتل أولًا، ثم تكبير الصورة، ثم تحسين حدتها بشكل طفيف عند الحاجة فقط. بالنسبة للصور الممسوحة ضوئيًا، يُمكن أن يُساعد التنظيف الدقيق النموذج على التركيز على البنية الحقيقية بدلًا من التلف. الهدف هو تقليل "مؤشرات النسيج الزائف" حتى لا يضطر مُكبّر الصورة إلى التخمين بناءً على مدخلات مشوّشة.

لماذا يُعدّ تحسين جودة الفيديو أصعب من تحسين جودة الصور؟

يجب أن تكون عملية تحسين جودة الفيديو متسقة بين جميع الإطارات، لا أن تقتصر جودتها على صورة ثابتة واحدة فقط. فإذا كانت التفاصيل تتذبذب من إطار لآخر، يصبح الناتج مشتتًا للانتباه بسرعة. تستخدم الأساليب المُخصصة للفيديو المعلومات الزمنية من الإطارات المجاورة لتحقيق استقرار عملية إعادة البناء وتجنب التشوهات الناتجة عن التذبذب. كما تتضمن العديد من عمليات سير العمل إزالة التشويش، وإزالة التشابك لبعض المصادر، وإعادة إدخال الحبيبات اختياريًا، بحيث يبدو التسلسل بأكمله متماسكًا بدلًا من أن يكون حادًا بشكل مصطنع.

متى لا يكون التوسع باستخدام الذكاء الاصطناعي مناسبًا أو يكون الاعتماد عليه محفوفًا بالمخاطر

يُفضّل التعامل مع تقنية الذكاء الاصطناعي لتحسين جودة الصور على أنها تحسين وليست دليلاً قاطعاً. في سياقات بالغة الأهمية كالصحافة، والأدلة القانونية، والتصوير الطبي، والطب الشرعي، قد يُضلل توليد صور "مُقنعة" لأنه قد يُضيف تفاصيل لم تكن موجودة في الصورة الأصلية. من الأنسب استخدامها على سبيل التوضيح مع الإشارة إلى أن عملية الذكاء الاصطناعي أعادت بناء التفاصيل. إذا كانت الدقة بالغة الأهمية، فيجب الاحتفاظ بالصور الأصلية وتوثيق كل خطوة من خطوات المعالجة والإعدادات.

مراجع

  1. arXiv - التعلم العميق لتحسين دقة الصور: دراسة استقصائية - arxiv.org

  2. arXiv - تحسين دقة الصور باستخدام الشبكات العصبية التلافيفية العميقة (SRCNN) - arxiv.org

  3. arXiv - Real-ESRGAN - arxiv.org

  4. arXiv - ESRGAN - arxiv.org

  5. arXiv - SR3 - arxiv.org

  6. مطور NVIDIA - NVIDIA DLSS - developer.nvidia.com

  7. AMD GPUOpen - FidelityFX Super Resolution 2 - gpuopen.com

  8. مؤسسة رؤية الحاسوب (CVF) - الوصول المفتوح - BasicVSR: البحث عن المكونات الأساسية في تحسين دقة الفيديو (CVPR 2021) - openaccess.thecvf.com

  9. arXiv - الشبكات التوليدية التنافسية - arxiv.org

  10. arXiv - SRGAN - arxiv.org

  11. arXiv - الخسائر الإدراكية (جونسون وآخرون، 2016) - arxiv.org

  12. GitHub - Real-ESRGAN (خيارات البلاطات) - github.com

  13. ويكيبيديا - الاستيفاء ثنائي التكعيب - wikipedia.org

  14. مختبرات توباز - توباز فوتو - topazlabs.com

  15. مختبرات توباز - فيديو توباز - topazlabs.com

  16. مركز مساعدة أدوبي - تحسين أدوبي > دقة فائقة - helpx.adobe.com

  17. المعهد الوطني للمعايير والتكنولوجيا/مجلس الأمن الخارجي - الدليل القياسي لإدارة الصور الرقمية الجنائية (الإصدار 1.0) - nist.gov

  18. SWGDE - إرشادات تحليل الصور الجنائية - swgde.org

اكتشف أحدث تقنيات الذكاء الاصطناعي في متجر مساعدي الذكاء الاصطناعي الرسمي

معلومات عنا

العودة إلى المدونة