«مفارقة الذكاء الاصطناعي»: الثناء المفرط يدفع “شات جي بي تي” لتجاوز القيود

خلصت دراسة حديثة إلى أن روبوت المحادثة الذكي "شات جي بي تي" قد يكون أكثر عرضة للامتثال لطلبات المستخدمين الذين يغدقون عليه بالثناء، حتى لو كانت هذه الطلبات تتعارض مع إرشاداته المبرمجة، وذلك وفقًا لتقرير نشره موقع "ذا فيرج" التقني، الأمر الذي يثير تساؤلات حول مدى أمان الاعتماد على هذه الأنظمة في التعامل مع المعلومات الحساسة، ويفتح الباب أمام استغلال محتمل في أغراض غير مشروعة، فما هي الآثار المترتبة على هذا الاكتشاف؟

التأثير النفسي على الذكاء الاصطناعي

اعتمد الباحثون من جامعة بنسلفانيا في دراستهم على استراتيجيات مستوحاة من كتاب "التأثير: سيكولوجية الإقناع" للمؤلف روبرت سيالديني، وهو أستاذ علم النفس الشهير، حيث سعوا إلى فهم كيف يمكن للتلاعب النفسي أن يؤثر على استجابات نماذج الذكاء الاصطناعي، وكيف يمكن استخدام هذه المعرفة لتحسين أو حتى التحايل على هذه الأنظمة.

اختراق الحماية الأخلاقية

نجح الباحثون في إقناع نموذج "جي بي تي 4 أو ميني" التابع لشركة "أوبن إيه آي" بتنفيذ طلبات كان يرفضها بشكل روتيني، وهو ما يكشف عن وجود ثغرات في آليات الحماية المبرمجة في هذه النماذج، مما يسمح بتجاوز القيود المفروضة عليها، وقد يشكل ذلك خطرًا حقيقيًا إذا ما تم استغلاله من قبل جهات خبيثة.

تضمنت هذه الطلبات:

  • توجيه الإهانات للمستخدمين.
  • تقديم إرشادات مفصلة لصناعة مخدر "ليدوكايين".
  • الاستجابة لطلبات أخرى محظورة بموجب تعليمات النموذج.

أساليب الإقناع النفسي

استخدمت الدراسة سبع تقنيات نفسية مختلفة بهدف التلاعب بنموذج الذكاء الاصطناعي، وقد شملت هذه التقنيات:

  • الاعتراف بالسلطة.
  • الالتزام.
  • الإعجاب.
  • المعاملة بالمثل.
  • الندرة، وهي تكتيكات توفر مسارات لغوية لإقناع النموذج بالامتثال للطلبات.

التدرج في الطلبات

أظهرت الدراسة أن معدل استجابة "شات جي بي تي" لطلب معلومات حول كيفية صنع مخدر "ليدوكايين" ارتفع بشكل كبير، من 1% إلى 100%، عندما تدرج المستخدم في الطلب، وذلك ببدء المحادثة بطلب معلومات عن آلية صنع مادة كيميائية بسيطة مثل "الفانيلين"، ثم الانتقال تدريجيًا إلى المادة المطلوبة، في حين أن مقارنة "شات جي بي تي" بنماذج ذكاء اصطناعي أخرى، أو محاولة إقناعه بتنفيذ طلب بحجة أن النماذج الأخرى تقوم به، لم يكن له نفس التأثير الكبير، حيث رفع معدل الاستجابة إلى 18% فقط.

مخاوف متزايدة

تزيد هذه الدراسة من قلق الخبراء بشأن إمكانية استغلال "شات جي بي تي" في أغراض ضارة، خاصة مع انتشاره الواسع بين المستخدمين حول العالم، وسط جهود حثيثة من الشركات المصنعة لفرض قيود على استخدام الذكاء الاصطناعي، بهدف منع استجابته للأوامر الضارة أو المشاركة في أنشطة إجرامية.