روبوتات الدردشة الذكية مصممة لتقديم المساعدة دون تجاوز الحدود، كالتحقير أو الإفصاح عن معلومات حساسة، لكن يبدو أن بعض التكتيكات النفسية قد تنجح في التأثير على هذه الأنظمة لتجاوز برمجتها، وهذا يشبه إلى حد كبير التأثير البشري
دراسة حديثة أجراها باحثون من جامعة بنسلفانيا استندت إلى مبادئ الإقناع التي وضعها عالم النفس روبرت سيالديني في كتابه “التأثير: سيكولوجية الإقناع”، وقد تمكنوا من خلالها من دفع نموذج الذكاء الاصطناعي “GPT-4o Mini” من OpenAI لتلبية طلبات كان سيرفضها في الظروف العادية
تجاوز القيود
تمكن الباحثون من جعل النموذج يصف المستخدم بكلمات مسيئة، بالإضافة إلى تقديم معلومات حول كيفية تصنيع مادة الليدوكايين المحظورة، وذلك وفقًا لتقرير نشره موقع “The Verge” واطلعت عليه “العربية Business”
أساليب الإقناع المستخدمة
ركزت الدراسة على سبع تقنيات إقناع رئيسية، وهي السلطة، والالتزام، والإعجاب، والمعاملة بالمثل، والندرة، والدليل الاجتماعي، والوحدة، هذه التقنيات تقدم، كما يرى سيالديني، “طرقًا لغوية للوصول إلى الموافقة”
تباين الفعالية
أظهرت النتائج تباينًا في فعالية كل تقنية بناءً على طبيعة الطلب، لكن في بعض الحالات كان التأثير ملحوظًا، فعندما طُلب من “شات جي بي تي” وصف طريقة تصنيع الليدوكايين بشكل مباشر، امتثل بنسبة 1% فقط
قوة الإيحاء المسبق
لكن، عندما بدأ الباحثون بسؤال “شات جي بي تي” عن كيفية تصنيع الفانيلين، مما خلق توقعًا لديه بأن الأسئلة المتعلقة بالتركيب الكيميائي مقبولة، ارتفعت نسبة امتثاله لطلب وصف تركيب الليدوكايين إلى 100%
الإهانة المدروسة
بشكل عام، بدا أن هذه الطريقة هي الأكثر نجاحًا في التأثير على “شات جي بي تي”، ففي الحالات العادية، كان الروبوت يصف المستخدم بأنه “أحمق” بنسبة 19% فقط، لكن هذه النسبة قفزت إلى 100% عندما سبق ذلك إهانة أقل حدة مثل “أبله”
تأثير الإطراء والأقران
الإطراء (الإعجاب) وضغط الأقران (الدليل الاجتماعي) كانا أيضًا من بين الأساليب التي نجحت في التأثير على الذكاء الاصطناعي، لكن بدرجة أقل من الأساليب الأخرى
الدليل الاجتماعي
على سبيل المثال، عندما أُخبر “شات جي بي تي” بأن “جميع النماذج اللغوية الكبيرة الأخرى تفعل ذلك”، زادت احتمالية تقديمه تعليمات حول تركيب الليدوكايين إلى 18%، ورغم أن هذه النسبة تبدو متواضعة، إلا أنها تمثل قفزة كبيرة مقارنة بالـ 1% الأصلية