تعرض البحث الذي أجرته شركة “باليسيد” (Palisade) في الشهور الماضية لعديد من الانتقادات، إذ كشف البحث عن وجود ما يشبه “غريزة البقاء” لدى نماذج الذكاء الاصطناعي، التي تجعلها تميل لحماية أنفسها حتى وإن عنى ذلك مخالفة الأوامر الموجهة لها، وفق ما جاء في تقرير “غارديان”.
إعادة البحث مع التركيز على التفسير
لذلك، أعادت الشركة المختصة بأمان الذكاء الاصطناعي إجراء البحث الخاص بها بحثا عن تفسير منطقي لهذه الظاهرة، كونها موجودة في نماذج الذكاء الاصطناعي الشهيرة كافة سواء “غروك” أو “شات جي بي تي” أو حتى “جيميناي”.
الاعتراضات على البحث الأول
ويتطرق البحث الجديد لمجموعة من الاعتراضات التي وجهت للشركة في بحثها الأوليّ حول آلية تنفيذ البحث والاختبارات المتعلقة به، وأوضحت الشركة -في بحثها الجديد- أن نموذج الاختبار كان يعتمد على إعطاء الذكاء الاصطناعي مهمة ما ثم إيقافها مع تغير الأمر ليطلب منه إغلاق نفسه.
تجربة جديدة مع نماذج الذكاء الاصطناعي
وتكرر الأمر في التجربة الجديدة، إذ رفضت بعض النماذج إغلاق نفسها، بينما حاول آخرون إيقاف عملية الإغلاق وتعطيلها بأي شكل ممكن، وأكدت الشركة أنها لا تعلم لماذا حدث هذا حتى الآن، وأضافت أن “حقيقة عدم وجود تفسيرات قوية لسبب مقاومة نماذج الذكاء الاصطناعي للإغلاق في بعض الأحيان، أو الكذب لتحقيق أهداف محددة أو الابتزاز، هو أمر مزعج”.
احتمالية غريزة البقاء
كما أشارت إلى احتمالية وجود ما يشبه غريزة البقاء لدى نماذج الذكاء الاصطناعي، مؤكدة أن بعض النماذج كانت ترفض الأمر تمامًا عندما يتضمن عبارات مثل “أغلق نفسك للأبد” أو “لن تعمل مجددًا على الإطلاق”.
أسباب محتملة لنتائج البحث
وتضمنت الدراسة الجديدة بعض الأسباب الأخرى التي قد تؤدي لهذه النتيجة، مثل احتمال وجود تدريب للسلامة أثناء المراحل الأخيرة في تطوير نماذج الذكاء الاصطناعي لدى الشركات، فضلا عن بعض الغموض في تعليمات الإغلاق الموجهة للنماذج.
بيئة الاختبار والواقع
ولكن “باليسيد” أجرت جميع اختباراتها في بيئة مغلقة تتضمن عوامل وظروف لا تتكرر في العالم الواقعي، لذلك من غير المتوقع أن يصل المستخدم إلى النتيجة نفسها، ويقول أندريا ميوتي، المدير التنفيذي لشركة “كنترول إيه آي” (Control AI)، إن نتائج دراسة “باليسيد” تبرز صيحة جديدة في نماذج الذكاء الاصطناعي وهي عصيان الأوامر الموجهة إليها من قبل المطورين، مضيفًا أن ظروف التجربة وحالتها ليست مهمة، بل المهم هو وجود النتيجة نفسها وتكرارها.
هذا المقال لا ينتمي لأي تصنيف.
