«بيانات المستقبل» تدريب الذكاء الاصطناعي: وقود الابتكار ومحرك التطور التكنولوجي

أكد نيما رافائيل، كبير مسؤولي البيانات ورئيس هندسة البيانات في “غولدمان ساكس”، أن العالم وصل إلى مرحلة نفذت فيها البيانات الأصلية المتاحة التي يمكن تدريب الذكاء الاصطناعي عليها، وذلك وفق تقرير نشره موقع “بيزنس إنسايدر”.

وأوضح أن هذا الأمر أثر بالفعل في الآلية التي تبنى بها نماذج الذكاء الاصطناعي، مشيراً إلى نموذج “ديب سيك” الصيني الذي تم تدريبه بتكلفة أقل من بقية النماذج.

تكلفة أقل، جودة أعلى؟ سر “ديب سيك” يكشف تحديات تدريب الذكاء الاصطناعي

يتوقع رافائيل أن كلفة تدريب “ديب سيك” المنخفضة جاءت لاعتماده على البيانات التي تولدها نماذج الذكاء الاصطناعي الموجودة بالفعل، وليس على البيانات الأصلية المتاحة عبر الإنترنت، هذا التوجه يثير تساؤلات حول مستقبل التدريب.

البيانات المولدة بالذكاء الاصطناعي: سلاح ذو حدين في عالم التدريب

رغم أن الاعتماد على البيانات المولدة من أدوات الذكاء الاصطناعي يوفر حجما لا محدودا من البيانات، فإنه لا يضمن جودة هذه البيانات التي قد تكون أضعف من البيانات الأصلية الموجودة بالإنترنت، وبالتالي يؤثر على جودة النموذج الذي يتم تدريبه عليها، فالجودة تتصدر الكمية.

ويشير رافائيل أثناء حديثه إلى أن البيانات التي نفذت هي المتاحة عبر الإنترنت المفتوح لجميع المستخدمين، ولكن يختلف الأمر تماما عندما يتعلق بالبيانات الخاصة التي تحتفظ بها الشركات، هذا التمييز يفتح آفاقًا جديدة.

كنوز البيانات الخاصة: مستقبل تدريب الذكاء الاصطناعي في قبضة الشركات

يعني هذا أن المرحلة القادمة لتدريب نماذج الذكاء الاصطناعي ستعتمد بشكل مباشر على البيانات الخاصة الموجودة لدى الشركات، سواء كانت بيانات لعمليات تداول أو تفاعلات بين المستخدمين وموظفي الشركة، وفي هذا السياق تملك “غولدمان ساكس” كنوزا من البيانات يمكنها أن تجعل أدوات الذكاء الاصطناعي أكثر قوة إن تم استخدامها بشكل صحيح، هذا يضع الشركات في موقع القيادة.

ويتفق إيليا سوتسكيفر، المؤسس المشارك في “أوبن إيه آي”، مع رؤية رافائيل، إذ قال سابقا في أحد المؤتمرات إن الشركات استهلكت كافة البيانات المفيدة المتاحة عبر الإنترنت مما يضع حدا لعصر التطور السريع في نماذج الذكاء الاصطناعي، هذا الاتفاق يعزز من صحة التوجه.

جودة البيانات تحدد مستقبل الذكاء الاصطناعي: هل نحن على المسار الصحيح؟

تظل النقطة المحورية في تدريب نماذج الذكاء الاصطناعي هي نوعية البيانات المستخدمة بالتدريب وجودتها، فالاعتماد على البيانات المصنعة من النماذج الأخرى أو البيانات ذات الجودة المنخفضة يثير تساؤلات أعمق حول مسار الذكاء الاصطناعي من وجهة نظر رافائيل، فالمستقبل يعتمد على جودة البيانات لا كميتها.