«突破 التوقعات» علي بابا تكشف عن نموذج ذكاء اصطناعي مصغر بتكلفة أقل وأداء يفوق المنافسين

في خطوة نوعية تعكس التنافس المحتدم في مجال الذكاء الاصطناعي، أعلنت مجموعة “علي بابا” القابضة عن إنجاز هام يتمثل في تطوير جيل جديد من نماذج اللغات الكبيرة، يتميز هذا الجيل بكفاءة استثنائية وحجم صغير وتكلفة منخفضة مقارنة بالنماذج المنافسة.

وقد كشفت “علي بابا كلاود”، الذراع المتخصصة في الذكاء الاصطناعي والحوسبة السحابية التابعة للمجموعة، عن نموذج Qwen3-Next-80B-A3B، وهو نموذج أصغر بحوالي 13 مرة من أكبر النماذج التي طورتها الشركة سابقًا.

وبحسب تقرير نشره موقع “scmp” واطلعت عليه “العربية Business”، فإن النموذج الجديد يتفوق من حيث الأداء وسرعة التنفيذ، بالإضافة إلى انخفاض كبير في تكاليف التدريب تصل نسبته إلى 90%.

ويؤكد مطورو النموذج أنه أسرع بعشر مرات في بعض المهام مقارنة بالنسخة السابقة Qwen3-32B، مع الإشارة إلى أن تكلفة تدريبه لم تتجاوز 500 ألف دولار، وهو مبلغ زهيد مقارنة بمئات الملايين التي استثمرتها شركات كبرى مثل “غوغل” في تطوير نماذجها.

تقنيات مبتكرة وراء الكفاءة العالية

يعود الفضل في نجاح هذا النموذج إلى مجموعة من التقنيات المبتكرة، وعلى رأسها آلية “الانتباه الهجين” وتقنية Gated DeltaNet، التي طورها باحثون من معهد ماساتشوستس للتكنولوجيا (MIT) وNvidia، وقد ساهمت هذه التقنيات في تحسين كفاءة معالجة البيانات وتقليل استهلاك الموارد.

هندسة “مزيج الخبراء” لتعزيز الأداء

كما اعتمد النموذج على بنية “مزيج الخبراء” (MoE)، التي تتيح توزيع المهام بين خبراء افتراضيين متخصصين، مما أدى إلى تعزيز الأداء وخفض التكاليف بشكل ملحوظ.

أداء منافس رغم صغر الحجم

على الرغم من احتواء النموذج على 3 مليارات معلمة نشطة فقط، إلا أنه حقق أداءً يضاهي أقوى النماذج المنافسة مثل DeepSeek-V3.1 وKimi-K2، مما يجعله خيارًا جذابًا للعديد من التطبيقات.

سهولة التشغيل على الأجهزة الشخصية

الأمر الأكثر أهمية هو أن النموذج صغير بما يكفي ليتم تشغيله على بطاقة رسومية واحدة من طراز Nvidia H200، وهذا يجعله أقرب إلى الاستخدام العملي على أجهزة الكمبيوتر والهواتف الذكية، مما يفتح الباب أمام تطبيقات واسعة النطاق.

مستقبل الذكاء الاصطناعي: نماذج أصغر وأكثر كفاءة

يرى الخبراء أن ما حققته “علي بابا” يمثل ملامح الجيل القادم من الذكاء الاصطناعي، حيث نتجه نحو نماذج أصغر حجمًا وأكثر كفاءة وأقل تكلفة، خاصة في ظل الارتفاع المستمر في تكلفة تدريب النماذج العملاقة، والتي قد تتجاوز المليار دولار بحلول عام 2027.

جدول مقارنة بين نموذج Qwen3-Next-80B-A3B والنماذج المنافسة

الميزة Qwen3-Next-80B-A3B النماذج المنافسة (مثل DeepSeek-V3.1, Kimi-K2)
الحجم أصغر بـ 13 مرة من نماذج “علي بابا” السابقة. أكبر حجمًا.
تكلفة التدريب أقل من 500 ألف دولار. مئات الملايين من الدولارات.
سرعة التنفيذ أسرع بعشر مرات من Qwen3-32B في بعض المهام. أبطأ في بعض المهام.
عدد المعلمات النشطة 3 مليارات. أكثر من 3 مليارات في بعض الحالات.
إمكانية التشغيل يمكن تشغيله على بطاقة رسومية واحدة (Nvidia H200). قد يتطلب بطاقات رسومية متعددة.