
أطلقت شركة Figure عرضًا جديدًا لروبوتها البشري وهو يقوم بمهمة غير تقليدية، وهي طي المناشف، في الفيديو الذي نشرته الشركة، يظهر الروبوت وهو يلتقط كل منشفة على حدة، يفردها بعناية، ثم يطويها بترتيب قبل وضعها في السلة، على الرغم من أن حركاته ليست مثالية، إلا أنه يحرص على إتمام المهمة بدقة مقبولة، مما يعكس مستوى متقدمًا من التحكم والتكيف، وهذا يثير التساؤلات حول مستقبل الروبوتات في حياتنا اليومية وإمكانية الاعتماد عليها في المهام المنزلية الروتينية
### الروبوت “فيجر” ونظام Helix المتطور
يعمل الروبوت باستخدام نموذج Helix الجديد، وهو نظام رؤية-لغة-فعل (VLA) يجمع بين الإدراك والفهم اللغوي والتحكم الحركي، صُمم هذا النموذج لمعالجة التحديات التي طال أمدها في مجال الروبوتات مثل التفاعل مع البيئة، وفهم التعليمات، وتنفيذ مهام معقدة بتكيف يشبه البشر، وكانت الشركة قد عرضت في وقت سابق من عام 2025 مقطعًا آخر يوضح كيف تمكنت من تطوير مشية طبيعية أكثر سلاسة للروبوت بفضل التعلم المعزز، وفقًا لـ interesting engineering
### مرونة عالية وقدرات متقدمة
يتيح نظام Helix للروبوت استخدام معصميه وأصابعه وجذعه ورأسه بمرونة عالية، مما يمنحه القدرة على أداء حركات دقيقة وتفاعلات أكثر واقعية، ومن أبرز إمكانياته أنه يسمح لروبوتين بالعمل معًا على مهمة واحدة لفترات طويلة، حتى عندما تكون الأدوات المستخدمة غير مألوفة، يتعلم النظام سلوكيات متعددة باستخدام مجموعة واحدة من الأوزان العصبية، مما يغني عن إعادة برمجة أو ضبط لكل مهمة جديدة
### تطبيقات منزلية وقدرات تعليمية
تستطيع الروبوتات المزودة بـ Helix التعامل مع أدوات منزلية متنوعة مثل الأدراج والثلاجات، وتنفيذ التعليمات عبر محفزات اللغة الطبيعية، يوحد هذا النهج عملية التعلم ويزيد من تنوع القدرات، وفي الوقت نفسه يقلل من تعقيدات التطوير، يعمل النموذج على وحدات معالجة رسومية منخفضة الطاقة، مما يجعله أكثر كفاءة وقابلية للتطبيق في الاستخدام التجاري
### نظامان متكاملان لكفاءة ودقة
يعتمد Helix على نظامين متكاملين، الأول S1، وهو نظام حركي بصري سريع ينفذ الأفعال الفورية، والثاني S2، وهو وحدة أبطأ تعتمد على نماذج اللغة والرؤية لفهم المشهد والتفكير المعقد، يسمح هذا الفصل بين النظامين بترقية كل منهما على حدة مع الحفاظ على دقة التنفيذ وسرعته
### تدريب مكثف وتصميم متطور
استخدمت الشركة نحو 500 ساعة من السلوكيات المُشغلة عن بعد لتدريب الروبوت، كما أُنشئت تعليمات بلغة طبيعية بواسطة نظام VLM لتسريع عملية التعلم، يجمع التصميم بين محول يضم 80 مليون معلمة للتحكم، ووحدة VLM تضم 7 مليارات معلمة لمعالجة اللغة والرؤية، والنتيجة هي نظام أكثر قدرة على التكيف، وأسرع في التعلم، وأكثر استعدادًا للتطبيقات العملية في الحياة اليومية