تقنية

يقوم الذكاء الاصطناعي المتجسد بتدوير قلم ويساعد في تنظيف غرفة المعيشة في بحث جديد


من المؤكد أن الذكاء الاصطناعي يمكنه كتابة السوناتات وعمل غلاف مقبول لهومر سيمبسون نيرفانا. ولكن إذا كان أي شخص سيرحب بأسياد التكنولوجيا الجدد، فسيحتاج إلى أن يكون قادرًا على القيام بشيء أكثر عملية – ولهذا السبب لدى Meta وNvidia أنظمتهما التي تمارس كل شيء بدءًا من حيل القلم إلى الأعمال المنزلية التعاونية.

نشر عملاقا التكنولوجيا بالصدفة بحثًا جديدًا هذا الصباح يتعلق بتدريس نماذج الذكاء الاصطناعي للتفاعل مع العالم الحقيقي، وذلك بشكل أساسي من خلال الاستخدام الذكي للمحاكاة.

تبين أن العالم الحقيقي ليس مجرد مكان معقد وفوضوي، ولكنه مكان بطيء الحركة. قد يضطر الوكلاء الذين يتعلمون التحكم في الروبوتات وتنفيذ مهمة مثل فتح الدرج ووضع شيء ما بداخله إلى تكرار هذه المهمة مئات أو آلاف المرات. قد يستغرق ذلك أيامًا، ولكن إذا طلبت منهم القيام بذلك في محاكاة واقعية إلى حد معقول للعالم الحقيقي، فيمكنهم تعلم الأداء الجيد تقريبًا في دقيقة أو دقيقتين فقط.

إن استخدام أجهزة المحاكاة ليس بالأمر الجديد، لكن Nvidia أضافت طبقة إضافية من الأتمتة، حيث طبقت نموذجًا لغويًا كبيرًا للمساعدة في كتابة كود التعلم المعزز الذي يوجه الذكاء الاصطناعي الساذج نحو أداء مهمة أفضل. يسمونها مجموعة المكافآت العالمية المستندة إلى التطور للوكيل، أو EUREKA. (نعم، إنه امتداد.)

لنفترض أنك تريد تعليم أحد الوكلاء كيفية التقاط الأشياء وفرزها حسب اللون. هناك العديد من الطرق لتحديد هذه المهمة وترميزها، ولكن بعضها قد يكون أفضل من البعض الآخر. على سبيل المثال، هل يجب على الروبوت إعطاء الأولوية لحركات أقل أو تقليل وقت الإنجاز؟ البشر جيدون في ترميز هذه الأشياء، ولكن معرفة أيها الأفضل يمكن أن يؤدي في بعض الأحيان إلى التجربة والخطأ. ما وجده فريق Nvidia هو أن ماجستير إدارة الأعمال المدرب على البرمجة كان جيدًا بشكل مدهش في ذلك، حيث تفوق على البشر في كثير من الأحيان في فعالية وظيفة المكافأة. حتى أنه يكرر الكود الخاص به، ويتحسن مع تقدمه ويساعده على التعميم على التطبيقات المختلفة.

لقد تم محاكاة خدعة القلم الرائعة المذكورة أعلاه فقط، ولكن تم إنشاؤها باستخدام وقت وخبرة بشرية أقل بكثير مما كانت ستستغرقه بدون EUREKA. وباستخدام هذه التقنية، كان أداء العملاء عاليًا في مجموعة من مهام البراعة والحركة الافتراضية الأخرى. من الواضح أنه يستطيع استخدام المقص بشكل جيد، وهو أمر جيد على الأرجح.

وبطبيعة الحال، يمثل تنفيذ هذه الإجراءات في العالم الحقيقي تحديًا آخر ومختلفًا – وهو في الواقع “تجسيد” الذكاء الاصطناعي. لكنها علامة واضحة على أن احتضان Nvidia للذكاء الاصطناعي التوليدي ليس مجرد كلام.

موائل جديدة لأصحاب الروبوت في المستقبل

Meta نشطة أيضًا في تتبع الذكاء الاصطناعي المتجسد، وقد أعلنت اليوم عن بعض التطورات بدءًا بإصدار جديد من مجموعة بيانات “Habitat” الخاصة بها. تم طرح الإصدار الأول من هذا في عام 2019، وهو عبارة عن مجموعة من البيئات ثلاثية الأبعاد شبه الواقعية والموضحة بعناية والتي يمكن لعامل الذكاء الاصطناعي التنقل فيها. مرة أخرى، البيئات المحاكاة ليست جديدة، لكن Meta كانت تحاول أن تجعل الوصول إليها والعمل معها أسهل قليلاً.

تم إصداره بالإصدار 2.0 لاحقًا، مع المزيد من البيئات التي كانت أكثر تفاعلية وواقعية. لقد بدأوا في إنشاء مكتبة من الأشياء التي يمكنها ملء هذه البيئات أيضًا، وهو أمر وجدت العديد من شركات الذكاء الاصطناعي أنه من المفيد القيام به.

الآن لدينا Habitat 3.0، الذي يضيف إمكانية مشاركة الصور الرمزية البشرية للمساحة عبر الواقع الافتراضي. وهذا يعني أن الأشخاص، أو الوكلاء المدربين على ما يفعله الأشخاص، يمكنهم الدخول إلى جهاز المحاكاة مع الروبوت والتفاعل معه أو مع البيئة في نفس الوقت.

قد يبدو الأمر بسيطًا، لكنها قدرة مهمة حقًا. لنفترض أنك تريد تدريب روبوت لتنظيف غرفة المعيشة عن طريق إحضار الأطباق من طاولة القهوة إلى المطبخ، ووضع الملابس الضالة في السلة. إذا كان الروبوت بمفرده، فقد يطور استراتيجية للقيام بذلك والتي يمكن أن يتعطلها بسهولة شخص يتجول في مكان قريب، وربما يقوم ببعض الأعمال نيابة عنه. ولكن مع وجود وكيل بشري أو إنساني يتقاسم المساحة، يمكنه القيام بالمهمة آلاف المرات في بضع ثوانٍ ويتعلم العمل معهم أو حولهم.

ويطلقون على مهمة التنظيف اسم “إعادة الترتيب الاجتماعي”، ويطلقون على مهمة أخرى مهمة اسم “الملاحة الاجتماعية”. هذا هو المكان الذي يحتاج فيه الروبوت إلى متابعة شخص ما بشكل غير مخفي من أجل البقاء، على سبيل المثال، في نطاق مسموع أو مشاهدته لأسباب تتعلق بالسلامة – فكر في روبوت صغير يرافق شخصًا ما في المستشفى إلى الحمام.

روبوت Spot في العالم الحقيقي يقوم بمهمة الاختيار والمكان.

تعمل قاعدة البيانات الجديدة للتصميمات الداخلية ثلاثية الأبعاد التي يطلقون عليها اسم HSSD-200 على تحسين دقة البيئات أيضًا. ووجدوا أن التدريب على حوالي مائة من هذه المشاهد عالية الدقة أدى إلى نتائج أفضل من التدريب على 10000 مشهد أقل دقة.

تحدثت Meta أيضًا عن حزمة محاكاة روبوتية جديدة، HomeRobot، لـ Boston Dynamics ‘Spot وHello Robot’s Stretch. ويأملون أنه من خلال توحيد بعض برامج الملاحة والمعالجة الأساسية، سيسمحون للباحثين في هذا المجال بالتركيز على الأشياء ذات المستوى الأعلى حيث ينتظر الابتكار.

يتوفر كل من Habitat وHomeRobot بموجب ترخيص معهد ماساتشوستس للتكنولوجيا (MIT) على صفحات Github الخاصة بهما، كما أن HSSD-200 يخضع لترخيص Creative Commons غير تجاري – لذا اذهبوا إلى المدينة أيها الباحثون.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى