يدعي Ghost، المدعوم الآن من OpenAI، أن LLMs سوف تتغلب على نكسات القيادة الذاتية – لكن الخبراء متشككون

ليس من المبالغة القول إن صناعة السيارات ذاتية القيادة تواجه حسابًا.
في هذا الأسبوع فقط، استدعت شركة Cruise أسطولها بالكامل من السيارات ذاتية القيادة بعد حادث مروع تورط فيه أحد المشاة، مما دفع DMV في كاليفورنيا إلى تعليق الشركة عن تشغيل سيارات الأجرة الآلية بدون سائق في الولاية. وفي الوقت نفسه، خرج الناشطون في سان فرانسيسكو إلى الشوارع – حرفياً – لشل حركة السيارات ذاتية القيادة كشكل من أشكال الاحتجاج ضد استخدام المدينة كميدان اختبار للتكنولوجيا الناشئة.
لكن إحدى الشركات الناشئة تقول إنها تمتلك المفتاح لتكنولوجيا القيادة الذاتية الأكثر أمانًا، وتعتقد أن هذا المفتاح سيقنع الرافضين.
أعلنت شركة Ghost Autonomy، وهي شركة تقوم ببناء برامج القيادة الذاتية لشركاء صناعة السيارات، هذا الأسبوع أنها تخطط للبدء في استكشاف تطبيقات نماذج اللغات الكبيرة متعددة الوسائط (LLMs) – نماذج الذكاء الاصطناعي التي يمكنها فهم النص وكذلك الصور – في القيادة الذاتية. ولتحقيق ذلك، عقدت Ghost شراكة مع OpenAI من خلال صندوق OpenAI Startup Fund للحصول على وصول مبكر إلى أنظمة OpenAI وموارد Azure من Microsoft، المتعاون الوثيق مع OpenAI، بالإضافة إلى استثمار بقيمة 5 ملايين دولار.
قال جون هايز، المؤسس المشارك والرئيس التنفيذي لشركة Ghost، لـ TechCrunch في مقابلة عبر البريد الإلكتروني: “تقدم LLMs طريقة جديدة لفهم “الذيل الطويل”، مضيفًا المنطق إلى المشاهد المعقدة حيث تكون النماذج الحالية قاصرة”. “إن حالات استخدام التحليل القائم على LLM في الحكم الذاتي سوف تنمو فقط عندما تصبح LLMs أسرع وأكثر قدرة.”
ولكن كيف يقوم Ghost بالضبط بتطبيق نماذج الذكاء الاصطناعي المصممة لشرح الصور وإنشاء النصوص للتحكم في السيارات ذاتية القيادة؟ وفقًا لهايز، يقوم Ghost بتجربة برنامج يعتمد على نماذج متعددة الوسائط “للقيام بتفسير مشهد أكثر تعقيدًا”. اقتراح قرارات الطريق (على سبيل المثال، “الانتقال إلى المسار الأيمن”) إلى أجهزة التحكم في السيارة بناءً على صور مشاهد الطريق من الكاميرات المثبتة على السيارة.
وقال هايز: “في Ghost، سنعمل على تحسين النماذج الحالية وتدريب النماذج الخاصة بنا لتحقيق أقصى قدر من الموثوقية والأداء على الطريق”. “على سبيل المثال، تحتوي مناطق البناء على مكونات غير عادية قد يكون من الصعب على النماذج الأبسط التنقل فيها – الممرات المؤقتة، وحاملي الأعلام الذين يحملون لافتات تتغير، والمفاوضات المعقدة مع مستخدمي الطريق الآخرين. لقد أظهر حاملو ماجستير إدارة الأعمال أنهم قادرون على معالجة كل هذه المتغيرات بالتنسيق مع مستويات التفكير الشبيهة بالإنسان.
لكن الخبراء الذين تحدثت معهم متشككون.
“[Ghost is] باستخدام “LLM” ككلمة طنانة للتسويق، “Os Keyes، دكتوراه. وقال مرشح في جامعة واشنطن يركز على القانون وأخلاقيات البيانات لـ TechCrunch عبر البريد الإلكتروني. “في الأساس، إذا أخذت هذا العرض واستبدلت LLM بـ “blockchain” وأرسلته مرة أخرى إلى عام 2016، فسيكون الأمر معقولًا تمامًا – ومن الواضح تمامًا أنه غير مجدي.”
يفترض كييز أن حاملي شهادات الماجستير هي ببساطة الأداة الخاطئة للقيادة الذاتية. ويؤكد أنهم لم يتم تصميمهم أو تدريبهم لهذا الغرض، وربما يكونون كذلك أقل طريقة فعالة لحل بعض التحديات العالقة في الحكم الذاتي للمركبات.
قال كييز: “يشبه الأمر سماع جارك يستخدم حزمة من أوراق الخزانة لرفع الطاولة”. “أنت استطاع افعل ذلك بهذه الطريقة، وهو بالتأكيد أفضل من البديل، ولكن… لماذا؟”
ويتفق مايك كوك، أحد كبار المحاضرين في جامعة كينغز كوليدج في لندن، والذي تركز أبحاثه على الإبداع الحسابي، مع تقييم كييز الشامل. ويشير إلى أن نماذج الوسائط المتعددة في حد ذاتها بعيدة كل البعد عن كونها علمًا محلولاً؛ في الواقع، يخترع النموذج الرئيسي لشركة OpenAI الحقائق ويرتكب أخطاء أساسية لا يرتكبها البشر، مثل نسخ النص بشكل غير صحيح والحصول على ألوان خاطئة.
وقال كوك: “لا أعتقد أن هناك أي شيء اسمه حل سحري في علوم الكمبيوتر”. “ببساطة لا يوجد سبب لوضع حاملي شهادة الماجستير في القانون في قلب شيء خطير ومعقد مثل قيادة السيارة. يكافح الباحثون في جميع أنحاء العالم بالفعل لإيجاد طرق للتحقق من صحة وإثبات سلامة حاملي شهادة الماجستير في المهام العادية إلى حد ما مثل الإجابة على الأسئلة المقالية، كما أن فكرة أننا يجب أن نطبق هذه التكنولوجيا التي لا يمكن التنبؤ بها وغير المستقرة في كثير من الأحيان على القيادة الذاتية هي فكرة سابقة لأوانها في أحسن الأحوال – و مضللة في أسوأ الأحوال.”
لكن هايز وOpenAI لن يثنيهما ذلك.
في بيان صحفي، نُقل عن براد لايت كاب، المدير التنفيذي للعمليات في OpenAI ومدير صندوق OpenAI Startup Fund، قوله إن النماذج متعددة الوسائط “لديها القدرة على توسيع نطاق تطبيق LLMs على العديد من حالات الاستخدام الجديدة”، بما في ذلك الاستقلالية والسيارات. ويضيف: “مع القدرة على الفهم واستخلاص النتائج من خلال الجمع بين الفيديو والصور والأصوات، قد تخلق النماذج متعددة الوسائط طريقة جديدة لفهم المشاهد والتنقل في البيئات المعقدة أو غير العادية”.
أرسلت TechCrunch أسئلة عبر البريد الإلكتروني إلى Lightcap عبر العلاقات الصحفية لـ OpenAI، لكنها لم تتلق ردًا حتى وقت النشر.
أما بالنسبة إلى هايز، فهو يقول إن حاملي شهادة الماجستير في القانون يمكن أن يسمحوا لأنظمة القيادة الذاتية “بالتفكير في مشاهد القيادة بشكل كلي” و”الاستفادة من المعرفة العالمية ذات القاعدة العريضة” من أجل “التنقل في المواقف المعقدة وغير العادية” – حتى المواقف التي لم يروها من قبل. وهو يدعي أن Ghost تختبر بشكل نشط اتخاذ القرار في مجال قيادة النماذج المتعددة الوسائط من خلال أسطول التطوير الخاص بها وتعمل مع شركات صناعة السيارات “للتحقق من صحة” النماذج الكبيرة الجديدة ودمجها في مجموعة الحكم الذاتي الخاصة بـ Ghost.
وقال هايز: “لا شك أن النماذج الحالية ليست جاهزة تمامًا للاستخدام التجاري في السيارات”. “لا يزال هناك الكثير من العمل الذي يتعين القيام به لتحسين موثوقيتها وأدائها. ولكن هذا هو بالضبط سبب وجود سوق للشركات المتخصصة في التطبيقات التي تقوم بالبحث والتطوير على هذه النماذج العامة. الشركات مثل شركتنا التي لديها الكثير من بيانات التدريب والفهم العميق للتطبيق ستحسن بشكل كبير النماذج العامة الحالية. النماذج نفسها سوف تتحسن أيضًا …. في نهاية المطاف، سوف تتطلب القيادة الذاتية نظامًا كاملاً لتوفير السلامة، مع العديد من أنواع النماذج والوظائف المختلفة. [Multimodal models] هي مجرد أداة واحدة للمساعدة في تحقيق ذلك.
وهذا يعد بالكثير مع التكنولوجيا غير المثبتة. هل يمكن لـ Ghost التسليم؟ وبالنظر إلى أن الشركات التي تتمتع بتمويل جيد وموارد جيدة، مثل Cruise وWaymo، تواجه انتكاسات كبيرة منذ سنوات عديدة في اختبار المركبات ذاتية القيادة على الطريق، فأنا لست متأكدًا من ذلك.