ساعدني وكيل مشغل Openai على التحرك ، لكن كان علي مساعدته أيضًا

أعطاني Openai أسبوعًا واحدًا لاختبار وكيل الذكاء الاصطناعي الجديد ، وهو نظام ، وهو نظام يمكنه القيام بمهام لك بشكل مستقل على الإنترنت.
المشغل هو أقرب شيء رأيته في رؤية صناعة التكنولوجيا لوكلاء الذكاء الاصطناعي – أنظمة يمكن أن تؤدي إلى أتمتة الأجزاء المملة من الحياة ، مما يحررنا للقيام بالأشياء التي نحبها حقًا. ومع ذلك ، انطلاقًا من تجربتي مع وكيل Openai ، لا تزال أنظمة الذكاء الاصطناعي “المستقلة” بعيدة المنال.
قام Openai بتدريب نموذج جديد على مشغل الطاقة ، والذي يجمع بين الفهم البصري لـ GPT-4O مع إمكانيات التفكير في O1.
يبدو أن هذا النموذج يعمل بشكل جيد للمهام الأساسية ؛ لقد شاهدت أزرار النقر على المشغل ، وتنقل القوائم على مواقع الويب ، وملء النماذج. كانت الذكاء الاصطناعى ناجحًا أحيانًا في اتخاذ الإجراءات بشكل مستقل ، وهي تعمل بشكل أسرع بكثير من الوكلاء القائم على الويب الذين رأيته من الأنثروبور وجوجل.
لكن خلال محاكمتي ، وجدت نفسي أساعد وكيل Openai أكثر مما أود. شعرت وكأنني كنت أتعامل مع كل مشكلة ، بينما أردت دفع مهام معينة من صفيحتي تمامًا.
في كثير من الأحيان أثناء الاختبار ، اضطررت إلى الإجابة على العديد من الأسئلة ، ومنح أذونات ، وملء المعلومات الشخصية ، ومساعدة الوكيل عندما يتعثر.
من حيث السيارة ، يشبه المشغل قيادة سيارة مع التحكم في التطواف-في بعض الأحيان ترفع قدمك من الدواسات وترك السيارة تقود نفسها-لكنها بعيدة كل البعد عن الطيار الآلي الكامل.
في الواقع ، يقول Openai إن توقفات المشغل المتكررة حسب التصميم.
لا يمكن للمشغل الذي يعمل بتشغيل الذكاء الاصطناعي ، مثله مثل AI الذي يعمل على تشغيل chatbots مثل chatgpt من Openai ، العمل بشكل مستقل لفترات طويلة من الزمن ، وهو عرضة لنفس النوع من الهلوسة. ولهذا السبب ، لا يريد Openai إعطاء النظام الكثير من قوة صنع القرار أو معلومات المستخدم الحساسة. ربما يكون هذا اختيارًا آمنًا من Openai ، لكنه يقلل من التطبيق العملي للمشغل.
ومع ذلك ، فإن الوكيل الأول لـ Openai هو دليل مثير للإعجاب على المفهوم – والواجهة – لمنظمة العفو الدولية التي يمكنها استخدام الواجهة الأمامية لأي موقع ويب. ولكن لإنشاء أنظمة منظمة العفو الدولية المستقلة حقًا ، ستحتاج شركات التكنولوجيا إلى بناء نماذج أكثر موثوقية AI التي لا تتطلب هذا التوجيه كثيرًا.
قليلا جدا “اليدين”
تزامنت تجربة المشغل مع الأسبوع الذي كنت أتحرك فيه الشقق ، لذلك حصلت على مساعدة وكيل Openai في نقل الخدمات اللوجستية.
طلبت من المشغل مساعدتي في شراء تصريح وقوف السيارات الجديد. أخبرني وكيل Openai ، “بالتأكيد” ، ثم فتح نافذة في متصفحه على شاشة جهاز الكمبيوتر الخاص بي.
ثم أجرى المشغل بحثًا عن تصريح وقوف السيارات في سان فرانسيسكو في المتصفح ، وأخذني إلى موقع المدينة الصحيح ، وحتى الصفحة الصحيحة.
لا يزال المشغل يتيح لك استخدام بقية جهاز الكمبيوتر الخاص بك أثناء عمله ، وهو أمر لا يمكن قوله لمشروع Google Mariner. وذلك لأن وكيل Openai لا يعمل حقًا على الكمبيوتر ، بل في السحابة في مكان ما.
للحصول على تصريح وقوف السيارات ، اضطررت إلى منح الإذن للمشغل لبدء عمليات مختلفة عدة مرات. توقف أيضًا عن طلب مني ملء النماذج بالمعلومات الشخصية – مثل اسمي ورقم هاتفي وعنوان البريد الإلكتروني. في بعض الأحيان ، فقدت المشغل أيضًا ، مما أجبرني على السيطرة على المتصفح وإعادة الوكيل إلى المسار الصحيح.
في اختبار آخر ، طلبت من المشغل أن يجعلني حجز في مطعم يوناني. يرجع الفضل في ذلك ، وجدني المشغل مكانًا لطيفًا في منطقتي بأسعار معقولة. لكن اضطررت إلى الإجابة على أكثر من نصف دزينة من الأسئلة طوال التدفق.

إذا كان عليك التدخل ست مرات أو أكثر لمجرد حجز الحجز من خلال وكيل الذكاء الاصطناعى ، فما الذي يسهل القيام بذلك بنفسك؟ هذا سؤال سألتني كثيرًا أثناء اختبار المشغل.
الوكيل كـ A-a-platform
في عدد قليل من اختباراتي ، واجهت مواقع الويب التي منعت المشغل لأي سبب من الأسباب. على سبيل المثال ، حاولت حجز كهربائي باستخدام TaskRabbit ، لكن وكيل Openai أخبرني أنه واجه خطأ ، وسألته عما إذا كان يمكنه استخدام خدمة بديلة بدلاً من ذلك. منعت Expedia و Reddit و YouTube أيضًا وكيل الذكاء الاصطناعى من الوصول إلى منصاتها.
ومع ذلك ، فإن الخدمات الأخرى تتبنى المشغل بأذرع مفتوحة. تعاونت Instacart و Uber و eBay مع Openai لإطلاق المشغل ، مما يسمح للوكيل بالتنقل على مواقع الويب الخاصة بهم نيابة عن البشر.
تستعد هذه الشركات لمستقبل حيث يتم تسهيل مجموعة فرعية من تفاعلات المستخدم من قبل وكيل الذكاء الاصطناعي.
وقال دانييل دانكر ، كبير مسؤولي المنتجات في Instacart ، في مقابلة مع TechCrunch: “يستخدم العملاء Instacart من خلال مجموعة متنوعة من نقاط الدخول المختلفة”. “نرى المشغل ، يحتمل ، واحدة أخرى من نقاط الدخول هذه.”
إن السماح لوكيل Openai باستخدام موقع Instacart على الويب نيابة عن شخص يبدو أنه سيفصل Instacart عن عملائه. ومع ذلك ، يقول Danker إن Instacart يريد مقابلة العملاء أينما كانوا.
وقال نيتزان ميكل-بوبروف ، كبير ضباط الذكاء الاصطناعي ، نيتزان ميكل بوبروف ، في مقابلة مع شركة TechCrunch: “إننا حقًا متفائلون بشأن اعتقادنا ، على غرار Openai ، أن أنظمة الوكلاء سيكون لها تأثير كبير على كيفية تفاعل المستهلكين مع الخصائص الرقمية”.
حتى لو ارتفعت شعبية وكلاء الذكاء الاصطناعي ، يقول Mekel-Bobrov إنه يتوقع أن يأتي المستخدمون دائمًا إلى موقع eBay ، مشيرًا إلى أن “الوجهات عبر الإنترنت لا تسير في أي مكان”.
قضايا الثقة
واجهت بعض المشكلات التي أثق في المشغل بعد أن تم هلوسها عدة مرات ، وكاد كلفني عدة مئات من الدولارات.
على سبيل المثال ، طلبت من الوكيل أن يجد لي مرآب للسيارات بالقرب من شقتي الجديدة. انتهى الأمر باقتراح اثنين من المرشحين الذي قال أنه سيستغرق بضع دقائق فقط للمشي.

إلى جانب كونه مخرجًا من النطاق السعري ، كانت المرائب بعيدة حقًا عن شقتي. كان أحدهما على بعد 20 دقيقة سيراً على الأقدام ، والآخر كان على بعد 30 دقيقة سيراً على الأقدام. تبين ، كان المشغل قد وضع العنوان الخطأ.
هذا هو بالضبط السبب في أن Openai لا يمنح وكيله رقم بطاقة الائتمان الخاصة بك أو كلمات المرور أو الوصول إلى البريد الإلكتروني. إذا لم يسمح لي Openai بالتدخل هنا ، لكان المشغل قد أهدر مئات الدولارات في مكان لوقوف السيارات لم أكن بحاجة إليه.
الهلوسة مثل هذه هي حاجز طريق رئيسي للعوامل المستقلة المفيدة فعليًا – تلك التي يمكن أن تأخذ مهام مزعجة من طبقك. لن يثق أحد في الوكلاء إذا كانوا عرضة لارتكاب الأخطاء الأساسية ، وخاصة الأخطاء ذات العواقب الواقعة.
مع المشغل ، يبدو أن Openai قام ببناء بعض الأدوات المثيرة للإعجاب للسماح لأنظمة الذكاء الاصطناعى بتصفح الويب. لكن هذه الأدوات لن تصل إلى حد كبير حتى يتمكن AI الأساسي من القيام بما يطلب من المستخدمين القيام به. حتى ذلك الحين ، سوف يكون البشر عالقًا في مساعدة الوكلاء – وليس العكس. وهذا النوع من الهزيمة هذه النقطة.
طعم وكيف دليل المطاعم والكافيهات دليل المطاعم مدن العالم طعام وشراب مقاهي الرياض أخبار ونصائح دليل الرياض كافيهات الرياض جلسات خارجية دليل مقاهي ومطاعم أفضل كافيهات الرياض عوائل
اكتشاف المزيد من موقع fffm
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.