الانطباعات الأولى عن OpenAI o1: ذكاء اصطناعي مصمم للتفكير الزائد فيه

أصدرت OpenAI نماذجها الجديدة o1 يوم الخميس، مما يمنح مستخدمي ChatGPT أول فرصة لتجربة نماذج الذكاء الاصطناعي التي تتوقف مؤقتًا “للتفكير” قبل الإجابة. كان هناك الكثير من الضجيج حول هذه النماذج، التي تحمل الاسم الرمزي “الفراولة” داخل OpenAI. ولكن هل ترقى الفراولة إلى مستوى الضجيج؟

نوع من.

بالمقارنة مع GPT-4o، تبدو نماذج o1 وكأنها خطوة للأمام وخطوتين للوراء. يتفوق OpenAI o1 في التفكير والإجابة على الأسئلة المعقدة، لكن تكلفة استخدام النموذج أعلى بأربع مرات تقريبًا من GPT-4o. يفتقر أحدث طراز من OpenAI إلى الأدوات وإمكانيات الوسائط المتعددة والسرعة التي جعلت GPT-4o مثيرًا للإعجاب. في الواقع، تعترف OpenAI بأن “GPT-4o لا يزال الخيار الأفضل لمعظم المطالبات” على صفحة المساعدة الخاصة بها، وتشير في مكان آخر إلى أن o1 يواجه صعوبات في المهام الأبسط.

وقال رافيد شفارتز زيف، الأستاذ في جامعة نيويورك الذي يدرس نماذج الذكاء الاصطناعي: “إنه أمر مثير للإعجاب، لكنني أعتقد أن التحسن ليس كبيرا للغاية”. “إنه أفضل في بعض المشكلات، لكن ليس لديك هذا التحسن الشامل.”

لكل هذه الأسباب، من المهم استخدام o1 فقط للأسئلة التي تم تصميمه للمساعدة في حلها: الأسئلة الكبيرة. لكي نكون واضحين، لا يستخدم معظم الناس الذكاء الاصطناعي التوليدي للإجابة على هذا النوع من الأسئلة اليوم، ويرجع ذلك إلى حد كبير إلى أن نماذج الذكاء الاصطناعي الحالية ليست جيدة في ذلك. ومع ذلك، فإن o1 يمثل خطوة مؤقتة في هذا الاتجاه.

التفكير من خلال الأفكار الكبيرة

يعد OpenAI o1 فريدًا من نوعه لأنه “يفكر” قبل الإجابة، ويقسم المشكلات الكبيرة إلى خطوات صغيرة ويحاول تحديد متى يكون صحيحًا أو خاطئًا في إحدى تلك الخطوات. إن هذا “الاستدلال متعدد الخطوات” ليس جديداً تماماً (لقد اقترحه الباحثون لسنوات، ويستخدمه موقع You.com للإجابة على استفسارات معقدة)، ولكنه لم يصبح عملياً حتى وقت قريب.

قال كيان كاتانفوروش، الرئيس التنفيذي لشركة Workera والمحاضر المساعد في جامعة ستانفورد، والذي يقوم بتدريس دروس التعلم الآلي، في مقابلة: “هناك الكثير من الإثارة في مجتمع الذكاء الاصطناعي”. “إذا كان بإمكانك تدريب خوارزمية التعلم المعزز المقترنة ببعض تقنيات نماذج اللغة التي تمتلكها OpenAI، فيمكنك من الناحية الفنية إنشاء تفكير خطوة بخطوة والسماح لنموذج الذكاء الاصطناعي بالرجوع إلى الوراء من الأفكار الكبيرة التي تحاول العمل من خلالها. “

OpenAI o1 باهظ الثمن أيضًا. في معظم النماذج، تدفع مقابل الرموز المميزة للإدخال والرموز المميزة للإخراج. ومع ذلك، يضيف o1 عملية مخفية (الخطوات الصغيرة التي يقسم النموذج المشكلات الكبيرة إليها)، مما يضيف قدرًا كبيرًا من الحوسبة التي لا تراها بالكامل أبدًا. تقوم OpenAI بإخفاء بعض تفاصيل هذه العملية للحفاظ على ميزتها التنافسية. ومع ذلك، لا يزال يتم تحصيل رسوم منك مقابل ذلك في شكل “رموز منطقية”. وهذا يؤكد أيضًا سبب حاجتك إلى توخي الحذر عند استخدام OpenAI o1، حتى لا يتم تحصيل الكثير من الرموز المميزة منك مقابل السؤال عن مكان عاصمة ولاية نيفادا.

ومع ذلك، فإن فكرة نموذج الذكاء الاصطناعي الذي يساعدك على “الرجوع إلى الوراء من الأفكار الكبيرة” هي فكرة قوية. ومن الناحية العملية، النموذج جيد جدًا في ذلك.

في أحد الأمثلة، طلبت من معاينة ChatGPT o1 مساعدة عائلتي في التخطيط لعيد الشكر، وهي مهمة يمكن أن تستفيد من القليل من المنطق والتفكير غير المتحيز. على وجه التحديد، أردت المساعدة في معرفة ما إذا كان هناك فرنان سيكونان كافيين لطهي عشاء عيد الشكر لـ 11 شخصًا وأردت التحدث عما إذا كان ينبغي لنا التفكير في استئجار Airbnb للوصول إلى فرن ثالث.

(ماكسويل زيف/أوبن إيه آي)

بعد 12 ثانية من “التفكير”، كتب لي موقع ChatGPT ردًا يزيد عن 750 كلمة يخبرني في النهاية أن وجود فرنين يجب أن يكون كافيًا مع بعض الاستراتيجيات الدقيقة، وسيسمح لعائلتي بتوفير التكاليف وقضاء المزيد من الوقت معًا. لكنها حطمت تفكيرها بالنسبة لي في كل خطوة على الطريق وشرحت كيف أخذت في الاعتبار كل هذه العوامل الخارجية، بما في ذلك التكاليف، ووقت الأسرة، وإدارة الفرن.

أخبرتني معاينة ChatGPT o1 بكيفية تحديد أولويات مساحة الفرن في المنزل الذي يستضيف الحدث، وهو أمر ذكي. ومن الغريب أنه اقترح أن أفكر في استئجار فرن محمول لهذا اليوم. ومع ذلك، كان أداء النموذج أفضل بكثير من GPT-4o، الأمر الذي تطلب أسئلة متابعة متعددة حول الأطباق المحددة التي كنت أحضرها، ثم أعطاني نصيحة بسيطة وجدتها أقل فائدة.

قد يبدو السؤال عن عشاء عيد الشكر أمرًا سخيفًا، ولكن يمكنك أن ترى كيف ستكون هذه الأداة مفيدة في تقسيم المهام المعقدة.

لقد طلبت أيضًا من o1 مساعدتي في التخطيط ليوم حافل في العمل، حيث كنت بحاجة إلى السفر بين المطار وعقد اجتماعات شخصية متعددة في مواقع مختلفة ومكتبي. لقد أعطتني خطة مفصلة للغاية، ولكن ربما كانت كثيرة بعض الشيء. في بعض الأحيان، يمكن أن تكون جميع الخطوات المضافة مرهقة بعض الشيء.

بالنسبة لسؤال أبسط، فإن o1 يفعل الكثير، فهو لا يعرف متى يتوقف عن التفكير الزائد. سألت أين يمكنك العثور على أشجار الأرز في أمريكا، وقد قدمت إجابة تزيد عن 800 كلمة، موضحة كل أنواع أشجار الأرز في البلاد، بما في ذلك اسمها العلمي. حتى أنها اضطرت إلى التشاور مع سياسات OpenAI في مرحلة ما، ولسبب ما. قام GPT-4o بعمل أفضل بكثير في الإجابة على هذا السؤال، حيث قدم لي حوالي ثلاث جمل تشرح أنه يمكنك العثور على الأشجار في جميع أنحاء البلاد.

تهدئة التوقعات

في بعض النواحي، لم تكن الفراولة على مستوى الضجيج. تعود التقارير حول نماذج الاستدلال الخاصة بـ OpenAI إلى نوفمبر 2023، في الوقت الذي كان الجميع يبحث فيه عن إجابة حول سبب إطاحة مجلس إدارة OpenAI بسام ألتمان. أدى ذلك إلى انتشار الشائعات في عالم الذكاء الاصطناعي، مما ترك البعض يتكهن بأن الفراولة كانت شكلاً من أشكال الذكاء الاصطناعي العام، وهي النسخة المستنيرة من الذكاء الاصطناعي التي تطمح شركة OpenAI إلى إنشائها في نهاية المطاف.

أكد ألتمان أن o1 ليس AGI لتوضيح أي شكوك، وليس أنك سوف تشعر بالارتباك بعد استخدام الشيء. كما قلص الرئيس التنفيذي أيضًا التوقعات حول هذا الإطلاق، حيث غرد قائلاً: “لا يزال o1 معيبًا، ولا يزال محدودًا، ولا يزال يبدو أكثر إثارة للإعجاب عند الاستخدام الأول مما هو عليه بعد قضاء المزيد من الوقت معه”.

يتأقلم بقية عالم الذكاء الاصطناعي مع عملية إطلاق أقل إثارة مما كان متوقعًا.

قال روهان باندي، مهندس الأبحاث في شركة الذكاء الاصطناعي الناشئة ReWorkd، التي تبني أدوات استخراج بيانات الويب باستخدام نماذج OpenAI: “لقد خرج هذا النوع من الضجيج عن سيطرة OpenAI”.

إنه يأمل أن تكون قدرة o1 على التفكير جيدة بما يكفي لحل مجموعة متخصصة من المشكلات المعقدة التي يعجز فيها GPT-4. من المحتمل أن هذه هي الطريقة التي ينظر بها معظم الأشخاص في الصناعة إلى o1، ولكن ليس تمامًا كخطوة ثورية للأمام التي يمثلها GPT-4 لهذه الصناعة.

“الجميع ينتظر تغييرًا تدريجيًا في وظيفة القدرات، ومن غير الواضح ما إذا كان هذا يمثل ذلك. قال مايك كونوفر، الرئيس التنفيذي لشركة Brightwave، والذي شارك سابقًا في إنشاء نموذج الذكاء الاصطناعي Dolly الخاص بشركة Databricks، في مقابلة: “أعتقد أن الأمر بهذه البساطة”.

ما القيمة هنا؟

المبادئ الأساسية المستخدمة لإنشاء o1 تعود إلى سنوات مضت. استخدمت جوجل تقنيات مماثلة في عام 2016 لإنشاء AlphaGo، وهو أول نظام ذكاء اصطناعي يهزم بطل العالم في لعبة اللوحة Go، كما يشير آندي هاريسون، موظف Google السابق والرئيس التنفيذي لشركة المشاريع S32. تم تدريب AlphaGo من خلال اللعب ضد نفسه مرات لا تحصى، وقام بالتعليم الذاتي بشكل أساسي حتى وصل إلى قدرة خارقة.

ويشير إلى أن هذا يثير نقاشًا قديمًا في عالم الذكاء الاصطناعي.

“يعتقد المعسكر الأول أنه يمكنك أتمتة سير العمل من خلال هذه العملية الوكلاءية. وقال هاريسون في مقابلة: “يعتقد المعسكر الثاني أنه إذا كان لديك ذكاء واستدلال معمم، فلن تحتاج إلى سير العمل، ومثل الإنسان، فإن الذكاء الاصطناعي سيصدر حكمًا فقط”.

يقول هاريسون إنه في المعسكر الأول وهذا المعسكر الثاني يتطلب منك أن تثق في الذكاء الاصطناعي لاتخاذ القرار الصحيح. إنه لا يعتقد أننا وصلنا إلى هناك بعد.

ومع ذلك، يعتقد البعض الآخر أن o1 أقل من كونه صانع قرار وأكثر من كونه أداة للتشكيك في تفكيرك بشأن القرارات الكبيرة.

وصف كاتانفوروش، الرئيس التنفيذي لشركة Workera، مثالاً حيث كان سيجري مقابلة مع عالم بيانات للعمل في شركته. أخبر OpenAI o1 أن لديه 30 دقيقة فقط ويريد تقييم عدد معين من المهارات. يمكنه العمل بشكل عكسي باستخدام نموذج الذكاء الاصطناعي لفهم ما إذا كان يفكر في هذا الأمر بشكل صحيح، وسوف يفهم o1 قيود الوقت وما إلى ذلك.

والسؤال هو ما إذا كانت هذه الأداة المفيدة تستحق هذا الثمن الباهظ. مع استمرار انخفاض تكلفة نماذج الذكاء الاصطناعي، يعد o1 أحد نماذج الذكاء الاصطناعي الأولى منذ فترة طويلة والتي رأيناها تصبح أكثر تكلفة.