لماذا تعتبر شركة Grok “ذات المصدر المفتوح” التابعة لشركة Elon Musk ذات أهمية – ولماذا لا تكون كذلك

أصدرت شركة Elon Musk’s xAI نموذجها اللغوي الكبير Grok باعتباره “مفتوح المصدر” خلال عطلة نهاية الأسبوع. ومن الواضح أن الملياردير يأمل في وضع شركته على خلاف مع شركة OpenAI المنافسة، والتي على الرغم من اسمها ليست مفتوحة بشكل خاص. ولكن هل يساهم إصدار التعليمات البرمجية لشيء مثل Grok فعليًا في مجتمع تطوير الذكاء الاصطناعي؟ نعم و لا.

Grok هو برنامج chatbot تم تدريبه بواسطة xAI للقيام بنفس الدور المحدد بشكل غامض كشيء مثل ChatGPT أو Claude: أنت تسأله، فهو يجيب. ومع ذلك، فقد مُنحت شهادة الماجستير في القانون أسلوبًا وقحًا وإمكانية وصول إضافية إلى بيانات تويتر كوسيلة لتمييزها عن الباقي.

وكما هو الحال دائمًا، يكاد يكون من المستحيل تقييم هذه الأنظمة، ولكن يبدو أن الإجماع العام هو أنها قادرة على المنافسة مع النماذج متوسطة الحجم من الجيل الأخير مثل GPT-3.5. (سواء قررت أن هذا مثير للإعجاب نظرًا للإطار الزمني القصير للتطوير أو مخيب للآمال نظرًا للميزانية والضجة المحيطة بـ xAI، فالأمر متروك لك تمامًا.)

على أي حال، يعد Grok بمثابة ماجستير إدارة أعمال (LLM) حديث وعملي ذو حجم وقدرات كبيرين، وكلما زاد وصول مجتمع المطورين إلى قلب مثل هذه الأشياء، كلما كان ذلك أفضل. تكمن المشكلة في تعريف كلمة “مفتوح” بطريقة تحقق أكثر من مجرد السماح لشركة (أو ملياردير) بالمطالبة بالأرضية الأخلاقية العالية.

ليست هذه هي المرة الأولى التي يتم فيها التشكيك أو إساءة استخدام مصطلحي “مفتوح” و”مفتوح المصدر” في عالم الذكاء الاصطناعي. ونحن لا نتحدث فقط عن مشكلة فنية، مثل اختيار ترخيص استخدام غير مفتوح مثل أي ترخيص آخر (Grok هو Apache 2.0، إذا كنت تتساءل).

في البداية، تختلف نماذج الذكاء الاصطناعي عن البرامج الأخرى عندما يتعلق الأمر بجعلها “مفتوحة المصدر”.

إذا كنت تصنع، على سبيل المثال، معالج نصوص، فمن السهل نسبيًا جعله مفتوح المصدر: فأنت تنشر جميع التعليمات البرمجية الخاصة بك علنًا وتسمح للمجتمع باقتراح التحسينات أو إنشاء نسختهم الخاصة. جزء مما يجعل المصدر المفتوح كمفهوم قيمًا هو أن كل جانب من جوانب التطبيق أصلي أو يُنسب إلى منشئه الأصلي – هذه الشفافية والالتزام بالإسناد الصحيح ليست مجرد منتج ثانوي، ولكنها جوهر مفهوم الانفتاح ذاته.

مع الذكاء الاصطناعي، يمكن القول إن هذا غير ممكن على الإطلاق، لأن الطريقة التي يتم بها إنشاء نماذج التعلم الآلي تنطوي على عملية غير معروفة إلى حد كبير حيث يتم استخلاص كمية هائلة من بيانات التدريب في تمثيل إحصائي معقد لا يوجهه أي إنسان حقًا، أو حتى يفهمه. . لا يمكن فحص هذه العملية وتدقيقها وتحسينها بالطريقة التي يمكن بها استخدام التعليمات البرمجية التقليدية – لذلك على الرغم من أنها لا تزال تتمتع بقيمة هائلة من ناحية ما، إلا أنه لا يمكن أن تكون مفتوحة حقًا على الإطلاق. (لم يحدد مجتمع المعايير حتى ما هو المجال المفتوح في هذا السياق، ولكنه يناقشه بنشاط).

لكن هذا لم يمنع مطوري وشركات الذكاء الاصطناعي من تصميم نماذجهم والمطالبة بها باعتبارها “مفتوحة”، وهو المصطلح الذي فقد الكثير من معناه في هذا السياق. يسمي البعض نموذجهم “مفتوحًا” إذا كانت هناك واجهة عامة أو واجهة برمجة تطبيقات (API). يسميها البعض “مفتوحة” إذا أصدروا ورقة تصف عملية التطوير.

يمكن القول إن الأقرب إلى “المصدر المفتوح” لنموذج الذكاء الاصطناعي هو عندما يقوم مطوروه بإصداره الأوزان، وهذا يعني السمات الدقيقة للعقد التي لا تعد ولا تحصى من شبكاتها العصبية، والتي تنفذ عمليات الرياضيات المتجهة بترتيب دقيق لإكمال النمط الذي بدأه إدخال المستخدم. ولكن حتى النماذج “ذات الأوزان المفتوحة” مثل LLaMa-2 تستبعد بيانات مهمة أخرى، مثل مجموعة بيانات التدريب والعملية، والتي ستكون ضرورية لإعادة إنشائها من الصفر. (بعض المشاريع تذهب إلى أبعد من ذلك بالطبع.)

كل هذا قبل أن نذكر حقيقة أن الأمر يتطلب ملايين الدولارات من موارد الحوسبة والهندسة لإنشاء أو تكرار هذه النماذج، مما يحد بشكل فعال من يمكنه إنشاءها وتكرارها للشركات التي تتمتع بموارد كبيرة.

إذن، أين يقع إصدار Grok الخاص بـ xAI في هذا الطيف؟

باعتباره نموذجًا مفتوح الأوزان، فهو جاهز لأي شخص للتنزيل أو الاستخدام أو التعديل أو التحسين أو التقطير. هذا جيد! ويبدو أنه من بين أكبر النماذج التي يمكن لأي شخص الوصول إليها بحرية بهذه الطريقة، من حيث المعلمات – 314 مليارًا – مما يمنح المهندسين الفضوليين الكثير للعمل معه إذا أرادوا اختبار كيفية أدائه بعد تعديلات مختلفة.

حجم النموذج له عيوب خطيرة، رغم ذلك: ستحتاج إلى مئات الجيجابايت من ذاكرة الوصول العشوائي عالية السرعة لاستخدامه في هذا النموذج الأولي. إذا لم تكن بحوزتك بالفعل، على سبيل المثال، عشرات من أجهزة Nvidia H100 في جهاز استدلال يعمل بالذكاء الاصطناعي مكون من ستة أرقام، فلا تهتم بالنقر فوق رابط التنزيل هذا.

وعلى الرغم من أن Grok يمكن القول إنها قادرة على المنافسة مع بعض النماذج الحديثة الأخرى، إلا أنها أيضًا أكبر بكثير منها، مما يعني أنها تتطلب المزيد من الموارد لإنجاز نفس الشيء. يوجد دائمًا تسلسل هرمي للحجم والكفاءة والمقاييس الأخرى، ولا يزال ذلك ذا قيمة، ولكنه يعتبر مادة خام أكثر من المنتج النهائي. ليس من الواضح أيضًا ما إذا كان هذا هو الإصدار الأحدث والأفضل من Grok، مثل الإصدار الذي تم ضبطه بوضوح والذي يمكن للبعض الوصول إليه عبر X.

بشكل عام، يعد نشر هذه البيانات أمرًا جيدًا، لكنه لا يغير قواعد اللعبة كما كان يأمل البعض.

ومن الصعب أيضًا ألا نتساءل عن سبب قيام ماسك بذلك. هل شركته الناشئة في مجال الذكاء الاصطناعي مخصصة حقًا لتطوير المصادر المفتوحة؟ أم أن هذا مجرد طين في عين شركة OpenAI، التي يسعى ” ماسك ” من خلالها حاليًا إلى الحصول على لحم البقر على مستوى الملياردير؟

إذا كانوا ملتزمين حقًا بتطوير المصادر المفتوحة، فسيكون هذا هو الإصدار الأول من بين العديد من الإصدارات، ونأمل أن يأخذوا تعليقات المجتمع في الاعتبار، ويصدروا معلومات مهمة أخرى، ويميزوا عملية بيانات التدريب، ويشرحوا نهجهم بشكل أكبر. إذا لم تكن كذلك، ويتم ذلك فقط حتى يتمكن ” ماسك ” من الإشارة إليها في الحجج عبر الإنترنت، فستظل ذات قيمة – ولكنها ليست شيئًا سيعتمد عليه أي شخص في عالم الذكاء الاصطناعي أو يهتم به كثيرًا بعد الأشهر القليلة المقبلة أثناء اللعب به. الموديل.