تقنية

لدينا أخيرًا تعريف “رسمي” للذكاء الاصطناعي مفتوح المصدر


هناك أخيرًا تعريف “رسمي” للذكاء الاصطناعي مفتوح المصدر.

أصدرت مبادرة المصدر المفتوح (OSI)، وهي مؤسسة طويلة الأمد تهدف إلى تعريف و”إدارة” كل ما هو مفتوح المصدر، اليوم الإصدار 1.0 من تعريف الذكاء الاصطناعي مفتوح المصدر (OSAID). نتاج عدة سنوات من التعاون مع الأوساط الأكاديمية والصناعية، يهدف OSAID إلى تقديم معيار يمكن لأي شخص من خلاله تحديد ما إذا كان الذكاء الاصطناعي مفتوح المصدر أم لا.

ربما تتساءل – كما تساءل هذا المراسل – عن أهمية الإجماع على تعريف الذكاء الاصطناعي مفتوح المصدر. حسنًا، هناك دافع كبير يتمثل في جعل صانعي السياسات ومطوري الذكاء الاصطناعي على نفس الصفحة، كما قال ستيفانو مافولي، نائب رئيس OSI.

وقال مافولي لـ TechCrunch: “إن المنظمين يراقبون الفضاء بالفعل”، مشيراً إلى أن هيئات مثل المفوضية الأوروبية سعت إلى منح اعتراف خاص للمصادر المفتوحة. “لقد قمنا بالتواصل بشكل واضح مع مجموعة متنوعة من أصحاب المصلحة والمجتمعات – وليس فقط المشتبه بهم المعتادين في مجال التكنولوجيا. لقد حاولنا أيضًا التواصل مع المنظمات التي تتحدث في أغلب الأحيان مع الهيئات التنظيمية من أجل الحصول على تعليقاتها المبكرة.

افتح الذكاء الاصطناعي

لكي يتم اعتبار نموذج الذكاء الاصطناعي مفتوح المصدر بموجب OSAID، يجب أن يوفر معلومات كافية حول تصميمه حتى يتمكن الشخص من إعادة إنشائه “بشكل كبير”. يجب أن يكشف النموذج أيضًا عن أي تفاصيل ذات صلة ببيانات التدريب الخاصة به، بما في ذلك المصدر وكيفية معالجة البيانات وكيفية الحصول عليها أو ترخيصها.

قال مافولي: “الذكاء الاصطناعي مفتوح المصدر هو نموذج للذكاء الاصطناعي يسمح لك بالفهم الكامل لكيفية بنائه”. “وهذا يعني أنه يمكنك الوصول إلى جميع المكونات، مثل الكود الكامل المستخدم للتدريب وتصفية البيانات.”

تحدد OSAID أيضًا حقوق الاستخدام التي يجب أن يتوقعها المطورون مع الذكاء الاصطناعي مفتوح المصدر، مثل حرية استخدام النموذج لأي غرض وتعديله دون الحاجة إلى طلب إذن من أي شخص. وأضاف مافولي: “الأهم من ذلك، أنه يجب أن تكون قادرًا على البناء على القمة”.

ليس لدى OSI آليات تنفيذ يمكن الحديث عنها. ولا يمكنها الضغط على المطورين للالتزام بـ OSAID أو متابعته. ولكنها تهدف إلى وضع علامة على النماذج الموصوفة بأنها “مفتوحة المصدر” ولكنها لا ترقى إلى مستوى التعريف.

وقال مافولي: “أملنا هو أنه عندما يحاول شخص ما إساءة استخدام هذا المصطلح، سيقول مجتمع الذكاء الاصطناعي: نحن لا نعترف بهذا باعتباره مصدرًا مفتوحًا، ويتم تصحيحه”. تاريخيًا، كان لذلك نتائج مختلطة، لكنه لم يكن بلا تأثير تمامًا.

استخدمت العديد من الشركات الناشئة وشركات التكنولوجيا الكبرى، وأبرزها شركة Meta، مصطلح “المصدر المفتوح” لوصف استراتيجيات إصدار نماذج الذكاء الاصطناعي الخاصة بها – لكن القليل منها يستوفي معايير OSAID. على سبيل المثال، تفرض شركة Meta على المنصات التي تضم أكثر من 700 مليون مستخدم نشط شهريًا أن تطلب ترخيصًا خاصًا لاستخدام نماذج Llama الخاصة بها.

لقد انتقد مافولي علنًا قرار ميتا بتسمية نماذجها “مفتوحة المصدر”. وقال إنه بعد مناقشات مع OSI، اتفقت شركتا Google وMicrosoft على التخلي عن استخدامهما للمصطلح للنماذج غير المفتوحة بالكامل، لكن Meta لم تفعل ذلك.

ويتطلب الذكاء الاصطناعي المستقر، الذي طالما أعلن عن نماذجه على أنها “مفتوحة”، أن تحصل الشركات التي تحقق إيرادات تزيد على مليون دولار على ترخيص مؤسسي. ويحظر ترخيص شركة ميسترال الفرنسية الناشئة في مجال الذكاء الاصطناعي استخدام نماذج ومخرجات معينة في المشاريع التجارية.

وجدت دراسة أجراها باحثون في مؤسسة Signal Foundation، ومعهد AI Now غير الربحي، وجامعة كارنيجي ميلون في أغسطس الماضي، أن العديد من نماذج “المصادر المفتوحة” هي في الأساس مفتوحة المصدر بالاسم فقط. يتم الحفاظ على سرية البيانات المطلوبة لتدريب النماذج، كما أن القدرة الحاسوبية اللازمة لتشغيلها بعيدة عن متناول العديد من المطورين، كما أن تقنيات ضبطها معقدة إلى حد مخيف.

وبدلاً من إضفاء الطابع الديمقراطي على الذكاء الاصطناعي، تميل هذه المشاريع “مفتوحة المصدر” إلى ترسيخ وتوسيع السلطة المركزية، كما خلص مؤلفو الدراسة. في الواقع، حققت نماذج Lllama التابعة لشركة Meta مئات الملايين من التنزيلات، وتدعي شركة Stability أن نماذجها تعمل على تشغيل ما يصل إلى 80٪ من جميع الصور التي يتم إنشاؤها بواسطة الذكاء الاصطناعي.

آراء مخالفة

لا يتفق ميتا مع هذا التقييم، مما لا يثير الدهشة – ويعترض على OSAID كما هو مكتوب (على الرغم من مشاركته في عملية الصياغة). دافع متحدث باسم الشركة عن ترخيص Llama، بحجة أن الشروط – وسياسة الاستخدام المقبول المصاحبة لها – تعمل بمثابة حواجز ضد عمليات النشر الضارة.

وقالت Meta أيضًا إنها تتخذ “نهجًا حذرًا” لمشاركة تفاصيل النموذج، بما في ذلك التفاصيل حول بيانات التدريب، مع تطور لوائح مثل قانون شفافية التدريب في كاليفورنيا.

وقال المتحدث: “نحن نتفق مع شريكنا OSI في العديد من الأشياء، لكننا، مثل الآخرين في الصناعة، نختلف مع تعريفهم الجديد”. “لا يوجد تعريف واحد للذكاء الاصطناعي مفتوح المصدر، ويمثل تعريفه تحديًا لأن التعريفات السابقة مفتوحة المصدر لا تشمل تعقيدات نماذج الذكاء الاصطناعي سريعة التقدم اليوم. نحن نجعل اللاما مجانية ومتاحة بشكل مفتوح، وتساعد سياسة الترخيص والاستخدام المقبول لدينا في الحفاظ على سلامة الأشخاص من خلال فرض بعض القيود. سنواصل العمل مع OSI ومجموعات الصناعة الأخرى لجعل الذكاء الاصطناعي أكثر سهولة ومجانية بشكل مسؤول، بغض النظر عن التعريفات التقنية.

وأشار المتحدث إلى الجهود الأخرى لتدوين الذكاء الاصطناعي “مفتوح المصدر”، مثل التعريفات المقترحة من مؤسسة Linux، ومعايير مؤسسة البرمجيات الحرة لـ “تطبيقات التعلم الآلي المجانية”، والمقترحات المقدمة من باحثين آخرين في مجال الذكاء الاصطناعي.

وعلى نحو متناقض بما فيه الكفاية، تعد شركة Meta واحدة من الشركات التي تمول عمل OSI – جنبًا إلى جنب مع عمالقة التكنولوجيا مثل Amazon، وGoogle، وMicrosoft، وCisco، وIntel، وSalesforce. (حصلت OSI مؤخرًا على منحة من مؤسسة Sloan Foundation غير الربحية لتقليل اعتمادها على داعمي صناعة التكنولوجيا).

من المحتمل أن يكون إحجام ميتا عن الكشف عن بيانات التدريب له علاقة بالطريقة التي يتم بها تطوير نماذج الذكاء الاصطناعي الخاصة بها.

تقوم شركات الذكاء الاصطناعي باستخلاص كميات هائلة من الصور والتسجيلات الصوتية ومقاطع الفيديو وغير ذلك الكثير من وسائل التواصل الاجتماعي والمواقع الإلكترونية، وتدرب نماذجها على هذه “البيانات المتاحة للعامة”، كما يطلق عليها عادة. في سوق اليوم الحاد، تعتبر أساليب الشركة في تجميع مجموعات البيانات وتحسينها ميزة تنافسية، وتشير الشركات إلى هذا باعتباره أحد الأسباب الرئيسية لعدم الكشف عنها.

لكن تفاصيل بيانات التدريب يمكن أن ترسم أيضًا هدفًا قانونيًا على ظهور المطورين. يدعي المؤلفون والناشرون أن Meta استخدمت كتبًا محمية بحقوق الطبع والنشر للتدريب. رفع الفنانون دعاوى قضائية ضد شركة Stability بتهمة شطط أعمالهم وإعادة إنتاجها دون رصيد، وهو عمل يشبهون بالسرقة.

ليس من الصعب أن نرى كيف يمكن أن يمثل OSAID مشكلة بالنسبة للشركات التي تحاول حل الدعاوى القضائية بشكل إيجابي، خاصة إذا وجد المدعون والقضاة أن التعريف مقنع بما يكفي لاستخدامه في المحكمة.

أسئلة مفتوحة

يقترح البعض أن التعريف لا يذهب إلى حد كافٍ، على سبيل المثال في كيفية تعامله مع ترخيص بيانات التدريب الخاصة. ويشير لوكا أنتيجا، الرئيس التنفيذي لشركة Lightning AI، إلى أن النموذج قد يلبي جميع متطلبات OSAID على الرغم من أن البيانات المستخدمة لتدريبه ليست متاحة مجانًا. هل هو “مفتوح” إذا كان عليك أن تدفع الآلاف لتفقد المتاجر الخاصة للصور التي دفعها منشئو النماذج لترخيصها؟

“لكي يكون ذا قيمة عملية، خاصة بالنسبة للشركات، فإن أي تعريف للذكاء الاصطناعي مفتوح المصدر يحتاج إلى إعطاء ثقة معقولة بما يتم ترخيصه يستطيع قال أنتيجا لـ TechCrunch: “يجب أن تكون مرخصًا بالطريقة التي تستخدمها بها المنظمة”. “من خلال إهمال التعامل مع ترخيص بيانات التدريب، يترك OSI فجوة كبيرة من شأنها أن تجعل المصطلحات أقل فعالية في تحديد ما إذا كان من الممكن اعتماد نماذج الذكاء الاصطناعي المرخصة من OSI في مواقف العالم الحقيقي.”

في الإصدار 1.0 من OSAID، لا يتناول OSI أيضًا حقوق الطبع والنشر فيما يتعلق بنماذج الذكاء الاصطناعي، وما إذا كان منح ترخيص حقوق الطبع والنشر سيكون كافيًا لضمان استيفاء النموذج لتعريف المصدر المفتوح. ليس من الواضح بعد ما إذا كانت النماذج — أو مكونات النماذج — يستطيع أن تكون محمية بحقوق الطبع والنشر بموجب قانون الملكية الفكرية الحالي. ولكن إذا قررت المحاكم ذلك، فإن OSI تشير إلى أنه قد تكون هناك حاجة إلى “أدوات قانونية” جديدة لفتح النماذج المحمية بالملكية الفكرية بشكل صحيح.

ويوافق مافولي على أن التعريف سيحتاج إلى تحديثات، ربما عاجلًا وليس آجلًا. ولتحقيق هذه الغاية، قام OSI بتشكيل لجنة ستكون مسؤولة عن مراقبة كيفية تطبيق OSAID، واقتراح التعديلات على الإصدارات المستقبلية.

قال: “هذا ليس من عمل العباقرة الوحيدين في الطابق السفلي”. “إنه عمل يتم تنفيذه في العلن مع مجموعة واسعة من أصحاب المصلحة ومجموعات المصالح المختلفة.”


اكتشاف المزيد من موقع fffm

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى

اكتشاف المزيد من موقع fffm

اشترك الآن للاستمرار في القراءة والحصول على حق الوصول إلى الأرشيف الكامل.

Continue reading