تطلق ميسترال Pixtral 12B، أول نموذج متعدد الوسائط لها

أصدرت شركة Mistral الفرنسية الناشئة للذكاء الاصطناعي نموذجها الأول الذي يمكنه معالجة الصور والنصوص أيضًا.
يُطلق على النموذج اسم Pixtral 12B، ويبلغ حجم النموذج الذي يحتوي على 12 مليار معلمة حوالي 24 جيجابايت. تتوافق المعلمات تقريبًا مع مهارات حل المشكلات الخاصة بالنموذج، والنماذج التي تحتوي على معلمات أكثر تؤدي عمومًا أداءً أفضل من تلك التي تحتوي على معلمات أقل.
تم بناء النموذج الجديد على أحد نماذج ميسترال النصية، Nemo 12B، ويمكنه الإجابة على أسئلة حول عدد عشوائي من الصور ذات الحجم العشوائي المعطاة إما بعناوين URL أو الصور المشفرة باستخدام base64، وهو نظام ترميز ثنائي إلى نص. على غرار النماذج متعددة الوسائط الأخرى مثل عائلة Anthropic’s Claude وGPT-4o من OpenAI، يجب أن يكون Pixtral 12B – على الأقل من الناحية النظرية – قادرًا على أداء مهام مثل التعليق على الصور وحساب عدد الكائنات في الصورة.
متاح عبر رابط تورنت على GitHub والذكاء الاصطناعي ومنصة تطوير التعلم الآلي Hugging Face، ويمكن تنزيل Pixtral 12B وضبطه واستخدامه بموجب ترخيص التطوير القياسي من Mistral، والذي يتطلب ترخيصًا مدفوع الأجر لأي تطبيقات تجارية، ولكن ليس للبحث الاستخدامات الأكاديمية.
ومع ذلك، لم توضح ميسترال بالضبط الترخيص الذي ينطبق على Pixtral 12B. تقدم الشركة الناشئة بعض النماذج بموجب ترخيص Apache 2.0 دون قيود. لقد تواصلنا مع ميسترال للحصول على مزيد من المعلومات وسنقوم بتحديث هذا المنشور إذا سمعنا ردًا.
لم يتمكن هذا الكاتب من أخذ Pixtral 12B في جولة، لسوء الحظ – لم تكن هناك أي عروض تجريبية على الويب في وقت النشر. في منشور على X، قالت صوفيا يانغ، رئيسة علاقات مطوري ميسترال، إن Pixtral 12B سيكون متاحًا للاختبار على روبوتات الدردشة ميسترال ومنصات خدمة واجهة برمجة التطبيقات، Le Chat وLe Platforme، قريبًا.
We dropped a new model – Pixtral 12B, our first-ever multimodal model. Enjoy! 🥰🎉 https://t.co/uvXnpJf6mQ
— Sophia Yang, Ph.D. (@sophiamyang) September 11, 2024
ليس من الواضح ما هي بيانات الصورة التي ربما استخدمتها ميسترال لتطوير Pixtral 12B.
يتم تدريب معظم نماذج الذكاء الاصطناعي التوليدي، بما في ذلك نماذج ميسترال الأخرى، على كميات هائلة من البيانات العامة من جميع أنحاء الويب، والتي غالبًا ما تكون محمية بحقوق الطبع والنشر. يزعم بعض البائعين النموذجيين أن حقوق “الاستخدام العادل” تخولهم الاستخلاص أي البيانات العامة، لكن العديد من أصحاب حقوق الطبع والنشر لا يوافقون على ذلك، وقد رفعوا دعاوى قضائية ضد كبار البائعين مثل OpenAI وMidjourney لوضع حد لهذه الممارسة.
يأتي Pixtral 12B في أعقاب قيام شركة Mistral بإغلاق جولة تمويل بقيمة 645 مليون دولار بقيادة General Catalyst والتي قدرت قيمة الشركة بمبلغ 6 مليارات دولار. منذ أكثر من عام بقليل، ينظر الكثيرون في مجتمع الذكاء الاصطناعي إلى ميسترال – المملوكة للأقلية من قبل مايكروسوفت – على أنها الرد الأوروبي على OpenAI. وتضمنت استراتيجية الشركة الأحدث حتى الآن إطلاق نماذج “مفتوحة” مجانية، وفرض رسوم على الإصدارات المدارة من تلك النماذج، وتقديم خدمات استشارية للعملاء من الشركات.
طعم وكيف دليل المطاعم والكافيهات دليل المطاعم مدن العالم طعام وشراب مقاهي الرياض أخبار ونصائح دليل الرياض كافيهات الرياض جلسات خارجية دليل مقاهي ومطاعم أفضل كافيهات الرياض عوائل
اكتشاف المزيد من موقع fffm
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.