تقدم SambaNova الآن مجموعة من نماذج الذكاء الاصطناعي التوليدية

SambaNova، وهي شركة ناشئة تعمل في مجال شرائح الذكاء الاصطناعي، والتي جمعت ما يزيد عن 1.1 مليار دولار من أموال رأس المال الاستثماري حتى الآن، تعمل على تطوير OpenAI – ومنافسيها – من خلال منتج جديد للذكاء الاصطناعي موجه نحو العملاء من المؤسسات.
أعلنت SambaNova اليوم عن Samba-1، وهو نظام مدعوم بالذكاء الاصطناعي مصمم لمهام مثل إعادة كتابة النص والترميز وترجمة اللغات والمزيد. تطلق الشركة على الهندسة المعمارية اسم “تكوين الخبراء” – وهو اسم اصطلاحي لمجموعة من نماذج الذكاء الاصطناعي مفتوحة المصدر، ويبلغ إجمالي عددها 56 نموذجًا.
يقول رودريجو ليانج، المؤسس المشارك والرئيس التنفيذي لشركة SambaNova، إن Samba-1 يسمح للشركات بضبط ومعالجة حالات استخدامات الذكاء الاصطناعي المتعددة مع تجنب تحديات تنفيذ أنظمة الذكاء الاصطناعي المخصصة.
وقال ليانغ لـ TechCrunch في مقابلة: “Samba-1 عبارة عن وحدات نمطية بالكامل، مما يمكّن الشركات من إضافة نماذج جديدة بشكل غير متزامن … دون إلغاء استثماراتها السابقة”. “وبالمثل، فهي متكررة وقابلة للتوسيع وسهلة التحديث، مما يمنح عملائنا مجالًا للتكيف مع دمج النماذج الجديدة.”
ليانغ مندوب مبيعات جيد، وما يقوله اصوات واعدة. ولكن هو سامبا-1 حقًا هل تتفوق على العديد من أنظمة الذكاء الاصطناعي الأخرى لمهام الأعمال المتوفرة، أقلها نماذج OpenAI؟
ذلك يعتمد على حالة الاستخدام.
الميزة الرئيسية الظاهرية لـ Samba-1 هي أنه نظرًا لأنه عبارة عن مجموعة من النماذج التي تم تدريبها بشكل مستقل بدلاً من نموذج واحد كبير، فإن العملاء لديهم القدرة على التحكم في كيفية توجيه المطالبات والطلبات إليه. ينتقل الطلب المقدم إلى نموذج كبير مثل GPT-4 في اتجاه واحد – عبر GPT-4. لكن الطلب المقدم إلى Samba-1 يسافر بواحدة من 56 الاتجاهات (إلى أحد النماذج الـ 56 التي يتكون منها Samba-1)، اعتمادًا على القواعد والسياسات التي يحددها العميل.
كما أن استراتيجية النماذج المتعددة هذه تقلل أيضًا من تكلفة الضبط الدقيق لبيانات العميل، كما يدعي ليانغ، لأنه لا يتعين على العملاء سوى القلق بشأن الضبط الدقيق لنماذج فردية أو مجموعات صغيرة بدلاً من النموذج الضخم. ويقول إنه – من الناحية النظرية – يمكن أن يؤدي إلى استجابات أكثر موثوقية (على سبيل المثال، أقل مدفوعًا بالهلوسة) للمطالبات، لأنه يمكن مقارنة الإجابات من أحد النماذج بإجابات النماذج الأخرى، وإن كان ذلك على حساب الحساب الإضافي.
وقال ليانغ: “مع هذه البنية، لن تضطر إلى تقسيم المهام الأكبر إلى مهام أصغر، ومن ثم يمكنك تدريب العديد من النماذج الأصغر”، مضيفًا أنه يمكن نشر Samba-1 محليًا أو في بيئة مستضافة اعتمادًا على احتياجات العملاء. “باستخدام نموذج واحد كبير، يمكن لجهاز الكمبيوتر الخاص بك أن يحقق كل ما تحتاجه [request] أعلى وبالتالي تكلفة التدريب أعلى. [Samba-1’s] الهندسة المعمارية تنهار تكلفة التدريب “.
أنا أعارض أن الكثير من البائعين، بما في ذلك OpenAI، يقدمون أسعارًا جذابة لضبط النماذج التوليدية الكبيرة، وأن العديد من الشركات الناشئة، مثل Martian وCredal، توفر أدوات لتوجيه المطالبات بين نماذج الطرف الثالث بناءً على قواعد مبرمجة يدويًا أو تلقائية .
لكن ما تبيعه SambaNova ليس جديداً في حد ذاته. بدلاً من ذلك، إنها حزمة ضبطها ونسيانها – حل متكامل يتضمن كل شيء متضمن، بما في ذلك شرائح الذكاء الاصطناعي، لإنشاء تطبيقات الذكاء الاصطناعي. وبالنسبة لبعض الشركات، قد يكون هذا أكثر جاذبية من أي شيء آخر مطروح على الطاولة.
وقال ليانغ: “يمنح Samba-1 كل مؤسسة نموذج GPT المخصص الخاص بها، والذي يتم “خصخصته” لبياناتها وتخصيصه ليناسب احتياجات مؤسستها”. “يتم تدريب النماذج على البيانات الخاصة لعملائنا، ويتم استضافتها على موقع واحد [server] رف، مع عُشر تكلفة الحلول البديلة.




