لماذا تراهن شركة الذكاء الاصطناعي الناشئة هذه على الروبوتات التي تدعم الصوت لتوسيع نطاق اعتماد الذكاء الاصطناعي في الهند

إذا كان السوق المستهدف يحتوي على 22 لغة رسمية ويتحدث الأشخاص فيه بأكثر من 19000 لهجة، فهل من المنطقي تقديم روبوت محادثة يعمل بالذكاء الاصطناعي للنص فقط ويمكنه العمل بشكل أفضل في بضع لغات؟

هذا هو السؤال الذي تعمل شركة Sarvam الهندية الناشئة في مجال الذكاء الاصطناعي على حله، وأطلقت يوم الثلاثاء سلسلة من العروض، بما في ذلك روبوت الذكاء الاصطناعي الذي يدعم الصوت ويدعم أكثر من 10 لغات هندية، مراهنة على أن الناس في البلاد يفضلون التحدث إلى شخص آخر. نموذج الذكاء الاصطناعي بلغتهم الخاصة بدلاً من الدردشة معه عبر النص. تطلق الشركة الناشئة أيضًا نموذجًا صغيرًا للغة، وأداة ذكاء اصطناعي للمحامين، بالإضافة إلى نموذج لغة صوتية.

“يفضل الناس التحدث بلغتهم الخاصة. قال فيفيك راغافان، المؤسس المشارك لشركة Sarvam AI، لـ TechCrunch: “إن الكتابة باللغات الهندية اليوم أمر صعب للغاية”.

تعمل الشركة الناشئة التي يقع مقرها في بنغالورو، والتي تستهدف الشركات والمؤسسات في المقام الأول، على الترويج لروبوتاتها التي تدعم الصوت بالذكاء الاصطناعي لعدد من الصناعات، لا سيما تلك التي تعتمد على دعم العملاء. على سبيل المثال، أشارت إلى أحد عملائها: Sri Mandir، وهي شركة ناشئة تقدم محتوى دينيًا، تستخدم وكيل Sarvam للذكاء الاصطناعي لقبول المدفوعات، وقد عالجت أكثر من 270 ألف معاملة حتى الآن.

وقالت الشركة إنه يمكن نشر عملاءها الصوتيين المدعمين بالذكاء الاصطناعي على واتساب، داخل التطبيق، ويمكنهم حتى العمل مع المكالمات الصوتية التقليدية.

بدعم من Peak XV وLightspeed، تخطط Sarvam لتسعير وكلاء الذكاء الاصطناعي لديها بدءًا من ₹1 (حوالي 1 سنت) لكل دقيقة استخدام.

اعتمادات الصورة: سارفام

تقوم الشركة الناشئة ببناء عملاء الذكاء الاصطناعي الذين يدعمون الصوت على أساس نموذج لغة أساسي صغير يسمى Sarvam 2B، والذي تم تدريبه على مجموعة بيانات مكونة من 4 تريليون رمز. تم تدريب النموذج بالكامل على البيانات الاصطناعية، وفقًا لراجافان.

ينصح خبراء الذكاء الاصطناعي في كثير من الأحيان بالحذر عند استخدام البيانات الاصطناعية – وهي بشكل أساسي البيانات التي تم إنشاؤها بواسطة نموذج لغة كبير يهدف إلى تكرار بيانات العالم الحقيقي – لتدريب نماذج الذكاء الاصطناعي الأخرى، لأن ماجستير إدارة الأعمال يميل إلى الهلوسة واختلاق معلومات قد لا تكون دقيقة. قد يؤدي تدريب نماذج الذكاء الاصطناعي على مثل هذه البيانات إلى تفاقم مثل هذه الأخطاء.

وقال راغافان إن سارفام اختار استخدام البيانات الاصطناعية بسبب التوفر المحدود للغاية لمحتوى اللغة الهندية على شبكة الإنترنت المفتوحة. وأضاف أن الشركة الناشئة طورت نماذج لتنظيف وتحسين البيانات المستخدمة لأول مرة لإنشاء مجموعات البيانات الاصطناعية.

ادعى المؤسس أن Sarvam 2B سيكلف عُشر أي شيء مماثل في الصناعة. تقوم الشركة الناشئة بفتح المصدر للنموذج، على أمل أن يقوم المجتمع بالبناء عليه بشكل أكبر.

وقال راغافان: “على الرغم من أن النماذج التأسيسية للغة الكبيرة مثيرة للغاية، إلا أنه يمكنك تحقيق تجربة متفوقة وأكثر تحديدًا وأقل تكلفة وبزمن وصول أقل باستخدام نماذج اللغة الصغيرة”. “إذا كنت تريد إجراء استعلام أو اثنين خلال أسبوع أو شهر، فيجب عليك استخدام نماذج اللغة الكبيرة. ولكن بالنسبة لحالات الاستخدام التي تتطلب ملايين التفاعلات اليومية، أعتقد أن النماذج الأصغر حجمًا هي الأكثر ملاءمة.

تطلق الشركة الناشئة أيضًا نموذجًا للغة الصوت، يسمى Shuka، مبنيًا على وحدة فك ترميز الصوت Saaras v1 وMeta’s Llama3-8B Instruct. هذا النموذج مفتوح المصدر أيضًا، بحيث يمكن للمطورين استخدام ترجمة الشركة الناشئة، وتحويل النص إلى كلام (TTS)، والوحدات النمطية الأخرى لبناء واجهات صوتية.

وهناك منتج آخر يطلق عليه اسم “A1” – وهو عبارة عن منصة عمل مولدة للذكاء الاصطناعي مصممة للمحامين الذين يمكنهم البحث عن اللوائح وصياغة المستندات وتنقيحها واستخراج البيانات.

Sarvam هي واحدة من مجموعة صغيرة من الشركات الهندية الناشئة التي تدافع عن حالات الاستخدام التي تتوافق مع مصالح البلاد وتساهم في جهود الحكومة لتطوير البنية التحتية الخاصة بها للذكاء الاصطناعي.

تتابع الحكومات في جميع أنحاء العالم بشكل متزايد “الذكاء الاصطناعي السيادي” – الذكاء الاصطناعي الذي يتم تطويره والتحكم فيه على المستوى الوطني. والهدف المزعوم لهذه الجهود هو حماية خصوصية البيانات، وتحفيز النمو الاقتصادي، وتكييف تطوير الذكاء الاصطناعي بما يتناسب مع سياقاتها الثقافية. وتمتلك الولايات المتحدة والصين حاليا أكبر الاستثمارات في هذا المجال، وتتابع الهند برنامجها “IndiaAI” ونماذجها الخاصة بلغات محددة.

إحدى المبادرات في إطار برنامج IndiaAI تسمى قدرة الحوسبة IndiaAI، وتتمثل الخطة في إنشاء حاسوب عملاق مدعوم بما لا يقل عن 10000 وحدة معالجة رسوميات. ويهدف أحد النماذج التي يجري تطويرها، والذي يطلق عليه اسم بهاشيني، إلى إضفاء الطابع الديمقراطي على الوصول إلى الخدمات الرقمية عبر اللغات الهندية المختلفة.

وقال راغافان إن شركته الناشئة مستعدة للمساهمة في برنامج IndiaAI. وقال في المقابلة: “إذا سنحت الفرصة، فسنعمل مع الحكومة”.