تقنية

توفر ElevenLabs الآن القدرة على بناء وكلاء الذكاء الاصطناعي للمحادثة


أطلقت شركة ElevenLabs، وهي شركة ناشئة توفر استنساخ الصوت بالذكاء الاصطناعي وواجهة برمجة تطبيقات تحويل النص إلى كلام، القدرة على إنشاء روبوتات محادثة تعمل بالذكاء الاصطناعي يوم الاثنين.

أعلنت الشركة أنه يمكن للمستخدمين الآن إنشاء وكلاء محادثة كاملين على منصة مطوري ElevenLabs، مع متغيرات قابلة للتخصيص مثل نبرة الصوت وطول الاستجابة.

عملت ElevenLabs في الغالب على توفير أصوات مختلفة وأدوات الذكاء الاصطناعي لخدمات تحويل النص إلى كلام. صرح رئيس قسم النمو في الشركة، سام سكلار، لـ TechCrunch أن العديد من عملائها كانوا يستخدمون بالفعل هذه القدرة لإنشاء عملاء الذكاء الاصطناعي للمحادثة. ومع ذلك، كانت أصعب الأجزاء هي دمج قاعدة المعرفة والتعامل مع الانقطاعات من العملاء. ولهذا السبب قررت الشركة بناء خط كامل لروبوتات المحادثة.

يمكن للمستخدمين تسجيل الدخول إلى حساب ElevenLabs الخاص بهم والبدء في إنشاء وكيل محادثة عن طريق تحديد قالب أو إنشاء مشروع جديد. يمكنهم اختيار اللغة الأساسية للوكيل، والرسالة الأولى، وموجه النظام لتحديد شخصية الوكيل. يتعين على المطورين أيضًا تحديد نموذج لغة كبير (Gemini أو GPT أو Claude)، ودرجة حرارة الاستجابات (لتحديد مدى إبداع الاستجابة)، وحد استخدام الرمز المميز.

يمكنهم أيضًا ضبط جوانب أخرى مثل الصوت وزمن الوصول والاستقرار ومعايير المصادقة والحد الأقصى لطول المحادثة مع وكيل الذكاء الاصطناعي.

يمكن للمستخدمين إضافة قاعدة المعرفة الخاصة بهم، مثل ملف أو عنوان URL أو كتلة نصية، لتشغيل روبوت المحادثة. بالإضافة إلى ذلك، يمكنهم أيضًا دمج ماجستير إدارة الأعمال المخصص الخاص بهم مع الروبوت. يتوافق SDK الخاص بـ ElevenLabs مع Python وJavascript وReact وSwift. تقدم الشركة أيضًا واجهة WebSocket API لمزيد من التخصيص.

يمكن للشركات أيضًا تحديد معايير لجمع عناصر بيانات معينة – على سبيل المثال، الاسم والبريد الإلكتروني للعملاء الذين يتحدثون إلى الوكيل – إلى جانب معايير التقييم باللغة الطبيعية لتحديد نجاح المكالمة أو فشلها.

تستفيد ElevenLabs من خط الأنابيب الحالي الخاص بها لجزء تحويل النص إلى كلام. يتعين على الشركة تطوير إمكانات تحويل الكلام إلى نص لمنتج المحادثة الجديد الذي يعمل بالذكاء الاصطناعي. لا تقدم الشركة واجهة برمجة تطبيقات تحويل الكلام إلى نص كمنتج مستقل حتى الآن، ولكنها قد تفعل ذلك في المستقبل، مما يجعلها منافسًا لواجهات برمجة تطبيقات تحويل الكلام إلى نص الخاصة بـ Google وMicrosoft وAmazon، بالإضافة إلى واجهات برمجة التطبيقات المتخصصة. واجهات برمجة التطبيقات، مثل OpenAI’s Whisper وAssemblyAI وDeepgram وSpeechmatics وGladia.

وتتنافس الشركة، التي تهدف إلى جمع تمويل جديد بقيمة تصل إلى 3 مليارات دولار، أيضًا مع شركات ناشئة أخرى تعمل بالذكاء الاصطناعي الصوتي، مثل Vapi وRetell، كما أنها تقوم ببناء وكلاء محادثة. والأهم من ذلك أن الشركة ستنافس أيضًا واجهة برمجة تطبيقات المحادثة في الوقت الفعلي الخاصة بـ OpenAI. ومع ذلك، تعتقد ElevenLabs أن تخصيصاتها وقدرتها على تبديل النماذج ستمنحها ميزة على OpenAI.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى