تقنية

يقدم DevDay من OpenAI واجهة Realtime API وغيرها من الميزات لمطوري تطبيقات الذكاء الاصطناعي


لقد كان أسبوعًا مضطربًا بالنسبة لـ OpenAI، مليئًا بالمغادرين التنفيذيين والتطورات الرئيسية لجمع التبرعات، لكن الشركة الناشئة عادت إلى ذلك، في محاولة لإقناع المطورين ببناء أدوات باستخدام نماذج الذكاء الاصطناعي الخاصة بها في DevDay لعام 2024. أعلنت الشركة عن العديد من الأدوات الجديدة يوم الثلاثاء، بما في ذلك الإصدار التجريبي العام من “Realtime API” الخاصة بها، لبناء تطبيقات ذات زمن وصول منخفض واستجابات صوتية يتم إنشاؤها بواسطة الذكاء الاصطناعي. إنه ليس وضع الصوت المتقدم في ChatGPT تمامًا، ولكنه قريب جدًا.

وفي مؤتمر صحفي قبل الحدث، قال كيفن ويل، كبير مسؤولي المنتجات في OpenAI، إن الرحيل الأخير لكبير مسؤولي التكنولوجيا ميرا موراتي وكبير مسؤولي الأبحاث بوب ماكجرو لن يؤثر على تقدم الشركة.

“سأبدأ بالقول إن بوب وميرا كانا قائدين رائعين. وقال ويل: “لقد تعلمت الكثير منهم، وهم جزء كبير من وصولنا إلى ما نحن عليه اليوم”. “وأيضًا، لن نتباطأ.”

بينما تخضع شركة OpenAI لإصلاح شامل آخر لمجموعة C-suite – وهو تذكير بالاضطراب الذي أعقب DevDay العام الماضي – تحاول الشركة إقناع المطورين بأنها لا تزال تقدم أفضل منصة لبناء تطبيقات الذكاء الاصطناعي عليها. يقول القادة إن لديها أكثر من 3 ملايين مطور يبنون نماذج الذكاء الاصطناعي الخاصة بها، لكن OpenAI تعمل في مساحة تنافسية بشكل متزايد.

أشارت OpenAI إلى أنها خفضت تكاليف المطورين للوصول إلى واجهة برمجة التطبيقات (API) الخاصة بها بنسبة 99٪ في العامين الماضيين، على الرغم من أنه من المحتمل أن يكون ذلك بسبب منافسين مثل Meta وGoogle الذين يخفضون أسعارهم باستمرار.

إحدى ميزات OpenAI الجديدة، والتي يطلق عليها اسم Realtime API، ستمنح المطورين الفرصة لبناء تجارب تحويل الكلام إلى كلام في الوقت الفعلي تقريبًا في تطبيقاتهم، مع اختيار استخدام ستة أصوات مقدمة من OpenAI. تختلف هذه الأصوات عن تلك المقدمة لـ ChatGPT، ولا يمكن للمطورين استخدام أصوات الطرف الثالث، وذلك لمنع مشكلات حقوق الطبع والنشر. (الصوت الغامض المبني على صوت سكارليت جوهانسون غير متوفر في أي مكان.)

خلال المؤتمر الصحفي، شارك رئيس تجربة المطورين في OpenAI، Romain Huet، عرضًا توضيحيًا لتطبيق تخطيط الرحلات المصمم باستخدام Realtime API. يسمح التطبيق للمستخدمين بالتحدث شفهيًا مع مساعد الذكاء الاصطناعي حول رحلة قادمة إلى لندن، والحصول على استجابات منخفضة زمن الوصول. تتمتع Realtime API أيضًا بإمكانية الوصول إلى عدد من الأدوات، لذلك كان التطبيق قادرًا على إضافة تعليق توضيحي على الخريطة بمواقع المطاعم عند الإجابة عليها.

وفي نقطة أخرى، أظهر Huet كيف يمكن لـ Realtime API التحدث عبر الهاتف مع الإنسان للاستفسار عن طلب الطعام لحدث ما. على عكس Duo سيئ السمعة من Google، لا تستطيع واجهة برمجة تطبيقات OpenAI الاتصال بالمطاعم أو المتاجر مباشرة؛ ومع ذلك، يمكنه التكامل مع استدعاء واجهات برمجة التطبيقات مثل Twilio للقيام بذلك. والجدير بالذكر أن OpenAI هو كذلك لا إضافة إفصاحات حتى تتمكن نماذج الذكاء الاصطناعي الخاصة بها من التعرف على نفسها تلقائيًا عند مكالمات كهذه، على الرغم من حقيقة أن هذه الأصوات التي يولدها الذكاء الاصطناعي تبدو واقعية تمامًا. في الوقت الحالي، يبدو أن مسؤولية إضافة هذا الكشف تقع على عاتق المطورين، وهو أمر قد يتطلبه قانون كاليفورنيا الجديد.

وكجزء من إعلانات DevDay، قدمت OpenAI أيضًا ميزة الضبط الدقيق للرؤية في واجهة برمجة التطبيقات (API) الخاصة بها، والتي ستسمح للمطورين باستخدام الصور، بالإضافة إلى النص، لضبط تطبيقاتهم لـ GPT-4o. ومن المفترض أن يساعد هذا، من الناحية النظرية، المطورين على تحسين أداء GPT-4o للمهام التي تتضمن الفهم البصري. أخبر أوليفييه جودمينت، رئيس واجهة برمجة تطبيقات المنتج في OpenAI، موقع TechCrunch أن المطورين لن يتمكنوا من تحميل صور محمية بحقوق الطبع والنشر (مثل صورة دونالد داك)، أو الصور التي تصور العنف، أو الصور الأخرى التي تنتهك سياسات السلامة الخاصة بـ OpenAI.

تتسابق OpenAI لمطابقة ما يقدمه منافسوها في مجال ترخيص نماذج الذكاء الاصطناعي بالفعل. تشبه ميزة التخزين المؤقت السريع الخاصة بها ميزة Anthropic التي تم إطلاقها منذ عدة أشهر، مما يسمح للمطورين بتخزين السياق المستخدم بشكل متكرر بين استدعاءات واجهة برمجة التطبيقات (API)، مما يقلل التكاليف ويحسن زمن الوصول. تقول OpenAI أن المطورين يمكنهم توفير 50% باستخدام هذه الميزة، في حين تعد Anthropic بخصم 90% عليها.

وأخيرًا، تقدم OpenAI ميزة تقطير النماذج للسماح للمطورين باستخدام نماذج الذكاء الاصطناعي الأكبر، مثل o1-preview وGPT-4o، لضبط النماذج الأصغر مثل GPT-4o mini. يوفر تشغيل النماذج الأصغر عمومًا وفورات في التكاليف مقارنة بتشغيل النماذج الأكبر حجمًا، ولكن من المفترض أن تسمح هذه الميزة للمطورين بتحسين أداء نماذج الذكاء الاصطناعي الصغيرة تلك. كجزء من عملية تقطير النموذج، تطلق OpenAI أداة تقييم تجريبية حتى يتمكن المطورون من قياس أداءهم الدقيق ضمن واجهة برمجة تطبيقات OpenAI.


اكتشاف المزيد من موقع fffm

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى

اكتشاف المزيد من موقع fffm

اشترك الآن للاستمرار في القراءة والحصول على حق الوصول إلى الأرشيف الكامل.

Continue reading