تقنية

تم إطلاق Gemini Live، رد Google على الوضع الصوتي المتقدم لـ ChatGPT


Gemini Live، رد جوجل على وضع الصوت المتقدم الذي تم إطلاقه مؤخرًا (في ألفا محدود) لـ ChatGPT الخاص بـ OpenAI، سيتم طرحه يوم الثلاثاء، بعد أشهر من الإعلان عنه في مؤتمر مطوري Google I/O 2024. تم الإعلان عنه في حدث Google Made by Google 2024.

يتيح Gemini Live للمستخدمين إمكانية إجراء محادثات صوتية “متعمقة” مع Gemini، برنامج الدردشة الآلي الذي يعمل بالذكاء الاصطناعي من Google، على هواتفهم الذكية. بفضل محرك الكلام المحسن الذي يقدم ما تدعي جوجل أنه حوار متعدد المنعطفات أكثر اتساقًا وتعبيرًا عاطفيًا وواقعيًا، يمكن للأشخاص مقاطعة جيميني أثناء تحدث برنامج الدردشة الآلي لطرح أسئلة المتابعة، وسوف يتكيف مع أنماط كلامهم في الواقع وقت.

وإليك كيف تصفها Google في منشور بالمدونة: “مع Gemini Live [via the Gemini app]يمكنك التحدث مع برج الجوزاء والاختيار من بينها [10 new] الأصوات الطبيعية التي يمكنه الاستجابة بها. يمكنك أيضًا التحدث بالسرعة التي تناسبك أو مقاطعة منتصف الرد بأسئلة توضيحية، تمامًا كما تفعل في أي محادثة.

Gemini Live هو تطبيق بدون استخدام اليدين إذا كنت تريد ذلك. يمكنك الاستمرار في التحدث باستخدام تطبيق Gemini في الخلفية أو عندما يكون هاتفك مقفلاً، ويمكن إيقاف المحادثات مؤقتًا واستئنافها في أي وقت.

إذن كيف يمكن أن يكون هذا مفيدًا؟ تقدم جوجل مثالاً للتدرب على مقابلة عمل – وهو سيناريو مثير للسخرية بعض الشيء، لكن حسنًا. تقول Google إن Gemini Live يمكن أن يتدرب معك، ويقدم نصائح حول التحدث ويقترح مهارات يجب تسليط الضوء عليها عند التحدث مع مدير التوظيف (أو الذكاء الاصطناعي، حسب الحالة).

ميزة واحدة الجوزاء لايف قد يعد وضع الصوت المتقدم في ChatGPT بمثابة ذاكرة أفضل. تتمتع بنية نموذج الذكاء الاصطناعي التوليدي الذي يقوم عليه Live وGemini 1.5 Pro وGemini 1.5 Flash، بـ “نافذة سياق” أطول من المتوسط، مما يعني أنه يمكنهم استيعاب الكثير من البيانات والتفكير فيها – نظريا ساعات من المحادثات ذهابًا وإيابًا – قبل صياغة الرد.

قال متحدث باسم Google لـ TechCrunch عبر البريد الإلكتروني: “يستخدم Live نماذج Gemini Advanced الخاصة بنا والتي قمنا بتكييفها لتكون أكثر تحادثية”. “يتم استخدام نافذة السياق الكبيرة للنموذج عندما يجري المستخدمون محادثات طويلة مع البث المباشر.”

سيتعين علينا أن نرى مدى نجاح كل هذا في الممارسة العملية، بطبيعة الحال. إذا كانت نكسات OpenAI في وضع الصوت المتقدم تمثل أي مؤشر، فنادرا ما تتم ترجمة العروض التوضيحية بسلاسة إلى العالم الحقيقي.

اعتمادات الصورة: جوجل

حول هذا الموضوع، الجوزاء لايف لا لديك إحدى الإمكانيات التي عرضتها Google في I/O حتى الآن: الإدخال متعدد الوسائط. في شهر مايو الماضي، أصدرت جوجل مقاطع فيديو مسجلة مسبقًا تظهر برنامج Gemini Live وهو يرى ويستجيب لمحيط المستخدمين من خلال الصور واللقطات التي تم التقاطها بواسطة كاميرات هواتفهم، على سبيل المثال تسمية جزء على دراجة مكسورة أو شرح جزء من التعليمات البرمجية على جهاز الكمبيوتر الشاشة تفعل.

وقالت جوجل إن المدخلات متعددة الوسائط ستصل “في وقت لاحق من هذا العام”، ورفضت تقديم تفاصيل. وفي وقت لاحق من هذا العام أيضًا، سيتم توسيع Live ليشمل لغات إضافية ونظام التشغيل iOS عبر تطبيق Google؛ إنه متوفر باللغة الإنجليزية فقط في الوقت الحالي.

Gemini Live، مثل وضع الصوت المتقدم، ليس مجانيًا. إنه حصري لـ Gemini Advanced، وهو إصدار أكثر تطورًا من Gemini خلف خطة Google One AI Premium Plan، بسعر 20 دولارًا شهريًا.

ومع ذلك، فإن ميزات Gemini الجديدة الأخرى في الطريق مجانية.

يمكن لمستخدمي Android قريبًا (في الأسابيع المقبلة) عرض تراكب Gemini أعلى أي تطبيق يستخدمونه لطرح أسئلة حول ما يظهر على الشاشة (فيديو على YouTube، على سبيل المثال) عن طريق الضغط على زر تشغيل هواتفهم أو قول “Hey Google” “. سيكون Gemini قادرًا على إنشاء صور (ولكن ليس صورًا للأشخاص للأسف) مباشرةً من التراكب – الصور التي يمكن سحبها وإسقاطها في تطبيقات مثل Gmail ورسائل Google.

تكتسب Gemini أيضًا عمليات تكامل جديدة مع خدمات Google (أو “الامتدادات” كما تفضل الشركة تسميتها) على الهاتف المحمول والويب. في الأسابيع المقبلة، سيتمكن Gemini من اتخاذ المزيد من الإجراءات باستخدام تقويم Google، وKeep، وTasks، وYouTube Music، والأدوات المساعدة، والتطبيقات التي تتحكم في الميزات الموجودة على الجهاز مثل الموقتات والمنبهات، وعناصر التحكم في الوسائط، والمصباح اليدوي، ومستوى الصوت، وWi-Fi. والبلوتوث وما إلى ذلك.

في منشور بالمدونة، تقدم Google بعض الأفكار حول كيفية استفادة الأشخاص. يبدو أنيقًا، على افتراض أن كل شيء يعمل بشكل موثوق:

  • اطلب من الجوزاء “إنشاء قائمة تشغيل من الأغاني التي تذكرني بأواخر التسعينات”.
  • التقط صورة لطائرة الحفلة واسأل الجوزاء إذا كنت متفرغًا في ذلك اليوم – وقم أيضًا بتعيين تذكير لشراء التذاكر.
  • اطلب من Gemini البحث عن وصفة في Gmail الخاص بك واطلب منه إضافة المكونات إلى قائمة التسوق الخاصة بك في Keep.

أخيرًا، بدءًا من وقت لاحق من هذا الأسبوع، سيكون Gemini متاحًا على الأجهزة اللوحية التي تعمل بنظام Android.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى