تقنية

يقول الرئيس التنفيذي لشركة DeepMind DeMis Hassabis إن Google ستجمع في النهاية بين طرز Gemini و Veo AI


في ظهور مؤخراً على “ممكن” ، قال بودكاست شارك في استضافة مؤسس شركة LinkedIn ريد هوفمان ، الرئيس التنفيذي لشركة Google Deepmind ، إن Google تخطط في نهاية المطاف للدمج بين نماذج Gemini AI مع نماذج توليد الفيديو Veo لتحسين فهم السابق للعالم المادي.

قال حاسابيس: “لقد بنينا دائمًا الجوزاء ، نموذج الأساس الخاص بنا ، ليكون متعدد الوسائط منذ البداية ، والسبب في أننا فعلنا ذلك [is because] لدينا رؤية لهذه الفكرة عن مساعد رقمي عالمي ، ومساعد ذلك […] في الواقع يساعدك في العالم الحقيقي. ”

تتحرك صناعة الذكاء الاصطناعى تدريجياً نحو نماذج “Omni” ، إذا صح التعبير – نماذج يمكنها فهم العديد من أشكال الوسائط وتوليفها. يمكن لأحدث نماذج Gemini من Google إنشاء صوت بالإضافة إلى صور ونص ، في حين أن النموذج الافتراضي لـ Openai في ChatGPT يمكنه إنشاء صور-بما في ذلك ، بالطبع ، فن Ghibli-Style. أعلنت Amazon أيضًا عن خطط لإطلاق نموذج “من أجل أي شخص” في وقت لاحق من هذا العام.

تتطلب هذه النماذج Omni الكثير من بيانات التدريب – الصور ، ومقاطع الفيديو ، والصوت ، والنص ، وما إلى ذلك. إن Hassabis ضمنيًا أن بيانات الفيديو الخاصة بـ VEO تأتي في الغالب من YouTube ، وهي منصة تمتلكها Google.

“في الأساس ، من خلال مشاهدة مقاطع فيديو YouTube – الكثير من مقاطع الفيديو على YouTube – [Veo 2] وقال هاسابيس: “يمكن معرفة ، كما تعلمون ، فيزياء العالم”.

أخبرت Google من قبل TechCrunch نماذجها “قد تكون” تدرب على “بعض” محتوى YouTube وفقًا لاتفاقها مع منشئي YouTube. وبحسب ما ورد ، وسعت Google شروط الخدمة العام الماضي جزئيًا للسماح للشركة بالضغط على المزيد من البيانات لتدريب نماذج الذكاء الاصطناعي.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى