تحصل سحابة مؤسسة Google على نموذج AI لتوليد الموسيقى

في يوم الأربعاء ، قامت Google بتقديم تحديثات إلى العديد من نماذج الذكاء الاصطناعى التي تم توليدها لوسائل الإعلام في الطرف الأول من خلال منصة Cloud الخاصة به من خلال Vertex AI.
يتوفر الآن Lyria ، طراز Google Text to Music ، في معاينة للعملاء المختارين ، وقد تم تعزيز نموذج إنشاء الفيديو VEO 2 الخاص بالشركة مع خيارات التحرير والتخصيص المرئي الجديد. أطلقت الشركة أيضًا ميزة تهدئة الصوت مدعومة من قبل Chirp 3 ، نموذج فهم الصوت من Google ، لمستخدمي “السماح”. ويقدم مولد الصور Imagen 3 الآن ما تصفه الشركة بأنه “أداء أفضل” بشكل كبير.
تعد التحديثات ، التي تم توقيتها لـ Cloud Next ، أحدث دفعة من Google إلى Corner the Enterprise Market for AI. ربما تتنافس الشركة بشكل مباشر مع Amazon ، والتي تقدم منصة Cloud AI قابلة للمقارنة تسمى Bedrock مع مجموعة من نماذج الذكاء الاصطناعى الخاصة بها.
تقوم Google بترويج Lyria كبديل لمكتبات الموسيقى الخالية من الملوك. وقالت الشركة إنه باستخدام النموذج ، يمكن للعملاء إنشاء أغاني في مجموعة من الأنماط والأنواع ، من المعزوفات المنفردة للبيانو Jazzy إلى مسارات Lo-Fi.
في هذه الأثناء ، يمكن أن يقوم chirp 3 بتجميع الكلام في حوالي 35 لغة. تم معاينة لأول مرة في وقت سابق من هذا العام ، يقود Chirp 3 صوتًا مخصصًا فوريًا ، والذي من المفترض أن يستنسخ صوتًا مع 10 ثوانٍ من الصوت. إنه متوفر الآن بشكل عام. يدعم هذا النموذج أيضًا أداة جديدة تطلق في المعاينة ، تسمى النسخ مع Diarization ، والتي تفصل وتحديد مكبرات الصوت في التسجيلات مع العديد من المشاركين.
لمنع الإساءة ، يخضع الصوت المخصص الفوري لعملية “العناية” للتحقق من “أذونات استخدام الصوت المناسبة” ، كما يقول Google.
بالنسبة إلى VEO 2 ، يمكن للنموذج الآن إزالة صور الخلفية والشعارات والكائنات من مقاطع الفيديو الموجودة ، وتوسيع إطار لقطات الفيديو (لتحويل فيديو المناظر الطبيعية إلى صورة ، على سبيل المثال). يمكنه الآن أيضًا ضبط زوايا الكاميرا والسرعة في المشاهد التي تم إنشاؤها من الذكاء الاصطناعى لإنشاء أجهزة توقيت ، ومقاطع على طراز الطائرات بدون طيار ، وأكثر من ذلك ، ويمكن أن تدور بين الأطر المبدئية المحددة والنهاية.
تتوفر ميزات VEO هذه في المعاينة في الوقت الحالي.
أما بالنسبة لترقيات Imagen 3 المذكورة أعلاه ، فقد قالت Google إنها تعمل على تحسين قدرة النموذج على إزالة الكائنات وإعادة بناء أجزاء من الصور المفقودة أو التالفة.
جميع الوسائط التي تم إنشاؤها بواسطة Imagen و Veo و Lyria (ولكن ليس الغرد) هي علامة مائية باستخدام تقنية Synthid من Google. قالت الشركة إن جميع نماذج الذكاء الاصطناعى التوليدي لها “ضمانات مدمجة” للحماية من إنشاء محتوى ضار.
لم تشير Google تاريخياً إلى البيانات المحددة التي تستخدمها لتدريب نماذجها ، وعملاق التكنولوجيا عالقًا مع تلك السابقة اليوم. تميل بيانات التدريب إلى أن تكون موضوعًا مثيرًا للجدل لأسباب تتعلق بـ IP. تقوم بعض الشركات بتدريب نماذجها على الأعمال المحمية بحقوق الطبع والنشر دون الحصول على إذن من حاملي الحقوق. في حين تدعي هذه الشركات أن العقيدة العادلة في الولايات المتحدة تحمي هذه الممارسة ، إلا أن بعض المبدعين لا يوافقون بشكل مفهوم. كثيرون يقاتلون البائعين في المحكمة.
سبق أن أخبرت Google TechCrunch أنها توفر آليات إلغاء الاشتراك للتدريب على النماذج بالإضافة إلى سياسة التعويض لحماية عملاء Google Cloud و Vertex AI من نزاعات حقوق الطبع والنشر المتعلقة بالنيابة.
طعم وكيف دليل المطاعم والكافيهات دليل المطاعم مدن العالم طعام وشراب مقاهي الرياض أخبار ونصائح دليل الرياض كافيهات الرياض جلسات خارجية دليل مقاهي ومطاعم أفضل كافيهات الرياض عوائل
اكتشاف المزيد من موقع fffm
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.