تقنية

أطلق رئيس Snap AI السابق شركة Higgsfield لتولي مولد الفيديو Sora الخاص بـ OpenAI


لقد استحوذت OpenAI على اهتمام عالم التكنولوجيا منذ بضعة أشهر من خلال نموذج الذكاء الاصطناعي التوليدي Sora، الذي يحول أوصاف المشاهد إلى مقاطع فيديو أصلية – دون الحاجة إلى كاميرات أو أطقم تصوير. لكن سورا كان محكمًا حتى الآن، ويبدو أن الشركة تستهدف المبدعين الممولين جيدًا مثل مخرجي هوليوود – وليس الهواة أو المسوقين الصغار بالضرورة.

شعر أليكس ماشربوف، الرئيس السابق للذكاء الاصطناعي التوليدي في شركة سناب، بوجود فرصة. لذلك أطلق Higgsfield AI، وهي منصة لإنشاء وتحرير الفيديو مدعومة بالذكاء الاصطناعي ومصممة لتطبيقات أكثر تخصيصًا وتخصيصًا.

مدعومًا بنموذج مخصص لتحويل النص إلى فيديو، يمكن لتطبيق Higgsfield الأول، Diffuse، إنشاء مقاطع فيديو من الصفر أو التقاط صورة شخصية وإنشاء مقطع من بطولة ذلك الشخص.

قال مشرابوف لـ TechCrunch في مقابلة: “جمهورنا المستهدف هو المبدعون من جميع الأنواع، بدءًا من المستخدمين العاديين الذين يرغبون في إنشاء محتوى ممتع مع أصدقائهم إلى منشئي المحتوى الاجتماعي الذين يتطلعون إلى تجربة تنسيق محتوى جديد إلى مسوقي الوسائط الاجتماعية الذين يريدون علامتهم التجارية”. قف في الخارج.”

جاء مشربوف إلى شركة Snap عن طريق AI Factory، شركته الناشئة السابقة، والتي استحوذت عليها شركة Snap في عام 2020 مقابل 166 مليون دولار. أثناء وجوده في Snap، ساعد مشرابوف في إنشاء منتجات مثل تأثيرات الواقع المعزز ومرشحات Snapchat، بما في ذلك Cameos، بالإضافة إلى MyAI chabot المثير للجدل في Snapchat.

يقدم Higgsfield – الذي شارك ماشرابوف في إطلاقه مع يرزات دولات، وهو باحث في الذكاء الاصطناعي متخصص في الفيديو التوليدي، منذ عدة أشهر – مجموعة منسقة من المقاطع التي تم إنشاؤها مسبقًا، وأداة لتحميل الوسائط المرجعية (أي الصور ومقاطع الفيديو) ومحرر سريع يتيح للمستخدمين وصف الشخصيات والأفعال والمشاهد التي يرغبون في تصويرها. باستخدام Diffuse، يمكن للمستخدمين إدخال أنفسهم مباشرة في مشهد تم إنشاؤه بواسطة الذكاء الاصطناعي، أو جعل صورهم الرقمية تحاكي الأشياء – مثل حركات الرقص – التي تم التقاطها في مقاطع فيديو أخرى.

اعتمادات الصورة: هيغزفيلد

وقال مشرابوف: “إن نموذجنا يدعم الحركات والتعبيرات الواقعية للغاية”. “نحن رواد “النماذج العالمية” للمستهلكين، والتي ستسمح لنا بإنشاء أفضل مقاطع الفيديو وتحريرها بمستوى رائع من التحكم.”

إن Higgsfield ليست شركة الفيديو التوليدية الوحيدة التي تتنافس مع OpenAI. لقد كان Runway من أوائل البرامج التي ظهرت على الساحة، ولا تزال أدواته مستمرة في التحسن. هناك أيضًا شركة Haiper، التي تحظى بدعم اثنين من خريجي DeepMind وأكثر من 13 مليون دولار من أموال الاستثمار.

يقول مشرابوف إن شركة Diffuse ستتميز بفضل إستراتيجيتها الخاصة بالذهاب إلى السوق والتي تركز على الهاتف المحمول أولاً.

وقال مشرابوف: “من خلال إعطاء الأولوية لتطبيقات iOS وAndroid بدلاً من سير عمل سطح المكتب، فإننا نمكن المبدعين من إنشاء محتوى مقنع لوسائل التواصل الاجتماعي في أي وقت وفي أي مكان”. “في الواقع، من خلال الاعتماد على الهاتف المحمول، أصبحنا قادرين على إعطاء الأولوية لسهولة الاستخدام والميزات الملائمة للمستهلك منذ اليوم الأول.”

هيغزفيلد يسير أيضًا بشكل هزيل. يقول مشرابوف إن النماذج التوليدية التي تقوم عليها المنصة تم تطويرها من قبل فريق مكون من 16 شخصًا في أقل من تسعة أشهر وتم تدريبهم على مجموعة مكونة من 32 وحدة معالجة رسوميات. (قد يبدو عدد 32 وحدة معالجة رسوميات كثيرًا، ولكن بالنظر إلى أن OpenAI يستخدم عشرات الآلاف، فهذا ليس كذلك حقًا.) وقد جمعت هيغزفيلد 8 ملايين دولار فقط حتى الآن، وجاء الجزء الأكبر منها من شريحة تمويل أولية حديثة بقيادة مينلو فنتشرز.

هيغزفيلد

اعتمادات الصورة: هيغزفيلد

للبقاء متقدمًا بخطوة على المنافسين، يخطط Higgsfield لتخصيص الأموال الأولية لبناء محرر فيديو محسّن يتيح للمستخدمين تعديل الشخصيات والكائنات في مقاطع الفيديو، ونحو تدريب نماذج أكثر قوة لتوليد الفيديو خصيصًا لحالات استخدام الوسائط الاجتماعية. في الواقع، يرى ماشرابوف أن وسائل التواصل الاجتماعي – والتسويق عبر وسائل التواصل الاجتماعي – هي المجال الرئيسي لكسب المال بالنسبة لهيغزفيلد.

على الرغم من أن Diffuse مجاني حاليًا للاستخدام، إلا أن مشرابوف يتصور مستقبلًا حيث يدفع المسوقون نوعًا من الرسوم أو الاشتراك للحصول على ميزات متميزة، أو لحملات كبيرة الحجم أو واسعة النطاق.

وقال: “نعتقد أن Higgsfield يفتح مستوى لا يصدق من الواقعية وحالات استخدام إنتاج المحتوى للمسوقين عبر وسائل التواصل الاجتماعي”. “نسمع باستمرار من مديري التسويق والمديرين الإبداعيين أنهم بحاجة إلى تحسين ميزانيات إنتاج المحتوى وتقصير الجداول الزمنية مع الاستمرار في تقديم محتوى مؤثر. لذلك نحن نؤمن بأن حلول الذكاء الاصطناعي المولدة للفيديو ستكون حلاً أساسيًا لمساعدتهم على تحقيق ذلك.

بالطبع، هيغزفيلد ليس محصنًا ضد التحديات الأوسع التي تواجه الشركات الناشئة في مجال الذكاء الاصطناعي.

من الثابت أن نماذج الذكاء الاصطناعي التوليدية، مثل نموذج Diffuse، يمكنها “تجديد” بيانات التدريب. لماذا يعتبر ذلك مشكلة؟ حسنًا، إذا تم تدريب العارضات على محتوى محمي بحقوق الطبع والنشر دون الحصول على إذن أو نوع من اتفاقية الترخيص المعمول بها، فيمكن لمستخدمي هذه النماذج عن غير قصد إنشاء عمل ينتهك حقوق الطبع والنشر – مما يعرضهم للدعاوى القضائية.

هيغزفيلد

اعتمادات الصورة: هيغزفيلد

لم يكشف ماشربوف عن مصدر بيانات تدريب هيغزفيلد (بخلاف القول إنها تأتي من أماكن “متعددة متاحة للجمهور”)، كما لم يذكر ما إذا كانت هيغزفيلد ستحتفظ ببيانات المستخدم لتدريب النماذج المستقبلية، الأمر الذي قد لا يتناسب مع البعض. زبائن القطاع التجاري. لقد لاحظ أنه يمكن لمستخدمي Diffuse طلب حذف بياناتهم في أي وقت من خلال التطبيق.

كما أصبحت منصات “الاستنساخ” الرقمية مثل هيجزفيلد جاهزة لإساءة الاستخدام، كما أظهر الانتشار الهائل للتزييف العميق على وسائل التواصل الاجتماعي في الأشهر الأخيرة.

وعلى نفس المنوال، يمكن لـ Higgsfield أن يسهل سرقة محتوى المبدعين. على سبيل المثال، يحتاج المرء فقط إلى تحميل مقطع فيديو لتصميم الرقصات الخاص بشخص ما لإنشاء مقطع فيديو لنفسه وهو يؤدي نفس تصميم الرقصات.

سألت مشرابوف عن الضمانات أو وسائل الحماية التي قد يستخدمها هيغزفيلد لمحاولة منع إساءة الاستخدام، و- رغم أنه لم يخوض في التفاصيل – ادعى أن المنصة تستخدم مزيجًا من الإشراف الآلي واليدوي.

وأضاف مشرابوف: “لقد قررنا طرح المنتج تدريجيًا واختباره في أسواق مختارة أولاً، حتى نتمكن من مراقبة الأماكن التي يوجد فيها احتمال إساءة الاستخدام وتطوير المنتج حسب الضرورة”.

سيتعين علينا أن ننتظر ونرى مدى نجاح ذلك في الممارسة العملية.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى