تقنية

يصل Stable Diffusion 3 لتعزيز الصدارة المبكرة في صور الذكاء الاصطناعي ضد Sora وGemini


أعلنت شركة Stability عن Stable Diffusion 3، وهو الإصدار الأحدث والأقوى من نموذج الذكاء الاصطناعي المولد للصور الخاص بالشركة. على الرغم من أن التفاصيل ضئيلة، فمن الواضح أنها محاولة لدرء الضجيج حول المنافسين الذين تم الإعلان عنهم مؤخرًا من OpenAI وGoogle.

سيكون لدينا المزيد من التفاصيل الفنية لكل هذا قريبًا، ولكن في الوقت الحالي يجب أن تعلم أن Stable Diffusion 3 يعتمد على بنية جديدة وسيعمل على مجموعة متنوعة من الأجهزة (على الرغم من أنك ستظل بحاجة إلى شيء سمين). لم يتم إصدارها بعد، ولكن يمكنك الاشتراك في قائمة الانتظار هنا.

يستخدم SD3 “محول نشر” محدث، وهي تقنية كانت رائدة في عام 2022 ولكن تمت مراجعتها في عام 2023 وتصل إلى قابلية التوسع الآن. يبدو أن Sora، مولد الفيديو المثير للإعجاب في OpenAI، يعمل على مبادئ مماثلة (ويل بيبلز، المؤلف المشارك في الورقة، شارك في قيادة مشروع Sora). كما أنها تستخدم “مطابقة التدفق”، وهي تقنية جديدة أخرى تعمل بالمثل على تحسين الجودة دون إضافة الكثير من النفقات العامة.

تتراوح مجموعة النماذج من 800 مليون معلمة (أقل من SD 1.5 الشائع الاستخدام) إلى 8 مليارات معلمة (أكثر من SD XL)، بهدف التشغيل على مجموعة متنوعة من الأجهزة. من المحتمل أنك ستظل تريد وحدة معالجة رسوميات (GPU) جدية وإعدادًا مخصصًا لعمل التعلم الآلي، ولكنك لا تقتصر على واجهة برمجة التطبيقات (API) كما هو الحال عمومًا مع نماذج OpenAI وGoogle. (لم تركز الأنثروبيك، من جانبها، على إنشاء الصور أو مقاطع الفيديو علنًا، لذا فهي ليست جزءًا من هذه المحادثة حقًا).

على تويتر، يشير رئيس شركة Stable Diffusion، عماد مصطفى، إلى أن النموذج الجديد قادر على فهم الوسائط المتعددة، بالإضافة إلى إدخال الفيديو وتوليده، وهي كل الأشياء التي أكد عليها منافسوه في منافسيهم الذين يعتمدون على واجهة برمجة التطبيقات (API). لا تزال هذه القدرات نظرية، ولكن يبدو أنه لا يوجد عائق تقني يحول دون تضمينها في الإصدارات المستقبلية.

من المستحيل مقارنة هذه النماذج، بالطبع، حيث لم يتم إصدار أي منها بالفعل وكل ما يتعين علينا الاستمرار فيه هو الادعاءات المتنافسة والأمثلة المنتقاة بعناية. لكن الانتشار المستقر له ميزة واحدة محددة: وجوده في روح العصر باعتباره النموذج المعتمد للقيام بأي نوع من توليد الصور في أي مكان، مع القليل من القيود الجوهرية في الطريقة أو المحتوى. (في الواقع، يكاد يكون من المؤكد أن SD3 سوف يستهل حقبة جديدة من المواد الإباحية التي يولدها الذكاء الاصطناعي، بمجرد تجاوز آليات الأمان.)

يبدو أن Stable Diffusion يريد أن يكون الذكاء الاصطناعي التوليدي ذو العلامة البيضاء الذي لا يمكنك الاستغناء عنه، بدلاً من الذكاء الاصطناعي التوليدي الذي لست متأكدًا من حاجتك إليه. ولتحقيق هذه الغاية، تعمل الشركة على ترقية أدواتها أيضًا، لخفض مستوى الاستخدام، على الرغم من أنه كما هو الحال مع بقية الإعلان، فإن هذه التحسينات متروكة للخيال.

ومن المثير للاهتمام أن الشركة وضعت السلامة في مقدمة أولوياتها في إعلانها، قائلة:

لقد اتخذنا ونستمر في اتخاذ خطوات معقولة لمنع إساءة استخدام Stable Diffusion 3 من قبل الجهات الفاعلة السيئة. تبدأ السلامة عندما نبدأ في تدريب نموذجنا وتستمر طوال فترة الاختبار والتقييم والنشر. استعدادًا لهذه المعاينة المبكرة، قدمنا ​​العديد من وسائل الحماية. ومن خلال التعاون المستمر مع الباحثين والخبراء ومجتمعنا، نتوقع المزيد من الابتكار بنزاهة مع اقترابنا من الإصدار العام للنموذج.

ما هي بالضبط هذه الضمانات؟ لا شك أن المعاينة ستحددها إلى حد ما، وبعد ذلك سيتم تحسين الإصدار العام أو فرض رقابة عليه اعتمادًا على وجهة نظرك حول هذه الأشياء. سنعرف المزيد قريبًا، وفي هذه الأثناء سنتعمق في الجانب الفني للأشياء لفهم النظرية والأساليب الكامنة وراء هذا الجيل الجديد من النماذج بشكل أفضل.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى