تقنية

لقد ظهر نموذج جديد غامض لتوليد الصور


يتفوق نموذج غامض جديد لتوليد الصور على نماذج من Midjourney وBlack Forest Labs وOpenAI في معيار التحليل الاصطناعي الجماعي.

يتقدم النموذج، الذي يحمل اسم “red_panda”، بحوالي 40 نقطة Elo عن النموذج التالي في الترتيب الأفضل، وهو Flux1.1 Pro من Black Forest Labs، في لوحة المتصدرين التي تعمل على تحويل النص إلى صورة من التحليل الاصطناعي. يستخدم التحليل الاصطناعي Elo، وهو نظام تصنيف تم تطويره في الأصل لحساب مستوى المهارة النسبي للاعبي الشطرنج، لمقارنة أداء النماذج المختلفة التي يختبرها.

يُقال إن الصورة تم إنشاؤها بواسطة red_panda. اعتمادات الصورة:ديدي داس (يفتح في نافذة جديدة)

على غرار معيار الذكاء الاصطناعي المجتمعي Chatbot Arena، يقوم التحليل الاصطناعي بتصنيف النماذج من خلال التعهيد الجماعي. بالنسبة لنماذج الصور، يختار التحليل الاصطناعي نموذجين بشكل عشوائي ويغذيهما بموجه فريد. بعد ذلك، يعرض الموجه والصور الناتجة، ويختار المستخدمون ما يعتقدون أنه يعكس الموجه بشكل أفضل.

التحليل الاصطناعي red_panda
اعتمادات الصورة:التحليل الاصطناعي

من المؤكد أن هناك بعض التحيز في عملية التصويت هذه. إن ناخبي التحليل الاصطناعي هم من المتحمسين للذكاء الاصطناعي، في معظمهم، وقد لا تعكس اختياراتهم تفضيلات المجتمع الأوسع لمستخدمي الذكاء الاصطناعي المبدعين.

لكن red_panda هو أيضًا أحد النماذج الأفضل أداءً على لوحة الصدارة من حيث سرعة الإنشاء. يستغرق النموذج حوالي 7 ثوانٍ في المتوسط ​​لإنشاء صورة، وهو أسرع بأكثر من 100 مرة من DALL-E 3 من OpenAI.

red_panda
يقال أن صورة أخرى من red_panda. اعتمادات الصورة:نيوراليثيك (يفتح في نافذة جديدة)

إذًا، من أين أتت الباندا الحمراء؟ أي شركة صنعته؟ ومتى نتوقع إصداره؟ كل الأسئلة الجيدة. تستخدم مختبرات الذكاء الاصطناعي بشكل متزايد معايير المجتمع لإثارة الترقب قبل الإعلان، لذلك قد لا يمر وقت طويل قبل أن نكتشف ذلك.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى