لقد ظهر نموذج جديد غامض لتوليد الصور

يتفوق نموذج غامض جديد لتوليد الصور على نماذج من Midjourney وBlack Forest Labs وOpenAI في معيار التحليل الاصطناعي الجماعي.
يتقدم النموذج، الذي يحمل اسم “red_panda”، بحوالي 40 نقطة Elo عن النموذج التالي في الترتيب الأفضل، وهو Flux1.1 Pro من Black Forest Labs، في لوحة المتصدرين التي تعمل على تحويل النص إلى صورة من التحليل الاصطناعي. يستخدم التحليل الاصطناعي Elo، وهو نظام تصنيف تم تطويره في الأصل لحساب مستوى المهارة النسبي للاعبي الشطرنج، لمقارنة أداء النماذج المختلفة التي يختبرها.
على غرار معيار الذكاء الاصطناعي المجتمعي Chatbot Arena، يقوم التحليل الاصطناعي بتصنيف النماذج من خلال التعهيد الجماعي. بالنسبة لنماذج الصور، يختار التحليل الاصطناعي نموذجين بشكل عشوائي ويغذيهما بموجه فريد. بعد ذلك، يعرض الموجه والصور الناتجة، ويختار المستخدمون ما يعتقدون أنه يعكس الموجه بشكل أفضل.

من المؤكد أن هناك بعض التحيز في عملية التصويت هذه. إن ناخبي التحليل الاصطناعي هم من المتحمسين للذكاء الاصطناعي، في معظمهم، وقد لا تعكس اختياراتهم تفضيلات المجتمع الأوسع لمستخدمي الذكاء الاصطناعي المبدعين.
لكن red_panda هو أيضًا أحد النماذج الأفضل أداءً على لوحة الصدارة من حيث سرعة الإنشاء. يستغرق النموذج حوالي 7 ثوانٍ في المتوسط لإنشاء صورة، وهو أسرع بأكثر من 100 مرة من DALL-E 3 من OpenAI.
إذًا، من أين أتت الباندا الحمراء؟ أي شركة صنعته؟ ومتى نتوقع إصداره؟ كل الأسئلة الجيدة. تستخدم مختبرات الذكاء الاصطناعي بشكل متزايد معايير المجتمع لإثارة الترقب قبل الإعلان، لذلك قد لا يمر وقت طويل قبل أن نكتشف ذلك.