يضم Hugging Face فريقًا مكونًا من شخصين يقوم بتطوير نماذج الذكاء الاصطناعي المشابهة لـ ChatGPT

تقدم شركة Hugging Face الناشئة في مجال الذكاء الاصطناعي مجموعة واسعة من أدوات استضافة وتطوير علوم البيانات، بما في ذلك بوابة تشبه GitHub لمستودعات أكواد الذكاء الاصطناعي والنماذج ومجموعات البيانات، بالإضافة إلى لوحات معلومات الويب لعرض التطبيقات التي تعمل بالذكاء الاصطناعي.
لكن بعض أدوات Hugging Face الأكثر إثارة للإعجاب – والأكثر قدرة – هذه الأيام تأتي من فريق مكون من شخصين تم تشكيله في يناير فقط.
تهدف H4، كما يطلق عليها – “H4” اختصار لعبارة “مفيدة وصادقة وغير ضارة ومعانقة” – إلى تطوير أدوات و”وصفات” لتمكين مجتمع الذكاء الاصطناعي من بناء روبوتات الدردشة التي تعمل بالذكاء الاصطناعي على غرار ChatGPT. كان إصدار ChatGPT هو الحافز لتشكيل H4، في الواقع، وفقًا للويس تونستول، مهندس التعلم الآلي في Hugging Face وأحد عضوي H4.
قال تونستول لـ TechCrunch في مقابلة عبر البريد الإلكتروني: “عندما تم إصدار ChatGPT بواسطة OpenAI في أواخر عام 2022، بدأنا في تبادل الأفكار حول ما قد يتطلبه الأمر لتكرار قدراته مع المكتبات والنماذج مفتوحة المصدر”. “ينصب التركيز البحثي الأساسي لـ H4 على المحاذاة، والتي تتضمن على نطاق واسع تعليم طلاب ماجستير إدارة الأعمال كيفية التصرف وفقًا لتعليقات البشر (أو حتى أنظمة الذكاء الاصطناعي الأخرى).”
تقف شركة H4 وراء عدد متزايد من نماذج اللغات الكبيرة مفتوحة المصدر، بما في ذلك Zephyr-7B-α، وهو إصدار دقيق ومركّز على الدردشة من نموذج Mistral 7B الذي يحمل نفس الاسم والذي أصدرته مؤخرًا شركة Mistral الفرنسية الناشئة للذكاء الاصطناعي. قامت شركة H4 أيضًا بتكوين نموذج Falcon-40B، وهو نموذج من معهد الابتكار التكنولوجي في أبو ظبي – حيث قامت بتعديل النموذج للاستجابة بشكل أكثر فائدة للطلبات باللغة الطبيعية.
لتدريب نماذجها، تعتمد H4 – مثل فرق البحث الأخرى في Hugging Face – على مجموعة مخصصة تضم أكثر من 1000 وحدة معالجة رسوميات Nvidia A100. يقيم تونستول وزميله الآخر في H4، إد بيتشينج، عن بعد في أوروبا، لكنهما يتلقيان الدعم من العديد من فرق Hugging Face الداخلية، من بينها فريق اختبار وتقييم النماذج.
قال بيتشينج لـ TechCrunch عبر البريد الإلكتروني: “إن الحجم الصغير لـ H4 هو اختيار متعمد، لأنه يسمح لنا بأن نكون أكثر ذكاءً والتكيف مع المشهد البحثي المتغير باستمرار”. “لدينا أيضًا العديد من عمليات التعاون الخارجية مع مجموعات مثل LMSYS وLlamaIndex، الذين نتعاون معهم في الإصدارات المشتركة.”
في الآونة الأخيرة، قامت H4 بالتحقيق في تقنيات المحاذاة المختلفة وأدوات البناء لاختبار مدى نجاح التقنيات التي يقترحها المجتمع والصناعة. أصدر الفريق هذا الشهر كتيبًا يحتوي على جميع التعليمات البرمجية المصدر ومجموعات البيانات التي استخدموها لبناء Zephyr، وتخطط H4 لتحديث الكتيب برمز من نماذج الذكاء الاصطناعي المستقبلية عند إصدارها.
سألت عما إذا كانت شركة H4 قد تعرضت لأي ضغط من كبار المسؤولين في شركة Hugging Face لتسويق أعمالهم. فقد جمعت الشركة، بعد كل شيء، مئات الملايين من الدولارات من مجموعة كبيرة من المستثمرين تشمل Salesforce، وIBM، وAMD، وGoogle، وAmazon Intel، وNvidia. بلغت قيمة جولة التمويل الأخيرة لشركة Hugging Face 4.5 مليار دولار، أي أكثر من 100 ضعف الإيرادات السنوية للشركة.
قال Tunstall أن H4 لا تستثمر أدواتها بشكل مباشر. لكنه اعترف بأن الأدوات يفعل قم بإدخال برنامج تسريع الخبراء الخاص بـ Hugging Face، وهو عرض يركز على المؤسسات من Hugging Face والذي يوفر إرشادات من فرق Hugging Face لإنشاء حلول مخصصة للذكاء الاصطناعي.
وعندما سُئل عما إذا كان يرى أن H4 تتنافس مع مبادرات الذكاء الاصطناعي مفتوحة المصدر الأخرى، مثل EleutherAI وLAION، قال Beeching أن هذا ليس هدف H4. وقال إن الهدف بدلاً من ذلك هو “تمكين” مجتمع الذكاء الاصطناعي المفتوح من خلال إطلاق كود التدريب ومجموعات البيانات المرتبطة بنماذج الدردشة الخاصة بـ H4.
قال بيتشينج: “لم يكن عملنا ممكنًا بدون المساهمات العديدة من المجتمع”.