تقنية

نشأ من الشبح مع نوع جديد من نموذج الذكاء الاصطناعى


Inception ، تدعي شركة جديدة مقرها بالو ألتو من قبل أستاذ علوم الكمبيوتر في ستانفورد ستيفانو إيرمون ، أنها طورت نموذجًا جديدًا من الذكاء الاصطناعي يعتمد على تكنولوجيا “الانتشار”. يطلق عليه Inception نموذج لغة كبير قائم على الانتشار ، أو “DLM” لفترة قصيرة.

يمكن تقسيم نماذج الذكاء الاصطناعى التوليدي التي تلقي معظم الاهتمام الآن على نطاق واسع إلى نوعين: نماذج لغة كبيرة (LLMS) ونماذج الانتشار. LLMS ، المبنية على بنية المحولات ، تستخدم لتوليد النص. وفي الوقت نفسه ، تستخدم نماذج الانتشار ، التي تعمل على تشغيل أنظمة الذكاء الاصطناعي مثل Midjourney و Openai’s Sora ، بشكل أساسي لإنشاء الصور والفيديو والصوت.

يقدم نموذج Inception إمكانيات LLMs التقليدية ، بما في ذلك توليد الكود وإجابات الأسئلة ، ولكن مع أداء أسرع بشكل كبير وتكاليف الحوسبة ، وفقًا للشركة.

أخبر Ermon TechCrunch أنه كان يدرس كيفية تطبيق نماذج الانتشار على الرسائل النصية لفترة طويلة في مختبر ستانفورد. استند بحثه إلى فكرة أن LLMs التقليدية بطيئة نسبيًا مقارنة بتكنولوجيا الانتشار.

مع LLMS ، “لا يمكنك إنشاء الكلمة الثانية حتى تقوم بإنشاء الكلمة الأولى ، ولا يمكنك إنشاء الكلمة الثالثة حتى تقوم بإنشاء الأولين”.

كان Ermon يبحث عن طريقة لتطبيق نهج الانتشار على النص لأنه ، على عكس LLMS ، التي تعمل بشكل متتابع ، تبدأ نماذج الانتشار بتقدير تقريبي للبيانات التي تولدها (على سبيل المثال صورة) ، ثم إحضار البيانات إلى التركيز مرة واحدة.

كان Ermon يفترض توليد وتعديل كتل كبيرة من النص بالتوازي مع نماذج الانتشار. بعد سنوات من المحاولة ، حقق إيرمون وطالبه اختراقًا كبيرًا ، قاموا بالتفصيل في ورقة بحثية نشرت العام الماضي.

مع إدراك إمكانات التقدم ، أسس Ermon Inception في الصيف الماضي ، واستفاد من طالبين سابقين ، أستاذ UCLA أديتيا جروفر وأستاذ كورنيل فولوديمير كوليشوف ، للمشاركة في قيادة الشركة.

بينما رفض Ermon مناقشة تمويل Inception ، يدرك TechCrunch أن صندوق Mayfield قد استثمر.

وقال Emron إن Inception قد ضمنت بالفعل العديد من العملاء ، بما في ذلك شركات Fortune 100 التي لم يكشف عن اسمها ، من خلال معالجة حاجتها الحاسمة إلى انخفاض زمن انتقال الذكاء الاصطناعي وزيادة السرعة.

“ما وجدناه هو أن نماذجنا يمكن أن تستفيد من وحدات معالجة الرسومات بشكل أكثر كفاءة” ، قال إرمون ، في إشارة إلى رقائق الكمبيوتر المستخدمة عادة لتشغيل النماذج في الإنتاج. “أعتقد أن هذا حقًا ، مثل ، مشكلة كبيرة ، لأنني أعتقد أن هذا سيغير الطريقة التي يبني بها الأشخاص نماذج اللغة.”

يوفر Inception واجهة برمجة تطبيقات بالإضافة إلى خيارات نشر الجهاز الحافة ودعم النماذج الدقيقة ، ومجموعة من DLMs خارج الصندوق لمختلف حالات الاستخدام. تدعي الشركة أن DLMs يمكن أن تصل إلى 10x أسرع من LLMs التقليدية بينما تكلف 10x أقل.

“نموذج الترميز” الصغير “جيد مثل [OpenAI’s] وقال متحدث باسم الشركة لـ TechCrunch: “GPT-4O Mini بينما أكثر من 10 مرات بالسرعة”. “نموذج” Mini “يتفوق على نماذج صغيرة مفتوحة المصدر مثل [Meta’s] LLAMA 3.1 8B ويحقق أكثر من 1000 رمز في الثانية. “

“الرموز” هي لغة صناعة أجزاء من البيانات الخام. ألف الرموز المميزة في الثانية هي سرعة مثيرة للإعجاب بالفعل ، على افتراض أن مطالبات إنشار.


اكتشاف المزيد من موقع fffm

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى

اكتشاف المزيد من موقع fffm

اشترك الآن للاستمرار في القراءة والحصول على حق الوصول إلى الأرشيف الكامل.

Continue reading