5 خطوات لضمان نجاح الشركات الناشئة في نشر LLMs
إيذانا بإطلاق ChatGPT في عصر النماذج اللغوية الكبيرة. بالإضافة إلى عروض OpenAI، تشمل برامج LLM الأخرى عائلة LLM من Google (بما في ذلك Bard)، ومشروع BLOOM (تعاون بين مجموعات في Microsoft وNvidia ومؤسسات أخرى)، وMeta’s LLaMA، وAnthropic’s Claude.
ولا شك أنه سيتم إنشاء المزيد. في الواقع، وجد استطلاع أجرته Arize في أبريل 2023 أن 53% من المشاركين خططوا لنشر LLMs خلال العام المقبل أو قبل ذلك. أحد الأساليب للقيام بذلك هو إنشاء ماجستير إدارة أعمال “عمودي” يبدأ بماجستير إدارة أعمال موجود وإعادة تدريبه بعناية على المعرفة الخاصة بمجال معين. يمكن أن ينجح هذا التكتيك في مجالات علوم الحياة والأدوية والتأمين والتمويل وقطاعات الأعمال الأخرى.
يمكن أن يوفر نشر LLM ميزة تنافسية قوية — ولكن فقط إذا تم تنفيذه بشكل جيد.
لقد أدى حاملو الماجستير في القانون بالفعل إلى قضايا تستحق النشر، مثل ميلهم إلى “الهلوسة” بالمعلومات غير الصحيحة. وهذه مشكلة خطيرة، ويمكن أن تصرف انتباه القيادة عن الاهتمامات الأساسية بالعمليات التي تولد تلك المخرجات، والتي يمكن أن تكون إشكالية بالمثل.
تحديات التدريب ونشر LLM
إحدى المشكلات المتعلقة باستخدام LLM هي نفقات التشغيل الهائلة لأن الطلب الحسابي لتدريبها وتشغيلها شديد للغاية (لا يطلق عليها نماذج لغوية كبيرة من أجل لا شيء).
تعد شهادات LLM مثيرة، ولكن تطويرها واعتمادها يتطلب التغلب على العديد من عقبات الجدوى.
أولا، الأجهزة اللازمة لتشغيل النماذج مكلفة. تم بيع وحدة معالجة الرسوميات H100 من Nvidia، وهي خيار شائع لحاملي شهادة LLM، في السوق الثانوية مقابل حوالي 40 ألف دولار لكل شريحة. قدر أحد المصادر أن الأمر سيستغرق ما يقرب من 6000 شريحة لتدريب ماجستير إدارة أعمال مماثل لـ ChatGPT-3.5. هذا ما يقرب من 240 مليون دولار على وحدات معالجة الرسومات وحدها.
تكلفة أخرى مهمة هي تشغيل تلك الرقائق. تشير التقديرات إلى أن مجرد تدريب نموذج يتطلب حوالي 10 جيجاوات/ساعة من الطاقة، أي ما يعادل الاستخدام السنوي للكهرباء في 1000 منزل في الولايات المتحدة. بمجرد تدريب النموذج، ستختلف تكلفة الكهرباء ولكنها قد تصبح باهظة. وقدر هذا المصدر أن استهلاك الطاقة لتشغيل ChatGPT-3.5 يبلغ حوالي 1 جيجاوات في الساعة يوميًا، أو الاستخدام اليومي للطاقة المجمعة لـ 33000 أسرة.
يمكن أن يكون استهلاك الطاقة أيضًا مأزقًا محتملاً لتجربة المستخدم عند تشغيل LLMs على الأجهزة المحمولة. وذلك لأن الاستخدام المكثف على الجهاز يمكن أن يستنزف بطاريته بسرعة كبيرة، مما قد يشكل عائقًا كبيرًا أمام اعتماد المستهلك.