تقنية

Meta Llama: كل ما تحتاج لمعرفته حول نموذج الذكاء الاصطناعي التوليدي المفتوح


مثل كل شركة تكنولوجيا كبيرة هذه الأيام، لدى Meta نموذجها الرائد الخاص بالذكاء الاصطناعي المولد، والذي يسمى Llama. يعتبر Llama فريدًا إلى حد ما بين النماذج الرئيسية من حيث أنه “مفتوح”، مما يعني أنه يمكن للمطورين تنزيله واستخدامه كما يحلو لهم (مع قيود معينة). وهذا على النقيض من نماذج مثل Anthropic’s Claude، وGPT-4o من OpenAI (الذي يشغل ChatGPT)، وGemini من Google، والتي لا يمكن الوصول إليها إلا عبر واجهات برمجة التطبيقات.

ومن أجل منح المطورين خيارًا، عقدت Meta أيضًا شراكة مع البائعين بما في ذلك AWS وGoogle Cloud وMicrosoft Azure لإتاحة الإصدارات المستضافة على السحابة من Llama. بالإضافة إلى ذلك، أصدرت الشركة أدوات مصممة لتسهيل ضبط النموذج وتخصيصه.

إليك كل ما تحتاج لمعرفته حول Llama، بدءًا من إمكانياته وإصداراته وحتى المكان الذي يمكنك استخدامه فيه. سنحافظ على تحديث هذا المنشور مع ترقيات إصدارات Meta وتقديم أدوات تطوير جديدة لدعم استخدام النموذج.

ما هو اللاما؟

اللاما هي عائلة من العارضات – وليست واحدة فقط:

  • اللاما 8 ب
  • اللاما 70 ب
  • اللاما 405 ب

أحدث الإصدارات هي اللاما 3.1 8 ب, اللاما 3.1 70 ب و اللاما 3.1 405 ب، والذي تم إصداره في يوليو 2024. وقد تم تدريبهم على صفحات الويب بمجموعة متنوعة من اللغات والأكواد العامة والملفات الموجودة على الويب، بالإضافة إلى البيانات الاصطناعية (أي البيانات التي تم إنشاؤها بواسطة نماذج الذكاء الاصطناعي الأخرى).

Llama 3.1 8B وLlama 3.1 70B هما طرازان صغيران ومدمجان مصممان للتشغيل على أجهزة تتراوح من أجهزة الكمبيوتر المحمولة إلى الخوادم. من ناحية أخرى، يعد Llama 3.1 405B نموذجًا واسع النطاق يتطلب (بدون بعض التعديلات) أجهزة مركز البيانات. Llama 3.1 8B وLlama 3.1 70B أقل قدرة من Llama 3.1 405B، لكنهما أسرع. إنها إصدارات “مقطرة” من 405B، في الواقع، مُحسّنة لتقليل عبء التخزين ووقت الاستجابة.

تحتوي جميع نماذج Llama على 128000 نافذة سياقية رمزية. (في علم البيانات، الرموز المميزة عبارة عن أجزاء مقسمة من البيانات الأولية، مثل المقاطع “fan” و”tas” و”tic” في كلمة “fantastic”.) يشير سياق النموذج، أو نافذة السياق، إلى البيانات المدخلة (مثل النص ) الذي يأخذه النموذج في الاعتبار قبل إنشاء المخرجات (على سبيل المثال نص إضافي). يمكن للسياق الطويل أن يمنع النماذج من “نسيان” محتوى المستندات والبيانات الحديثة، ومن الانحراف عن الموضوع والاستقراء بشكل خاطئ.

تُترجم هذه الرموز البالغ عددها 128000 إلى حوالي 100000 كلمة أو 300 صفحة، وهي كمرجع تقريبًا بطول “مرتفعات ويذرينج” و”رحلات جاليفر” و”هاري بوتر وسجين أزكابان”.

ماذا يمكن أن تفعل اللاما؟

مثل نماذج الذكاء الاصطناعي التوليدية الأخرى، يمكن لـ Llama أداء مجموعة من المهام المساعدة المختلفة، مثل البرمجة والإجابة على أسئلة الرياضيات الأساسية، بالإضافة إلى تلخيص المستندات بثماني لغات (الإنجليزية والألمانية والفرنسية والإيطالية والبرتغالية والهندية والإسبانية والتايلاندية). معظم أعباء العمل المستندة إلى النصوص – مثل تحليل الملفات مثل ملفات PDF وجداول البيانات – تقع ضمن نطاق اختصاصها؛ ولا يستطيع أي من نماذج اللاما معالجة الصور أو توليدها، على الرغم من أن ذلك قد يتغير في المستقبل القريب.

يمكن تكوين جميع نماذج Llama الأحدث للاستفادة من تطبيقات وأدوات وواجهات برمجة التطبيقات التابعة لجهات خارجية لإكمال المهام. لقد تم تدريبهم بشكل مبتكر لاستخدام Brave Search للإجابة على الأسئلة المتعلقة بالأحداث الأخيرة، وWolfram Alpha API للاستعلامات المتعلقة بالرياضيات والعلوم، ومترجم Python للتحقق من صحة التعليمات البرمجية. بالإضافة إلى ذلك، يقول ميتا إن نماذج Llama 3.1 يمكنها استخدام أدوات معينة لم تروها من قبل (ولكن ما إذا كان بإمكانهم ذلك؟) بشكل موثوق واستخدام تلك الأدوات أمر آخر).

أين يمكنني استخدام اللاما؟

إذا كنت تتطلع إلى الدردشة ببساطة مع Llama، فهي تعمل على تعزيز تجربة الدردشة الآلية Meta AI على Facebook Messenger وWhatsApp وInstagram وOculus وMeta.ai.

يمكن للمطورين الذين يستخدمون Llama تنزيل النموذج أو استخدامه أو ضبطه عبر معظم الأنظمة الأساسية السحابية الشائعة. تدعي شركة Meta أن لديها أكثر من 25 شريكًا يستضيفون Llama، بما في ذلك Nvidia وDatabricks وGroq وDell وSnowflake.

قام بعض هؤلاء الشركاء ببناء أدوات وخدمات إضافية فوق اللاما، بما في ذلك الأدوات التي تسمح للنماذج بالإشارة إلى بيانات الملكية وتمكينها من العمل بزمن وصول أقل.

تقترح Meta استخدام نماذجها الأصغر، Llama 8B وLlama 70B، لتطبيقات الأغراض العامة مثل تشغيل برامج الدردشة الآلية وإنشاء التعليمات البرمجية. تقول الشركة إن Llama 405B مخصص بشكل أفضل لتقطير النماذج – عملية نقل المعرفة من نموذج كبير إلى نموذج أصغر وأكثر كفاءة – وتوليد بيانات تركيبية لتدريب (أو ضبط) النماذج البديلة.

والأهم من ذلك، أن ترخيص Llama يقيد كيفية قيام المطورين بنشر النموذج: يجب على مطوري التطبيقات الذين لديهم أكثر من 700 مليون مستخدم شهريًا طلب ترخيص خاص من Meta ستمنحه الشركة وفقًا لتقديرها.

إلى جانب Llama، توفر Meta أدوات تهدف إلى جعل النموذج “أكثر أمانًا” للاستخدام:

  • حارس اللاما, إطار الاعتدال
  • الحرس الفوري, أداة للحماية من هجمات الحقن الفوري
  • سايبر سيك إيفال, مجموعة تقييم مخاطر الأمن السيبراني

يحاول Llama Guard اكتشاف المحتوى الذي قد يسبب مشكلات سواء تم تغذيته أو إنشاؤه بواسطة نموذج Llama، بما في ذلك المحتوى المتعلق بالنشاط الإجرامي واستغلال الأطفال وانتهاكات حقوق الطبع والنشر والكراهية وإيذاء النفس والاعتداء الجنسي. يمكن للمطورين تخصيص فئات المحتوى المحظور، وتطبيق الكتل على جميع اللغات التي يدعمها Llama خارج الصندوق.

مثل Llama Guard، يمكن لـ Prompt Guard حظر النص المخصص لـ Llama، ولكن فقط النص الذي يهدف إلى “مهاجمة” النموذج وجعله يتصرف بطرق غير مرغوب فيها. يدعي Meta أن Llama Guard يمكنه الدفاع ضد المطالبات الضارة بشكل صريح (أي عمليات كسر الحماية التي تحاول الالتفاف حول مرشحات الأمان المضمنة في Llama) بالإضافة إلى المطالبات التي تحتوي على “مدخلات محقونة”.

أما بالنسبة لـ CyberSecEval، فهي ليست أداة بقدر ما هي مجموعة من المعايير لقياس أمان النموذج. يمكن لـ CyberSecEval تقييم المخاطر التي يشكلها نموذج اللاما (على الأقل وفقًا لمعايير Meta) لمطوري التطبيقات والمستخدمين النهائيين في مجالات مثل “الهندسة الاجتماعية الآلية” و”توسيع نطاق العمليات السيبرانية الهجومية”.

قيود اللاما

تأتي اللاما مع بعض المخاطر والقيود، مثل جميع نماذج الذكاء الاصطناعي التوليدية.

على سبيل المثال، ليس من الواضح ما إذا كانت Meta قد قامت بتدريب اللاما على محتوى محمي بحقوق الطبع والنشر. إذا حدث ذلك، فقد يكون المستخدمون مسؤولين عن الانتهاك إذا انتهى بهم الأمر عن غير قصد إلى استخدام مقتطف محمي بحقوق الطبع والنشر قام النموذج بتقيؤه.

استخدمت شركة Meta في وقت ما كتبًا إلكترونية محمية بحقوق الطبع والنشر للتدريب على الذكاء الاصطناعي على الرغم من تحذيرات محاميها، وفقًا لتقارير حديثة صادرة عن رويترز. تقوم الشركة بشكل مثير للجدل بتدريب الذكاء الاصطناعي الخاص بها على المنشورات والصور والتعليقات التوضيحية على Instagram وFacebook، وتجعل من الصعب على المستخدمين إلغاء الاشتراك. علاوة على ذلك، فإن Meta، جنبًا إلى جنب مع OpenAI، هي موضوع دعوى قضائية مستمرة رفعها مؤلفون، بما في ذلك الممثلة الكوميدية سارة سيلفرمان، بشأن الاستخدام غير المصرح به للشركات المزعوم للبيانات المحمية بحقوق الطبع والنشر للتدريب النموذجي.

تعد البرمجة مجالًا آخر من الحكمة التعامل معه بخفة عند استخدام اللاما. وذلك لأن Llama – مثل نظيراتها من الذكاء الاصطناعي التوليدي – قد تنتج تعليمات برمجية بها أخطاء أو تعليمات برمجية غير آمنة.

كما هو الحال دائمًا، من الأفضل أن يقوم خبير بشري بمراجعة أي تعليمات برمجية تم إنشاؤها بواسطة الذكاء الاصطناعي قبل دمجها في خدمة أو برنامج.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى