تريد أمازون استضافة نماذج الذكاء الاصطناعي التوليدية المخصصة للشركات

تريد AWS، وهي شركة الحوسبة السحابية التابعة لشركة Amazon، أن تكون المكان الذي تلجأ إليه الشركات لاستضافة نماذج الذكاء الاصطناعي التوليدية المخصصة الخاصة بها وضبطها بدقة.

أعلنت AWS اليوم عن إطلاق Custom Model Import (قيد المعاينة)، وهي ميزة جديدة في Bedrock، وهي مجموعة خدمات الذكاء الاصطناعي التوليدية التي تركز على المؤسسات من AWS، والتي تتيح للمؤسسات استيراد نماذج الذكاء الاصطناعي التوليدية الداخلية والوصول إليها كواجهات برمجة تطبيقات مُدارة بالكامل .

تستفيد النماذج الخاصة بالشركات، بمجرد استيرادها، من نفس البنية التحتية مثل نماذج الذكاء الاصطناعي التوليدية الأخرى في مكتبة Bedrock (مثل Meta’s Llama 3 وAnthropic’s Claude 3)، بما في ذلك الأدوات اللازمة لتوسيع معرفتها وضبطها وتنفيذ الضمانات للتخفيف من تحيزاتها. .

قال Vasi Philomin، نائب الرئيس للذكاء الاصطناعي التوليدي في AWS، لـ TechCrunch في مقابلة: “كان هناك عملاء AWS قاموا بضبط أو بناء نماذجهم الخاصة خارج Bedrock باستخدام أدوات أخرى”. “تسمح لهم إمكانية استيراد النماذج المخصصة هذه بإحضار نماذجهم الخاصة إلى Bedrock ورؤيتها بجوار جميع النماذج الأخرى الموجودة بالفعل على Bedrock – واستخدامها مع جميع مسارات العمل الموجودة بالفعل على Bedrock أيضًا. “.

استيراد نماذج مخصصة

وفقا لاستطلاع حديث أجرته شركة Cnvrg، وهي شركة تابعة لشركة إنتل تركز على الذكاء الاصطناعي، فإن غالبية الشركات تقترب من الذكاء الاصطناعي التوليدي من خلال بناء نماذجها الخاصة وتحسينها لتناسب تطبيقاتها. وتقول هذه الشركات نفسها إنها ترى أن البنية التحتية، بما في ذلك البنية التحتية للحوسبة السحابية، هي أكبر عائق أمام النشر، وفقًا للاستطلاع.

من خلال Custom Model Import، تهدف AWS إلى الاندفاع لتلبية الحاجة مع الحفاظ على مواكبة المنافسين السحابيين. (تنبأ آندي جاسي، الرئيس التنفيذي لشركة أمازون، بذلك في رسالته السنوية الأخيرة إلى المساهمين).

لبعض الوقت، سمحت Vertex AI، نظير Google لـ Bedrock، للعملاء بتحميل نماذج الذكاء الاصطناعي التوليدية وتخصيصها وتقديمها من خلال واجهات برمجة التطبيقات. كما قدمت Databricks أيضًا منذ فترة طويلة مجموعات أدوات لاستضافة النماذج المخصصة وتعديلها، بما في ذلك نموذج DBRX الذي تم إصداره مؤخرًا.

عند سؤاله عما يميز Custom Model Import، أكد Philomin أنه – وبالتالي Bedrock – يقدم نطاقًا أوسع وعمقًا لخيارات تخصيص النموذج من المنافسة، مضيفًا أن “عشرات الآلاف” من العملاء اليوم يستخدمون Bedrock.

قال فيلومين: “أولاً، توفر شركة Bedrock عدة طرق للعملاء للتعامل مع نماذج الخدمة”. “ثانيًا، لدينا مجموعة كاملة من مسارات العمل حول هذه النماذج – والآن يمكن للعملاء قف بجوار جميع النماذج الأخرى المتوفرة لدينا بالفعل. الشيء الرئيسي الذي يعجب معظم الأشخاص في هذا الأمر هو القدرة على تجربة عدة نماذج مختلفة باستخدام نفس سير العمل، ومن ثم نقلها فعليًا إلى الإنتاج من نفس المكان.

إذن ما هي خيارات تخصيص النموذج المشار إليها؟

يشير فيلومين إلى Guardrails، الذي يتيح لمستخدمي Bedrock تكوين عتبات لتصفية – أو على الأقل محاولة تصفية – مخرجات النماذج لأشياء مثل خطاب الكراهية والعنف والمعلومات الشخصية أو معلومات الشركة الخاصة. (تشتهر نماذج الذكاء الاصطناعي التوليدي بخروجها عن المسار بطرق إشكالية، بما في ذلك تسريب معلومات حساسة؛ ولم تكن AWS استثناءً.) كما سلط الضوء على تقييم النموذج، وهي أداة أساسية يمكن للعملاء استخدامها لاختبار مدى جودة النموذج – أو عدة نماذج – أداء عبر مجموعة معينة من المعايير.

أصبح كل من حواجز الحماية وتقييم النماذج متاحين الآن بشكل عام بعد معاينة استمرت لعدة أشهر.

أجد نفسي مضطرًا إلى الإشارة هنا إلى أن Custom Model Import يدعم فقط ثلاثة بنيات نموذجية في الوقت الحالي – نماذج Hugging Face’s Flan-T5 وMeta’s Llama وMistral – وأن Vertex AI وغيرها من الخدمات المنافسة لـ Bedrock، بما في ذلك أدوات تطوير الذكاء الاصطناعي من Microsoft على Azure، تقديم ميزات أمان وتقييم قابلة للمقارنة إلى حد ما (راجع سلامة محتوى Azure AI وتقييم النموذج في Vertex وما إلى ذلك).

ماذا يكون ومع ذلك، فإن ما يميز Bedrock هو عائلة Titan من نماذج الذكاء الاصطناعي التوليدية من AWS. و- بالتزامن مع إصدار Custom Model Import – هناك العديد من التطورات الجديرة بالملاحظة على هذه الجبهة.

نماذج تيتان مطورة

أصبح Titan Image Generator، وهو نموذج تحويل النص إلى صورة من AWS، متاحًا الآن بشكل عام بعد إطلاقه في المعاينة في نوفمبر الماضي. كما كان من قبل، يمكن لـ Titan Image Generator إنشاء صور جديدة مع وصف نصي أو تخصيص الصور الموجودة، على سبيل المثال تبديل خلفية الصورة مع الاحتفاظ بالموضوعات في الصورة.

ومقارنة بإصدار المعاينة، يستطيع Titan Image Generator في GA إنشاء صور بمزيد من “الإبداع”، كما قال فيلومين، دون الخوض في التفاصيل. (تخمينك لما يعنيه ذلك جيد مثل تخميني.)

سألت Philomin إذا كان لديه أي تفاصيل أخرى لمشاركتها حول كيفية تدريب Titan Image Generator.

في أول ظهور للنموذج في تشرين الثاني (نوفمبر) الماضي، كانت AWS غامضة بشأن البيانات التي استخدمتها بالضبط في تدريب Titan Image Generator. قليل من البائعين يكشفون عن مثل هذه المعلومات بسهولة؛ إنهم ينظرون إلى بيانات التدريب على أنها ميزة تنافسية، وبالتالي يحتفظون بها والمعلومات المتعلقة بها بالقرب من صدرهم.

وتشكل تفاصيل بيانات التدريب أيضًا مصدرًا محتملاً للدعاوى القضائية المتعلقة بالملكية الفكرية، وهو ما يشكل عائقًا آخر للكشف عن الكثير. ترفض العديد من القضايا التي تشق طريقها إلى المحاكم دفاعات الاستخدام العادل المقدمة من البائعين، بحجة أن أدوات تحويل النص إلى صورة تحاكي أنماط الفنانين دون الحصول على إذن صريح من الفنانين وتسمح للمستخدمين بإنشاء أعمال جديدة تشبه أعمال الفنانين الأصلية والتي لا يتلقى الفنانون أي مقابل مقابلها. .

سيخبرني Philomin فقط أن AWS تستخدم مجموعة من بيانات الطرف الأول والبيانات المرخصة.

وقال: “لدينا مجموعة من مصادر البيانات الخاصة، ولكننا نرخص أيضًا الكثير من البيانات”. “نحن في الواقع ندفع رسوم ترخيص لأصحاب حقوق الطبع والنشر حتى نتمكن من استخدام بياناتهم، ولدينا عقود مع العديد منهم.

إنها تفاصيل أكثر مما كانت عليه في نوفمبر. ولكن لدي شعور بأن إجابة فيلومين لن ترضي الجميع، وخاصة منشئي المحتوى وعلماء أخلاقيات الذكاء الاصطناعي الذين يدعون إلى قدر أكبر من الشفافية عندما يتعلق الأمر بالتدريب على نماذج الذكاء الاصطناعي التوليدي.

بدلاً من الشفافية، تقول AWS إنها ستستمر في تقديم سياسة التعويض التي تغطي العملاء في حالة قيام نموذج Titan مثل Titan Image Generator بتكرار (أي يبصق نسخة طبق الأصل من) مثال تدريبي يحتمل أن يكون محميًا بحقوق الطبع والنشر. (يقدم العديد من المنافسين، بما في ذلك ميكروسوفت وجوجل، سياسات مماثلة تغطي نماذج توليد الصور الخاصة بهم).

ولمواجهة تهديد أخلاقي ملح آخر – التزييف العميق – تقول AWS إن الصور التي تم إنشاؤها باستخدام Titan Image Generator، كما هو الحال أثناء المعاينة، ستأتي مع علامة مائية غير مرئية “مقاومة للتلاعب”. يقول Philomin أن العلامة المائية أصبحت أكثر مقاومة في إصدار GA للضغط وتعديلات الصور ومعالجتها الأخرى.

بالانتقال إلى منطقة أقل إثارة للجدل، سألت Philomin عما إذا كانت AWS – مثل Google وOpenAI وغيرهما – تستكشف إنشاء الفيديو نظرًا للإثارة المحيطة بالتكنولوجيا (والاستثمار فيها). لم يقل فيلومين أن AWS لم يكن… لكنه لن يلمح إلى أكثر من ذلك.

وقال فيلومين: “من الواضح أننا نتطلع باستمرار لمعرفة القدرات الجديدة التي يرغب العملاء في الحصول عليها، ومن المؤكد أن إنشاء الفيديو يظهر في المحادثات مع العملاء”. “أطلب منك أن تظل على اطلاع.”

في خبر أخير يتعلق بـ Titan، أصدرت AWS الجيل الثاني من نموذج Titan Embeddings، Titan Text Embeddings V2. يقوم Titan Text Embeddings V2 بتحويل النص إلى تمثيلات رقمية تسمى التضمينات لتشغيل تطبيقات البحث والتخصيص. وكذلك فعل الجيل الأول من نموذج Embeddings – لكن AWS تدعي أن Titan Text Embeddings V2 أكثر كفاءة وفعالية من حيث التكلفة ودقة بشكل عام.

“ما يفعله نموذج Embeddings V2 هو تقليل مساحة التخزين الإجمالية [necessary to use the model] بما يصل إلى أربع مرات مع الاحتفاظ بنسبة 97% من الدقة،” كما ادعى فيلومين، “متفوقًا على النماذج الأخرى المماثلة.”

سنرى ما إذا كان اختبار العالم الحقيقي سيثبت ذلك.