تقنية

تقوم Databricks بتوسيع Mosaic AI لمساعدة المؤسسات على البناء باستخدام حاملي شهادات LLM


قبل عام، استحوذت شركة Databricks على شركة MosaicML مقابل 1.3 مليار دولار. والآن تم تغيير علامتها التجارية لتصبح Mosaic AI، وأصبحت المنصة جزءًا لا يتجزأ من حلول الذكاء الاصطناعي الخاصة بشركة Databricks. اليوم، في قمة Data + AI للشركة، تطلق عددًا من الميزات الجديدة للخدمة. قبل الإعلانات، تحدثت مع الرئيس التنفيذي لمؤسسي Databricks علي قدسي والمدير التنفيذي للتكنولوجيا ماتي زهاريا.

تطلق Databricks خمس أدوات Mosaic AI جديدة في مؤتمرها: Mosaic AI Agent Framework، وتقييم وكيل Mosaic AI، وكتالوج أدوات Mosaic AI، وMosaic AI Model Training، وMosaic AI Gateway.

“لقد كان عامًا رائعًا، شهد تطورات هائلة في مجال الذكاء الاصطناعي. أخبرني قدسي أن الجميع متحمسون لذلك. “لكن الأشياء التي يهتم بها الجميع لا تزال هي نفس الأشياء الثلاثة: كيف يمكننا رفع جودة أو موثوقية هذه النماذج؟ رقم اثنين، كيف نتأكد من أنها فعالة من حيث التكلفة؟ وهناك تباين كبير في التكلفة بين النماذج هنا – فرق هائل في السعر. وثالثًا، كيف يمكننا أن نفعل ذلك بطريقة نحافظ فيها على خصوصية بياناتنا؟

تهدف عمليات الإطلاق اليوم إلى تغطية غالبية هذه المخاوف لعملاء Databricks.

وأشار زهاريا أيضًا إلى أن الشركات التي تنشر الآن نماذج لغوية كبيرة (LLMs) في الإنتاج تستخدم أنظمة تحتوي على مكونات متعددة. وهذا يعني غالبًا أنهم يقومون باستدعاءات متعددة لنموذج (أو ربما نماذج متعددة أيضًا)، ويستخدمون مجموعة متنوعة من الأدوات الخارجية للوصول إلى قواعد البيانات أو القيام بالاسترجاع المعزز (RAG). تعمل هذه الأنظمة المركبة على تسريع التطبيقات المستندة إلى LLM، وتوفير المال باستخدام نماذج أرخص لاستعلامات محددة أو نتائج التخزين المؤقت، وربما الأهم من ذلك، جعل النتائج أكثر جدارة بالثقة وملاءمة من خلال زيادة النماذج الأساسية ببيانات خاصة.

وأوضح: “نعتقد أن هذا هو مستقبل تطبيقات الذكاء الاصطناعي عالية التأثير وذات المهام الحرجة”. “لأنه إذا فكرت في الأمر، إذا كنت تفعل شيئًا بالغ الأهمية حقًا، فسوف تريد أن يكون المهندسون قادرين على التحكم في جميع جوانبه – ويمكنك القيام بذلك باستخدام نظام معياري. لذلك نحن نعمل على تطوير الكثير من الأبحاث الأساسية حول أفضل طريقة لإنشاء هذه الأشياء [systems] لمهمة محددة حتى يتمكن المطورون من العمل معهم بسهولة وربط جميع الأجزاء وتتبع كل شيء من خلاله ومعرفة ما يحدث.

أما بالنسبة لبناء هذه الأنظمة فعليًا، تطلق Databricks خدمتين هذا الأسبوع: Mosaic AI Agent Framework وMosaic AI Tools Catalog. يأخذ AI Agent Framework وظيفة البحث المتجه بدون خادم للشركة، والتي أصبحت متاحة بشكل عام الشهر الماضي وتوفر للمطورين الأدوات اللازمة لإنشاء تطبيقاتهم المستندة إلى RAG علاوة على ذلك.

أكد قدسي وزاهريا على أن نظام البحث المتجه Databricks يستخدم أسلوبًا هجينًا، يجمع بين البحث الكلاسيكي القائم على الكلمات الرئيسية مع البحث المضمن. تم دمج كل هذا بشكل عميق مع مستودع بيانات Databricks ويتم دائمًا الحفاظ على مزامنة البيانات الموجودة على كلا النظامين الأساسيين تلقائيًا. يتضمن ذلك ميزات الإدارة الخاصة بمنصة Databricks الشاملة – وعلى وجه التحديد طبقة إدارة Databricks Unity Catalog – لضمان، على سبيل المثال، عدم تسرب المعلومات الشخصية إلى خدمة البحث المتجه.

عند الحديث عن Unity Catalog (الذي تفتح الشركة الآن مصادره ببطء)، تجدر الإشارة إلى أن Databricks تعمل الآن على توسيع هذا النظام للسماح للمؤسسات بالتحكم في أدوات ووظائف الذكاء الاصطناعي التي يمكن أن يستعين بها حاملو شهادة الماجستير في القانون عند إنشاء الإجابات. وتقول Databricks إن هذا الكتالوج سيجعل هذه الخدمات أكثر قابلية للاكتشاف عبر الشركة.

أبرز قدسي أيضًا أنه يمكن للمطورين الآن استخدام كل هذه الأدوات لبناء وكلاء خاصين بهم من خلال ربط النماذج والوظائف معًا باستخدام Langchain أو LlamaIndex، على سبيل المثال. وبالفعل، أخبرني زهاريا أن الكثير من عملاء Databricks يستخدمون هذه الأدوات بالفعل اليوم.

“هناك الكثير من الشركات التي تستخدم هذه الأشياء، حتى سير العمل الشبيه بالوكيل. أعتقد أن الناس غالبًا ما يتفاجأون بعددهم، ولكن يبدو أن هذا هو الاتجاه الذي تسير فيه الأمور. وقد وجدنا أيضًا في تطبيقات الذكاء الاصطناعي الداخلية لدينا، مثل التطبيقات المساعدة لمنصتنا، أن هذه هي الطريقة لبنائها.

لتقييم هذه التطبيقات الجديدة، تطلق Databricks أيضًا Mosaic AI Agent Evaluation، وهي أداة تقييم مدعومة بالذكاء الاصطناعي تجمع بين القضاة المعتمدين على LLM لاختبار مدى جودة أداء الذكاء الاصطناعي في الإنتاج، ولكنها تسمح أيضًا للمؤسسات بالحصول على تعليقات المستخدمين بسرعة (والسماح يقومون بتسمية بعض مجموعات البيانات الأولية أيضًا). يشتمل مختبر الجودة على مكون واجهة المستخدم استنادًا إلى استحواذ Databricks على Lilac في وقت سابق من هذا العام، والذي يتيح للمستخدمين تصور مجموعات بيانات نصية ضخمة والبحث فيها.

“يقول كل عميل لدينا: أحتاج إلى إجراء بعض التصنيفات داخليًا، وسأطلب من بعض الموظفين القيام بذلك. وأوضح قدسي: “أحتاج فقط إلى 100 إجابة، أو ربما 500 إجابة – وبعد ذلك يمكننا تقديم ذلك إلى حكام ماجستير الحقوق”.

هناك طريقة أخرى لتحسين النتائج وهي استخدام النماذج المضبوطة بدقة. ولهذا السبب، تقدم Databricks الآن خدمة Mosaic AI Model Training، والتي – كما خمنت – تسمح لمستخدميها بضبط النماذج مع البيانات الخاصة لمؤسستهم لمساعدتهم على الأداء بشكل أفضل في مهام محددة.

الأداة الجديدة الأخيرة هي Mosaic AI Gateway، والتي تصفها الشركة بأنها “واجهة موحدة للاستعلام عن أي نموذج مفتوح المصدر أو خاص وإدارته ونشره”. الفكرة هنا هي السماح للمستخدمين بالاستعلام عن أي LLM بطريقة محكومة، باستخدام مخزن بيانات الاعتماد المركزي. ففي نهاية المطاف، لا توجد مؤسسة ترغب في أن يقوم مهندسوها بإرسال بيانات عشوائية إلى خدمات الطرف الثالث.

في أوقات تقلص الميزانيات، تسمح بوابة الذكاء الاصطناعي أيضًا لتكنولوجيا المعلومات بوضع حدود الأسعار لموردين مختلفين للحفاظ على إمكانية التحكم في التكاليف. بالإضافة إلى ذلك، تحصل هذه المؤسسات أيضًا على تتبع الاستخدام والتتبع لتصحيح أخطاء هذه الأنظمة.

وكما أخبرني قدسي، فإن كل هذه الميزات الجديدة هي رد فعل على كيفية عمل مستخدمي Databricks الآن مع حاملي شهادات LLM. “لقد شهدنا تحولًا كبيرًا يحدث في السوق خلال الربع ونصف الأخير. بداية العام الماضي، أي شخص تتحدث إليه، سيقول: نحن مؤيدون للمصادر المفتوحة، والمصادر المفتوحة رائعة. لكن عندما شجعت الناس حقًا، كانوا يستخدمون الذكاء الاصطناعي المفتوح. الجميع، بغض النظر عما قالوا، بغض النظر عن مدى ترويجهم لمدى روعة المصدر المفتوح، خلف الكواليس، كانوا يستخدمون Open AI. الآن، أصبح هؤلاء العملاء أكثر تطورًا ويستخدمون نماذج مفتوحة (عدد قليل جدًا منهم مفتوح المصدر بالطبع)، الأمر الذي يتطلب منهم بدوره اعتماد مجموعة جديدة تمامًا من الأدوات لمعالجة المشكلات – والفرص – التي تأتي مع الذي – التي.


اكتشاف المزيد من موقع fffm

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى

اكتشاف المزيد من موقع fffm

اشترك الآن للاستمرار في القراءة والحصول على حق الوصول إلى الأرشيف الكامل.

Continue reading