تقنية

تدعي أنثروبيك أن أحدث طراز لها هو الأفضل في فئتها


تطلق شركة Anthropic المنافسة لـ OpenAI نموذجًا قويًا جديدًا للذكاء الاصطناعي يسمى Claude 3.5 Sonnet. لكنها خطوة تدريجية أكثر من كونها قفزة هائلة إلى الأمام.

يمكن لـ Claude 3.5 Sonnet تحليل كل من النص والصور بالإضافة إلى إنشاء نص، وهو النموذج الأنثروبي الأفضل أداءً حتى الآن – على الورق على الأقل. عبر العديد من معايير الذكاء الاصطناعي للقراءة والترميز والرياضيات والرؤية، يتفوق Claude 3.5 Sonnet على النموذج الذي يحل محله، Claude 3 Sonnet، و يتفوق على الطراز الرائد السابق لشركة Anthropic Claude 3 Opus.

لا تعد المعايير المرجعية بالضرورة المقياس الأكثر فائدة لتقدم الذكاء الاصطناعي، ويرجع ذلك جزئيًا إلى أن العديد منها يختبر حالات هامشية مقصورة على فئة معينة لا تنطبق على الشخص العادي، مثل الإجابة على أسئلة الاختبار الصحي. ولكن مقابل ما يستحق، كلود 3.5 السوناتة بالكاد أفضل النماذج الرائدة المنافسة، بما في ذلك GPT-4o الذي أطلقته OpenAI مؤخرًا، وفقًا للمعايير التي اختبرتها Anthropic.

إلى جانب النموذج الجديد، تطلق Anthropic ما تسميه Artifacts، وهي مساحة عمل يمكن للمستخدمين من خلالها تحرير وإضافة المحتوى – مثل التعليمات البرمجية والمستندات – التي تم إنشاؤها بواسطة نماذج Anthropic. تقول Anthropic إن Artifacts قيد المعاينة حاليًا، وستكتسب ميزات جديدة، مثل طرق التعاون مع فرق أكبر وتخزين قواعد المعرفة، في المستقبل القريب.

التركيز على الكفاءة

يعد Claude 3.5 Sonnet أكثر أداءً قليلاً من Claude 3 Opus، وتقول Anthropic أن النموذج يفهم بشكل أفضل التعليمات الدقيقة والمعقدة، بالإضافة إلى مفاهيم مثل الفكاهة. (على الرغم من أن الذكاء الاصطناعي غير مضحك.) ولكن ربما الأهم من ذلك بالنسبة للمطورين الذين ينشئون تطبيقات باستخدام Claude والتي تتطلب استجابات سريعة (مثل روبوتات الدردشة لخدمة العملاء)، فإن 3.5 Sonnet أسرع. إنها ضعف سرعة 3 Opus، كما تدعي Anthropic.

الرؤية – تحليل الصور – هي أحد المجالات التي تحسن فيها Claude 3.5 Sonnet بشكل كبير مقارنة بـ 3 Opus، وفقًا لـ Anthropic. 3.5 يمكن لـ Sonnet تفسير المخططات والرسوم البيانية بشكل أكثر دقة ونسخ النص من صور “غير كاملة”، مثل الصور ذات التشوهات والتحف البصرية.

يقول مايكل غيرستنهابر، رئيس المنتج في Anthropic، إن التحسينات جاءت نتيجة التعديلات المعمارية وبيانات التدريب الجديدة، بما في ذلك البيانات التي تم إنشاؤها بواسطة الذكاء الاصطناعي. ما هي البيانات على وجه التحديد؟ لم يكشف Gerstenhaber عن ذلك، لكنه أشار ضمنًا إلى أن Claude 3.5 Sonnet يستمد الكثير من قوته من مجموعات التدريب هذه.

اعتمادات الصورة: أنثروبي

“ما يهم [businesses] وقال غيرستينهابر لـ TechCrunch: “إن الأمر يتعلق بما إذا كان الذكاء الاصطناعي يساعدهم في تلبية احتياجات أعمالهم أم لا، وليس ما إذا كان الذكاء الاصطناعي قادرًا على المنافسة وفقًا للمعايير أم لا”. “ومن هذا المنظور، أعتقد أن Claude 3.5 Sonnet سيكون خطوة متقدمة على أي شيء آخر متوفر لدينا – وأيضًا متقدم على أي شيء آخر في الصناعة.”

قد تكون السرية المحيطة ببيانات التدريب لأسباب تنافسية. ولكن يمكن أيضًا أن يكون ذلك لحماية الأنثروبيك من التحديات القانونية – وخاصة التحديات المتعلقة بالاستخدام العادل. لم تقرر المحاكم بعد ما إذا كان البائعون مثل Anthropic ومنافسوها، مثل OpenAI وGoogle وAmazon وما إلى ذلك، لهم الحق في التدريب على البيانات العامة، بما في ذلك البيانات المحمية بحقوق الطبع والنشر، دون تعويض أو اعتماد منشئي تلك البيانات.

لذلك، كل ما نعرفه هو أن Claude 3.5 Sonnet تم تدريبه على الكثير من النصوص والصور، مثل نماذج Anthropic السابقة، بالإضافة إلى ردود الفعل من المختبرين البشريين لمحاولة “مواءمة” النموذج مع نوايا المستخدمين، على أمل منعه من إطلاق مواد سامة أو غير ذلك. نص إشكالي.

أنثروبي كلود 3.5 السوناتة
اعتمادات الصورة: أنثروبي

ماذا نعرف؟ حسنًا، تبلغ نافذة سياق Claude 3.5 Sonnet — مقدار النص الذي يمكن للنموذج تحليله قبل إنشاء نص جديد — 200000 رمز، وهو نفس عدد 3 Sonnet. الرموز عبارة عن أجزاء مقسمة من البيانات الأولية، مثل المقاطع الصوتية “fan” و”tas” و”tic” في كلمة “fantastic”؛ 200.000 رمز يعادل حوالي 150.000 كلمة.

ونحن نعلم أن كلود 3.5 السوناتة متاح اليوم. يمكن للمستخدمين المجانيين لعميل الويب Anthropic وتطبيق Claude iOS الوصول إليه مجانًا؛ يحصل المشتركون في خطط Anthropic المدفوعة، Claude Pro وClaude Team، على حدود أسعار أعلى بمقدار 5 أضعاف. 3.5 Sonnet موجود أيضًا على واجهة برمجة تطبيقات Anthropic والمنصات المُدارة مثل Amazon Bedrock وVertex AI من Google Cloud.

قال غيرستنهابر: “يعد Claude 3.5 Sonnet حقًا تغييرًا تدريجيًا في الذكاء دون التضحية بالسرعة، وهو يهيئنا للإصدارات المستقبلية على طول عائلة طرازات Claude بأكملها”.

يقوم Claude 3.5 Sonnet أيضًا بتشغيل Artifacts، والتي تنبثق نافذة مخصصة في عميل الويب Claude عندما يطلب المستخدم من النموذج إنشاء محتوى مثل مقتطفات التعليمات البرمجية أو المستندات النصية أو تصميمات مواقع الويب. يوضح Gerstenhaber: “المصنوعات اليدوية هي مخرجات النموذج التي تضع المحتوى الذي تم إنشاؤه جانبًا وتسمح لك، كمستخدم، بالتكرار على هذا المحتوى. لنفترض أنك تريد إنشاء تعليمات برمجية – سيتم وضع القطعة الأثرية في واجهة المستخدم، وبعد ذلك يمكنك التحدث مع كلود وتكرار المستند لتحسينه حتى تتمكن من تشغيل التعليمات البرمجية.

الصورة الاكبر

إذًا ما هي أهمية Claude 3.5 Sonnet في السياق الأوسع للأنثروبيك – والنظام البيئي للذكاء الاصطناعي، في هذا الصدد؟

يوضح كلود 3.5 السوناتة أن التقدم التدريجي هو مدى ما يمكن أن نتوقعه الآن على جبهة النموذج، باستثناء تحقيق تقدم كبير في الأبحاث. شهدت الأشهر القليلة الماضية إصدارات رئيسية من Google (Gemini 1.5 Pro) وOpenAI (GPT-4o) والتي تحرك الإبرة بشكل هامشي من حيث الأداء المعياري والنوعي. ولكن لم تكن هناك قفزة لمطابقة القفزة من GPT-3 إلى GPT-4 منذ فترة طويلة، وذلك بسبب جمود بنيات النماذج الحالية والحوسبة الهائلة التي تتطلبها التدريب.

في الوقت الذي يحول فيه بائعو الذكاء الاصطناعي التوليدي اهتمامهم إلى تنظيم البيانات وترخيصها بدلاً من البنى الجديدة الواعدة القابلة للتطوير، هناك دلائل على أن المستثمرين أصبحوا حذرين من المسار الأطول من المتوقع لعائد الاستثمار للذكاء الاصطناعي التوليدي. لقد تم تحصين الأنثروبيك إلى حد ما من هذا الضغط، حيث أنها في موقف تحسد عليه فيما يتعلق بتأمين أمازون (وبدرجة أقل جوجل) ضد OpenAI. لكن إيرادات الشركة، التي من المتوقع أن تصل إلى ما يقل قليلاً عن مليار دولار بحلول نهاية عام 2024، تمثل جزءًا صغيرًا من إيرادات OpenAI – وأنا متأكد من أن داعمي Anthropic لا يسمحون لها بنسيان هذه الحقيقة.

على الرغم من قاعدة العملاء المتنامية التي تشمل العلامات التجارية المنزلية مثل Bridgewater، وBrave، وSlack، وDuckDuckGo، لا تزال Anthropic تفتقر إلى طابع مؤسسي معين. ومن المثير للاهتمام أن OpenAI – وليس الأنثروبي – هو الذي أبرمت معه شركة برايس ووترهاوس كوبرز شراكة مؤخرًا لإعادة بيع عروض الذكاء الاصطناعي التوليدية للمؤسسة.

لذا فإن Anthropic تتخذ نهجًا استراتيجيًا ومدروسًا جيدًا لتحقيق نجاحات، واستثمار وقت التطوير في منتجات مثل Claude 3.5 Sonnet لتقديم أداء أفضل قليلاً بأسعار السلع الأساسية. يتم تسعير 3.5 Sonnet بنفس سعر 3 Sonnet: 3 دولارات لكل مليون رمز يتم إدخاله في النموذج و15 دولارًا لكل مليون رمز يتم إنشاؤه بواسطة النموذج.

تحدث Gerstenhaber عن هذا في محادثتنا. وقال: “عندما تقوم بإنشاء تطبيق، لا ينبغي للمستخدم النهائي أن يعرف النموذج الذي يتم استخدامه أو كيف قام المهندس بتحسين تجربته، ولكن يمكن أن يكون لدى المهندس الأدوات المتاحة لتحسين تلك التجربة على طول المتجهات التي تحتاج إلى التحسين، والتكلفة هي بالتأكيد واحدة منها.

كلود 3.5 السوناتة لا يحل مشكلة الهلوسة. يكاد يكون من المؤكد أنه يرتكب أخطاء. ولكن قد يكون الأمر جذابًا بدرجة كافية لجعل المطورين والشركات يتحولون إلى منصة Anthropic. وفي نهاية المطاف، هذا ما يهم الأنثروبيك.

ولتحقيق هذه الغاية نفسها، ضاعفت شركة Anthropic أدوات مثل الذكاء الاصطناعي التوجيهي التجريبي، الذي يتيح للمطورين “توجيه” الميزات الداخلية لنماذجها؛ عمليات التكامل للسماح لنماذجها باتخاذ الإجراءات داخل التطبيقات؛ والأدوات المبنية على القمة من نماذجها مثل تجربة التحف المذكورة أعلاه. كما تم تعيين أحد مؤسسي Instagram كرئيس للمنتج. كما قامت بتوسيع نطاق توافر منتجاتها، وكان آخرها جلب كلود إلى أوروبا وإنشاء مكاتب في لندن ودبلن.

يبدو أن الأنثروبي قد توصل إلى فكرة مفادها أن بناء نظام بيئي حول النماذج – وليس مجرد نماذج معزولة – هو المفتاح للاحتفاظ بالعملاء مع تضييق فجوة القدرات بين النماذج.

ومع ذلك، أصر جيرستنهابر على أن النماذج الأكبر والأفضل – مثل Claude 3.5 Opus – في الأفق القريب، مع ميزات مثل البحث على الويب والقدرة على تذكر التفضيلات.

“لم أرَ التعلم العميق يصل إلى طريق مسدود بعد، وسأترك الأمر للباحثين للتكهن بشأن هذا الجدار، لكنني أعتقد أنه من المبكر بعض الشيء التوصل إلى استنتاجات حول ذلك، خاصة إذا نظرت إلى الوتيرة وقال “الابتكار”. “هناك تطور سريع للغاية وابتكار سريع للغاية، وليس لدي أي سبب للاعتقاد بأنه سوف يتباطأ.”

سوف نرى.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى