تقنية

تطلق الأنثروبور نموذجًا جديدًا من الذكاء الاصطناعى “يفكر” طالما تريد


تطلق الأنثروبور نموذجًا جديدًا لـ Frontier AI يسمى Claude 3.7 Sonnet ، والتي صممت الشركة “للتفكير” في الأسئلة طالما أن المستخدمين يريدون ذلك.

يدعو الأنثروبور Claude 3.7 Sonnet أول نموذج “AI Hybrid AI” ، لأنه نموذج واحد يمكن أن يعطي كل من الإجابات في الوقت الفعلي وأكثر “مدروسًا” للإجابات على الأسئلة. يمكن للمستخدمين اختيار ما إذا كان سيتم تنشيط قدرات “التفكير” لنموذج الذكاء الاصطناعى ، الأمر الذي يدفع كلود 3.7 Sonnet إلى “التفكير” لفترة قصيرة أو طويلة من الزمن.

يمثل النموذج الجهد الأوسع للأنثروبولوجيا لتبسيط تجربة المستخدم حول منتجات AI الخاصة به. تحتوي معظم AI chatbots اليوم على منتقي طراز شاق يجبر المستخدمين على الاختيار من بين العديد من الخيارات المختلفة التي تختلف في التكلفة والقدرة. إن المختبرات مثل الأنثروبور تفضل ألا تضطر إلى التفكير في الأمر – من الناحية المثالية ، يقوم أحد النماذج بكل العمل.

قال كلود 3.7 Sonnet لجميع المستخدمين والمطورين يوم الاثنين ، وقال أنثروبور ، لكن فقط المستخدمين الذين يدفعون لخطط chatbot المتميزة من الأنثروبور سيتمكنون من الوصول إلى ميزات التفكير في الطراز. سيحصل مستخدمو كلود المجانيين على الإصدار القياسي غير المعتاد من Claude 3.7 Sonnet ، والذي يتفوق عليه الادعاءات الأنثروبرية نموذجها السابق للحدود AI ، Claude 3.5 Sonnet. (نعم ، تخطت الشركة رقمًا.)

تكلف كلود 3.7 Sonnet 3 دولارات لكل مليون رموز إدخال (مما يعني أنه يمكنك إدخال ما يقرب من 750،000 كلمة ، وكلمات أكثر من سلسلة Lord of the Rings بأكملها ، إلى Claude مقابل 3 دولارات) و 15 دولارًا لكل مليون رموز إخراج. هذا يجعلها أغلى من Openai’s O3-MINI (1.10 دولار لكل 1 مليون رموز إدخال/4.40 دولار لكل رموز الإخراج 1M) و DEERSEEK’s R1 (0.55 دولار لكل 1 مليون رموز إدخال/2.19 دولار لكل 1M رموز الإخراج) ، ولكن ضع في اعتبارك أن O3-MINI و R1 هي نماذج التفكير الصارم – وليس الهجينة مثل كلود 3.7 السوناتة.

أوضاع التفكير الأنثروبور الجديدة اعتمادات الصورة: الإنسان

كلود 3.7 Sonnet هو أول نموذج من الذكاء الاصطناعى في الأنثروبور يمكنه “العقل” ، وهي تقنية تحولت إلى العديد من مختبرات الذكاء الاصطناعي كطرق تقليدية لتحسين أداء AI.

استخدام نماذج التفكير مثل O3-Mini و R1 و Gemini 2.0 Flash Thinking و Xai’s Grok 3 (Think) استخدام المزيد من الوقت وقوة الحوسبة قبل الإجابة على الأسئلة. تنقسم النماذج المشكلات إلى خطوات أصغر ، والتي تميل إلى تحسين دقة الإجابة النهائية. نماذج التفكير لا تفكر أو تفكير مثل الإنسان ، بالضرورة ، ولكن تم تصميم عمليتها بعد الخصم.

في النهاية ، تود الإنسان الأنثروبور أن يكتشف كلود المدة التي يجب أن “يجب أن تفكر فيها” حول الأسئلة بمفردها ، دون الحاجة إلى اختيار المستخدمين مقدمًا ، حسبما قال ديان بن بير ، ديان بن ، في مقابلة.

وكتبت الأنثروبور في منشور مدونة مشتركة مع TechCrunch ، “على غرار كيف ليس لدى البشر أدمغة منفصلة للأسئلة التي يمكن الإجابة عليها فورًا مقابل تلك التي تتطلب التفكير”. يجب دمجها بسلاسة مع القدرات الأخرى ، بدلاً من أن يتم توفيرها في نموذج منفصل. “

تقول الأنثروبور إنها تسمح لـ Claude 3.7 Sonnet بإظهار مرحلة التخطيط الداخلي من خلال “لوحة خدش مرئية”. أخبر Lee أن مستخدمي TechCrunch سيرون عملية التفكير الكامل لكلود لمعظم المطالبات ، ولكن قد يتم تنقيح بعض الأجزاء لأغراض الثقة والسلامة.

عملية تفكير كلود في تطبيق كلود (الائتمان: الإنسان)

تقول الأنثروبور إنه يحسن أوضاع تفكير كلود للمهام الواقعية ، مثل مشاكل الترميز الصعبة أو المهام الوكيل. يمكن للمطورين النقر على واجهة برمجة تطبيقات الأنثروبور التحكم في “الميزانية” للتفكير وسرعة التداول وتكلفة جودة الإجابة.

في اختبار واحد لقياس مهام الترميز في الكلمة الحقيقية ، كان كلود 3.7 Swe-bench ، دقيقًا بنسبة 62.3 ٪ ، مقارنة بنموذج Openai’s O3-Mini الذي سجل 49.3 ٪. في اختبار آخر لقياس قدرة نموذج الذكاء الاصطناعى على التفاعل مع المستخدمين المحاكاة وواجهة برمجة التطبيقات الخارجية في إعداد البيع بالتجزئة ، سجل كلود 3.7 سونيت 81.2 ٪ ، مقارنةً بنموذج Openai الذي سجل 73.5 ٪.

يقول الأنثروبري أيضًا إن كلود 3.7 سونيت سيرفض الإجابة على الأسئلة أقل من نماذجها السابقة ، مدعيا أن النموذج قادر على إجراء تمييز أكثر دقة بين المطالبات الضارة والحميدة. يقول الأنثروبور إنه يقلل من الرفض غير الضروري بنسبة 45 ٪ مقارنة بـ Claude 3.5 Sonnet. يأتي هذا في وقت تقوم فيه بعض مختبرات AI الأخرى بإعادة التفكير في مقاربتها لتقييد إجابات AI chatbot.

بالإضافة إلى Claude 3.7 Sonnet ، تطلق الأنثروبور أيضًا أداة ترميز وكيل تسمى Claude Code. بعد إطلاق معاينة البحث ، تتيح الأداة للمطورين تشغيل مهام محددة من خلال كلود مباشرة من محطةهم.

في العرض التجريبي ، أظهر الموظفون الأنثروبريون كيف يمكن لـ Claude Code تحليل مشروع الترميز مع أمر بسيط مثل ، اشرح بنية المشروع هذا. ” باستخدام اللغة الإنجليزية العادية في سطر الأوامر ، يمكن للمطور تعديل قاعدة كود. سوف يصف Claude Code تعديلاته أثناء إجراء تغييرات ، وحتى اختبار مشروع للأخطاء أو دفعه إلى مستودع GitHub.

وقال متحدث باسم أنثروبور لـ TechCrunch إن Claude Code سيكون متاحًا في البداية لعدد محدود من المستخدمين على أساس “First Come First Serve”.

تطلق الأنثروبور كلود 3.7 سونيت في وقت تقوم فيه AI Labs بشحن طرز الذكاء الاصطناعى الجديدة بوتيرة كسر. تاريخيا اتخذت الأنثروبور نهجا أكثر منهجية تركز على السلامة. لكن هذه المرة ، تتطلع الشركة إلى قيادة الحزمة.

إلى متى هو السؤال. قد يكون Openai على وشك إطلاق نموذج AI المختلط من تلقاء نفسه ؛ قال الرئيس التنفيذي للشركة ، سام التمان ، إنها ستصل في “أشهر”.


اكتشاف المزيد من موقع fffm

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى

اكتشاف المزيد من موقع fffm

اشترك الآن للاستمرار في القراءة والحصول على حق الوصول إلى الأرشيف الكامل.

Continue reading