تقنية

يمكن أن تسبب نماذج كلود 4 منظمة العفو الدولية الجديدة في الأنثروبري


خلال مؤتمر المطور الافتتاحي يوم الخميس ، أطلقت الأنثروبور نموذجين جديدين من الذكاء الاصطناعى الذي تدعي شركة بدء التشغيل من بين أفضل ما في هذا المجال ، على الأقل من حيث كيفية تسجيلهم في المعايير الشعبية.

يمكن لـ Claude Opus 4 و Claude Sonnet 4 ، وهي جزء من عائلة النماذج الجديدة في الأنثروبور ، Claude 4 ، تحليل مجموعات البيانات الكبيرة ، وتنفيذ مهام الأفق الطويلة ، واتخاذ إجراءات معقدة ، وفقًا للشركة. يقول أنثروبور إن كلا النموذجين تم ضبطهما لأداء جيد في مهام البرمجة ، مما يجعلها مناسبة تمامًا للكتابة والتحرير.

سيتمكن كل من المستخدمين الذين يدفعون ومستخدمي تطبيقات chatbot المجانية للشركة من الوصول إلى Sonnet 4 ، ولكن فقط يدفع المستخدمون الذين سيحصلون على Opus 4. من أجل API من أنثروبولوجيا ، عبر منصة الأساس من Amazon و Vertex AI من Google ، سيكون سعر Opus 4 بمبلغ 15 دولارًا/مبلغًا من الرفاهية (الإدخال/المخرجات) و Sonnet 4 مقابل 15 دولارًا لكل مليون دولار.

الرموز هي أجزاء من البيانات الخام التي تعمل بها نماذج الذكاء الاصطناعى ، مع مليون رموز تعادل حوالي 750،000 كلمة – حوالي 163000 كلمة أطول من “الحرب والسلام”.

ائتمانات الصورة:الإنسان

تصل نماذج كلود 4 من الإنسان حيث تتطلع الشركة إلى زيادة الإيرادات بشكل كبير. يقال إن الزي ، الذي أسسه الباحثون السابقون ، يهدف إلى الحصول على 12 مليار دولار من الأرباح في عام 2027 ، بزيادة من 2.2 مليار دولار هذا العام. أغلقت الأنثروبور مؤخرًا تسهيلًا ائتمانيًا بقيمة 2.5 مليار دولار وجمع مليارات الدولارات من Amazon وغيرهم من المستثمرين تحسباً للتكاليف المتزايدة المرتبطة بالنماذج الحدودية النامية.

لم يسهل المنافسون من السهل الحفاظ على وضع القطب في سباق الذكاء الاصطناعي. في حين أطلقت الأنثروبور نموذجًا جديدًا من الذكاء الاصطناعي الرائد في وقت سابق من هذا العام ، فقد تسابق كلود سونيت 3.7 ، إلى جانب أداة ترميز وكيل تسمى Claude Code ، المنافسين بما في ذلك Openai و Google للتغلب على الشركة مع نماذج قوية وأدوات Dev الخاصة بهم.

تلعب الإنسان من أجل Keeps مع Claude 4.

يقول الإنسان إن الأنثروبور إن أكثر قدرة على النموذجين المقدمة اليوم ، OPUS 4 ، يمكنه الحفاظ على “الجهد المركّز” عبر العديد من الخطوات في سير العمل. وفي الوقت نفسه ، فإن Sonnet 4-المصممة كـ “بديل إسقاط” لـ Sonnet 3.7-يتحسن في الترميز والرياضيات مقارنةً بالنماذج السابقة للأنثروبولوجيا ويتبع التعليمات بشكل أكثر دقة ، وفقًا للشركة.

إن عائلة كلود 4 هي أيضًا أقل احتمالًا من Sonnet 3.7 للانخراط في “مكافأة القرصنة” ، كما تدعي الأنثروبور. يعد Hacking Hacking ، المعروف أيضًا باسم Gaming Gaming ، سلوكًا حيث تأخذ النماذج اختصارات وثغرات لإكمال المهام.

لكي نكون واضحين ، لم تسفر هذه التحسينات إلى العالم أفضل نماذج من كل معيار. على سبيل المثال ، بينما يتفوق Opus 4 يتفوق على Google Gemini 2.5 Pro و Openai’s O3 و GPT-4.1 على Swe-bench ، والذي تم تصميمه لتقييم قدرات ترميز النموذج ، فإنه لا يمكن أن يتجاوز O3 في التقييم متعدد الوسائط MMMU أو GPQA Diamond ، وهي مجموعة من علم الأحياء على مستوى PHD ، والفيزياء ، والكيمياء.

الأنثروبور كلود 4
نتائج الاختبارات القياسية الداخلية للأنثروبور.ائتمانات الصورة:الإنسان

ومع ذلك ، فإن الأنثروبور تطلق OPUS 4 تحت ضمانات أكثر صرامة ، بما في ذلك كاشفات المحتوى الضارة المعززة ودفاعات الأمن السيبراني. تدعي الشركة أن اختبارها الداخلي وجدت أن OPUS 4 “قد” يزيد بشكل كبير من قدرة شخص لديه خلفية ساق على الحصول على أو إنتاج أو نشر أسلحة كيميائية أو بيولوجية أو نووية ، حيث يصل إلى مواصفات نموذج “ASL-3” للأنثروبولوجيا.

كل من Opus 4 و Sonnet 4 هما نماذج “هجينة” ، كما يقول الإنسان-قادرة على الاستجابات القريبة من الثابت والتفكير الممتد للتفكير الأعمق (إلى الحد الذي يمكن أن “العقل” و “التفكير” كما يفهم البشر هذه المفاهيم). مع تشغيل وضع التفكير ، يمكن أن تستغرق النماذج مزيدًا من الوقت للنظر في الحلول الممكنة لمشكلة معينة قبل الإجابة.

كما يسبب النماذج ، فإنهم سيظهرون ملخصًا “سهل الاستخدام” لعملية التفكير الخاصة بهم ، كما يقول الأنثروبور. لماذا لا تظهر كل شيء؟ جزئيا لحماية “المزايا التنافسية” للأنثروبولوجيا ، تعترف الشركة في مسودة مدونة منشور المقدمة إلى TechCrunch.

يمكن لـ Opus 4 و Sonnet 4 استخدام أدوات متعددة ، مثل محركات البحث ، بالتوازي ، والبديل بين التفكير والأدوات لتحسين جودة إجاباتهم. يمكنهم أيضًا استخراج وإنقاذ الحقائق في “الذاكرة” للتعامل مع المهام بشكل أكثر موثوقية ، وبناء ما يصفه الإنسان بأنه “المعرفة الضمنية” مع مرور الوقت.

لجعل النماذج أكثر ملاءمة للمبرمج ، يتم طرح الترقيات الأنثروبرية إلى رمز كلود المذكور أعلاه. Claude Code ، الذي يتيح للمطورين تشغيل مهام محددة من خلال نماذج الإنسان مباشرة من محطة ، يتكامل الآن مع IDES ويوفر SDK يتيح لـ Devs توصيلها بتطبيقات الطرف الثالث.

يتيح Claud Code SDK ، الذي تم الإعلان عنه في وقت سابق من هذا الأسبوع ، تشغيل رمز Claude كعملية فرعية في أنظمة التشغيل المدعومة ، مما يوفر وسيلة لبناء مساعدين وأدوات ترميز تعمل بالنيابة التي تستفيد من إمكانات طرازات كلود.

أصدرت الأنثروبور امتدادات رمز Claude وموصلات لرمز Microsoft VS و JetBrains و Github. يتيح موصل GitHub للمطورين وضع علامة على رمز Claude للرد على ملاحظات المراجع ، وكذلك محاولة إصلاح الأخطاء في الكود – أو تعديلها بطريقة أخرى.

لا تزال نماذج الذكاء الاصطناعى تكافح لترميز برامج الجودة. يميل الذكاء الاصطناعي المولد بالدولة إلى تقديم نقاط الضعف والأخطاء الأمنية ، بسبب نقاط الضعف في مجالات مثل القدرة على فهم منطق البرمجة. ومع ذلك ، فإن وعدهم بزيادة إنتاجية الترميز هو دفع الشركات – والمطورين – إلى تبنيها بسرعة.

إنثروبور ، واعية تمامًا لهذا ، يعد بمثابة تحديثات نموذجية أكثر تكرارًا.

“كان […] كتبت شركة Startup في مسودة مشاركتها ، “إن التحول إلى تحديثات طراز أكثر تواتراً ، وتوفير دفق مستمر من التحسينات التي تجلب إمكانيات اختراق للعملاء بشكل أسرع”.


اكتشاف المزيد من موقع fffm

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى

اكتشاف المزيد من موقع fffm

اشترك الآن للاستمرار في القراءة والحصول على حق الوصول إلى الأرشيف الكامل.

Continue reading