تقوم Google بطرح Gemini Deep Think AI ، وهو نموذج التفكير الذي يختبر أفكارًا متعددة بالتوازي

تقوم Google DeepMind بطرح Gemini 2.5 Deep Think ، والتي ، كما تقول الشركة ، هي نموذج التفكير الأكثر تقدماً في الذكاء الاصطناعي ، قادرًا على الإجابة على الأسئلة من خلال استكشاف أفكار متعددة في وقت واحد ثم استخدام هذه المخرجات لاختيار أفضل إجابة.
سيمكن المشتركون في الاشتراك Ultra في Google بقيمة 250 دولارًا في الشهر في Gemini 2.5 Deep Think في تطبيق Gemini الذي يبدأ يوم الجمعة.
تم الكشف عنها لأول مرة في مايو في Google I/O 2025 ، Gemini 2.5 Deep Think هو أول نموذج متعدد العوامل متاح من Google. تفرخ هذه الأنظمة من عوامل متعددة لمعالجة سؤال بالتوازي ، وهي عملية تستخدم موارد حسابية أكثر بكثير من وكيل واحد ، ولكنها تميل إلى أن تؤدي إلى إجابات أفضل.
استخدمت Google تباينًا في Gemini 2.5 Deep Think لتسجيل ميدالية ذهبية في أولمبياد الرياضيات الدولي لهذا العام (IMO).
إلى جانب Gemini 2.5 Deep Think ، تقول الشركة إنها تصدر النموذج الذي استخدمه في IMO لمجموعة مختارة من علماء الرياضيات والأكاديميين. تقول Google هذا نموذج الذكاء الاصطناعي “يستغرق ساعات إلى العقل” ، بدلاً من ثوانٍ أو دقائق مثل معظم نماذج الذكاء الاصطناعى التي تواجه المستهلك. وتأمل الشركة أن يعزز نموذج IMO الجهود البحثية ، وتهدف إلى الحصول على تعليقات حول كيفية تحسين النظام متعدد الوكلاء لحالات الاستخدام الأكاديمي.
تشير Google إلى أن نموذج Gemini 2.5 Deep Think يعد تحسناً كبيرًا حول ما أعلنته في I/O. تدعي الشركة أيضًا أنها طورت “تقنيات تعلم تعزيز جديدة” لتشجيع Gemini 2.5 Deep Think للاستفادة بشكل أفضل من مسارات التفكير.
وقال Google في منشور مدونة مشتركة مع TechCrunch: “يمكن أن يساعد التفكير العميق الأشخاص في مواجهة المشكلات التي تتطلب الإبداع والتخطيط الاستراتيجي وإجراء تحسينات خطوة بخطوة”.
حدث TechCrunch
سان فرانسيسكو
|
27-29 أكتوبر ، 2025
وتقول الشركة إن Gemini 2.5 Deep Think يحقق أداءً أحدث في امتحان الإنسانية الأخير (HLE)-وهو اختبار صعب يقيس قدرة الذكاء الاصطناعى على الإجابة على الآلاف من الأسئلة الجماعية عبر الرياضيات والإنسانية والعلوم. تدعي Google أن نموذجه سجل 34.8 ٪ على HLE (بدون أدوات) ، مقارنة بـ XAI’s Grok 4 ، الذي سجل 25.4 ٪ ، و Openai’s O3 ، والذي سجل 20.3 ٪.
تقول Google أيضًا إن Gemini 2.5 Deep Think يتفوق على نماذج الذكاء الاصطناعي من Openai و Xai و Hothropic على LiveCodeBench6 ، وهو اختبار صعب لمهام الترميز التنافسية. سجل نموذج Google 87.6 ٪ ، في حين سجل Grok 4 79 ٪ ، وسجل Openai’s O3 72 ٪.
يعمل Gemini 2.5 Deep Think تلقائيًا مع أدوات مثل تنفيذ التعليمات البرمجية والبحث في Google ، وتقول الشركة إنها قادرة على إنتاج “استجابات أطول بكثير” من نماذج الذكاء الاصطناعي التقليدية.
في اختبار Google ، أنتج النموذج مهام تطوير الويب أكثر تفصيلاً وجمالاً مقارنةً بنماذج الذكاء الاصطناعى الأخرى. تدعي الشركة أن النموذج يمكن أن يساعد الباحثين و “يحتمل أن يسرع طريق الاكتشاف”.

يبدو أن العديد من مختبرات الذكاء الاصطناعي الرائدة تتقارب حول نهج متعدد الوكلاء.
أصدرت إيلون موسك XAI مؤخرًا نظامًا متعدد الوكلاء ، Grok 4 Heavy ، والذي تقول إنه قادر على تحقيق أداء رائد في الصناعة في العديد من المعايير. قال باحث Openai Noam Brown على البودكاست إن نموذج الذكاء الاصطناعى الذي لم يتم إصداره الذي استخدمته الشركة لتحقيق الميدالية الذهبية في أولمبياد الرياضيات الدولي لهذا العام (IMO) كان أيضًا نظامًا متعدد الوكلاء. وفي الوقت نفسه ، يتم تشغيل وكيل الأبحاث التابع لشركة Anthropic ، والذي يولد ملخصات بحثية شاملة ، بواسطة نظام متعدد الوكلاء.
على الرغم من الأداء القوي ، يبدو أن الأنظمة متعددة الوكلاء أكثر تكلفة للخدمة من نماذج الذكاء الاصطناعى التقليدية. هذا يعني أن شركات التكنولوجيا قد تبقي هذه الأنظمة بوابة خلف خطط الاشتراك الأكثر تكلفة ، والتي اختارت XAI والآن Google القيام بها.
في الأسابيع المقبلة ، تقول Google إنها تخطط لمشاركة Gemini 2.5 Deep Think مع مجموعة مختارة من المختبرين عبر واجهة برمجة تطبيقات Gemini. تقول الشركة إنها تريد أن تفهم بشكل أفضل كيف يمكن للمطورين والمؤسسات استخدام نظامها متعدد الوكلاء.