AI Pioneers Scoop Turing Award لعمل التعلم التعزيز

فاز اثنان من علماء الكمبيوتر في Trailblazing بجائزة Turing لعام 2024 لعملهم في التعلم التعزيز ، وهو تخصص تتعلم فيه الآلات من خلال نهج التجارب والخطأ القائم على المكافآت يتيح لهم التكيف في بيئات مقيدة أو ديناميكية.

أندرو ج. بارتو ، أستاذ فخري بجامعة ماساتشوستس أمهيرست ؛ وريتشارد سوتون ، أستاذ بجامعة ألبرتا ، طور خوارزميات ونظريات رئيسية من خلال سلسلة من الأوراق التي تبدأ في الثمانينات. وهذا يشمل العمل على تقنية التعزيز تسمى التعلم الفرق الزمني ؛ نشر الثنائي في وقت لاحق كتابًا أكاديميًا يسمى التعلم التعزيز: مقدمة.

أنتج عالم الرياضيات المحترم آلان تورينج (في الصورة أعلاه) ، وبعد ذلك اسم جائزة تورينج ، أنتجت ورقة في الخمسينيات من القرن الماضي تسمى آلات الحوسبة والذكاء التي تساءلت عما إذا كانت أجهزة الكمبيوتر يمكنها التفكير والتطرق إلى مفاهيم مماثلة حول التعلم من التجربة.

في السنوات الأخيرة ، تلقى التعلم التعويضي مزيدًا من الاهتمام بعد أن استخدمت Google Deepmind هذه التقنية لبناء منظمة العفو الدولية التي هزم أفضل لاعبي AlphaGo في العالم. وفي الأشهر القليلة الماضية ، أصاب Deepseek من الذكاء الاصطناعي الصيني عناوين الصحف لنموذج التفكير R1 الذي يغير اللعبة ، والذي استند بشدة إلى التعلم التعزيز لإنشاء نماذج أساس أكثر فعالية من حيث التكلفة.

أندرو ج. بارتو وريتشارد سوتونائتمانات الصورة:ACM

“جائزة نوبل للحوسبة”

غالبًا ما يطلق على جائزة Turing ، التي تديرها جمعية آلات الحوسبة (ACM) ، اسم “جائزة نوبل للحوسبة”. ومع ذلك ، فإن جائزة نوبل نفسها تتعدى في عالم الحوسبة ، وخاصة حول الذكاء الاصطناعي ؛ فاز جيف هينتون وجون هوبفيلد بجائزة نوبل في الفيزياء لعملهما في الذكاء الاصطناعى التأسيسي العام الماضي. وتبع ذلك بعد فترة وجيزة من ديميس هاسابيس من ديبميند وجون جومبر اللذين حصلوا على جائزة نوبل في الكيمياء لعملهما في ألفافولد.

وقال رئيس ACM Yannis Ioannidis في بيان صحفي: “المجالات البحثية التي تتراوح من العلوم المعرفية وعلم النفس إلى علم الأعصاب ألهمت تطور التعلم التعزيز ، الذي وضع الأسس لبعض من أهم التطورات في الذكاء الاصطناعي وأعطتنا نظرة أكبر على كيفية عمل الدماغ”. “إن عمل بارتو وسوتون ليس حجرًا انتقالًا قد انتقلنا منه الآن. يستمر التعلم التعزيز في النمو ويوفر إمكانات كبيرة لمزيد من التقدم في الحوسبة والعديد من التخصصات الأخرى. من المناسب أننا نكرمهم بجائزة مرموقة في مجالنا. “

من بين رواد الذكاء الاصطناعى الآخرين الذين يفوزون بجائزة تورينج ، رئيس منظمة العفو الدولية ، يان ليكون ، كبير علماء الذكاء الاصطناعي ، الذي حصل على الجائزة في عام 2018 إلى جانب جيف هينتون ويوشوا بينجيو لعملهم على الشبكات العصبية العميقة.

سيشارك Barto و Sutton الجائزة النقدية البالغة مليون دولار ، والتي تم تزويدها بدعم من Google.