تقنية

يوافق Elon Musk على أننا استنفذنا بيانات تدريب الذكاء الاصطناعي على الإنترنت


يتفق إيلون ماسك مع خبراء آخرين في الذكاء الاصطناعي على أنه لم يتبق سوى القليل من بيانات العالم الحقيقي لتدريب نماذج الذكاء الاصطناعي عليها.

“لقد استنفدنا الآن بشكل أساسي المجموع التراكمي للمعرفة الإنسانية…. قال ماسك خلال محادثة تم بثها مباشرة مع رئيس شركة Stagwell، مارك بن، على قناة X في وقت متأخر من يوم الأربعاء: “في تدريب الذكاء الاصطناعي”. “لقد حدث هذا بشكل أساسي في العام الماضي.”

ردد ماسك، الذي يمتلك شركة الذكاء الاصطناعي xAI، المواضيع التي تطرق إليها إيليا سوتسكيفر، كبير العلماء السابق في OpenAI، في مؤتمر NeurIPS للتعلم الآلي، خلال خطاب ألقاه في ديسمبر. وتوقع سوتسكيفر، الذي قال إن صناعة الذكاء الاصطناعي وصلت إلى ما أسماه “ذروة البيانات”، أن نقص بيانات التدريب سيؤدي إلى التحول عن الطريقة التي يتم بها تدريب النماذج اليوم.

في الواقع، اقترح ماسك أن البيانات الاصطناعية – البيانات التي تم إنشاؤها بواسطة نماذج الذكاء الاصطناعي نفسها – هي الطريق إلى الأمام. “مع البيانات الاصطناعية … [AI] وقال: “سوف تقوم بتصنيف نفسها نوعًا ما وتخوض عملية التعلم الذاتي هذه باستخدام البيانات الاصطناعية”.

وتستخدم شركات أخرى، بما في ذلك عمالقة التكنولوجيا مثل مايكروسوفت، وميتا، وأوبن إيه آي، وأنتروبيك، بالفعل البيانات الاصطناعية لتدريب نماذج الذكاء الاصطناعي الرائدة. وتشير تقديرات جارتنر إلى أن 60% من البيانات المستخدمة في مشاريع الذكاء الاصطناعي والتحليلات في عام 2024 تم إنشاؤها صناعيًا.

تم تدريب Phi-4 من Microsoft، والذي كان مفتوح المصدر في وقت مبكر من يوم الأربعاء، على البيانات الاصطناعية إلى جانب بيانات العالم الحقيقي. وكذلك كانت نماذج جيما من جوجل. استخدمت أنثروبيك بعض البيانات الاصطناعية لتطوير أحد أنظمتها الأكثر أداءً، وهو Claude 3.5 Sonnet. وقامت Meta بضبط أحدث سلسلة من نماذج Llama باستخدام البيانات التي تم إنشاؤها بواسطة الذكاء الاصطناعي.

والتدريب على البيانات الاصطناعية له مزايا أخرى، مثل توفير التكاليف. تدعي شركة AI الناشئة Writer أن نموذج Palmyra X 004 الخاص بها، والذي تم تطويره باستخدام مصادر اصطناعية بالكامل تقريبًا، كلف تطويره 700 ألف دولار فقط – مقارنة بتقديرات تبلغ 4.6 مليون دولار لنموذج OpenAI ذو الحجم المماثل.

ولكن هناك عيوب كذلك. تشير بعض الأبحاث إلى أن البيانات الاصطناعية يمكن أن تؤدي إلى انهيار النموذج، حيث يصبح النموذج أقل “إبداعا” – وأكثر انحيازا – في مخرجاته، مما يؤدي في النهاية إلى تعريض وظائفه للخطر بشكل خطير.


اكتشاف المزيد من موقع fffm

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى

اكتشاف المزيد من موقع fffm

اشترك الآن للاستمرار في القراءة والحصول على حق الوصول إلى الأرشيف الكامل.

Continue reading