تقنية

تتعامل أحبار OpenAI لتدريب الذكاء الاصطناعي على بيانات Reddit


توصلت OpenAI وReddit إلى اتفاق للسماح لـ OpenAI بتدريب نماذج الذكاء الاصطناعي التوليدية الخاصة بها على بيانات Reddit.

في منشور مدونة على موقع العلاقات الصحفية الخاص بـ OpenAI، قالت OpenAI أنه من خلال الشراكة التي تم تشكيلها حديثًا مع Reddit، ستتمكن من الوصول إلى “محتوى منظم وفريد ​​في الوقت الفعلي” – على سبيل المثال المنشورات والردود – من Reddit، مما يسمح لأدواتها ونماذج “لفهم وعرض” محتوى Reddit بشكل أفضل. سيتم دمج المحتوى من Reddit في ChatGPT، منصة الدردشة الآلية المدعومة بالذكاء الاصطناعي الخاصة بـ OpenAI، وستعمل OpenAI مع Reddit لتقديم “ميزات جديدة مدعومة بالذكاء الاصطناعي” غير محددة لكل من مستخدمي Reddit والمشرفين.

ستصبح OpenAI أيضًا شريكًا إعلانيًا لـ Reddit.

كتب OpenAI في المنشور: “سيعتمد Reddit على منصة OpenAI لنماذج الذكاء الاصطناعي لإضفاء الحيوية على رؤيته القوية”. “إن استخدام LLMs وML وAI يسمح لـ Reddit بتحسين تجربة المستخدم للجميع.”

لدى OpenAI العديد من صفقات الترخيص المماثلة مع موفري المحتوى بدءًا من مكتبات الوسائط المالية وحتى ناشري الأخبار. لكن الزاوية غير المعتادة في هذا الأمر هي أن سام ألتمان، الرئيس التنفيذي لشركة OpenAI، يمتلك حصة قدرها 8.7% في Reddit، مما يجعله ثالث أكبر مساهم، وكان ذات يوم عضوًا في مجلس إدارة الشركة.

في محاولة لإلغاء التدقيق، تقول OpenAI في بيانها الصحفي أنه على الرغم من أن Altman لا يزال مساهمًا في Reddit، إلا أن الشراكة “كانت بقيادة المدير التنفيذي للعمليات في OpenAI”. [Brad Lightcap]”و” تمت الموافقة عليه من قبل [OpenAI’s] مجلس إدارة مستقل.” (سأشير هنا إلى أن ألتمان نفسه عضو في مجلس إدارة OpenAI.)

جعلت Reddit من اتفاقيات ترخيص البيانات جزءًا أساسيًا بشكل متزايد من استراتيجية النمو الخاصة بها أثناء تنقلها في السوق كشركة عامة.

كشفت Reddit في نشرة الاكتتاب العام أن لديها اتفاقيات تعاقدية لترخيص بياناتها للعملاء بما في ذلك Google بقيمة إجمالية تزيد عن 200 مليون دولار. وفي تقرير أرباحها الأول كشركة عامة، أعلنت ريديت عن زيادة بنسبة 450% على أساس سنوي في الإيرادات غير الإعلانية، وهو ما يعزى في الأساس إلى تلك الاتفاقيات.

ارتفع سهم Reddit بنسبة 11% في تداولات ممتدة بعد الإعلان عن صفقة OpenAI.

قال ستيف هوفمان، الرئيس التنفيذي لشركة Reddit، خلال مكالمة أرباح الشركة في مارس: “المفارقة التي أراها هي أنه مع زيادة المحتوى على الإنترنت الذي تكتبه الآلات، هناك أهمية متزايدة للمحتوى الذي يأتي من أشخاص حقيقيين”. “ولدينا ما يقرب من عقدين من المحادثة الحقيقية.”

تعد منصة Reddit – التي تحتوي على أكثر من مليار مشاركة وأكثر من 16 مليار تعليق، وهي أرقام تنمو كل يوم بفضل مئات الملايين من المستخدمين النشطين أسبوعيًا – بمثابة منجم ذهب لشركات الذكاء الاصطناعي التوليدي، التي تتعلم نماذجها من أمثلة المحتوى لإنشاء محتوى جديد. المحتوى، مثل النصوص والصور.

لكن الشركة قد تواجه معارضة من المستخدمين القلقين بشأن كيفية تحقيق الدخل من بياناتهم.

من المفيد إلقاء نظرة على Stack Overflow، منتدى الأسئلة والأجوبة لمطوري البرامج، والذي وقع مؤخرًا اتفاقية مع OpenAI لتوفير البيانات للتدريب النموذجي للأخير. واحتجاجًا على ذلك، قام بعض المستخدمين بحذف إجاباتهم ذات التصنيف الأعلى على الأسئلة الموجودة في المجتمع. لكن Stack Overflow استعاد المنشورات المحذوفة وحظر هؤلاء المستخدمين، بدعوى أنهم لم يلتزموا بشروط الخدمة الخاصة به.

لقد أعرب Reddit بالفعل عن استيائه من محاولة واحدة لمنح مستخدمي Reddit تحكمًا أكبر في بياناتهم الخاصة.

تحاول Vana، وهي شركة ناشئة مبنية على blockchain، إطلاق بيانات “DAO” (منظمة رقمية مستقلة) للسماح لمستخدمي Reddit بتجميع بياناتهم والسماح لهم باتخاذ القرار معًا حول كيفية استخدام (أو بيع) تلك البيانات المجمعة. قام Reddit بحظر موقع Vana الفرعي المخصص للمناقشة حول DAO، في بيان لـ TechCrunch، واتهم الشركة “باستغلال” ضوابط تصدير البيانات الخاصة بها.


اكتشاف المزيد من موقع fffm

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى

اكتشاف المزيد من موقع fffm

اشترك الآن للاستمرار في القراءة والحصول على حق الوصول إلى الأرشيف الكامل.

Continue reading