هذا الأسبوع في الذكاء الاصطناعي: دعونا لا ننسى مُعلق البيانات المتواضع

إن مواكبة صناعة سريعة الحركة مثل الذكاء الاصطناعي يعد أمرًا صعبًا. لذا، إلى أن يتمكن الذكاء الاصطناعي من القيام بذلك نيابةً عنك، إليك ملخصًا مفيدًا للقصص الحديثة في عالم التعلم الآلي، إلى جانب الأبحاث والتجارب البارزة التي لم نغطيها بمفردنا.

أود هذا الأسبوع في موضوع الذكاء الاصطناعي أن أسلط الضوء على الشركات الناشئة في مجال وضع العلامات والتعليقات التوضيحية – الشركات الناشئة مثل Scale AI، والتي يقال إنها تجري محادثات لجمع أموال جديدة بقيمة 13 مليار دولار. قد لا تحظى منصات وضع العلامات والتعليقات التوضيحية بالاهتمام الذي تحظى به نماذج الذكاء الاصطناعي التوليدية الجديدة البراقة مثل Sora من OpenAI. لكنها ضرورية. بدونها، يمكن القول إن نماذج الذكاء الاصطناعي الحديثة لن تكون موجودة.

يجب تسمية البيانات التي تتدرب عليها العديد من النماذج. لماذا؟ تساعد التسميات أو العلامات النماذج على فهم البيانات وتفسيرها أثناء عملية التدريب. على سبيل المثال، قد تأخذ التسميات المخصصة لتدريب نموذج التعرف على الصور شكل علامات حول الكائنات أو “المربعات المحيطة” أو التسميات التوضيحية التي تشير إلى كل شخص أو مكان أو كائن مصور في الصورة.

تؤثر دقة الملصقات وجودتها بشكل كبير على أداء النماذج المدربة وموثوقيتها. وتعد التعليقات التوضيحية مهمة ضخمة، وتتطلب آلافًا وملايين من التسميات لمجموعات البيانات الأكبر حجمًا والأكثر تطورًا المستخدمة.

لذلك قد تعتقد أنه سيتم التعامل مع معلقي البيانات بشكل جيد، ودفع أجورهم المعيشية، ومنحهم نفس المزايا التي يتمتع بها المهندسون الذين يقومون ببناء النماذج بأنفسهم. ولكن في كثير من الأحيان، يكون العكس هو الصحيح – وهو نتاج لظروف العمل القاسية التي تعززها العديد من الشركات الناشئة الخاصة بالتعليقات التوضيحية والتصنيفية.

اعتمدت الشركات التي لديها مليارات في البنوك، مثل OpenAI، على المفسرين في دول العالم الثالث مقابل بضعة دولارات فقط في الساعة. يتعرض بعض هؤلاء المعلقين لمحتوى مزعج للغاية، مثل الصور الرسومية، ومع ذلك لا يتم منحهم إجازة (لأنهم عادة متعاقدون) أو الوصول إلى موارد الصحة العقلية.

مقالة ممتازة في NY Mag تزيل الستار عن Scale AI على وجه الخصوص، والذي يقوم بتجنيد المعلقين في بلدان بعيدة مثل نيروبي وكينيا. تتطلب بعض المهام في Scale AI من القائمين على التصنيف عدة أيام عمل مدتها ثماني ساعات – بدون فترات راحة – وتدفع ما لا يقل عن 10 دولارات. وهؤلاء العمال مدينون بالفضل لأهواء المنصة. في بعض الأحيان، يمضي المدونون فترات طويلة دون الحصول على عمل، أو يتم طردهم بشكل غير رسمي من Scale AI – كما حدث للمقاولين في تايلاند وفيتنام وبولندا وباكستان مؤخرًا.

تدعي بعض منصات التعليقات التوضيحية ووضع العلامات أنها توفر أعمال “التجارة العادلة”. لقد جعلوها جزءًا أساسيًا من علامتهم التجارية في الواقع. ولكن كما لاحظت كيت كاي من معهد ماساتشوستس للتكنولوجيا، لا توجد لوائح تنظيمية، فقط معايير صناعية ضعيفة لما يعنيه عمل العلامات الأخلاقية – وتختلف تعريفات الشركات بشكل كبير.

اذا مالعمل؟ وباستثناء حدوث طفرة تكنولوجية هائلة، فإن الحاجة إلى إضافة تعليقات توضيحية وتصنيف البيانات لتدريب الذكاء الاصطناعي لن تختفي. وبوسعنا أن نأمل أن تنظم هذه المنصات نفسها ذاتيا، ولكن يبدو أن الحل الأكثر واقعية يتمثل في صنع السياسات. وهذا في حد ذاته احتمال صعب، لكنه أفضل فرصة لدينا لتغيير الأمور نحو الأفضل. أو على الأقل البدء في ذلك.

فيما يلي بعض قصص الذكاء الاصطناعي الأخرى الجديرة بالملاحظة من الأيام القليلة الماضية:

- يبني OpenAI مستنسخًا صوتيًا: تقوم OpenAI بمعاينة أداة جديدة تعمل بالذكاء الاصطناعي قامت بتطويرها، وهي Voice Engine، والتي تمكن المستخدمين من استنساخ صوت من تسجيل مدته 15 ثانية لشخص يتحدث. لكن الشركة اختارت عدم نشره على نطاق واسع (حتى الآن)، مشيرة إلى مخاطر سوء الاستخدام.
- أمازون تتضاعف على الأنثروبيك: استثمرت أمازون 2.75 مليار دولار إضافية في قوة الذكاء الاصطناعي المتنامية Anthropic، متابعةً للخيار الذي تركته مفتوحًا في سبتمبر الماضي.
- يُطلق Google.org مسرّعًا: يطلق Google.org، الجناح الخيري لشركة Google، برنامجًا جديدًا بقيمة 20 مليون دولار لمدة ستة أشهر للمساعدة في تمويل المنظمات غير الربحية التي تعمل على تطوير التكنولوجيا التي تستفيد من الذكاء الاصطناعي التوليدي.
- بنية نموذجية جديدة: أصدرت شركة AI21 Labs الناشئة في مجال الذكاء الاصطناعي نموذجًا توليديًا للذكاء الاصطناعي، Jamba، يستخدم بنية نموذجية جديدة (ish) – نماذج فضاء الحالة، أو SSMs – لتحسين الكفاءة.
- تطلق Databricks DBRX: وفي أخبار النماذج الأخرى، أصدرت Databricks هذا الأسبوع DBRX، وهو نموذج ذكاء اصطناعي توليدي يشبه سلسلة GPT من OpenAI وGemini من Google. تدعي الشركة أنها حققت أحدث النتائج في عدد من معايير الذكاء الاصطناعي الشائعة، بما في ذلك العديد من أساليب القياس.
- أوبر إيتس وتنظيم الذكاء الاصطناعي في المملكة المتحدة: تكتب ناتاشا عن كيفية مكافحة تحيز شركة Uber Eats ضد الذكاء الاصطناعي، حيث تظهر أن تحقيق العدالة بموجب لوائح الذكاء الاصطناعي في المملكة المتحدة أمر صعب المنال.
- إرشادات أمن الانتخابات في الاتحاد الأوروبي: ونشر الاتحاد الأوروبي الثلاثاء مسودة مبادئ توجيهية لأمن الانتخابات تستهدف من حولها دزينتين المنصات الخاضعة للتنظيم بموجب قانون الخدمات الرقمية، بما في ذلك المبادئ التوجيهية المتعلقة بمنع خوارزميات توصية المحتوى من نشر معلومات مضللة تعتمد على الذكاء الاصطناعي (المعروفة أيضًا باسم التزييف العميق السياسي).
- تمت ترقية Grok: سيحصل برنامج الدردشة Grok الخاص بـ X قريبًا على نموذج أساسي تمت ترقيته، Grok-1.5 – وفي الوقت نفسه، سيتمكن جميع المشتركين المميزين على X من الوصول إلى Grok. (كان Grok في السابق حصريًا لعملاء X Premium+.)
- يقوم Adobe بتوسيع Firefly: كشفت شركة Adobe هذا الأسبوع عن Firefly Services، مجموعة تضم أكثر من 20 واجهة برمجة تطبيقات وأدوات وخدمات جديدة ومبتكرة. كما أطلقت أيضًا نماذج مخصصة، والتي تسمح للشركات بضبط نماذج Firefly استنادًا إلى أصولها – وهي جزء من مجموعة GenStudio الجديدة من Adobe.

المزيد من التعلم الآلي

كيف هو الطقس؟ أصبح الذكاء الاصطناعي قادرًا بشكل متزايد على إخبارك بهذا. لقد لاحظت بعض الجهود المبذولة في مجال التنبؤ على مدار الساعة والأسبوع والقرن منذ بضعة أشهر، ولكن مثل كل الأشياء المتعلقة بالذكاء الاصطناعي، فإن هذا المجال يتحرك بسرعة. نشرت الفرق التي تقف وراء MetNet-3 وGraphCast ورقة بحثية تصف نظامًا جديدًا يسمى SEEDS، من أجل Scalable Envelope Diffusion Sampler.

رسوم متحركة توضح كيف يؤدي المزيد من التنبؤات إلى توزيع أكثر توازناً للتنبؤات الجوية.

يستخدم SEEDS الانتشار لتوليد “مجموعات” من نتائج الطقس المعقولة لمنطقة ما بناءً على المدخلات (قراءات الرادار أو الصور المدارية ربما) بشكل أسرع بكثير من النماذج القائمة على الفيزياء. ومع وجود أعداد أكبر من المجموعات، يمكنهم تغطية المزيد من الحالات الحدية (مثل حدث يحدث فقط في سيناريو واحد من أصل 100 سيناريو محتمل) ويكونون أكثر ثقة بشأن المواقف الأكثر احتمالية.

وتأمل فوجيتسو أيضًا في فهم العالم الطبيعي بشكل أفضل من خلال تطبيق تقنيات معالجة الصور بالذكاء الاصطناعي على الصور تحت الماء وبيانات الليدار التي تجمعها المركبات ذاتية التحكم تحت الماء. سيؤدي تحسين جودة الصور إلى السماح للعمليات الأخرى الأقل تعقيدًا (مثل التحويل ثلاثي الأبعاد) بالعمل بشكل أفضل على البيانات المستهدفة.

اعتمادات الصورة: فوجيتسو

وتتمثل الفكرة في بناء “توأم رقمي” للمياه يمكنه المساعدة في محاكاة التطورات الجديدة والتنبؤ بها. نحن بعيدون جدًا عن ذلك، لكن عليك أن تبدأ من مكان ما.

من بين حاملي شهادة الماجستير في القانون، وجد الباحثون أنهم يحاكيون الذكاء بطريقة أبسط من المتوقع: الوظائف الخطية. بصراحة، الرياضيات خارج نطاق قدراتي (أشياء متجهة في العديد من الأبعاد) ولكن هذا المقال في معهد ماساتشوستس للتكنولوجيا يوضح تمامًا أن آلية الاستدعاء لهذه النماذج بسيطة جدًا.

على الرغم من أن هذه النماذج معقدة حقًا، ووظائف غير خطية يتم تدريبها على الكثير من البيانات ويصعب فهمها، إلا أنه في بعض الأحيان توجد آليات بسيطة حقًا تعمل بداخلها. وقال المؤلف الرئيسي المشارك إيفان هيرنانديز: “هذا أحد الأمثلة على ذلك”. إذا كنت مهتمًا أكثر بالأمور التقنية، فاطلع على الورقة هنا.

إحدى الطرق التي يمكن أن تفشل بها هذه النماذج هي عدم فهم السياق أو ردود الفعل. حتى طلاب LLM القادرين حقًا قد لا “يفهمون الأمر” إذا أخبرتهم أن اسمك يُنطق بطريقة معينة، لأنهم لا يعرفون أو يفهمون أي شيء في الواقع. وفي الحالات التي قد يكون فيها ذلك مهمًا، مثل التفاعلات بين الإنسان والروبوت، فقد يؤدي ذلك إلى إبعاد الناس إذا تصرف الروبوت بهذه الطريقة.

لقد بحثت شركة Disney Research في التفاعلات الآلية بين الشخصيات لفترة طويلة، وقد ظهر نطق الاسم وإعادة استخدام الورق منذ فترة قصيرة. يبدو الأمر واضحًا، لكن استخراج المقاطع الصوتية عندما يقوم شخص ما بتقديم نفسه وترميز ذلك بدلاً من مجرد الاسم المكتوب يعد أسلوبًا ذكيًا.

اعتمادات الصورة: أبحاث ديزني

أخيرًا، مع تداخل الذكاء الاصطناعي والبحث أكثر فأكثر، من المفيد إعادة تقييم كيفية استخدام هذه الأدوات وما إذا كانت هناك أي مخاطر جديدة يمثلها هذا الاتحاد غير المقدس. لقد كانت صفية أوموجا نوبل صوتًا مهمًا في مجال الذكاء الاصطناعي وأخلاقيات البحث لسنوات، وكان رأيها مفيدًا دائمًا. لقد أجرت مقابلة رائعة مع فريق أخبار UCLA حول كيفية تطور عملها ولماذا نحتاج إلى البقاء متجمدين عندما يتعلق الأمر بالتحيز والعادات السيئة في البحث.