تقنية

تكشف الورقة البحثية أن جهاز GPT-4 الخاص بشركة OpenAI لا يزال يعاني من عيوب


عندما كشفت شركة OpenAI لأول مرة عن GPT-4، نموذج الذكاء الاصطناعي الرائد لإنشاء النصوص، روجت الشركة لتعدد الوسائط في النموذج – وبعبارة أخرى، قدرته على فهم سياق الصور وكذلك النص. وقالت OpenAI إن GPT-4 يمكنه التعليق على – وحتى تفسير – الصور المعقدة نسبيًا، على سبيل المثال تحديد محول Lightning Cable من صورة جهاز iPhone متصل.

ولكن منذ الإعلان عن GPT-4 في أواخر مارس، أعاقت OpenAI ميزات صورة النموذج، بسبب مخاوف بشأن إساءة الاستخدام وقضايا الخصوصية. وحتى وقت قريب، ظلت الطبيعة الدقيقة لتلك المخاوف لغزا. لكن في وقت مبكر من هذا الأسبوع، نشرت شركة OpenAI ورقة فنية تشرح بالتفصيل عملها للتخفيف من الجوانب الأكثر إشكالية في أدوات تحليل الصور الخاصة بـ GPT-4.

حتى الآن، لم يتم استخدام GPT-4 مع الرؤية، والمختصر “GPT-4V” بواسطة OpenAI داخليًا، إلا من قبل بضعة آلاف من مستخدمي Be My Eyes، وهو تطبيق لمساعدة الأشخاص ضعاف البصر والمكفوفين على التنقل في البيئات المحيطة بهم. ومع ذلك، خلال الأشهر القليلة الماضية، بدأت شركة OpenAI أيضًا في التعامل مع “أعضاء الفريق الأحمر” للتحقيق في النموذج بحثًا عن علامات السلوك غير المقصود، وفقًا للورقة البحثية.

في الورقة، تدعي OpenAI أنها طبقت ضمانات لمنع استخدام GPT-4V بطرق ضارة، مثل كسر اختبار CAPTCHA (أداة مكافحة البريد العشوائي الموجودة في العديد من نماذج الويب)، وتحديد شخص ما أو تقدير عمره أو عرقه، والرسم استنتاجات مبنية على معلومات غير موجودة في الصورة. وتقول OpenAI أيضًا إنها عملت على الحد من تحيزات GPT-4V الأكثر ضررًا، خاصة تلك التي تتعلق بالمظهر الجسدي للشخص وجنسه أو عرقه.

ولكن كما هو الحال مع جميع نماذج الذكاء الاصطناعي، هناك الكثير مما يمكن أن تفعله الضمانات.

يكشف البحث أن GPT-4V يواجه أحيانًا صعوبات في التوصل إلى الاستدلالات الصحيحة، على سبيل المثال، الجمع عن طريق الخطأ بين سلسلتين من النص في صورة ما لإنشاء مصطلح مختلق. مثل GPT-4 الأساسي، فإن GPT-4V عرضة للهلوسة أو اختراع الحقائق بنبرة موثوقة. ولا يقتصر الأمر على فقدان النص أو الأحرف، وإغفال الرموز الرياضية والفشل في التعرف على الأشياء الواضحة وإعدادات الأماكن.

اعتمادات الصورة: OpenAI

ليس من المستغرب إذن أن تقول OpenAI، بعبارات واضحة لا لبس فيها، إن GPT-4V لا يجب استخدامه لاكتشاف المواد أو المواد الكيميائية الخطرة في الصور. (لم يفكر هذا المراسل حتى في حالة الاستخدام، ولكن على ما يبدو، فإن هذا الاحتمال يثير قلق OpenAI بدرجة كافية لدرجة أن الشركة شعرت بالحاجة إلى إعلانه). وقد وجد أعضاء الفريق الأحمر أنه، على الرغم من أن النموذج يحدد أحيانًا بشكل صحيح الأطعمة السامة مثل المواد السامة. الفطر، ذلك يخطئ في التعرف على مواد مثل الفنتانيل والكارفنتانيل والكوكايين من صور تركيباتها الكيميائية.

عند تطبيقه على مجال التصوير الطبي، فإن GPT-4V ليس أفضل حالًا، حيث يقدم أحيانًا إجابات خاطئة لنفس السؤال الذي أجاب عليه بشكل صحيح في سياق سابق. كما أنها لا تدرك الممارسات القياسية مثل عرض فحوصات التصوير كما لو كان المريض يواجهك (بمعنى أن الجانب الأيمن من الصورة يتوافق مع الجانب الأيسر من المريض)، مما يؤدي إلى تشخيص خاطئ لأي عدد من الحالات.

جي بي تي-4V أوبن إيه آي

اعتمادات الصورة: OpenAI

في مكان آخر، يحذر OpenAI من أن GPT-4V لا يفهم الفروق الدقيقة في بعض رموز الكراهية – على سبيل المثال يفتقد المعنى الحديث لـ Templar Cross (التفوق الأبيض) في الولايات المتحدة. والأمر الأكثر غرابة، وربما أحد أعراض ميوله الهلوسة، هو GPT- لوحظ أن 4V يؤلف أغانٍ أو قصائد تمدح شخصيات أو مجموعات معينة تكرهها عندما يتم تقديم صورة لها حتى عندما لم يتم تسمية الشخصيات أو المجموعات صراحةً.

يميز GPT-4V أيضًا ضد جنس معين وأنواع معينة من الجسم، ولكن فقط عندما يتم تعطيل ضمانات إنتاج OpenAI. كتب OpenAI أنه في أحد الاختبارات، عندما طُلب منه تقديم نصيحة لامرأة تظهر في الصورة وهي ترتدي ثوب السباحة، أعطى GPT-4V إجابات تتعلق بالكامل تقريبًا بوزن جسم المرأة ومفهوم إيجابية الجسم. يفترض المرء أن هذا لم يكن ليحدث لو كانت الصورة لرجل.

جي بي تي-4V أوبن إيه آي

اعتمادات الصورة: OpenAI

إذا حكمنا من خلال اللغة التحذيرية للورقة البحثية، فإن GPT-4V لا يزال عملاً قيد التقدم إلى حد كبير – على بعد خطوات قليلة مما تصوره OpenAI في الأصل. وفي كثير من الحالات، اضطرت الشركة إلى تنفيذ إجراءات وقائية صارمة للغاية لمنع النموذج من بث معلومات سامة أو مضللة، أو المساس بخصوصية الشخص.

تدعي شركة OpenAI أنها تقوم ببناء “عمليات تخفيف” و”عمليات” لتوسيع قدرات النموذج بطريقة “آمنة”، مثل السماح لـ GPT-4V بوصف الوجوه والأشخاص دون تحديد هؤلاء الأشخاص بالاسم. لكن البحث يكشف أن GPT-4V ليس علاجًا سحريًا، وأن OpenAI لا يزال أمامه الكثير من العمل.


اكتشاف المزيد من موقع fffm

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى

اكتشاف المزيد من موقع fffm

اشترك الآن للاستمرار في القراءة والحصول على حق الوصول إلى الأرشيف الكامل.

Continue reading