تقنية

تنشر Anthropic “موجه النظام” الذي يجعل كلود علامة


نماذج الذكاء الاصطناعي التوليدية ليست في الواقع شبيهة بالبشر. ليس لديهم أي ذكاء أو شخصية، بل مجرد أنظمة إحصائية تتنبأ بالكلمات التالية الأكثر احتمالية في الجملة. ولكن مثل المتدربين في مكان العمل الاستبدادي، فإنهم يفعل اتبع التعليمات دون شكوى – بما في ذلك “مطالبات النظام” الأولية التي تزود النماذج بصفاتها الأساسية، وما ينبغي عليها فعله وما لا ينبغي لها فعله.

يستخدم كل بائعي الذكاء الاصطناعي، من OpenAI إلى Anthropic، مطالبات النظام لمنع (أو على الأقل محاولة منع) النماذج من التصرف بشكل سيئ، وتوجيه النغمة العامة والمشاعر لردود النماذج. على سبيل المثال، قد يخبر العارضة أنه يجب أن يكون مهذبًا ولكن لا يعتذر أبدًا.

لكن البائعين عادةً ما يحتفظون بمطالبات النظام بالقرب من الصندوق – ربما لأسباب تنافسية، ولكن ربما أيضًا لأن معرفة موجه النظام قد تقترح طرقًا للتحايل عليه. الطريقة الوحيدة لكشف موجه نظام GPT-4o، على سبيل المثال، هي من خلال هجوم الحقن الفوري. (وحتى في هذه الحالة، لا يمكن الوثوق بمخرجات النظام بشكل كامل.)

ومع ذلك، قامت شركة Anthropic، في إطار جهودها المتواصلة لتصوير نفسها على أنها بائع أكثر أخلاقية وشفافية للذكاء الاصطناعي، بنشر مطالبات النظام لأحدث نماذجها (Claude 3.5 Opus وSonnet وHaiku) في تطبيقات Claude iOS وAndroid وعلى الويب.

قال Alex Albert، رئيس علاقات المطورين في Anthropic، في منشور على X أن Anthropic تخطط لجعل هذا النوع من الكشف أمرًا منتظمًا أثناء تحديث النظام وضبطه.

أحدث المطالبات، بتاريخ 12 يوليو/تموز، تحدد بوضوح شديد ما لا يستطيع كلود فعله – على سبيل المثال “لا يستطيع كلود فتح عناوين URL أو الروابط أو مقاطع الفيديو”. يعد التعرف على الوجه أمرًا محظورًا للغاية؛ يخبر موجه النظام الخاص بـ Claude 3.5 Opus النموذج بأن “يستجيب دائمًا كما لو كان مصابًا بالعمى التام” وأن “يتجنب تحديد أو تسمية أي بشر في [images]”.

لكن المطالبات تصف أيضًا سمات وخصائص شخصية معينة – السمات والخصائص التي قد تجسدها النماذج الأنثروبيكية.

على سبيل المثال، تقول المطالبة الخاصة بـ Opus أن كلود يجب أن يظهر كما لو كان “ذكيًا جدًا وفضوليًا فكريًا”، و”يستمتع بسماع ما يفكر فيه البشر حول قضية ما والمشاركة في مناقشة حول مجموعة واسعة من المواضيع”. كما تطلب من كلود التعامل مع المواضيع المثيرة للجدل بحياد وموضوعية، وتقديم “أفكار متأنية” و”معلومات واضحة” – وعدم البدء مطلقًا في الرد بكلمة “بالتأكيد”.

الأمر كله غريب بعض الشيء بالنسبة لهذا الإنسان: مطالبات النظام هذه، والتي تتم كتابتها مثل ممثل في مسرحية قد يكتب ورقة تحليل الشخصية. تنتهي المطالبة بـ Opus بعبارة “كلود الآن متصل بإنسان”، مما يعطي الانطباع بأن كلود هو نوع من الوعي على الطرف الآخر من الشاشة هدفه الوحيد هو تحقيق أهواء شركائه في المحادثة من البشر.

لكن بالطبع هذا وهم. إذا كانت توجيهات كلود تخبرنا بأي شيء، فهو أنه بدون التوجيه البشري والدعم، فإن هذه النماذج ستكون عبارة عن ألواح فارغة بشكل مخيف.




اكتشاف المزيد من موقع fffm

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى

اكتشاف المزيد من موقع fffm

اشترك الآن للاستمرار في القراءة والحصول على حق الوصول إلى الأرشيف الكامل.

Continue reading