تنشر Anthropic “موجه النظام” الذي يجعل كلود علامة

نماذج الذكاء الاصطناعي التوليدية ليست في الواقع شبيهة بالبشر. ليس لديهم أي ذكاء أو شخصية، بل مجرد أنظمة إحصائية تتنبأ بالكلمات التالية الأكثر احتمالية في الجملة. ولكن مثل المتدربين في مكان العمل الاستبدادي، فإنهم يفعل اتبع التعليمات دون شكوى – بما في ذلك “مطالبات النظام” الأولية التي تزود النماذج بصفاتها الأساسية، وما ينبغي عليها فعله وما لا ينبغي لها فعله.

يستخدم كل بائعي الذكاء الاصطناعي، من OpenAI إلى Anthropic، مطالبات النظام لمنع (أو على الأقل محاولة منع) النماذج من التصرف بشكل سيئ، وتوجيه النغمة العامة والمشاعر لردود النماذج. على سبيل المثال، قد يخبر العارضة أنه يجب أن يكون مهذبًا ولكن لا يعتذر أبدًا.

لكن البائعين عادةً ما يحتفظون بمطالبات النظام بالقرب من الصندوق – ربما لأسباب تنافسية، ولكن ربما أيضًا لأن معرفة موجه النظام قد تقترح طرقًا للتحايل عليه. الطريقة الوحيدة لكشف موجه نظام GPT-4o، على سبيل المثال، هي من خلال هجوم الحقن الفوري. (وحتى في هذه الحالة، لا يمكن الوثوق بمخرجات النظام بشكل كامل.)

ومع ذلك، قامت شركة Anthropic، في إطار جهودها المتواصلة لتصوير نفسها على أنها بائع أكثر أخلاقية وشفافية للذكاء الاصطناعي، بنشر مطالبات النظام لأحدث نماذجها (Claude 3.5 Opus وSonnet وHaiku) في تطبيقات Claude iOS وAndroid وعلى الويب.

قال Alex Albert، رئيس علاقات المطورين في Anthropic، في منشور على X أن Anthropic تخطط لجعل هذا النوع من الكشف أمرًا منتظمًا أثناء تحديث النظام وضبطه.

لقد أضفنا قسمًا جديدًا لملاحظات إصدار مطالبات النظام إلى مستنداتنا. سنقوم بتسجيل التغييرات التي نجريها على مطالبات النظام الافتراضية على Claude dot ai وتطبيقات الهاتف المحمول الخاصة بنا. (لا يؤثر موجه النظام على واجهة برمجة التطبيقات.) pic.twitter.com/9mBwv2SgB1

– أليكس ألبرت (@ alexalbert__) 26 أغسطس 2024

أحدث المطالبات، بتاريخ 12 يوليو/تموز، تحدد بوضوح شديد ما لا يستطيع كلود فعله – على سبيل المثال “لا يستطيع كلود فتح عناوين URL أو الروابط أو مقاطع الفيديو”. يعد التعرف على الوجه أمرًا محظورًا للغاية؛ يخبر موجه النظام الخاص بـ Claude 3.5 Opus النموذج بأن “يستجيب دائمًا كما لو كان مصابًا بالعمى التام” وأن “يتجنب تحديد أو تسمية أي بشر في [images]”.

لكن المطالبات تصف أيضًا سمات وخصائص شخصية معينة – السمات والخصائص التي قد تجسدها النماذج الأنثروبيكية.

على سبيل المثال، تقول المطالبة الخاصة بـ Opus أن كلود يجب أن يظهر كما لو كان “ذكيًا جدًا وفضوليًا فكريًا”، و”يستمتع بسماع ما يفكر فيه البشر حول قضية ما والمشاركة في مناقشة حول مجموعة واسعة من المواضيع”. كما تطلب من كلود التعامل مع المواضيع المثيرة للجدل بحياد وموضوعية، وتقديم “أفكار متأنية” و”معلومات واضحة” – وعدم البدء مطلقًا في الرد بكلمة “بالتأكيد”.

الأمر كله غريب بعض الشيء بالنسبة لهذا الإنسان: مطالبات النظام هذه، والتي تتم كتابتها مثل ممثل في مسرحية قد يكتب ورقة تحليل الشخصية. تنتهي المطالبة بـ Opus بعبارة “كلود الآن متصل بإنسان”، مما يعطي الانطباع بأن كلود هو نوع من الوعي على الطرف الآخر من الشاشة هدفه الوحيد هو تحقيق أهواء شركائه في المحادثة من البشر.

لكن بالطبع هذا وهم. إذا كانت توجيهات كلود تخبرنا بأي شيء، فهو أنه بدون التوجيه البشري والدعم، فإن هذه النماذج ستكون عبارة عن ألواح فارغة بشكل مخيف.

مرتبط

الوسوم

تنشر Anthropic “موجه النظام” الذي يجعل كلود علامة

معجب بهذه:

مرتبط

اترك تعليقاً إلغاء الرد

أسلحة أندوريل المستقلة تتعثر في الاختبارات والقتال، حسبما ذكرت وول ستريت جورنال

بدء عملية اختيار الأمين العام الجديد للأمم المتحدة – ما هو دوره ومن هم السابقون؟

“برلمان مصغر” في قلب النقاش حول تمكين الشباب في القمة العالمية للصناعة

تضيف أستراليا Twitch إلى حظر وسائل التواصل الاجتماعي للمراهقين، مع استثناء Pinterest

قمة أممية في الرياض – هل يمكن للنمو الصناعي والعمل المناخي أن يسيرا جنبا إلى جنب؟

نوفمبر 2025
س	د	ن	ث	أرب	خ	ج
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

شارك هذا الموضوع:

معجب بهذه:

مرتبط

مقالات ذات صلة

اترك تعليقاً إلغاء الرد