تقنية

“لحظة GPT” لروبوتات الذكاء الاصطناعي قريبة


ليس سراً أن النماذج الأساسية قد حولت الذكاء الاصطناعي في العالم الرقمي. أحدثت نماذج اللغات الكبيرة (LLMs) مثل ChatGPT وLLaMA وBard ثورة في الذكاء الاصطناعي للغة. على الرغم من أن نماذج GPT الخاصة بـ OpenAI ليست النموذج اللغوي الكبير الوحيد المتاح، إلا أنها حققت الاعتراف الأكثر شيوعًا بأخذ مدخلات النص والصور وتقديم استجابات شبيهة بالاستجابات البشرية – حتى مع بعض المهام التي تتطلب حل مشكلات معقدة وتفكيرًا متقدمًا.

لقد شكل اعتماد ChatGPT الفيروسي والواسع النطاق إلى حد كبير كيفية فهم المجتمع لهذه اللحظة الجديدة للذكاء الاصطناعي.

إن التقدم التالي الذي سيحدد هوية الذكاء الاصطناعي لأجيال عديدة هو الروبوتات. إن بناء الروبوتات التي تعمل بالذكاء الاصطناعي والتي يمكنها تعلم كيفية التفاعل مع العالم المادي من شأنه أن يعزز جميع أشكال العمل المتكرر في قطاعات تتراوح من الخدمات اللوجستية، والنقل، والتصنيع إلى البيع بالتجزئة، والزراعة، وحتى الرعاية الصحية. كما أنه سيفتح العديد من الكفاءات في العالم المادي كما رأينا في العالم الرقمي على مدى العقود القليلة الماضية.

في حين أن هناك مجموعة فريدة من المشاكل التي يجب حلها داخل الروبوتات مقارنة باللغة، إلا أن هناك أوجه تشابه عبر المفاهيم الأساسية الأساسية. وقد أحرز بعض ألمع العقول في مجال الذكاء الاصطناعي تقدما كبيرا في بناء “الجي بي تي للروبوتات”.

ما الذي يمكّن من نجاح GPT؟

لفهم كيفية بناء “GPT للروبوتات”، انظر أولاً إلى الركائز الأساسية التي مكنت من نجاح ماجستير إدارة الأعمال مثل GPT.

نهج نموذج الأساس

GPT هو نموذج ذكاء اصطناعي تم تدريبه على مجموعة بيانات واسعة ومتنوعة. قام المهندسون سابقًا بجمع البيانات وتدريب ذكاء اصطناعي محدد على مشكلة معينة. ثم سيحتاجون إلى جمع بيانات جديدة لحل مشكلة أخرى. مشكلة اخرى؟ بيانات جديدة مرة أخرى. أما الآن، ومع اتباع نهج النموذج الأساسي، فإن العكس تمامًا هو ما يحدث.

بدلاً من بناء أنظمة ذكاء اصطناعي متخصصة لكل حالة استخدام، يمكن استخدام واحد منها عالميًا. وهذا النموذج العام أكثر نجاحًا من كل نموذج متخصص. يعمل الذكاء الاصطناعي في النموذج الأساسي بشكل أفضل في مهمة واحدة محددة. يمكنه الاستفادة من الدروس المستفادة من المهام الأخرى والتعميم على المهام الجديدة بشكل أفضل لأنه تعلم مهارات إضافية من الاضطرار إلى الأداء الجيد عبر مجموعة متنوعة من المهام.

التدريب على مجموعة بيانات كبيرة ومملوكة وعالية الجودة

للحصول على ذكاء اصطناعي معمم، تحتاج أولاً إلى الوصول إلى كمية هائلة من البيانات المتنوعة. حصلت شركة OpenAI على بيانات العالم الحقيقي اللازمة لتدريب نماذج GPT بكفاءة معقولة. لقد تدربت GPT على البيانات التي تم جمعها من الإنترنت بالكامل باستخدام مجموعة بيانات كبيرة ومتنوعة، بما في ذلك الكتب والمقالات الإخبارية ومنشورات وسائل التواصل الاجتماعي والأكواد والمزيد.

إن بناء الروبوتات التي تعمل بالذكاء الاصطناعي والتي يمكنها تعلم كيفية التفاعل مع العالم المادي من شأنه أن يعزز جميع أشكال العمل المتكرر.

ليس حجم مجموعة البيانات هو المهم فحسب؛ ويلعب تنظيم البيانات عالية الجودة والقيمة دورًا كبيرًا أيضًا. حققت نماذج GPT أداءً غير مسبوق لأن مجموعات البيانات عالية الجودة الخاصة بها تعتمد في الغالب على المهام التي يهتم بها المستخدمون والإجابات الأكثر فائدة.

دور التعلم المعزز (RL)

يستخدم OpenAI التعلم المعزز من ردود الفعل البشرية (RLHF) لمواءمة استجابة النموذج مع التفضيلات البشرية (على سبيل المثال، ما يعتبر مفيدًا للمستخدم). يجب أن يكون هناك أكثر من مجرد التعلم الخاضع للإشراف (SL) لأن التعلم الخاضع للإشراف لا يمكنه التعامل مع المشكلة إلا من خلال نمط واضح أو مجموعة من الأمثلة. تتطلب LLMs من الذكاء الاصطناعي تحقيق هدف دون الحصول على إجابة صحيحة وفريدة. أدخل RLHF.

يسمح RLHF للخوارزمية بالتحرك نحو الهدف من خلال التجربة والخطأ بينما يعترف الإنسان بالإجابات الصحيحة (مكافأة عالية) أو يرفض الإجابات غير الصحيحة (مكافأة منخفضة). يعثر الذكاء الاصطناعي على وظيفة المكافأة التي تشرح التفضيل البشري بشكل أفضل ثم يستخدم RL لمعرفة كيفية الوصول إلى هناك. يمكن لـ ChatGPT تقديم استجابات تعكس قدرات المستوى البشري أو تتجاوزها من خلال التعلم من ردود الفعل البشرية.

الحدود التالية لنماذج الأساس هي في مجال الروبوتات

نفس التكنولوجيا الأساسية التي تسمح لـ GPT بالرؤية والتفكير وحتى التحدث، تمكن أيضًا الآلات من الرؤية والتفكير والتصرف. يمكن للروبوتات المدعومة بنموذج أساسي فهم البيئة المادية المحيطة بها، واتخاذ قرارات مستنيرة، وتكييف أفعالها مع الظروف المتغيرة.

يتم بناء “GPT للروبوتات” بنفس الطريقة التي تم بها بناء GPT، مما يضع الأساس لثورة ستعيد تعريف الذكاء الاصطناعي كما نعرفه مرة أخرى.

نهج نموذج الأساس

من خلال اتباع نهج النموذج الأساسي، يمكنك أيضًا إنشاء ذكاء اصطناعي واحد يعمل عبر مهام متعددة في العالم المادي. قبل بضع سنوات، نصح الخبراء بإنشاء ذكاء اصطناعي متخصص للروبوتات التي تقوم باختيار وتعبئة مواد البقالة. وهذا يختلف عن النموذج الذي يمكنه فرز الأجزاء الكهربائية المختلفة، والذي يختلف عن نموذج تفريغ المنصات من الشاحنة.

يمكّن هذا التحول النموذجي إلى النموذج الأساسي الذكاء الاصطناعي من الاستجابة بشكل أفضل لسيناريوهات الحالة المتطورة التي توجد غالبًا في بيئات العالم الحقيقي غير المنظمة والتي قد تعوق النماذج ذات التدريب الأضيق. يعد بناء ذكاء اصطناعي واحد معمم لجميع هذه السيناريوهات أكثر نجاحًا. ومن خلال التدريب على كل شيء تحصل على الاستقلالية على المستوى البشري التي افتقدناها عن الأجيال السابقة من الروبوتات.

التدريب على مجموعة بيانات كبيرة ومملوكة وعالية الجودة

إن تعليم الروبوت لمعرفة الإجراءات التي تؤدي إلى النجاح وما يؤدي إلى الفشل أمر صعب للغاية. فهو يتطلب بيانات واسعة النطاق وعالية الجودة تعتمد على التفاعلات الفيزيائية في العالم الحقيقي. تعد إعدادات المختبر الفردي أو أمثلة الفيديو مصادر غير موثوقة أو قوية بدرجة كافية (على سبيل المثال، تفشل مقاطع فيديو YouTube في ترجمة تفاصيل التفاعل المادي وتميل مجموعات البيانات الأكاديمية إلى أن تكون محدودة النطاق).

على عكس الذكاء الاصطناعي لمعالجة اللغة أو الصور، لا توجد مجموعة بيانات موجودة مسبقًا تمثل كيفية تفاعل الروبوتات مع العالم المادي. وبالتالي، تصبح مجموعة البيانات الكبيرة عالية الجودة تحديًا أكثر تعقيدًا في مجال الروبوتات، كما أن نشر أسطول من الروبوتات في الإنتاج هو الطريقة الوحيدة لبناء مجموعة بيانات متنوعة.

دور التعلم المعزز

على غرار الإجابة على الأسئلة النصية بقدرات على المستوى البشري، يتطلب التحكم الآلي والتلاعب من الوكيل أن يسعى لتحقيق التقدم نحو هدف لا يحتوي على إجابة واحدة صحيحة وفريدة من نوعها (على سبيل المثال، “ما هي الطريقة الناجحة لالتقاط هذه البصلة الحمراء؟”) . مرة أخرى، مطلوب أكثر من مجرد التعلم الخاضع للإشراف.

أنت بحاجة إلى روبوت يقوم بتشغيل التعلم المعزز العميق (deep RL) لتحقيق النجاح في مجال الروبوتات. يجمع هذا النهج المستقل للتعلم الذاتي بين التعلم العميق والشبكات العصبية العميقة لفتح مستويات أعلى من الأداء – وسيقوم الذكاء الاصطناعي تلقائيًا بتكييف استراتيجيات التعلم الخاصة به ويستمر في ضبط مهاراته أثناء تجربة سيناريوهات جديدة.

النمو الهائل والصعب قادم

في السنوات القليلة الماضية، وضع بعض ألمع خبراء الذكاء الاصطناعي والروبوتات في العالم الأساس التقني والتجاري لثورة نموذج الأساس الآلي التي ستعيد تعريف مستقبل الذكاء الاصطناعي.

في حين تم بناء نماذج الذكاء الاصطناعي هذه بشكل مشابه لـ GPT، فإن تحقيق الاستقلالية على المستوى البشري في العالم المادي يمثل تحديًا علميًا مختلفًا لسببين:

  1. إن بناء منتج قائم على الذكاء الاصطناعي يمكنه أن يخدم مجموعة متنوعة من إعدادات العالم الحقيقي يتطلب مجموعة رائعة من المتطلبات المادية المعقدة. يجب أن يتكيف الذكاء الاصطناعي مع تطبيقات الأجهزة المختلفة، حيث أنه من المشكوك فيه أن يعمل جهاز واحد في مختلف الصناعات (الخدمات اللوجستية، والنقل، والتصنيع، وتجارة التجزئة، والزراعة، والرعاية الصحية، وما إلى ذلك) والأنشطة داخل كل قطاع.
  2. تعد المستودعات ومراكز التوزيع بيئة تعليمية مثالية لنماذج الذكاء الاصطناعي في العالم المادي. من الشائع أن يكون لديك مئات الآلاف أو حتى الملايين من وحدات حفظ المخزون المختلفة (SKU) التي تتدفق عبر أي منشأة في أي لحظة – مما يوفر مجموعة البيانات الكبيرة والملكية وعالية الجودة اللازمة لتدريب “GPT للروبوتات”.

“لحظة GPT” لروبوتات الذكاء الاصطناعي قريبة

يتسارع مسار نمو نماذج الأساس الروبوتية بوتيرة سريعة للغاية. يتم بالفعل تطبيق التطبيقات الروبوتية، خاصة في المهام التي تتطلب معالجة دقيقة للكائنات، في بيئات الإنتاج الواقعية – وسنرى عددًا هائلاً من التطبيقات الروبوتية القابلة للتطبيق تجاريًا والتي سيتم نشرها على نطاق واسع في عام 2024.

نشر تشين أكثر من 30 بحثًا أكاديميًا ظهرت في أفضل المجلات العالمية المتخصصة في الذكاء الاصطناعي والتعلم الآلي.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى