يتعامل الذكاء الاصطناعي الذي تعمل على تنظيف الورق من شركة Reliant مع كدح البيانات العلمية

لقد أثبتت نماذج الذكاء الاصطناعي قدرتها على القيام بأشياء كثيرة، ولكن ما هي المهام التي نريدها أن تقوم بها بالفعل؟ يُفضل العمل الشاق، ويوجد الكثير من ذلك في مجال البحث والأوساط الأكاديمية. تأمل Reliant أن تتخصص في هذا النوع من أعمال استخراج البيانات التي تستغرق وقتًا طويلاً والتي تعد حاليًا تخصصًا لطلاب الدراسات العليا والمتدربين المتعبين.

قال الرئيس التنفيذي كارل موريتز: “أفضل شيء يمكنك القيام به باستخدام الذكاء الاصطناعي هو تحسين التجربة الإنسانية: تقليل العمالة الوضيعة والسماح للناس بالقيام بالأشياء التي تهمهم”. في عالم الأبحاث، حيث عمل هو والمؤسسان المشاركان مارك بيلمار وريتشارد شليغل لسنوات، تعد مراجعة الأدبيات أحد الأمثلة الأكثر شيوعًا على هذا “العمل الوضيع”.

تستشهد كل ورقة بحثية بأعمال سابقة وذات صلة، لكن العثور على هذه المصادر في بحر العلوم ليس بالأمر السهل. وبعضها، مثل المراجعات المنهجية، يستشهد أو يستخدم بيانات من الآلاف.

في إحدى الدراسات، يتذكر موريتز قائلاً: “كان على المؤلفين أن ينظروا إلى 3500 منشور علمي، وانتهى الأمر بالكثير منها غير ذي صلة. لقد أمضينا الكثير من الوقت في استخلاص كمية ضئيلة من المعلومات المفيدة، ويبدو أن هذا شيء يجب أن تتم أتمتته بواسطة الذكاء الاصطناعي.

لقد كانوا يعلمون أن نماذج اللغة الحديثة يمكنها القيام بذلك: فقد قامت إحدى التجارب بتكليف ChatGPT بالمهمة، ووجدت أنها قادرة على استخراج البيانات بمعدل خطأ قدره 11%. مثل العديد من الأشياء التي يمكن لحاملي LLM القيام بها، فهي مثيرة للإعجاب ولكنها لا تشبه ما يحتاجه الناس فعليًا.

اعتمادات الصورة: الذكاء الاصطناعي المعتمد

قال موريتز: “هذا ليس جيدًا بما فيه الكفاية”. “بالنسبة لهذه المهام المعرفية، مهما كانت وضيعة، فمن المهم جدًا ألا ترتكب الأخطاء.”

يعتمد منتج Reliant الأساسي، Tabular، على LLM جزئيًا (LLaMa 3.1)، ولكن مع تقنيات أخرى خاصة به، فهو أكثر فعالية إلى حد كبير. في استخراج الدراسة أعلاه، قالوا إنها قامت بنفس المهمة دون أي أخطاء.

ما يعنيه ذلك هو: تقوم بتفريغ آلاف المستندات، ولنفترض أنك تريد إخراج هذا وذاك والبيانات الأخرى منها، وتقوم شركة Reliant من خلالها بالعثور على تلك المعلومات – سواء كانت مُصنفة ومُنظمة بشكل مثالي أو (على الأرجح بكثير) ليس كذلك. ثم يقوم بإدراج كل تلك البيانات وأي تحليلات تريد إجراؤها في واجهة مستخدم رائعة حتى تتمكن من التعمق في الحالات الفردية.

“يحتاج مستخدمونا إلى أن يكونوا قادرين على التعامل مع جميع البيانات في وقت واحد، ونحن نبني ميزات تسمح لهم بتحرير البيانات الموجودة هناك، أو الانتقال من البيانات إلى الأدبيات؛ قال موريتز: “نحن نرى أن دورنا هو مساعدة المستخدمين في العثور على المكان الذي يصرفون فيه انتباههم”.

هذا التطبيق المصمم والفعال للذكاء الاصطناعي – ليس بنفس روعة الصديق الرقمي ولكنه بالتأكيد أكثر قابلية للتطبيق – يمكنه تسريع العلوم عبر عدد من المجالات عالية التقنية. وقد لاحظ المستثمرون ذلك، حيث قاموا بتمويل جولة تأسيسية بقيمة 11.3 مليون دولار؛ قادت Tola Capital وInovia Capital الجولة بمشاركة الملاك مايك فولبي.

مثل أي تطبيق للذكاء الاصطناعي، فإن تقنية Reliant كثيفة الاستخدام للحوسبة، ولهذا السبب اشترت الشركة أجهزتها الخاصة بدلاً من استئجارها حسب الطلب من أحد كبار مقدمي الخدمة. إن استخدام الأجهزة داخل الشركة يوفر المخاطر والمكافأة: عليك أن تجعل هذه الأجهزة الباهظة الثمن تدفع ثمنها بنفسها، ولكن تحصل على فرصة لحل المشكلة من خلال الحوسبة المخصصة.

وأوضح موريتز: “أحد الأشياء التي اكتشفناها هو أنه من الصعب جدًا تقديم إجابة جيدة إذا كان لديك وقت محدود لتقديم تلك الإجابة”، على سبيل المثال، إذا طلب أحد العلماء من النظام إجراء مهمة استخلاص أو تحليل جديدة على كائن ما. مائة ورقة. يمكن أن يتم ذلك بسرعة، أو بشكل جيد، ولكن ليس كليهما – إلا إذا توقعوا ما هو المستخدمون قد اسأل واكتشف الإجابة، أو شيء من هذا القبيل، في وقت مبكر.

قال بيلمار، كبير المسؤولين العلميين في الشركة الناشئة: “الأمر هو أن الكثير من الأشخاص لديهم نفس الأسئلة، لذا يمكننا العثور على الإجابات قبل أن يطرحوها، كنقطة بداية”. “يمكننا تحويل 100 صفحة من النص إلى شيء آخر، قد لا يكون هذا هو ما تريده بالضبط، ولكن من الأسهل بالنسبة لنا العمل معه.”

فكر في الأمر بهذه الطريقة: إذا كنت ستستخرج المعنى من ألف رواية، فهل ستنتظر حتى يطلب منك شخص ما أسماء الشخصيات لتصفحها والحصول عليها؟ أم أنك ستقوم بهذا العمل مسبقًا (إلى جانب أشياء مثل المواقع والتواريخ والعلاقات وما إلى ذلك) مع العلم أنه من المحتمل أن تكون البيانات مطلوبة؟ بالتأكيد الأخير – إذا كان لديك حساب احتياطي.

كما يمنح هذا الاستخراج المسبق النماذج وقتًا لحل الغموض والافتراضات التي لا مفر منها الموجودة في المجالات العلمية المختلفة. عندما “يشير” أحد المقاييس إلى مقياس آخر، فقد لا يعني ذلك نفس الشيء في مجال المستحضرات الصيدلانية كما هو الحال في علم الأمراض أو التجارب السريرية. ليس هذا فحسب، بل تميل النماذج اللغوية إلى تقديم مخرجات مختلفة اعتمادًا على كيفية طرح أسئلة معينة عليهم. لذا، كانت مهمة ريلاينت هي تحويل الغموض إلى يقين. «وهذا شيء لا يمكنك القيام به إلا إذا كنت على استعداد للاستثمار في علم أو مجال معين،» كما أشار موريتز.

كشركة، ينصب تركيز Reliant الأول على إثبات أن التكنولوجيا يمكن أن تدفع تكاليفها بنفسها قبل محاولة أي شيء أكثر طموحًا. وقال موريتز: “من أجل تحقيق تقدم مثير للاهتمام، يجب أن يكون لديك رؤية كبيرة ولكن عليك أيضًا أن تبدأ بشيء ملموس”. “من وجهة نظر بقاء الشركات الناشئة، فإننا نركز على الشركات الربحية، لأنها تعطينا المال لدفع ثمن وحدات معالجة الرسومات الخاصة بنا. نحن لا نبيع هذا بخسارة للعملاء.

قد يتوقع المرء أن تشعر الشركة بالضغط من شركات مثل OpenAI وAnthropic، التي تضخ الأموال في التعامل مع مهام أكثر تنظيماً مثل إدارة قواعد البيانات والتشفير، أو من شركاء التنفيذ مثل Cohere وScale. لكن بلمار كان متفائلاً: “نحن نبني هذا على نطاق واسع – أي تحسين في مجموعتنا التكنولوجية يعد أمرًا رائعًا بالنسبة لنا. ربما يكون برنامج LLM واحدًا من ثمانية نماذج كبيرة للتعلم الآلي – أما النماذج الأخرى فهي مملوكة لنا بالكامل، وقد تم إنشاؤها من الصفر بناءً على ملكية البيانات لنا.”

من المؤكد أن تحول صناعة التكنولوجيا الحيوية والأبحاث إلى صناعة تعتمد على الذكاء الاصطناعي لا يزال في بدايته، وقد يكون خليطًا إلى حد ما لسنوات قادمة. ولكن يبدو أن شركة Reliant قد وجدت أساسًا قويًا للبدء منه.

قال موريتز: “إذا كنت تريد حلاً بنسبة 95%، وتعتذر بغزارة لأحد عملائك من حين لآخر، فهذا رائع”. “نحن ندعم حيث الدقة والتذكر مهمان حقًا، والأخطاء مهمة حقًا. وبصراحة، هذا يكفي، نحن سعداء بترك الباقي للآخرين.