تقنية

يدعم Google Gradient إرسال الذكاء الاصطناعي لمساعدة المؤسسات على استخراج البيانات من المستندات المعقدة


ترغب شركة هولندية ناشئة في مساعدة الشركات على الحصول على بيانات إضافية من كميات كبيرة من المستندات المعقدة حيث تكون الدقة والأمان أمرًا بالغ الأهمية – وقد حصلت للتو على دعم Gradient Ventures من Google للقيام بذلك.

تتفوق شركة Send AI، كما تُسمى الشركة الناشئة، على الشركات القائمة في مجال معالجة المستندات مثل UiPath، وAbbyy، وRossum، وKofax، من خلال منصة قابلة للتخصيص تسمح للشركات بضبط نماذج الذكاء الاصطناعي لاستخراج البيانات الفردية الخاصة بها. الاحتياجات.

على سبيل المثال، من المرجح أن تضطر الشركة التي تعمل في صناعة شديدة التنظيم مثل التأمين إلى معالجة عدد لا يحصى من التنسيقات، من ملفات PDF والملفات الورقية إلى صور الهواتف الذكية الملتقطة بجميع أنواع التوجهات و”الضوضاء” في الخلفية. يمكن أن تكون أنواع البيانات “غير المنظمة” غير القياسية هذه صعبة بما يكفي لتحليلها من قبل البشر، ولكن النهج الذي تقوده الآلة بالكامل يمكن أن يؤدي إلى رفض مطالبات خاطئة أو سداد التكاليف ومشاكل إدارية في المستقبل.

في الواقع، غالبًا ما يتم تصميم برامج معالجة المستندات النموذجية الجاهزة لأنواع المستندات الأكثر شيوعًا التي تتقاطع مع صناعات متعددة، مما يجعلها غير مناسبة لحالات استخدام معينة. من ناحية أخرى، باستخدام Send AI، يمكن للشركات تدريب نموذج رؤية الكمبيوتر للتعرف على مستندات محددة، ونموذج لغة منفصل لاستخراج البيانات ذات الصلة والتحقق من صحتها – مع إشراك البشر إذا كان هناك أي شك، للتحكم في كل منها ومراجعتها. خطوة من خلال واجهة الويب.

قال توم ترينتيلمان، المؤسس والرئيس التنفيذي لشركة Send AI، لـ TechCrunch: “يمكن أن يكون هذا التحقق بسيطًا مثل التحقق مما إذا كان الرقم المتوقع هو رقم بالفعل، أو بحث أكثر تعقيدًا عن رقم التسجيل في قاعدة البيانات لمعرفة ما إذا كان هناك تطابق”. “سيتم الإبلاغ عن أي حالة من عدم الأمان للمراجعة البشرية.”

تأسست شركة Send AI في أمستردام في عام 2021 في البداية باسم Autopilot، وقد جمعت سابقًا استثمارًا صغيرًا بقيمة 100000 دولار من صندوق خريجي الجامعات، ولكن مع بدء تكثيف الأمور، فقد جمعت الآن مبلغًا إضافيًا قدره 2.2 مليون يورو (2.4 مليون دولار) في عام 2021. – جولة تمويل أولية شاركت في قيادتها شركة Gradient Ventures من Google وKeen Venture Partners، بمشاركة عدد من الملائكة النابعة من شركات مثل DeepMind.

كيف تعمل

يمكن للشركات الوصول إلى برامج Send AI المستندة إلى السحابة عبر واجهات برمجة التطبيقات (APIs) التي تنقل البيانات من المستندات المرسلة عبر البريد الإلكتروني. عند الاستلام، يقوم Send AI بتحسين المستندات بصريًا قبل إرسالها إلى نماذج اللغة الخاصة بها لتصنيفها واستخراجها.

فيما يتعلق بالسوق المستهدف، يقول ترنتلمان إن الشركة تستهدف بشكل جوهري المؤسسات الأكبر حجمًا، لأنها “تكافح مع المستندات أكثر من غيرها”، على الرغم من أن أي شركة تعالج كميات كبيرة من المستندات يمكن أن تجد في الحقيقة استخدامًا لهذه التكنولوجيا.

اعتمادات الصورة إرسال الذكاء الاصطناعي: استخراج البيانات

ربما من نافلة القول أنه إلى جانب العدد الكبير من أدوات معالجة المستندات الموجودة بالفعل في السوق، تواجه Send AI جيلًا جديدًا من الشركات الناشئة التي تبيع خدمات مبنية على نماذج لغوية كبيرة جديدة قوية (LLMs) مثل OpenAI الذي تفعله مع GPT-X (الذي يشغل ChatGPT). ولكن في حين يعترف ترينتيلمان بأن مثل هذه المنتجات تعمل بشكل رائع في المواقف التي تتطلب درجة “جيدة ذاتيًا” مثل التلخيص أو الإجابة على الأسئلة، حيث تكون هناك حاجة إلى درجة عالية من الدقة عبر كميات كبيرة من المستندات، إلا أن الأمر مختلف.

قال ترينتيلمان: “سوف تصطدم بهذه التقنيات عاجلاً وليس آجلاً – فبرامج الماجستير في القانون الكبيرة والعامة لا تزال غير قابلة للتنبؤ، وبطيئة، ومكلفة”. “في Send AI، نسمح للعميل ببناء الحل الخاص به.”

تحت الغطاء، تم بناء Send AI على نماذج أصغر مفتوحة المصدر يقوم العميل بتدريبها أولاً عن طريق معالجة مجموعة صغيرة من المستندات يدويًا، وبعد ذلك يتم شطفها وتكرارها على مستندات جديدة مع وجود البشر في متناول اليد لتقديم التصحيحات.

فيما يتعلق بالتسعير، تفرض خدمة Send AI رسومًا على أساس ائتماني أساسي، حيث يدفع العملاء مقابل كل خطوة معالجة. وقال ترينتيلمان: “بهذه الطريقة، يمكننا التمييز بين معالجة ملف PDF مكون من 50 صفحة أو مجرد مقتطف من نص واحد”. “إن نماذجنا رخيصة وسريعة وموثوقة، لذا يمكننا نشرها على أساس كل عميل. وبهذه الطريقة، يتحكم العملاء في بياناتهم وأدائهم، ولهذا السبب نقوم بعمل جيد في الصناعات الخاضعة للتنظيم مثل التأمين الصحي والحكومة.

يتحكم

تدعي شركة Send AI أن تقنيتها ستجذب الصناعات شديدة التنظيم نظرًا للتحكم الذي تمنحه للعملاء على بياناتهم، وهو ما قد يبدو غير بديهي نظرًا لأن كل ذلك يعتمد على السحابة. ومع ذلك، يشير ترنتلمان إلى كيفية عمل ماجستير إدارة الأعمال النموذجي من أمثال OpenAI، في مقابل الطريقة التي يمكن بها مزج بيانات التدريب من عدة عملاء مختلفين في نموذج واحد، مما يزيد من احتمالية تسرب البيانات الحساسة. وهذا هو بالضبط السبب وراء ظهور عدد كبير من الشركات الناشئة مع وعد بحماية البيانات الخاصة ضمن البرامج التي تدعمها LLM.

يحاول Send AI معالجة هذه المخاوف من خلال نشر نماذج محولات صغيرة ومعزولة مفتوحة المصدر لكل عميل.

وقال ترينتيلمان: “نحن نستخدم مجموعة متنوعة منهم لإنجاز المهمة – فهم لا يثيرون إعجابهم كثيرًا، ولكن بمجرد تدريبهم على بيانات عالية الجودة، يصبحون أقوياء ودقيقين”.

لذلك، في حين أن النماذج وبيانات التدريب المرتبطة بها لا تزال موجودة على سحابة Send AI، فإن استخدام النماذج المعزولة يعني أنه يمكنه تحديد مكان وجود البيانات بدقة وبالتالي حذفها عند الطلب. وهذا، وفقًا لترينتيلمان، يكفي لجعله “المرشح المفضل” على مقدمي الخدمة الآخرين، ويقطع شوطًا نحو إقناع الشركات التي تركز على خصوصية البيانات بأن عمليات النشر داخل الشركة ليست خيارها الوحيد.

وقال ترينتيلمان: “في الوقت الحاضر، تسمح المزيد من الشركات الخاضعة للتنظيم للموردين باستخدام السحابة العامة، طالما أنهم يلتزمون بقائمة واسعة من اللوائح”. “لقد طرحنا دائمًا سؤالًا مقدمًا حول ما إذا كان بإمكاننا النشر داخل الشركة، ولكن في النهاية اختارت جميع الشركات، باستثناء شركة واحدة، عروضنا السحابية العامة.”

في الوقت الحالي، تعمل خدمة Send AI في الوضع التجريبي الخاص، على الرغم من أنها تدعي بالفعل وجود بعض العملاء المثيرين للإعجاب بما في ذلك شركة التأمين العملاقة Axa. ومع فريق مكون من سبعة أفراد اليوم، تخطط الشركة لاستخدام ضخها النقدي الجديد لمضاعفة عدد موظفيها على مدار العام قبل الإطلاق التجاري الكامل.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى