تقنية

يمكن لأحدث نماذج Writer إنشاء نص من الصور، بما في ذلك المخططات والرسوم البيانية


مع استمرار الذكاء الاصطناعي التوليدي في السيطرة على العناوين الرئيسية، فمن الصعب في بعض الأحيان العثور على حالات استخدام تجاري فعلية بين هذه الضجة. Writer هي شركة ناشئة في سان فرانسيسكو تعمل على إنشاء منتجات كتابة إبداعية تعمل بالذكاء الاصطناعي مع وضع المؤسسة في الاعتبار. أعلنت الشركة اليوم عن قدرة جديدة لنموذج Palmyra الخاص بها والذي يقوم بإنشاء نص من الصور، بما في ذلك الرسوم البيانية والمخططات، والتي يطلقون عليها اسم Palmyra-Vision.

تقول مي حبيب، المؤسس المشارك للشركة والرئيس التنفيذي، إنهم اتخذوا قرارًا استراتيجيًا بالتركيز على المحتوى متعدد الوسائط، وتعد القدرة على إنشاء نص من الصور جزءًا من هذه الإستراتيجية. قال حبيب لـ TechCrunch: “سنركز على الإدخال متعدد الوسائط، ولكن على إخراج النص، وبالتالي إنشاء النص والرؤية التي يتم تسليمها عبر النص”.

ومن خلال اتباع هذا النجم المرشد، قررت الشركة تحليل الصور، بدلاً من إنتاجها (على الأقل في الوقت الحالي). إنها تحتفظ بالحق في إنشاء مخططات ورسوم بيانية في مرحلة ما من البيانات، ولكن هذا ليس شيئًا يفعلونه في الوقت الحالي. يركز هذا الإصدار تحديدًا على إنشاء نص من تلك الأنواع من الصور.

وتستخدم الشركة نهج النماذج المتعددة لإنتاج نتائج Palmyra-Vision، حيث يكون لكل نموذج وظيفة محددة للقيام بها في تحديد ما هو موجود في الصورة ومن ثم إنشاء النص بأربع تسعات من الدقة، بحسب حبيب.

يحتوي هذا على عدد من حالات الاستخدام، بما في ذلك موقع ويب للتجارة الإلكترونية يقوم بإنشاء نص من آلاف الصور المتغيرة لملء موقع الويب بأحدث البضائع دون الحاجة إلى مواكبة الإنسان لكل تغيير، أو تفسير الوجبات الرئيسية من المخططات والرسوم البيانية تلقائيًا. مثال آخر هو التحقق من الامتثال. على سبيل المثال، يمكن لشركة أدوية استخدام Palmyra-Vision لإجراء فحص تلقائي للامتثال لإدارة الغذاء والدواء (FDA) مقابل نسخة الإعلان، والتأكد من أن الإعلان متوافق مع لوائح إدارة الغذاء والدواء (FDA) كما هو موضح في مستند مرتبط، كما هو موضح في المثال أدناه.

مثال للكاتب Palmyra Vision لشركة أدوية تقوم بفحص الإعلان مقابل مستند يتوافق مع متطلبات إدارة الغذاء والدواء.

مثال Palmyra-Vision لشركة أدوية تقوم بفحص الإعلان مقابل مستند يتوافق مع متطلبات إدارة الغذاء والدواء. اعتمادات الصورة: كاتب

وأخيرًا، يمكن للمنتج تفسير وتلخيص الملاحظات المكتوبة بخط اليد وتحويلها إلى نص، لكن حبيب يقول إنه يتطلب تدريب النموذج على حالات الاستخدام الفردي مثل الحالات الطبية أو التأمين، حتى تكون الدقة موجودة.

تقول حبيب إنها لا توصي باستخدام هذه الأدوات دون مراجعة بشرية كجزء من سير العمل. إنها تعتقد أن هذا ضروري للغاية لأن أي نموذج يمكن أن يهلوس (يختلق أشياء) أو ببساطة يخطئ في الحقائق، ومن المهم أن يقوم الأشخاص بالتحقق من النتائج. على الرغم من أنهم يوصون دائمًا بهذا لكل عميل، ويتفهم معظمهم ذلك في هذه المرحلة، إلا أنها تعتقد أن الأمر سيتطلب في النهاية سير عمل أكثر آلية لتحقيق ذلك بشكل متسق عبر العملاء، وهو أمر تقول إنهم يعملون على تحقيقه.

جمعت الشركة 126 مليون دولار حتى الآن، وفقًا لبيانات Crunchbase، وتتحدث حاليًا مع منصات البنية التحتية السحابية الكبيرة حول الشراكة أثناء محاولتها توسيع نطاق الشركة. وكانت آخر جولة لها هي سلسلة B بقيمة 100 مليون دولار في سبتمبر الماضي بقيادة Iconiq.

أحدث إصدار من Palmyra مزود بإمكانيات تحويل الصورة إلى نص متاح بدءًا من اليوم.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى