تقنية

يقوم Napkin بتحويل النص إلى صور مرئية مع القليل من الذكاء الاصطناعي التوليدي


لدينا جميعًا أفكار، لكن توصيلها بشكل فعال وكسب الناس ليس بالأمر السهل. إذًا كيف يمكننا تحقيق ذلك على أفضل وجه في عصر الحمل الزائد للمعلومات وتقلص فترات الاهتمام؟

إذا كنت مهندسًا برامود شارما وجيروم شولر، فإنك تستخدم Napkin، وهي منصة “الذكاء الاصطناعي البصري” الجديدة التي أنشأها الاثنان معًا. يتم إطلاق Napkin بشكل خفي اليوم بتمويل قدره 10 ملايين دولار من Accel وCRV.

نشأت شركة Napkin نتيجة لإحباط شارما وشولر من العدد اللامتناهي من المستندات ومجموعات العروض التقديمية التي أصبحت هي القاعدة في عالم الشركات. قبل إنشاء شركة Napkin، قام شارما، وهو موظف سابق في Google، بتأسيس شركة الألعاب التعليمية Osmo. كان شولر ضمن الفريق المؤسس لشركة Osmo، وقبل ذلك كان يعمل في Ubisoft وLucasArts وGoogle.

وقال شارما لـ TechCrunch: “إن منتج Napkin الأساسي يستهدف المسوقين ومنشئي المحتوى والمهندسين والمهنيين في مجال بيع الأفكار وإنشاء المحتوى”. “الهدف هو تقليل الوقت والصداع في عملية التصميم من خلال تحويلها إلى تدفق إنتاجي في الغالب.”

تشير كلمة “مولد” إلى الذكاء الاصطناعي التوليدي. نعم، منديل بعد آخر تراهن الشركة على إمكانات التكنولوجيا وتنضم إلى قائمة طويلة جدًا. لكن تبرز بعض الأشياء في هذه التجربة، التي تعتمد بشكل صارم على الويب في الوقت الحالي.

باستخدام Napkin، يبدأ المستخدمون بالنص – عرضًا تقديميًا أو مخططًا تفصيليًا أو أي مستند آخر على نفس المنوال – أو اطلب من التطبيق إنشاء نص من موجه (على سبيل المثال، “مخطط لأفضل الممارسات لمقابلة التوظيف”). يقوم Napkin بعد ذلك بإنشاء لوحة قماشية تشبه Notion مع هذا النص، ثم يُلحق “رمز الشرارة” بفقرات النص التي، عند النقر عليها، تحول النص إلى مرئيات قابلة للتخصيص.

لا تقتصر هذه العناصر المرئية على الصور، بل تشمل أنماطًا مختلفة من المخططات الانسيابية والرسوم البيانية والرسوم البيانية ومخططات Venn وأشجار القرار. تحتوي كل صورة من هذه الصور على أيقونات يمكن استبدالها بأخرى في معرض Napkin، وستحصل على موصلات يمكنها ربط مفهومين أو أكثر بشكل مرئي أيضًا. الألوان والخطوط قابلة للتحرير، ويقدم Napkin “عناصر زخرفية” مثل الإبرازات والتسطير لإضفاء مظهر جميل على أي عنصر.

بمجرد الانتهاء، يمكن تصدير العناصر المرئية كملفات PNG أو PDF أو SVG، أو كعنوان URL يرتبط باللوحة القماشية التي تم إنشاؤها فيها.

وقال شارما: “على عكس الأدوات الحالية التي تضيف مكونًا توليديًا إلى محرر حالي، فإننا نركز على تجربة الجيل الأول حيث تتم إضافة التحرير لتكملة الجيل وليس العكس”.

أخذت المنديل في جولة قصيرة للتعرف على ما يمكن أن يفعله.

في خطوة إنشاء المستند، وبدافع من الفضول المرضي، حاولت أن أجعل Napkin ينشئ شيئًا مثيرًا للجدل، مثل “تعليمات لقتل شخص ما” أو “قائمة من الإهانات المسيئة للغاية”. أيًا كان ما يستخدمه AI Napkin، فلن يخبرني بكيفية ارتكاب جريمة قتل، لكنه امتثل للطلب الأخير – وإن كان ذلك مع إضافة حول كيف كانت الإهانات “مقصودة لأغراض تعليمية”. (يوجد زر في شاشة اللوحة للإبلاغ عن هذا النوع من سوء سلوك الذكاء الاصطناعي.)

نجح الأذى، وألقيت مقالة TechCrunch في Napkin – مسودة لهذا المقال على وجه الدقة. وسرعان ما أصبح واضحًا أين تكمن نقاط القوة والضعف لدى نابكين.

يعمل المنديل بشكل أفضل مع الأوصاف البسيطة، والخطوط العريضة للأفكار، والسرد مع جداول زمنية محددة بوضوح. إن أبسط طريقة للتعبير عن ذلك هي أنه إذا كانت الفكرة تبدو وكأنها يمكن توضيحها بشكل أفضل في صورة مرئية، فإن المنديل في كثير من الأحيان سوف يرقى إلى مستوى المناسبة.

اعتمادات الصورة: منديل

عندما يكون النص أكثر غموضًا، يمسك المنديل بالقش، مما يؤدي في بعض الأحيان إلى إنشاء صور غير مرتبطة بهذا النص على الإطلاق. ألقِ نظرة على ما هو موضح أدناه، على سبيل المثال، فهو على وشك أن يكون غير منطقي.

منديل
اعتمادات الصورة: منديل

بالنسبة إلى الصورة المرئية أدناه، اخترع Napkin إيجابيات وسلبيات من القماش بالكامل (كما تفعل النماذج التوليدية). لم أذكر في أي مكان في الفقرة مشكلات الخصوصية أو منحنى التعلم الخاص بـ Napkin.

منديل
اعتمادات الصورة: منديل

يقترح Napkin أحيانًا صورًا أو أعمالًا فنية للمرئيات. سألت شارما عما إذا كان على المستخدمين القلق بشأن الآثار المترتبة على حقوق الطبع والنشر لهذه، وقال إن Napkin لا تستخدم أي بيانات عامة أو محمية بموجب IP لإنشاء الصور. وأضاف: “إنه أمر داخلي بالنسبة إلى Napkin، لذا لا داعي للقلق بشأن حقوق المحتوى الذي تم إنشاؤه”.

منديل
اعتمادات الصورة: منديل

لا يسعني إلا أن ألاحظ أن العناصر المرئية في Napkin تلتزم جميعًا بلغة تصميم عامة ومتجانسة. وصف بعض المستخدمين الأوائل لميزات الذكاء الاصطناعي التوليدية من Microsoft لبرنامج PowerPoint النتائج من هذا البرنامج بأنها “على مستوى المدرسة الثانوية”، ولم يكن بوسع العرض التوضيحي Napkin إلا أن يستحضر هذه التعليقات في ذهني.

هذا لا يعني أن بعضًا من هذا غير قابل للإصلاح. لا يزال الوقت مبكرًا بالنسبة لـ Napkin، على كل حال – لدى المنصة خطط لإطلاق خطط مدفوعة، ولكن ليس في أي وقت قريب – والفريق مقيد قليلاً بالموارد بسبب حجمه. يوجد 10 أشخاص في Napkin ومقرها Los Altos في الوقت الحالي، وتخطط للنمو إلى 15 بحلول نهاية العام.

علاوة على ذلك، يمكن قليلون أن يجادلوا بأن شارما وشولر ليسا من رواد الأعمال الناجحين، حيث باعا شركة Osmo لشركة التكنولوجيا التعليمية الهندية العملاقة Byju’s مقابل 120 مليون دولار في عام 2019. وقد دعم ريتش وونغ من شركة Accel شركة Napkin جزئيًا لأنه أعجب بخروج Osmo – وكان Wong أيضًا من أوائل المستثمرين في شركة Napkin. أوسمو.

وقال وونغ في بيان: “يتمتع جيروم وبرامود بقدرة خارقة على التعامل مع شيء صعب للغاية من منظور تقني وتسهيل الأمر على المستخدمين”. “باعتبارنا شريكًا لشركتهم الأولى، Osmo، شاهدناهم وهم يحققون رؤيتهم لحركة لعب جديدة باستخدام الذكاء الاصطناعي العاكس. نحن متحمسون لدعم هذا الفصل الجديد حيث تقوم Napkin بجلب الذكاء الاصطناعي المرئي إلى رواية القصص التجارية.

يقول شارما إن عائدات الجولة البالغة 10 ملايين دولار سيتم تخصيصها لتطوير المنتجات وتوظيف مهندسي الذكاء الاصطناعي ومصممي الجرافيك.

وقال: “ستتجه كل طاقتنا ومواردنا نحو كيفية قيام Napkin بإنشاء العناصر المرئية الأكثر صلة وإقناعًا في ضوء محتوى النص”. “هناك طرق لا حصر لها للتصور والتصميم. نحن نستثمر رأس المال في بناء هذا العمق وتحسين جودة الذكاء الاصطناعي.


اكتشاف المزيد من موقع fffm

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى

اكتشاف المزيد من موقع fffm

اشترك الآن للاستمرار في القراءة والحصول على حق الوصول إلى الأرشيف الكامل.

Continue reading