Humane’s Ai Pin عن قرب

بضعة ساعات بعد الكشف الكبير هذا الصباح، فتحت منظمة Humane أبوابها لحفنة من الصحافة. يقع المكتب في مبنى عادي في حي SoMa في سان فرانسيسكو، وهو موطن لفرق تصميم الأجهزة في الشركة الناشئة.
يوجد مكتب مجاور يضم مهندسي منتجات Humane، بينما يعمل فريق الهندسة الكهربائية من مساحة ثالثة مباشرة عبر الشارع. تدير الشركة أيضًا مكتبًا في نيويورك، على الرغم من أن نصيب الأسد من الموظفين البالغ عددهم 250 شخصًا موجود هنا في سان فرانسيسكو.
اليوم، تشغل سلسلة من المحطات التجريبية جزءًا كبيرًا من المساحة (مع سياسة صارمة لعدم التصوير)، حيث يتم وضع دبابيس Ai المختلفة في حالات مختلفة من خلع ملابسها، مما يفضح مكائدها الخارجية. ومع ذلك، قبل حضور هذه الاجتماعات، يقف مؤسسو شركة Humane أمام مجموعة صغيرة من الكراسي، محاطين بشاشة مسطحة تعرض رؤية الشركة.
تقدم الرئيسة التنفيذية بيثاني بونجيورنو نبذة تاريخية عن الشركة، بدءًا من كيفية التقائها بالمؤسس المشارك والرئيس عمران تشودري في أول يوم لها في شركة Apple. يعود تاريخ الشركة بأكمله إلى صاحب العمل السابق. وهناك قاموا بسرقة مدير التكنولوجيا التنفيذي باتريك جيتس، إلى جانب 90 شخصًا أو نحو ذلك من موظفي أبل السابقين.
اعتمادات الصورة: بريان هيتر
ومن جانبه، يصور تشودري قصة الشركة باعتبارها إحدى المنحنيات على شكل حرف S – وهي دورات من التكنولوجيا مدتها 15 عامًا تشكل الأساس للمرحلة التالية وتفسح المجال لها في نهاية المطاف. يقول للحاضرين: “لقد استقرت الحقبة الأخيرة”، مشيراً إلى أن عمر الهاتف الذكي “16 عاماً” – على الرغم من أن هذا أيضاً يبدو بمثابة غمزة لأرباب العمل السابقين، الذين وصل أول هاتف آيفون الخاص بهم في عام 2007.
وهو يصور المنتج الأول لشركة Humane على أنه “طريقة جديدة للتفكير، وإحساس جديد بالفرصة”. ويضيف أنه جهد من أجل “إنتاج الذكاء الاصطناعي”. من المؤكد أن العرض التقديمي الشخصي أقوى مما قد تقودك مقاطع الفيديو السابقة إلى تصديقه. صحيح أن التصريحات لا تزال فخمة وشاملة، حيث تضع الجهاز الذي يرتديه طية صدر السترة في سياقه كخطوة تالية في رحلة حوسبة بدأت بحواسيب مركزية بحجم الغرفة، لكن المحادثة تصبح أكثر واقعية عندما يتم وضع الجهاز أمامنا.
يتميز الجهاز بحجم دفتر الثقاب بمعالج Snapdragon وسعة تخزين محلية تبلغ 32 جيجابايت. الكاميرا عبارة عن مستشعر بدقة 12 ميجابكسل مصمم للهاتف الذكي ولكنه مدمج في وحدة Humane الخاصة. يوجد مقياس تسارع وجيروسكوب ومستشعر عمق ووقت الطيران. مثل منتجات أبل، تم تصميمه في كاليفورنيا وتم تصنيعه بشكل أساسي في آسيا.
يتم احتكار غالبية الجزء الخارجي للجهاز من خلال لوحة تعمل باللمس تحتوي على غالبية المكونات الموجودة على متن الطائرة وبطارية يجب أن تستمر لمدة أربع أو خمس ساعات مقابل الشحن. وفوق هذا، يوجد نوع من شريط الكاميرا يضم المستشعرات المذكورة أعلاه، جنبًا إلى جنب مع نظام عرض الليزر – وهو الجانب الأكثر لفتًا للنظر في الأمر برمته. يميل شريط الكاميرا بزاوية لأسفل. يقول Humane إنهم اختبروا الدبوس على مجموعة متنوعة من أنواع الجسم المختلفة واستقروا على تصميم يناسب المستخدمين ذوي الصناديق الأكبر حجمًا.
وأخبرتني الشركة أيضًا أنها اختبرت جهاز عرض الليزر بمجموعة من ظلال البشرة المختلفة، للتأكد من أنه سيكون مرئيًا. على الرغم من أنها جذابة بصريًا، إلا أنها تعتبر ميزة ثانوية لما يعتبر في الأساس منتجًا صوتيًا أولاً. ومع ذلك، إذا كنت في بيئة صاخبة جدًا أو هادئة جدًا بحيث لا تستوعب مكبر الصوت الصغير المتجه لأعلى والذي يمتد على طول الجزء العلوي من الجهاز، فانقر على لوحة اللمس وستبدأ الكاميرا في العمل بحثًا عن يد. بمجرد رصده، يبدأ في البروز.

اعتمادات الصورة: بريان هيتر
أظهر تشودري هذه الميزة خلال محادثة TED في شهر مايو. وبعد دقيقة أو دقيقتين، تأتي مكالمة منظمة من بونجيورنو، ويسقطها الدبوس على كفه في شكل نص. ومن هنا، يمكنه النقر بكفه لقبول المكالمة أو رفضها، حيث يقوم النظام بتحديد الحركة والتصرف وفقًا لذلك.
ومع ذلك، يمكن أن تعرض أجهزة الليزر أكثر من ذلك بكثير. إظهار النص من الرسائل، والذي يمكنك التمرير خلاله باستخدام إيماءة الضغط على نفس اليد. يمكنهم أيضًا عرض معاينات أولية للصور التي تلتقطها، من خلال الليزر الأخضر الذي لا يقوم بأفضل وظيفة في تسليط الضوء على التعقيدات الدقيقة للصورة.
يتمتع دبوس AI بوزن قليل، على الرغم من أن هذا يقابله إلى حد ما “معزز البطارية” الذي يتم شحنه في العلبة، مما يجعل عمر البطارية الكامل حوالي تسع ساعات. يأتي المنتج أيضًا مع علبة على شكل بيضة تضيف شحنًا كاملاً آخر للمنتج. يمكنك إدخال إما الدبوس أو المعزز أو كليهما، وسيتم تثبيتهما في مكانهما مغناطيسيًا. يتم الشحن عن طريق سلسلة من المسامير الموجودة في الجزء الخلفي من الجهاز. يوجد أيضًا في الصندوق لوحة شحن للاستخدام المنزلي.
وأكد بونجيورنو تقارير سابقة عن دفعة أولية مكونة من 100 ألف وحدة. وتقول: “أعتقد أنه كما هو الحال مع كل شركة ناشئة في مجال الأجهزة، نريد التأكد من التخطيط بشكل متحفظ لجميع السيناريوهات”. “بالنسبة لنا في البداية، كان الأمر حقاً هو النظر إلى ما هو الشيء المحافظ والصحيح والمسؤول الذي يجب القيام به، فيما يتعلق بالطلب والسماح لنا بالاختيار إذا تجاوز طلبنا 100 ألف”.
وتضيف أنه حتى يوم أمس، كان أكثر من 110 آلاف شخص قد سجلوا للانتظار – على الرغم من أن هذا الرقم يعد مؤشرا على الفضول أكثر من خطط الشراء الفعلية، حيث لم تكن هناك حاجة إلى إيداع. القائمة أيضًا عالمية، حيث أن الجهاز متاح فقط للطلب المسبق في الولايات المتحدة، حيث سيتم طرحه للبيع في وقت ما “أوائل العام المقبل”. سيتم منح مجموعة قائمة الانتظار الأولية “أولوية الوصول” لشراء المنتج.

اعتمادات الصورة: بريان هيتر
قلب الجهاز هو الذكاء الاصطناعي. إنها من بين منتجات الأجهزة الأولى التي تركب الموجة الحالية من الإثارة حول الذكاء الاصطناعي التوليدي، لكنها بالتأكيد لن تكون الأخيرة. لقد ارتبط اسم Sam Altman ارتباطًا وثيقًا بالشركة الناشئة منذ يوم الإعلان عنها. أسأل عن مدى مشاركة Altman وOpenAI في إنشاء المنتج.
يقول بونجيورنو: “قاد سام السلسلة A في عام 2020. وكان عمران واضحًا جدًا أن سام كان هدف السلسلة A وأراد حقًا إشراكه”. “أعتقد أنه كان هناك الكثير من الاحترام المتبادل والإثارة حول ما اعتقدنا جميعًا أنه المستقبل، فيما يتعلق بالكمبيوتر. لقد كان مناصرًا وداعمًا رائعًا لنا، ويرد على الهاتف في كل مرة نحتاج فيها إلى المشورة والتوجيه. لقد عملنا مع فريق OpenAI. لقد تعاون فريقنا الهندسي وعمل معًا بشكل وثيق.”
وفقًا لتشودري، تعد GPT واحدة من العديد من برامج LLM التي يتم الاستفادة منها بواسطة النظام. وأكد أيضًا أن GPT-4 سيكون من بين الحالات التي يستخدمها النظام. ومع ذلك، في نهاية المطاف، فإن أنظمة الذكاء الاصطناعي الدقيقة التي يتم تسخيرها لأي مهمة معينة غامضة إلى حد ما من حيث التصميم. ويتم الوصول إليها على أساس كل حالة على حدة، بناءً على تحديد الدبوس لمسار العمل المناسب.
وينطبق هذا أيضًا على الاستعلامات المستندة إلى الويب. يقوم النظام بالزحف إلى مجموعة متنوعة من محركات البحث والموارد المختلفة مثل ويكيبيديا. سيكون بعضهم شركاء محتوى رسميين، والبعض الآخر لا. وحتى الآن، فإن الشركاء الفعليين محدودون. هناك OpenAI وMicrosoft، بالإضافة إلى Tidal، الذي يعمل كتطبيق الموسيقى الافتراضي للنظام. أحد الأمثلة التي تم تقديمها خلال أحد عروضنا التوضيحية كان “تشغيل الموسيقى التي أنتجها برينس”، بدلاً من “تشغيل برينس” الأكثر وضوحًا.
“جزء من الذكاء الاصطناعي الخاص بنا مملوك لنا. يقول بونجيورنو: “نحن نبني أنظمة الذكاء الاصطناعي الخاصة بنا، ثم نستفيد من أشياء مثل GPT ونماذج OpenAI”. “يمكننا إضافة ماجستير إدارة الأعمال والكثير من الخدمات المقدمة من أشخاص آخرين، وهدفنا هو أن نكون منصة للجميع ونسمح بالوصول إلى الكثير من تجارب وخدمات الذكاء الاصطناعي المختلفة، لذلك تم تنظيم نموذج الأعمال بطريقة تسمح لنا للقيام بذلك. وأعتقد أننا سنفكر في نماذج الإيرادات المختلفة التي يمكننا إضافتها أيضًا ومصادر الإيرادات المختلفة على المنصة.

اعتمادات الصورة: بريان هيتر
الهدف هو جعل التجربة سلسة، سواء فيما يتعلق بما يحدث في النهاية الخلفية مع LLMs وعمليات البحث والتحديثات على الويب. تم تصميم النظام لدفع التحديثات باستمرار وإضافة ميزات جديدة في الخلفية. ويستخدم سياقًا إضافيًا أيضًا، بما في ذلك الأسئلة التي تم طرحها مؤخرًا والموقع، باستخدام نظام تحديد المواقع العالمي (GPS) الموجود على متن الطائرة.
الصور هي أيضًا قطعة كبيرة من اللغز. تتميز الكاميرا الموجودة على اللوحة بزاوية واسعة جدًا مع مجال رؤية يبلغ 120 درجة. لا يوجد تركيز بؤري تلقائي قيد التشغيل، بل هو طول بؤري ثابت. في أضواء مكاتب سان فرانسيسكو، على الأقل، بدت الصور ثابتة. هناك قدر كبير من التصوير الفوتوغرافي الحسابي الذي يحدث خارج الأجهزة، بما في ذلك حساب ما إذا كان الدبوس مستويًا عند التقاط الصورة وتوجيه الصورة النهائية وفقًا لذلك.
لا يزال كل شيء يبدو في أيامه الأولى هنا، ولكن من الواضح أن الكثير من الاهتمام (والمال) قد تم إنفاقه على المنتج. ولعل الطلب هو أكبر علامة استفهام هنا. هل وجدت Humane حقًا تطبيقًا قاتلًا؟ بالنسبة لصانعي الساعات الذكية، كانت الصحة هي الحل منذ فترة طويلة. لكن التتبع الصحي يلعب دورًا متضائلًا بشكل كبير هنا.
لا يتلامس المنتج فعليًا بشكل مباشر مع جلد مرتديه، لذا فإن المقاييس الصحية التي يمكنه جمعها فعليًا محدودة بما يتجاوز مجرد العمل كمقياس للخطى – على الرغم من أن هذه الميزة غير مدعومة حاليًا أيضًا. أكبر ميزة متعلقة بالصحة في الوقت الحالي هي حساب السعرات الحرارية، حيث تخبرك على وجه التحديد بعدد السعرات الحرارية والحقائق الغذائية الأخرى الموجودة في قطعة الطعام التي تحملها أمام الكاميرا، وذلك باستخدام منصة تعريف الطعام التابعة لجهة خارجية غير مسماة.

اعتمادات الصورة: بريان هيتر
من المؤكد أن السعر سيشكل عقبة أمام الجهاز غير المثبت – 699 دولارًا لا شيء في الأساس وفقًا لمعايير الهواتف الذكية، ولكن هناك الكثير مما يجب طلبه للحصول على منتج من الجيل الأول وعامل شكل جديد. إن إضافة 24 دولارًا شهريًا لا تساعد أيضًا، على الرغم من أن بونجيورنو يضيف: “أنت تحصل على رقم هاتف؛ ستحصل على عدد غير محدود من المحادثات والنصوص والبيانات؛ ستتلقى العديد من استفسارات الذكاء الاصطناعي كما تريد، بالإضافة إلى جميع خدمات الذكاء الاصطناعي لدينا. اليوم، نرى مدى الإثارة الموجودة حول ChatGPT، حيث يدفع الناس مقابل الوصول إلى ذلك بالفعل.
ومع ذلك، إذا لم تقم بالدفع في ذلك الشهر، فسيظل المنتج بمثابة ثقالة ورق فعليًا حتى تبدأ الاشتراك.
قبل أن تنتهي جلستنا، سألت شودري كيف وصلت الشركة إلى القمة، من بين جميع الأماكن، خاصة عندما كان يُنظر إلى شاشات العرض التي يرتديها الرأس على أنها الوضع الافتراضي لبعض الوقت. من المؤكد أن صاحب العمل السابق لشركة Apple يراهن على الوجه من خلال Vision Pro القادم.
يقول: “لطالما كان يُفترض أن الحوسبة السياقية هي شيء يجب عليك ارتدائه على وجهك”. “هناك الكثير من المشكلات المتعلقة بذلك. كثير من الناس يرتدون النظارات التي ترتديها لسبب محدد حقًا. إما لمساعدتك على الرؤية أو لحماية عينيك. هذا قرار شخصي للغاية – شكل الإطار الخاص بك، ووزن الإطار الخاص بك. كل ذلك يذهب إلى شيء فريد مثلك. إذا نظرت إلى قوة السياق، وهذا هو العائق أمام تحقيق الحوسبة السياقية، فلا بد أن تكون هناك طريقة أخرى. لذلك بدأنا ننظر إلى ما هي القطعة التي تتيح لنا أن نكون أكثر شخصية؟ لقد توصلنا إلى حقيقة أننا جميعًا نرتدي الملابس، فكيف يمكننا تزيين جهاز يعطينا سياقًا لملابسنا؟”