يقوم LogicStar ببناء وكلاء الذكاء الاصطناعي لصيانة التطبيق

المنطق Swiss Startup LogicStar عازمة على الانضمام إلى لعبة وكيل الذكاء الاصطناعى. حصلت بدء التشغيل على تأسيس صيف 2024 على 3 ملايين دولار كتمويل قبل بذرة لجلب الأدوات إلى سوق المطورين الذي يمكنه القيام بالصيانة المستقلة لتطبيقات البرمجيات ، بدلاً من حالة استخدام وكيل الذكاء الاصطناعى الأكثر نموذجيًا للتطوير المشترك.
يقترح الرئيس التنفيذي لشركة LogicStar والمؤسس المشارك Boris Paskalev أن وكلاء AI في بدء التشغيل قد ينتهي بهم المطاف بالشراكة مع وكلاء تطوير الكود-مثل ، على سبيل المثال ، أمثال Devin من Contion Labs-في فوز العمل.
تعتبر Code Fidelity مشكلة في إنشاء وكلاء AI للموظفين ونشرها ، تمامًا كما هو الحال بالنسبة للمطورين البشريين ، وتريد LogicStar القيام ببضعها لتشويه عجلة التطوير عن طريق التقاط وتثبيت الأخطاء تلقائيًا أينما كانوا في رمز تم نشره.
كما هو الحال ، يقترح Paskalev أنه “حتى أفضل النماذج والوكلاء” هناك غير قادرين على حل غالبية الأخطاء التي يتم تقديمها معها – ومن هنا كان الفريق يتجسس على فرصة لبدء بدء منظمة العفو الدولية المخصصة لتحسين هذه الصعاب وتقديمها حلم أقل صيانة التطبيق.
تحقيقًا لهذه الغاية ، يقومون ببناء نماذج لغوية كبيرة (LLMS)-مثل GPT من Openai أو حتى Deepseek في الصين-اتباع نهجا ناتجًا عن النموذج لمنصتهم. يتيح هذا لـ LogicStar الانخفاض في LLMs المختلفة وزيادة فائدة وكلاء AI ، استنادًا إلى النموذج الأساسي الذي يعمل بشكل أفضل لحل مشكلة رمز معينة.
يزعم Paskalev أن الفريق المؤسس لديه المعرفة التقنية والمعرفة الخاصة بالمجال لبناء منصة يمكنها حل مشاكل البرمجة التي يمكن أن تتحدى أو تعمل على العمل بمفردها. لديهم أيضًا نجاح سابق في تنظيم المشاريع للإشارة إلى: لقد باع بدء تشغيل Code Review السابق ، DeepCode ، إلى عملاق الأمن السيبراني Snyk في سبتمبر 2020.
وقال لـ TechCrunch: “في البداية كنا نفكر في بناء نموذج لغة كبير للرمز”. “ثم أدركنا أن ذلك سيصبح بسرعة سلعة … الآن نحن نبني على افتراض أن جميع نماذج اللغة الكبيرة موجودة. على افتراض أن هناك بعضًا لائقًا بالفعل [AI] وكلاء الكود ، كيف نستخرج أقصى قيمة عمل منهم؟ “
وقال إن الفكرة المبنية على فهم الفريق لكيفية تحليل تطبيقات البرمجيات. “اجمع ذلك مع نماذج اللغة الكبيرة – ثم التركيز على التأريض والتحقق من ما يقترحه نماذج اللغة الكبيرة وعامل الذكاء الاصطناعى بالفعل.”
التنمية التي تحركها الاختبار
ماذا يعني ذلك في الممارسة؟ يقول Paskalev إن LogicStar يقوم بتحليل لكل تطبيق يتم نشر تقنيته – باستخدام “أساليب علوم الكمبيوتر الكلاسيكية” – من أجل بناء “قاعدة معرفة”. هذا يعطي وكيل الذكاء الاصطناعى خريطة شاملة لمدخلات ومخرجات البرنامج ؛ كيف ترتبط المتغيرات بالوظائف ؛ وأي روابط وتبعيات أخرى وما إلى ذلك.
بعد ذلك ، لكل خطأ يتم تقديمه معه ، يكون عامل الذكاء الاصطناعي قادرًا على تحديد أجزاء التطبيق المتأثرة – مما يسمح لـ LogicStar بتضييق الوظائف التي تحتاج إلى محاكاة من أجل اختبار عشرات الإصلاحات المحتملة.
لكل Paskalev ، تتيح “بيئة التنفيذ المصورة” لعامل الذكاء الاصطناعى تشغيل “الآلاف” من الاختبارات التي تهدف إلى إعادة إنتاج الأخطاء لتحديد “اختبار فاشل” ، ومن خلال نهج “التنمية القائم على الاختبار”-في نهاية المطاف على إصلاح ذلك العصي.
ويؤكد أن إصلاحات الأخطاء الفعلية يتم الحصول عليها من LLMS. ولكن نظرًا لأن منصة LogicStar تمكن هذه “البيئة التنفيذية السريعة للغاية” يمكن أن يعمل وكلاء AI على نطاق واسع لفصل القمح عن القشر ، كما كان ، ويخدم مستخدميها باختصار لأفضل ما يمكن أن تقدمه LLMs.
“ما نراه هو [LLMs are] رائع للنماذج الأولية ، واختبار الأشياء ، وما إلى ذلك ، لكنها ليست رائعة على الإطلاق [code] الإنتاج ، التطبيقات التجارية. أعتقد أننا بعيدون عن هناك ، وهذا ما يسلمه منصتنا “. “لكي نكون قادرين على استخراج هذه القدرات من النماذج اليوم ، يمكننا في الواقع استخراج القيمة التجارية بأمان وتوفير الوقت في الواقع للمطورين للتركيز حقًا على الأشياء المهمة.”
تم تعيين المؤسسات لتكون الهدف الأولي للمنطق. يهدف “وكلاء السيليكون” إلى العمل إلى جانب فرق DEV للشركات ، وإن كان ذلك على جزء صغير من الراتب المطلوب لتوظيف مطور بشري ، والتعامل مع مجموعة من مهام صيانة التطبيق وتحرير المواهب الهندسية لمزيد من الإبداع و/أو التحدي عمل. (أو ، على الأقل ، على الأقل حتى تحصل LLMs ووكلاء الذكاء الاصطناعي على قدر أكبر من القدرة.)
على الرغم من أن ملعب بدء التشغيل يصف قدرة صيانة التطبيق “المستقلة تمامًا” ، إلا أن Paskalev تؤكد أن النظام الأساسي سيسمح للمطورين البشريين بمراجعة (وإشراكها) في الإصلاحات. لذلك يمكن أن تكون الثقة – ويجب أن تكون – كسب أولاً.
“الدقة التي يقدمها مطور بشري يتراوح بين 80 إلى 90 ٪. هدفنا [for our AI agents] هو أن تكون هناك بالضبط.
لا يزال هناك أيام مبكرة لـ LogicStar: إصدار ألفا من تقنيتها في الاختبار مع عدد من الشركات غير المعلنة التي يشير إليها Paskalev باسم “شركاء التصميم”. تدعم التقنية حاليًا Python فقط – ولكن يتم وصف التوسعات على TypeScript و JavaScript و Java على أنها “قادمة قريبًا”.
الهدف الرئيسي [with the pre-seed funding] هو في الواقع إظهار أن التكنولوجيا تعمل مع شركاء التصميم لدينا – مع التركيز على بيثون ، “يضيف Paskalev. “لقد أمضينا بالفعل سنة ، ولدينا الكثير من الفرص للتوسع بالفعل. ولهذا السبب نحاول تركيزه أولاً ، لإظهار القيمة في حالة واحدة. “
قادت شركة Northzone الأوروبية لشراء شركة الناشئة ، حيث انضمت المستثمرين من DeepMind و Fleet و Sequoia Scouts و Snyk و Spotify أيضًا إلى الجولة.
في بيان ، قال ميشيل كوتنج ، شريك في نورث باسون: “لا يزال توليد الكود الذي يحركه الذكاء الاصطناعي في مراحله المبكرة ، لكن مكاسب الإنتاجية التي نراها بالفعل ثورية. إن إمكانية قيام هذه التكنولوجيا بتبسيط عمليات التطوير ، وتقليل التكاليف ، وتسريع الابتكار أمر هائل. والخبرة التقنية الواسعة للفريق وتسجيلها التتبع يضعهم في تقديم نتائج حقيقية وفعالة. يتم إعادة تشكيل مستقبل تطوير البرمجيات ، وسوف يلعب LogicStar دورًا مهمًا في صيانة البرامج. “
تقوم LogicStar بتشغيل قائمة انتظار للعملاء المحتملين الذين يرغبون في التعبير عن الاهتمام بالوصول المبكر. أخبرنا أن إصدار تجريبي مخطط له في وقت لاحق من هذا العام.