مایکروسافت مدعی شده که سیستمی رو توسعه داده که میتونه یک باگ امنیتی رو از یک باگ غیرامنیتی تشخیص بده، اونم با دقت ۹۹٪، همچنین این سیستم میتونه در ۹۷٪ مواقع، بحرانی بودن یک باگ رو هم مشخص کنه. گفته شده که این سیستم در طول چند ماه آینده بازمتن خواهد شد تا بقیه هم بتونن ازش استفاده کنن.
میشه حدس زد که یکی از پایههای رسیدن به این مساله، خریدن گیت هاب توسط مایکروسافت در ۲۰۱۸ و دسترسی مستقیم به حجم عظیمی از کد و ایشوهای مرتبط با اونها بوده. مایکروسافت میگه این سیستم بر اساس ۱۳ میلیون نمونه قبلی کار می کنه و احتمالا همراه خوبی خواهد بود در انسانهایی که میخوان باگهای رو دسته بندی کنن. ادعا میشه هر برنامه نویس در هر ۱۰۰۰ خط تقریبا ۷۰ باگ تولید میکنه و بنا به تخمین، حل یک باگ ۳۰ برابر بیشتر از نوشتن یه خط کد زمان میخواد. در حال حاضر گفته میشه که آمریکا به تنهایی ۱۱۳ میلیارد دلار هزینه کشف و حل مشکلات نرمافزاری میکنه.
مدلی که مایکروسافت توسعه داده، بر اساس دیتاهای لیبل خورده کار می کنه و در دو سطح: اول تشخیص امنیتی بودن باگ و بعد تعیین سطح اون. سیستم بر اساس الگوریتم فراوانی وزنی TF-IDF کار می کنه و به گفته مایکروسافت در داخل شرکت در حال استفاده است. این سیستم باگ های وارده رو نگاه می کنه و سعی می کنه اونهایی که از نظر امنیتی مهم هستن رو مشخص کنه تا بشه زودتر سراغشون رفت. چیزی که وقت زیادی از نیروهای انسانی شرکت ها رو به خودش اختصاص می ده و در نهایت هم بازدهی کمتری از این سیستم ایجاد میکنه.
این حضور هوض مصنوعی در دنیای نرم افزار، روند رو به رشدی است و قبلا هم کدگوروی آمازون سعی می کرد نرم افزارهای داخلی این شرکت رو از نظر مشکلاتی مثل لینک منابع بررسی کنه و حالا یه نسخه پیش نمایش عمومی ازش وجود داره یا مثلا SapFix فیسبوک هم سعی می کرد کار مشابهی رو برای این یکی غول بکنه.