微软新AI找漏洞，100%识别零误报，连GPT-5.5都输了

智享AI

封面图

微软昨天悄悄发布了一个叫MDASH的AI系统，专门用来审计代码安全性。它不靠单一模型单打独斗，而是让100多个AI智能体分工合作——有的负责扫描代码，有的负责验证结果，有的负责去重，就像一支专业的安全团队各司其职。在权威的CyberGym基准测试里，MDASH直接碾压了Anthropic的Mythos模型和OpenAI的GPT-5.5，成功挖出16个从未发现的漏洞，其中有4个是能远程执行恶意代码的高危漏洞。更吓人的是，在人工植入21个漏洞的私有测试中，MDASH实现了100%的识别率，而且一个误报都没有。也就是说，它既能精准命中真漏洞，又不会乱报警。回顾历史数据，MDASH对Windows核心驱动clfs.sys近五年的漏洞召回率高达96%，对tcpip.sys更是100%。目前，微软内部工程团队已经开始用这个系统加固产品，并面向部分客户开放了内部预览。一句话总结：在AI找漏洞这件事上，人多力量大，多模型协作比单一大模型靠谱得多。