
微软昨天悄悄发布了一个叫MDASH的AI系统,专门用来审计代码安全性。它不靠单一模型单打独斗,而是让100多个AI智能体分工合作——有的负责扫描代码,有的负责验证结果,有的负责去重,就像一支专业的安全团队各司其职。在权威的CyberGym基准测试里,MDASH直接碾压了Anthropic的Mythos模型和OpenAI的GPT-5.5,成功挖出16个从未发现的漏洞,其中有4个是能远程执行恶意代码的高危漏洞。更吓人的是,在人工植入21个漏洞的私有测试中,MDASH实现了100%的识别率,而且一个误报都没有。也就是说,它既能精准命中真漏洞,又不会乱报警。回顾历史数据,MDASH对Windows核心驱动clfs.sys近五年的漏洞召回率高达96%,对tcpip.sys更是100%。目前,微软内部工程团队已经开始用这个系统加固产品,并面向部分客户开放了内部预览。一句话总结:在AI找漏洞这件事上,人多力量大,多模型协作比单一大模型靠谱得多。