
5月13日,微软发布了名为MDASH的新安全系统。它不是靠一个超级AI模型单打独斗,而是派出了超过100个AI智能体组成“特工队”,一起扫描代码漏洞。在测试中,这个系统不仅识别出16个从未曝光的漏洞,还在故意植入的21个漏洞中实现了100%的命中率,而且一个误报都没有。相比之下,大名鼎鼎的GPT-5.5和Anthropic的Mythos模型都输给了它。
这套系统的妙处在于分工合作。100多个智能体各干各的:有的负责把代码整理好,有的专心扫描漏洞,还有的专门复核结果。遇到复杂的推理任务,就让性能最强的模型上;需要快速处理海量代码时,就派轻量的响应模型出马。就像一个查案小组,老侦探动脑子,实习生跑腿,配合得滴水不漏。
实际效果也经得起考验。在专注于安全测试的CyberGym基准测试中,MDASH挖出了4个高危的远程代码执行漏洞。它对历史漏洞的“回查”能力更是惊人:对Windows系统核心文件clfs.sys过去五年的漏洞,挖出了96%;对tcpip.sys的漏洞,则一个不落,全找到了。
目前,MDASH已经开始帮微软内部的工程团队加固产品,部分客户也能用它进行内部预览测试。微软用这套系统证明了一个道理:AI安全攻防,未必需要最强单体,一群配合默契的“小兵”反而能打出更漂亮的仗。未来,这种多模型协作的思路,很可能会成为AI安全领域的标配。