微软搞了个“AI特工队”：100个智能体协作抓漏洞，识别率100%零误报

智享AI

封面图

5月13日，微软发布了名为MDASH的新安全系统。它不是靠一个超级AI模型单打独斗，而是派出了超过100个AI智能体组成“特工队”，一起扫描代码漏洞。在测试中，这个系统不仅识别出16个从未曝光的漏洞，还在故意植入的21个漏洞中实现了100%的命中率，而且一个误报都没有。相比之下，大名鼎鼎的GPT-5.5和Anthropic的Mythos模型都输给了它。
这套系统的妙处在于分工合作。100多个智能体各干各的：有的负责把代码整理好，有的专心扫描漏洞，还有的专门复核结果。遇到复杂的推理任务，就让性能最强的模型上；需要快速处理海量代码时，就派轻量的响应模型出马。就像一个查案小组，老侦探动脑子，实习生跑腿，配合得滴水不漏。
实际效果也经得起考验。在专注于安全测试的CyberGym基准测试中，MDASH挖出了4个高危的远程代码执行漏洞。它对历史漏洞的“回查”能力更是惊人：对Windows系统核心文件clfs.sys过去五年的漏洞，挖出了96%；对tcpip.sys的漏洞，则一个不落，全找到了。
目前，MDASH已经开始帮微软内部的工程团队加固产品，部分客户也能用它进行内部预览测试。微软用这套系统证明了一个道理：AI安全攻防，未必需要最强单体，一群配合默契的“小兵”反而能打出更漂亮的仗。未来，这种多模型协作的思路，很可能会成为AI安全领域的标配。