微软MDASH安全系统超越GPT-5.5,树立漏洞扫描新标杆

AI大模型在安全领域的落地,终于迎来一个标志性时刻。微软的安全团队刚刚丢出一枚重磅炸弹:一个名为 MDASH 的多模型智能体扫描框架正式亮相。用一句话概括它的特点——**不是靠单个大模型单打独斗,而是让上百个AI智能体协同作业**,这种架构设计思路在业内相当罕见。

从技术细节来看,MDASH 没有像传统方案那样押注单一巨无霸模型,微软安全团队反其道而行之,整合了超过100个独立的AI智能体。每个智能体各司其职:有的负责拆解代码逻辑,有的专注漏洞特征匹配,还有的专门对扫描结果做交叉验证。这样一来,核心推理任务可以由最强模型扛起,而面对海量代码的快速扫描,则换上轻量级模型提升吞吐量。这种“轻重搭配”的架构,理论上能兼顾扫描深度与效率。

实际表现如何?在 CyberGym 这个公开基准测试中,MDASH 成功挖出了16个此前未被发现的漏洞,其中包含4个高危远程代码执行漏洞。更惊人的是,在面向21个刻意植入漏洞的私有测试里,它实现了100%的识别率,并且全程零误报。为了评估它“回头看”的能力,团队还拿历史漏洞做了复现测试:clfs.sys 五年间的漏洞复现率达到96%,而 tcpip.sys 更是达到100%。这些数据放在行业里看,确实处于第一梯队。

客观来说,这种多智能体协作模式并非没有代价。上百个智能体之间的调度、通信与冲突处理,本身就是一个复杂的系统工程问题。微软敢于将其推向内部工程团队和少数预览客户,说明至少在实验室环境下,这套框架已经跑通了稳定性与准度之间的平衡点。不过,当代码库规模从百万行级跃升至数十亿行级时,MDASH 的调度延迟和资源消耗是否还能保持平衡,仍需更长时间的实际部署来验证。

从行业视角看,MDASH 的出现也折射出一个趋势:单纯比拼大模型参数量的时代正在过去,工程化的多实体协作架构开始成为新的竞争焦点。GPT-5.5 和 Anthropic Mythos 这类单体模型在通用对话场景下表现惊艳,但在安全这种需要专精与分工明确的领域,MDASH 的架构思路显然更具针对性。

值得注意的是,微软安全团队透露,MDASH 目前已经投入到自家产品的安全加固工作中——比如 Windows 和 Azure 的代码审计环节,而服务器拥堵甚至崩溃的风险,正是靠这类工具提前拦截在发布之前。此外,微软也向部分企业提供了内部预览测试资格,这显然是想在正式商用前收集更多真实场景的反馈。

或许有人会问:这么强的框架,会不会让安全研究员失业?目前来看,MDASH 更多是扮演“效率倍增器”的角色——它能在数小时内完成人类团队数周的粗筛工作,但最终漏洞的利用逻辑挖掘和修复方案设计,仍然需要专业安全人员的介入。在AI与人类协作的棋局中,MDASH 更像是那个不知疲倦的棋盘扫描仪,而落子决策权仍在人手中。

总结几个核心看点:

🔍 MDASH 是微软最新发布的多模型智能体扫描框架,在漏洞识别率上超越了 GPT-5.5 和 Anthropic Mythos 等单体模型。

⚡ 系统内置超过100个AI智能体,分工覆盖代码预处理、漏洞扫描、结果验证等全链条,重点任务由高配模型处理,海量扫描交给轻量模型提速。

🔥 公开测试中成功发现16个新漏洞(含4个RCE),私有测试21个植入漏洞实现100%识别且零误报,历史漏洞复现率最高达100%。

🛡️ 已投入微软内部产品安全加固,并向部分客户开放预览测试,标志着AI安全攻防从单模型竞赛进入多智能体协作时代。

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
(0)
AI快讯网编辑-青青AI快讯网编辑-青青
上一篇 6小时前
下一篇 3小时前

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

欢迎来到AI快讯网,开启AI资讯新时代!