AI 安全领域正在出现一个比模型能力展示更值得重视的变化:AI 已经开始把漏洞发现从“专家稀缺能力”推向“规模化流水线”。Anthropic 对 Project Glasswing 的初步披露显示,Claude Mythos Preview 在约 50 个合作伙伴的使用中,已经帮助发现超过一万个高危或严重级别漏洞。真正的变化不只是“模型更会找 bug”,而是安全工作的瓶颈正在整体后移。
发生了什么
Anthropic 在 Project Glasswing 更新中表示,过去一个月,合作伙伴使用 Claude Mythos Preview 对关键软件进行安全分析,发现了大量高危或严重漏洞。Cloudflare 报告在关键路径系统中发现约 2000 个 bug,其中约 400 个属于高危或严重级别;Mozilla 在 Firefox 150 测试中发现并修复 271 个漏洞。英国 AI Security Institute 也称 Mythos Preview 是首个能够端到端解决其两个 cyber range 的模型。
这些数字最重要的地方,不在于某一次扫描结果有多惊人,而在于它说明 AI 正在进入可执行漏洞研究阶段:模型不只是给出“这里可能有问题”的静态提示,而是在更接近真实攻防流程的环境中寻找、推理和验证漏洞路径。
真正变化:从“找不到”变成“修不过来”
过去很多软件安全问题的限制在于发现能力不足:专家时间有限,关键依赖太多,开源项目长期无人系统性审计。现在,Anthropic 给出的判断很清楚:进展不再主要受限于发现漏洞的速度,而是受限于验证、披露和修补大量 AI 找出的漏洞的速度。
这意味着安全团队的核心工作会发生变化。AI 可以把候选漏洞数量大幅放大,但每个结果仍然需要复现、去重、定级、判断影响面、协调维护者、设计补丁,并做回归测试。如果这些环节没有被系统化,AI 找洞能力越强,反而越可能制造新的运营压力:漏洞报告堆积、维护者疲劳、误报成本上升,以及披露节奏失控。
为什么这件事重要
它影响的不只是安全公司。几乎所有依赖开源组件、云服务、浏览器、开发框架和基础设施软件的企业,都会被这种变化触及。
对大型平台来说,AI 安全模型会成为持续审计的一部分,类似自动化测试和 CI/CD 一样嵌入工程流程。对开源生态来说,长期无人审查的基础库可能迎来一次系统性体检,但维护者需要更好的分流、验证和补丁协作机制。对企业采购和合规团队来说,未来评估供应商安全能力时,问题也会从“有没有安全扫描”升级为“AI 发现的问题如何被验证、分级、修复和追踪”。
对工作流的影响
更现实的落地方式不是让 AI 自动提交大量漏洞结论,而是建立闭环:
- AI 先发现可疑漏洞和利用路径;
- 工具链复现并生成最小证据;
- 人类安全人员或维护者确认影响等级;
- 补丁进入测试、回归和披露流程;
- 失败案例再沉淀为新的安全回归测试。
这个流程与普通代码 Agent 的经验很相似:模型能力越强,越需要日志、权限边界、验证器和回滚机制。安全场景尤其如此,因为一次未经验证的自动化判断可能误伤维护者,而一次过早披露也可能给攻击者创造窗口。
我的判断
Project Glasswing 的价值不在于证明“AI 会替代安全专家”,而在于它把安全行业推向一个更工程化的阶段。漏洞发现会越来越像高通量筛选,真正稀缺的是后面的判断、协调和修补能力。
因此,接下来值得关注的不是 Mythos Preview 本身会不会全面开放,而是各类组织能否把 AI 找洞能力接入严肃的 CVD、补丁优先级、测试回归和供应链治理流程。AI 安全的竞争,正在从单点模型能力转向完整防守系统的吞吐量与可信度。