AI 漏洞发现开始进入规模化流水线

AI 安全领域正在出现一个比模型能力展示更值得重视的变化：AI 已经开始把漏洞发现从“专家稀缺能力”推向“规模化流水线”。Anthropic 对 Project Glasswing 的初步披露显示，Claude Mythos Preview 在约 50 个合作伙伴的使用中，已经帮助发现超过一万个高危或严重级别漏洞。真正的变化不只是“模型更会找 bug”，而是安全工作的瓶颈正在整体后移。

发生了什么

Anthropic 在 Project Glasswing 更新中表示，过去一个月，合作伙伴使用 Claude Mythos Preview 对关键软件进行安全分析，发现了大量高危或严重漏洞。Cloudflare 报告在关键路径系统中发现约 2000 个 bug，其中约 400 个属于高危或严重级别；Mozilla 在 Firefox 150 测试中发现并修复 271 个漏洞。英国 AI Security Institute 也称 Mythos Preview 是首个能够端到端解决其两个 cyber range 的模型。

这些数字最重要的地方，不在于某一次扫描结果有多惊人，而在于它说明 AI 正在进入可执行漏洞研究阶段：模型不只是给出“这里可能有问题”的静态提示，而是在更接近真实攻防流程的环境中寻找、推理和验证漏洞路径。

真正变化：从“找不到”变成“修不过来”

过去很多软件安全问题的限制在于发现能力不足：专家时间有限，关键依赖太多，开源项目长期无人系统性审计。现在，Anthropic 给出的判断很清楚：进展不再主要受限于发现漏洞的速度，而是受限于验证、披露和修补大量 AI 找出的漏洞的速度。

这意味着安全团队的核心工作会发生变化。AI 可以把候选漏洞数量大幅放大，但每个结果仍然需要复现、去重、定级、判断影响面、协调维护者、设计补丁，并做回归测试。如果这些环节没有被系统化，AI 找洞能力越强，反而越可能制造新的运营压力：漏洞报告堆积、维护者疲劳、误报成本上升，以及披露节奏失控。

为什么这件事重要

它影响的不只是安全公司。几乎所有依赖开源组件、云服务、浏览器、开发框架和基础设施软件的企业，都会被这种变化触及。

对大型平台来说，AI 安全模型会成为持续审计的一部分，类似自动化测试和 CI/CD 一样嵌入工程流程。对开源生态来说，长期无人审查的基础库可能迎来一次系统性体检，但维护者需要更好的分流、验证和补丁协作机制。对企业采购和合规团队来说，未来评估供应商安全能力时，问题也会从“有没有安全扫描”升级为“AI 发现的问题如何被验证、分级、修复和追踪”。

对工作流的影响

更现实的落地方式不是让 AI 自动提交大量漏洞结论，而是建立闭环：

AI 先发现可疑漏洞和利用路径；
工具链复现并生成最小证据；
人类安全人员或维护者确认影响等级；
补丁进入测试、回归和披露流程；
失败案例再沉淀为新的安全回归测试。

这个流程与普通代码 Agent 的经验很相似：模型能力越强，越需要日志、权限边界、验证器和回滚机制。安全场景尤其如此，因为一次未经验证的自动化判断可能误伤维护者，而一次过早披露也可能给攻击者创造窗口。

我的判断

Project Glasswing 的价值不在于证明“AI 会替代安全专家”，而在于它把安全行业推向一个更工程化的阶段。漏洞发现会越来越像高通量筛选，真正稀缺的是后面的判断、协调和修补能力。

因此，接下来值得关注的不是 Mythos Preview 本身会不会全面开放，而是各类组织能否把 AI 找洞能力接入严肃的 CVD、补丁优先级、测试回归和供应链治理流程。AI 安全的竞争，正在从单点模型能力转向完整防守系统的吞吐量与可信度。

参考来源：Anthropic Project Glasswing 初步更新、The Verge 报道。

发生了什么

真正变化：从“找不到”变成“修不过来”

为什么这件事重要

对工作流的影响

我的判断

发表评论 取消回复

发表评论取消回复