Hotdry.
security

Anthropic 发布 Claude Code Security:将前沿网络安全能力交给防御者

Anthropic 推出 Claude Code Security 工具,利用 Opus 4.6 模型扫描代码库并提供针对性补丁建议,帮助防御者发现传统工具遗漏的高危漏洞。

在网络安全形势日益严峻的当下,攻击者与防御者之间的能力差距正在不断拉大。传统静态分析工具依赖已知漏洞模式,难以应对复杂的逻辑漏洞和上下文相关的安全缺陷;而熟练的安全研究人员数量有限,漏洞修复积压问题愈发突出。Anthropic 于 2026 年 2 月发布的 Claude Code Security 正是为了解决这一结构性矛盾而推出的解决方案 —— 将前沿 AI 模型的网络安全能力直接交到防御者手中。

Claude Code Security 的技术定位

Claude Code Security 是内置于 Claude Code Web 版本的全新安全能力,当前以有限研究预览的形式向 Enterprise 和 Team 客户开放,同时为开源项目维护者提供快速免费通道。该工具的核心定位是突破传统静态分析的局限:不再局限于匹配已知漏洞模式,而是像人类安全研究员一样阅读和推理代码 —— 理解组件交互方式、追踪数据在应用中的流动轨迹,从而捕获规则匹配工具难以发现的复杂漏洞。

这一能力背后依赖的是 Anthropic 近期发布的 Claude Opus 4.6 模型。根据官方披露,Anthropic 的 Frontier Red Team 使用该模型在生产级开源代码库中发现了超过 500 个此前长期未被检测到的高危漏洞,这些漏洞在多年专家审查中均未被发现。从技术能力角度看,这意味着模型已经具备了自主发现零日漏洞的初步能力,能够识别包括未授权访问、数据窃取和服务中断在内的多种严重安全问题。

多阶段验证与可信度评级

为降低误报率并提升实用性,Claude Code Security 采用了多阶段验证流程。在每一个发现提交给分析师之前,Claude 会重新审视结果,尝试自行证明或推翻原有发现,从而过滤掉大量误报。每个发现还附带严重程度分级和置信度评级,使安全团队能够优先处理最关键的修复。由于代码层面的问题往往存在细微差别,Claude 同时提供置信度评分,确保人类决策者能够充分评估风险后再行操作。

所有经过验证的发现会显示在 Claude Code Security 仪表板中,团队可以在此审查发现内容、检查建议的补丁,并在批准后交由开发人员执行。值得注意的是,整个流程的设计哲学是 “人类始终做最终决定”:Claude 负责识别问题和提出解决方案,但实际修复必须经过人工审批才会被应用。这一设计既保留了 AI 的高效扫描能力,又避免了自动化修复可能带来的潜在风险。

对防御者的实际价值

从行业视角来看,Claude Code Security 的发布标志着 AI 安全工具从概念验证向实际可用的关键转折。对于资源有限的安全团队而言,该工具可以显著放大现有人员的漏洞发现能力 —— 原本需要数周手动代码审计的工作,现在可以在更短时间内完成初筛。对于开源社区,Anthropic 提供的免费快速通道尤为重要,因为大量关键基础设施依赖于开源软件,而这些项目的维护者往往缺乏专业安全资源。

Anthropic 还将其内部安全实践延伸到了产品层面:该公司使用 Claude 自身来审查自身代码,并表示该工具在保护 Anthropic 系统方面极为有效。这种 “用 AI 保护 AI 研发” 的模式为行业提供了可参考的范本,尤其适合需要在快速迭代与安全性之间取得平衡的研发团队。

风险管理与双重用途考量

前沿 AI 模型的网络安全能力天然具有双重用途:同样能帮助防御者发现并修复漏洞的能力,也可能被攻击者用来寻找可利用的弱点。Anthropic 在发布 Claude Code Security 时明确承认了这一风险,并将其纳入更广泛的前沿网络风险管理框架中。该框架包含 “网络能力阈值” 概念 —— 当模型能力超过一定门槛时,系统会自动触发额外的安全防护和监督机制。

在实际部署层面,Anthropic 正在开发基于探测的检测器和实时干预措施,以识别和阻止恶意网络使用行为。例如,当系统检测到明显的攻击性利用工作流时,会进行拦截。这一设计选择意味着某些合法的安全研究可能会遇到额外摩擦,但 Anthropic 认为这是平衡安全与风险的必要代价。

关键基础设施合作与未来展望

除了面向企业和开源社区的工具发布,Anthropic 还在国家安全与关键基础设施领域展开深入合作。该公司与太平洋西北国家实验室(PNNL)合作,利用 Claude 在高保真水处理厂模拟环境中进行网络物理防御的红队演练。这一项目的目标是验证 AI 加速防御的概念可行性,而非开发自主攻击工具。此外,Anthropic 还与美国国家核安全管理局和能源部 Genesis 任务合作,共同开发与国家安全和关键系统相关的 AI 风险评估与缓解措施。

展望未来,Anthropic 预计在不久的将来,全球相当比例的代码将被 AI 持续扫描。攻击者无疑会利用 AI 以更快的速度发现可利用的弱点,但快速行动的防御者同样可以在这场竞赛中占据优势 —— 先行发现漏洞、及时修复,从而降低被攻击的风险。Claude Code Security 正是这一战略方向的第一步,其目标不仅是提升单个组织的安全基线,更是推动整个行业的安全水位上升。

工程化落地的关键参数

对于计划采用 Claude Code Security 的团队,以下参数值得关注:预览阶段优先向 Enterprise 与 Team 客户开放,开源维护者可通过专门通道申请免费快速接入;漏洞发现基于 Claude Opus 4.6 模型,具备自主推理和零日漏洞识别能力;所有发现经多阶段验证后附带严重程度和置信度双评级;最终修复必须经过人工审批确认。这些机制共同构成了该工具在提升效率与保障安全之间的平衡框架。

资料来源:Anthropic 官方公告《Making frontier cybersecurity capabilities available to defenders》(anthropic.com/news/claude-code-security)。

查看归档