Shannon 确定性状态机：约束 AI 自主攻击行为的工程实践

AI 自主渗透测试工具面临的核心矛盾在于：既要赋予系统足够的探索自由度以发现未知漏洞，又必须确保其行为可控、结果可重现、误报率趋近于零。Shannon 作为开源的完全自主 AI 渗透测试框架，通过引入确定性状态机（Deterministic State Machine）架构，将传统渗透测试的方法论转化为可编程的工作流，在 "侦查 - 武器化 - 利用 - 验证" 的闭环中实现了对 AI 代理行为的有效约束。

确定性状态机的设计哲学

传统 AI 代理系统常因 LLM 的概率性输出而陷入行为不可预测、探索路径发散的困境。Shannon 的解决方案是将渗透测试过程建模为有限状态机（Finite State Machine），每个状态对应明确的阶段目标，状态转换由可观测的条件触发，而非完全依赖模型的自主决策。

这一设计的核心在于将 "探索" 与 "验证" 解耦。在探索阶段，AI 代理拥有较大的自由度进行攻击面分析和漏洞假设生成；而在验证阶段，系统则强制执行严格的确定性流程，只有通过实际利用验证的漏洞才能进入报告阶段。这种 "无利用，不报告"（No Exploit, No Report）的原则从根本上消除了传统扫描器常见的误报问题。

四阶段工作流详解

Shannon 的状态机包含四个核心状态：侦察（Reconnaissance）、漏洞分析（Vulnerability Analysis）、利用（Exploitation）和报告（Reporting）。

侦察阶段负责构建目标应用的完整攻击面地图。系统并行执行源代码分析、网络资产发现（通过集成 Nmap、Subfinder 等工具）和动态应用探索。当攻击面地图趋于稳定（即连续一段时间内未发现新的端点或资产）或达到预设的超时阈值时，状态机自动转换至漏洞分析阶段。

漏洞分析阶段采用并行化架构，为每种 OWASP 漏洞类别（注入、XSS、SSRF、身份验证 / 授权缺陷）分配专门的分析代理。每个代理基于侦察阶段的数据执行结构化的数据流分析，追踪用户输入到危险代码路径的流向，生成高置信度的攻击假设。这一阶段的关键产出是 "假设性可利用路径" 列表，而非直接的漏洞报告。

利用阶段是确定性约束最严格的环节。专门的利用代理接收分析阶段生成的假设路径，通过浏览器自动化、构造恶意请求、执行命令行工具等方式尝试实际攻击。状态机在此阶段强制执行严格的验证逻辑：只有当攻击成功执行并产生可观测的影响（如身份验证绕过、数据泄露）时，该漏洞才被标记为 "已验证"。失败的尝试会被记录但不会进入报告，这确保了最终输出的每一个发现都是可复现的真实漏洞。

报告阶段整合所有已验证的发现，生成包含复现步骤、PoC 代码和影响评估的专业渗透测试报告。系统在此阶段还会执行去噪处理，过滤掉 LLM 可能产生的幻觉内容，确保报告的准确性。

并行代理与可控探索

Shannon 的架构设计充分利用了并行处理来提升效率。在漏洞分析和利用阶段，不同漏洞类别的代理可以并发执行，互不阻塞。这种并行性不仅缩短了整体测试时间（典型运行时间为 1 至 1.5 小时），更重要的是通过任务隔离降低了单一代理行为失控的风险。

每个代理都被限制在特定的漏洞类别范围内工作，这种 "关注点分离" 策略有效防止了 AI 代理在探索过程中的行为发散。代理之间的通信通过结构化的中间表示（如攻击假设对象）进行，而非自由文本，这进一步增强了系统的确定性。

状态转换条件的设计体现了工程上的务实考量。例如，从侦察到分析的转换基于 "地图稳定性" 而非固定的扫描时长，这使得系统能够自适应地处理不同复杂度的目标应用。而从利用阶段到报告阶段的转换则严格依赖 "成功验证" 这一二元条件，不存在模糊地带。

可重现性保障的工程参数

对于安全团队而言，测试结果的可重现性至关重要。Shannon 通过以下工程实践保障可重现性：

首先，系统完整记录每个工作流的执行轨迹，包括代理的决策日志、执行的命令、生成的请求和接收的响应。这些审计日志与最终报告一同存储，支持事后复盘和结果验证。

其次，Shannon 采用白盒测试方法，要求访问目标应用的源代码。这使得系统能够在代码层面建立稳定的锚点，而非仅依赖可能变化的网络行为。源代码分析为动态测试提供了上下文，使得相同的代码版本能够产生一致的测试结果。

最后，系统提供了配置化的规则引擎，允许安全团队定义测试边界（如排除某些路径或功能）、设置认证流程（支持表单登录、OAuth、TOTP 2FA）和调整超时参数。这些配置以声明式文件的形式存在，可被版本控制，确保测试环境的一致性。

局限性与适用边界

需要明确的是，Shannon 的确定性状态机架构也有其适用范围。当前版本仅针对特定的 OWASP 漏洞类别进行测试，对于第三方库漏洞、配置错误等静态分析问题覆盖有限。此外，系统的 "证明即利用" 模式意味着它只报告那些能够主动利用的漏洞，这虽然消除了误报，但也可能遗漏某些理论上存在但当前利用技术无法触达的安全问题。

从成本角度考虑，完整的测试运行大约需要 $50 USD 的 API 费用（基于 Claude 4.5 Sonnet 模型），这对持续集成场景提出了预算规划的要求。

结论

Shannon 的确定性状态机架构为 AI 自主安全测试提供了一个可落地的工程范式。通过将渗透测试过程分解为明确定义的状态和转换条件，系统在保持 AI 探索能力的同时实现了行为的可预测性和结果的可重现性。"无利用，不报告" 的原则从根本上解决了传统安全扫描工具的误报痛点，而并行代理架构则在效率与可控性之间取得了平衡。对于希望将 AI 渗透测试纳入 DevSecOps 流程的安全团队而言，Shannon 提供了一个值得参考的实现路径。

资料来源

KeygraphHQ/shannon GitHub 仓库：https://github.com/KeygraphHQ/shannon
Automated Penetration Testing with LLM Agents and Classical Security Tools (arXiv 2512.11143)