PentAGI 架构解析：多代理系统与知识图谱驱动的自主渗透测试

在网络安全领域，渗透测试始终是一项高度依赖专业知识和经验的工作。传统渗透测试需要安全工程师手动完成信息收集、漏洞发现、攻击利用等复杂环节，耗时且容易遗漏。PentAGI（Penetration testing Artificial General Intelligence）的出现标志着 AI 在安全测试领域的重大突破 —— 它是一个完全自主的 AI Agent 系统，能够自动执行复杂的渗透测试任务。本文将从架构设计角度，深入解析这一系统的工程实现。

核心服务架构

PentAGI 采用微服务架构设计，整个系统由多个松耦合的组件构成，每个组件负责特定的功能域。从部署视角来看，系统可分为五个主要层次：核心服务层、知识图谱层、监控层、分析平台层和安全工具层。

核心服务层是整个系统的大脑，由前端 UI、Backend API、向量数据库、任务队列和 AI Agent 系统组成。前端 UI 基于 React 和 TypeScript 构建，提供现代化的 Web 界面；Backend API 采用 Go 语言开发，同时支持 REST 和 GraphQL 两种接口形式，便于外部系统集成；向量数据库基于 PostgreSQL 配合 pgvector 扩展，实现语义搜索和记忆存储功能；任务队列负责异步任务处理，确保系统在高负载下的稳定运行。

Backend API 采用 Go 语言的 GraphQL 实现，这一选择值得深入分析。GraphQL 的强类型特性与 Go 语言的静态编译能力相结合，能够在编译阶段发现大部分接口不匹配问题。同时，GraphQL 的灵活查询能力使得前端可以根据实际需要请求精确的数据结构，避免过度获取或不足获取。对于渗透测试这类复杂任务场景，这种灵活性尤为重要 —— 不同的任务阶段可能需要不同粒度的数据视图。

多代理任务编排系统

PentAGI 最核心的创新在于其多代理任务编排系统。系统定义了完整的任务层级结构：Flow（流程）→ Task（任务）→ SubTask（子任务）→ Action（动作）。每个 Flow 代表一次完整的渗透测试会话，Task 是 Flow 中的具体目标，SubTask 是分配给特定 Agent 的工作单元，而 Action 则是实际执行的原子操作。

系统内置了超过十三种专业 Agent 类型，包括 Orchestrator（编排器）、Researcher（研究员）、Developer（开发者）、Executor（执行者）、Simple（简单任务）、Simple_JSON（JSON 响应）、Assistant（交互助手）、Generator（内容生成器）、Refiner（内容改进器）、Adviser（顾问）、Reflector（反思者）、Searcher（搜索者）、Enricher（富化器）、Coder（编码器）和 Installer（安装器）。这种专业化分工使得系统能够将复杂任务分解为适合不同能力的 Agent 处理。

以一次典型的渗透测试为例，Orchestrator 首先分析目标并制定总体策略；Researcher 负责信息收集和漏洞分析，会从向量数据库中搜索历史上类似目标的渗透测试经验；Developer 根据研究结果规划攻击路径，查询漏洞利用代码和攻击技巧；Executor 负责实际执行，包括运行 nmap 扫描、Metasploit 攻击模块、SQLMap 注入测试等专业工具。整个过程中，各 Agent 通过消息队列异步协作，每个 Agent 的执行结果都会存储到向量数据库供后续参考。

这种架构的优势在于可扩展性和容错性。由于各 Agent 之间通过消息队列解耦，增加新的 Agent 类型或调整现有 Agent 的职责不需要修改系统核心代码。同时，单个 Agent 的失败不会导致整个流程中断，Orchestrator 可以检测到失败状态并进行重试或调整策略。

三层记忆系统设计

PentAGI 实现了复杂的三层记忆系统，这是系统能够从历史渗透测试中学习和改进的关键。系统将记忆分为长期记忆（Long-term Memory）、工作记忆（Working Memory）和情景记忆（Episodic Memory）三个层次，每个层次承担不同的信息管理职责。

长期记忆存储持久化的知识和经验，包括向量数据库中的语义记忆、知识库中的领域专业知识、以及工具使用模式库。当研究员 Agent 需要分析一个新目标时，系统会自动从长期记忆中检索相似历史任务的经验，包括哪些扫描技术最有效、哪些漏洞在特定场景下更容易被发现等。这种设计避免了重复试错，显著提升了测试效率。

工作记忆维护当前任务的执行状态，包括活跃的目标列表、系统资源状态、当前攻击阶段等信息。工作记忆相当于一个高速缓存，确保 Agent 在执行当前任务时能够快速访问必要的上下文信息。与长期记忆不同，工作记忆的生命周期与任务同步，任务完成后其内容会被清理或归档到情景记忆。

情景记忆记录历史动作和结果，形成成功模式的模式库。每次渗透测试完成后，系统会自动提取有价值的经验 —— 例如某种特定网络环境下 Nmap 扫描参数的选择、针对特定 Web 框架的指纹识别技巧等。这些经验以向量形式存储，在未来遇到类似场景时可以优先被检索出来。

链式摘要与上下文管理

在实现上述三层记忆系统的同时，PentAGI 还必须解决一个关键工程挑战：大语言模型上下文窗口有限，但长程渗透测试任务会产生大量对话历史。系统通过链式摘要（Chain Summarization）技术来解决这个问题。

链式摘要的工作原理是将对话链转换为抽象语法树（ChainAST）表示，然后对不同部分应用不同的压缩策略。系统会优先保留最近一轮问答（QA Pair）的完整内容，对较早的对话进行摘要压缩。配置参数允许运维人员精细控制压缩比例：全局摘要器默认保留最后 50KB 的对话内容，单个消息对最大 16KB，QA 部分最大 64KB。Assistant 级别的摘要器配置更为宽松，为 75KB，以支持需要更多上下文的复杂任务。

这种自适应压缩策略在保持关键信息的同时，显著降低了 token 消耗。对于渗透测试而言，这意味着系统可以在数小时的测试过程中保持对原始目标的聚焦，同时不会因为早期信息丢失而产生重复工作。

知识图谱集成

PentAGI 集成了 Graphiti 知识图谱系统，基于 Neo4j 图数据库实现语义关系追踪。这一组件将渗透测试过程中提取的实体、关系和时序上下文组织成图结构，支持复杂的查询模式。

系统会自动捕获并图谱化的信息包括：Agent 的推理过程和决策依据、工具执行记录和输出结果、漏洞与利用方法的关联关系、目标系统指纹与技术栈等。通过知识图谱，系统可以回答诸如「过去一年中哪些工具在处理同类目标时效果最好」这样的复杂查询，这远超出向量检索的能力范围。

Graphiti 的集成采用可选架构，默认关闭以降低部署复杂度。启用时需要额外配置 Neo4j 数据库和相关环境变量。对于需要长期积累和组织渗透测试知识的大型安全团队，知识图谱功能可以显著提升知识复用效率。

安全沙箱与部署架构

渗透测试系统本身必须具备严格的安全隔离能力。PentAGI 将所有操作限制在 Docker 容器环境中，每个任务根据类型自动选择合适的容器镜像 —— 通用任务使用 Debian 镜像，渗透测试任务使用专门的 Kali Linux 镜像。系统支持自定义镜像配置，允许组织使用经过审计的自有镜像。

对于生产环境，PentAGI 推荐采用双节点部署架构：主节点负责 API 服务和任务调度，运行在安全的内部网络；工作节点承载实际的渗透测试容器，通过 Docker-in-Docker 方式运行并通过 TLS 认证与主节点通信。这种架构确保被测试目标的流量和可能的攻击行为都被限制在专用工作节点上，不会影响主系统安全。

系统对运行环境有明确要求：至少 2 核 CPU、4GB 内存、20GB 可用磁盘空间，需要互联网连接以下载 Docker 镜像和安全工具更新。部署通过 Docker Compose 完成，支持快速启动。

可观测性体系

企业级 AI 系统必须具备完善的可观测性能力。PentAGI 集成了完整的监控栈，包括 OpenTelemetry 用于统一的可观测性数据采集和关联分析、Grafana 用于实时可视化仪表板、VictoriaMetrics 用于高性能时序指标存储、Jaeger 用于端到端分布式追踪、Loki 用于日志聚合。

对于 AI 运营分析，系统集成了 Langfuse 平台，提供模型调用追踪、成本分析、延迟监控等专门针对大语言模型运营的指标。Langfuse 与 ClickHouse、Redis、MinIO 等组件配合，形成完整的 AI 运营数据管道。所有这些数据都可以通过 Grafana 仪表板统一查看，为运维团队提供系统健康状况的完整视图。

工程实践要点

从工程实现角度，部署 PentAGI 时有若干关键配置值得特别关注。首先是 LLM 提供商的选择 —— 系统支持 OpenAI、Anthropic Claude、Google Gemini、AWS Bedrock、Ollama 本地部署等多种选择，不同模型在推理能力、速度、成本和安全性方面各有取舍。对于敏感环境，Ollama 本地部署是零成本且数据不外泄的方案，但需要自行准备 GPU 资源。

其次是摘要器的参数调优。默认配置适合大多数场景，但如果测试任务特别复杂（例如需要对数千个端口进行详细分析），可能需要增大保留的上下文大小。相反，如果遇到 token 溢出错误，则需要压缩更多历史内容。

最后是知识图谱的启用决策。对于安全团队规模较小、渗透测试频率较低的场景，关闭知识图谱可以简化部署并降低资源消耗；但对于需要系统化积累测试经验的团队，启用知识图谱能够带来长期的知识复用价值。

资料来源：本文技术细节主要参考 PentAGI 官方 GitHub 仓库（https://github.com/vxcontrol/pentagi），该仓库提供了完整的技术文档和部署指南。