Superpowers 代理开发方法论：代码生成-审查-测试-部署循环与运行时验证

在代理式软件开发（Agentic Development）中，Superpowers 框架提供了一套技能驱动的方法论，将代码生成、审查、测试和部署串联成高效循环，并通过运行时验证确保可靠性。这种方法论的核心在于强制代理遵循结构化流程，避免随意编码，转而强调证据驱动的迭代。

代码生成阶段：任务分解与子代理驱动

代码生成不是直接输出，而是从需求提炼开始。代理首先激活 “brainstorming” 技能，通过苏格拉底式提问澄清意图，生成可读的设计文档，分块呈现供用户确认。随后，“writing-plans” 技能将设计分解为 2-5 分钟的小任务，每个任务指定精确文件路径、完整代码变更和验证步骤。例如，对于一个 TODO 应用，计划可能包括 “在 src/todo.js 第 15 行添加 addTodo 函数，预期输入 { text: 'buy milk' } 输出更新列表”。

落地参数：

任务粒度：每个任务≤300 行代码变更，预计执行时间 < 5min。
子代理分发：使用 “subagent-driven-development” 技能，为每个任务启动独立子代理，进行两阶段审查：第一阶段验证规格符合（spec compliance），第二阶段检查代码质量。参数设置：子代理上下文限制为计划片段 + 相关文件，超时阈值 10min。
并行度：≤3 个子代理同时运行，避免资源争用。

这一阶段的证据在于代理能自主运行数小时而不偏离计划，用户仅需在批次间确认。

审查阶段：分级问题阻塞

生成后立即触发 “requesting-code-review” 技能。审查者（主代理或专用审查子代理）按严重度分类问题：Critical（阻塞，如安全漏洞）、High（立即修复，如逻辑错误）、Medium/Low（累积反馈）。例如，“Critical: 未验证用户输入导致 XSS 风险，必须修复后继续”。

可落地清单：

审查清单：符合计划？TDD 完整？YAGNI 原则（无冗余）？DRY（无重复）？
阻塞阈值：≥1 Critical 问题时暂停，通知用户。
反馈循环：“receiving-code-review” 技能要求代理验证每个修复前运行测试，确认问题根因。

引用 Superpowers 仓库：“代理在任务间审查工作，按严重度报告问题，关键问题阻塞进度。”

测试阶段：严格 TDD 循环

核心是 “test-driven-development” 技能，强制 RED-GREEN-REFACTOR：

RED：编写失败测试，运行确认失败（e.g., expect (addTodo ('milk')).toThrow ()）。
GREEN：最小代码使测试通过。
REFACTOR：优化后重新测试。

参数：

测试覆盖：每个变更前≥80% 行覆盖，优先行为测试。
反模式避免：技能内置清单，如 “禁止预写实现代码”。
基线验证：使用 git worktree 确保干净测试基线。

运行时验证嵌入：每个任务末尾 “verification-before-completion” 技能运行端到端测试，检查运行行为（如 API 响应时序、错误恢复）。

部署阶段：分支完成与 PR 自动化

任务完成后，“finishing-a-development-branch” 技能激活：

运行全套测试，确认无回归。
选项：创建 GitHub PR、局部 merge、保留 / 丢弃分支。

落地参数：

PR 模板：自动填充变更总结、测试日志、审查状态。
CI 集成：PR 提交后触发 GitHub Actions，阈值：构建成功 + 覆盖≥90%。
回滚策略：若 PR 失败，自动切换 worktree 回主分支，清理变更。

整个循环使用 “using-git-worktrees” 隔离开发，避免主分支污染。

运行时验证与监控要点

运行时验证不是事后，而是贯穿：

系统化调试：“systematic-debugging” 四阶段：重现、隔离根因、防御深度、条件等待。
验证参数：每个变更后运行≥3 场景负载测试，监控指标：响应时间 < 200ms、错误率 < 0.1%。

监控清单：

阶段	关键指标	阈值	告警动作
生成	任务完成率	>95%	重新分发
审查	Critical 问题数	0	阻塞
测试	测试通过率	100%	REFACTOR
部署	PR 合并成功率	>90%	人工审阅
运行时	行为一致性	零偏差	回滚

风险控制：代理漂移时，回退到 “executing-plans” 手动批次执行；资源超限，限制子代理深度≤5 层。

实施清单与最佳实践

安装：Claude Code 中 /plugin install superpowers@superpowers-marketplace，重启生效。
触发：新会话描述需求，代理自动搜索技能。
自定义：用 “writing-skills” 扩展新技能，TDD 测试子代理遵守。
规模化：集成 Microsoft Amplifier bundle，支持多语言。

此方法论已在实践中证明：代理从混乱编码转向工程化流程，生产力提升显著。

资料来源：