在代理式软件开发(Agentic Development)中,Superpowers 框架提供了一套技能驱动的方法论,将代码生成、审查、测试和部署串联成高效循环,并通过运行时验证确保可靠性。这种方法论的核心在于强制代理遵循结构化流程,避免随意编码,转而强调证据驱动的迭代。
代码生成阶段:任务分解与子代理驱动
代码生成不是直接输出,而是从需求提炼开始。代理首先激活 “brainstorming” 技能,通过苏格拉底式提问澄清意图,生成可读的设计文档,分块呈现供用户确认。随后,“writing-plans” 技能将设计分解为 2-5 分钟的小任务,每个任务指定精确文件路径、完整代码变更和验证步骤。例如,对于一个 TODO 应用,计划可能包括 “在 src/todo.js 第 15 行添加 addTodo 函数,预期输入 { text: 'buy milk' } 输出更新列表”。
落地参数:
- 任务粒度:每个任务≤300 行代码变更,预计执行时间 < 5min。
- 子代理分发:使用 “subagent-driven-development” 技能,为每个任务启动独立子代理,进行两阶段审查:第一阶段验证规格符合(spec compliance),第二阶段检查代码质量。参数设置:子代理上下文限制为计划片段 + 相关文件,超时阈值 10min。
- 并行度:≤3 个子代理同时运行,避免资源争用。
这一阶段的证据在于代理能自主运行数小时而不偏离计划,用户仅需在批次间确认。
审查阶段:分级问题阻塞
生成后立即触发 “requesting-code-review” 技能。审查者(主代理或专用审查子代理)按严重度分类问题:Critical(阻塞,如安全漏洞)、High(立即修复,如逻辑错误)、Medium/Low(累积反馈)。例如,“Critical: 未验证用户输入导致 XSS 风险,必须修复后继续”。
可落地清单:
- 审查清单:符合计划?TDD 完整?YAGNI 原则(无冗余)?DRY(无重复)?
- 阻塞阈值:≥1 Critical 问题时暂停,通知用户。
- 反馈循环:“receiving-code-review” 技能要求代理验证每个修复前运行测试,确认问题根因。
引用 Superpowers 仓库:“代理在任务间审查工作,按严重度报告问题,关键问题阻塞进度。”
测试阶段:严格 TDD 循环
核心是 “test-driven-development” 技能,强制 RED-GREEN-REFACTOR:
- RED:编写失败测试,运行确认失败(e.g., expect (addTodo ('milk')).toThrow ())。
- GREEN:最小代码使测试通过。
- REFACTOR:优化后重新测试。
参数:
- 测试覆盖:每个变更前≥80% 行覆盖,优先行为测试。
- 反模式避免:技能内置清单,如 “禁止预写实现代码”。
- 基线验证:使用 git worktree 确保干净测试基线。
运行时验证嵌入:每个任务末尾 “verification-before-completion” 技能运行端到端测试,检查运行行为(如 API 响应时序、错误恢复)。
部署阶段:分支完成与 PR 自动化
任务完成后,“finishing-a-development-branch” 技能激活:
- 运行全套测试,确认无回归。
- 选项:创建 GitHub PR、局部 merge、保留 / 丢弃分支。
落地参数:
- PR 模板:自动填充变更总结、测试日志、审查状态。
- CI 集成:PR 提交后触发 GitHub Actions,阈值:构建成功 + 覆盖≥90%。
- 回滚策略:若 PR 失败,自动切换 worktree 回主分支,清理变更。
整个循环使用 “using-git-worktrees” 隔离开发,避免主分支污染。
运行时验证与监控要点
运行时验证不是事后,而是贯穿:
- 系统化调试:“systematic-debugging” 四阶段:重现、隔离根因、防御深度、条件等待。
- 验证参数:每个变更后运行≥3 场景负载测试,监控指标:响应时间 < 200ms、错误率 < 0.1%。
- 监控清单:
阶段 关键指标 阈值 告警动作 生成 任务完成率 >95% 重新分发 审查 Critical 问题数 0 阻塞 测试 测试通过率 100% REFACTOR 部署 PR 合并成功率 >90% 人工审阅 运行时 行为一致性 零偏差 回滚
风险控制:代理漂移时,回退到 “executing-plans” 手动批次执行;资源超限,限制子代理深度≤5 层。
实施清单与最佳实践
- 安装:Claude Code 中
/plugin install superpowers@superpowers-marketplace,重启生效。 - 触发:新会话描述需求,代理自动搜索技能。
- 自定义:用 “writing-skills” 扩展新技能,TDD 测试子代理遵守。
- 规模化:集成 Microsoft Amplifier bundle,支持多语言。
此方法论已在实践中证明:代理从混乱编码转向工程化流程,生产力提升显著。
资料来源: