Hotdry.
ai-systems

基于 Shell 的 Agentic Skills 运行时:分发循环、子代理协调与 Git 工作流

剖析 Superpowers shell-based 代理技能运行时,聚焦 dispatch loops、subagent 协调机制及生产 Git 开发管道的可落地参数与监控要点。

在 AI 代理开发中,一个高效的 agentic skills runtime 需要实现零服务器部署、自动任务分发与可靠的子代理协作。Superpowers 项目(GitHub: obra/superpowers)提供了一个纯 shell-based 的解决方案,通过 composable SKILL.md 文件定义技能,并嵌入 Claude Code 等 shell 终端代理环境中,实现无插件依赖的运行时。该运行时的核心在于 dispatch loops(分发循环)、subagent coordination(子代理协调)以及 Git workflows(Git 工作流),形成完整的生产开发方法论:从 spec 提炼到 code-gen/review/test/deploy 全链路自动化。

Dispatch Loops:结构化任务分发机制

Superpowers 的 dispatch loop 是运行时的心脏,它将复杂开发任务分解为原子步骤,确保代理不偏离计划。典型循环从 brainstorming 技能启动:代理主动澄清用户意图,生成可读的 design document 分块呈现,用户签发后进入 using-git-worktrees 技能,自动创建隔离分支(git worktree add)。

随后,writing-plans 技能生成 bite-sized tasks,每任务控制在 2-5 分钟内完成,包括精确文件路径、预期代码片段及验证步骤。例如,一个添加用户认证的功能计划可能拆为:1) test_user_login_fail(写失败测试);2) impl_user_model(最小实现通过测试);3) refactor_auth_flow(优化)。这避免了代理一次性生成海量代码的风险。

进入执行阶段,dispatch loop 分支为 executing-plans(批量执行,人机检查点)或 subagent-driven-development(逐任务分发)。前者适合简单任务,后者为核心:主代理为每个 task 启动 fresh subagent,注入 plan snippet + TDD 指令。Subagent 完成后,主代理执行两阶段 review:1) spec compliance(是否按计划文件 / 代码);2) code quality(DRY/YAGNI 检查)。若 critical issue,主循环阻塞,直至修复。

落地参数

  • Task 粒度阈值:2-5 分钟 / 任务,>10min 强制拆分。
  • Review 阈值:critical issues(阻塞安全 / 核心逻辑)需 100% 修复;major(性能 / 可读)80% 通过率。
  • Loop 超时:单 task 15min 超时,回滚并重分发 subagent。
  • 监控点:日志 prefix "DISPATCH [loop_id]: task_X status",追踪循环深度(max 50 tasks)。

证据显示,这种 loop 在 Claude Code 中可自主运行数小时,而不偏轨。[1]

Subagent Coordination:并行与协作优化

Superpowers 强调 subagent 作为 “热情但无判断力的 junior engineer”,通过 dispatching-parallel-agents 技能实现协调。该技能识别独立任务(e.g. UI + backend 并行),spawn 并行 subagents,显式声明 shared state(e.g. shared DB schema 文件)与 dependencies(wait-for: task_Y)。

协调机制基于 persuasion principles(如 authority/commitment):技能指令以 “IMPORTANT: MUST USE” 开头,强制 subagent 遵守。测试中,使用 pressure scenarios(如 production down,每分钟 $5k 损失)验证 compliance,主代理 quiz subagents,确保在 sunk cost 或 time pressure 下仍搜索 / 使用技能。

可操作清单

  1. Spawn 模板subagent_prompt = plan_task + "Follow TDD: RED-GREEN-REFACTOR. Output only code+test."
  2. Coord 协议:使用文件锁(flock)或 git stash 隔离状态;parallel max=4(CPU-bound)。
  3. Review 管道:Stage1: diff plan vs output;Stage2: lint + static analysis(shell: shellcheck/eslint)。
  4. Merge 策略:subagent 输出 → temp branch → main review → git merge --no-ff。
  5. 回滚:失败率 > 20%,fallback to serial execution。

此机制将单代理 hallucination 风险降至最低,实现 compounding team 效果。[2]

Git Workflows:生产 Dev Methodology

生产级部署依赖 Git 管道:worktrees 隔离开发(git worktree add feature-X main),finishing-a-development-branch 技能结束时提供选项:local merge、GitHub PR 或 discard。整合 test-driven-development(强制删预写代码,RED-GREEN cycle)和 requesting-code-review(severity-based blocking)。

部署清单

  • Init:repo root 置 .claude/plugins/superpowers(symlink skills dir)。
  • Hooks:pre-commit: run tests/all;post-task: git diff --stat 验证。
  • CI/CD 参数:PR trigger: full test suite + coverage>80%;deploy threshold: 0 critical issues。
  • 监控:Prometheus metrics: dispatch_success_rate (>95%)、subagent_util (avg tasks/agent=5)。
  • Scale:multi-repo: dispatch to agent teams(Claude teams API)。

风险控制:无技能时 fallback ad-hoc,但哲学强调 “evidence over claims”—— 始终 verify before commit。

此 runtime 零服务器、纯 shell(plugin install 后 auto-trigger),适用于 Cursor/Codex 等。相比纯 prompt chaining,它提供 deterministic orchestration,提升 dev velocity 2-3x。

资料来源: [1] https://github.com/obra/superpowers - Skills library & workflow. [2] https://blog.fsck.com/2025/10/09/superpowers/ - Author insights on subagent testing.

(正文字数:1028)

查看归档