gstack 多 Agent 编排模式与上下文隔离策略解析

从单一代码助手到虚拟工程团队

当 Andrej Karpathy 在 2026 年 3 月表示 "自 12 月以来可能一行代码都没写过" 时，业界开始重新审视 AI 编码助手的边界。Garry Tan 开源的 gstack 项目给出了一个系统性的答案：将 Claude Code 从单一助手转化为一个由 23 个专业角色组成的虚拟工程团队。

gstack 的核心设计哲学是将传统软件工程中的角色分工抽象为可复用的技能（skill）。每个斜杠命令对应一个特定角色 ——/office-hours 是 YC 风格的合伙人，/plan-ceo-review 是产品 CEO，/plan-eng-review 是工程经理，/design-review 是资深设计师，/qa 是 QA 主管，/ship 是发布工程师。这种角色化设计不是简单的提示词包装，而是将每个角色的决策框架、审查清单和输出格式固化在 Markdown 文件中，使 Claude Code 能够在不同上下文间切换身份。

编排模式：Sprint 流水线与技能串联

gstack 的编排遵循 "Think → Plan → Build → Review → Test → Ship → Reflect" 的 Sprint 流程。关键的设计在于技能间的上下文传递机制：/office-hours 生成的设计文档会自动被下游的 /plan-ceo-review 读取，/plan-eng-review 产出的测试计划会被 /qa 继承，/review 发现的缺陷会在 /ship 阶段验证修复。这种流水线设计确保了信息不会在每个环节丢失。

角色编排的精妙之处在于智能路由。gstack 会追踪已执行的审查类型，根据变更内容自动判断需要哪些角色介入 —— 后端基础设施变更不会触发设计审查，UI 调整不会触发工程架构审查。这种 "Review Readiness Dashboard" 机制让多 Agent 协作避免了冗余开销。

对于复杂项目，gstack 提供了 /autoplan 一键编排，自动串联 CEO → 设计 → 工程 → DX 审查，并将需要人工决策的 "品味选择"（taste decisions）上浮给用户确认。这种 "编码决策原则"（encoded decision principles）的模式，将可自动化的判断留给 Agent，将需要人类直觉的选择暴露给开发者。

上下文隔离策略

在多 Agent 并行运行的场景下，上下文隔离是避免混乱的关键。gstack 采用三层隔离策略：

项目级隔离通过 CLAUDE.md 实现。每个项目根目录的 CLAUDE.md 文件定义了该项目的 gstack 配置，包括可用技能列表、浏览器行为约定、以及项目特定的上下文。当 Claude Code 进入项目时，它会读取该文件并限制在该项目的上下文中操作。

技能级隔离通过独立的 Markdown 文件实现。每个技能（如 /review、 /qa）是一个独立的 Markdown 文件，定义了该角色的系统提示、工具调用权限和输出格式。技能之间不共享状态，除非显式通过文件系统传递文档。

会话级隔离通过 Conductor 实现。Conductor 可以在同一台机器上运行多个独立的 Claude Code 会话，每个会话在自己的工作空间中运行不同的 Sprint。Garry Tan 提到他常规运行 10-15 个并行 Sprint，每个 Sprint 有独立的上下文和状态。

可落地的配置参数

对于希望采用 gstack 模式的团队，以下是关键配置建议：

技能前缀策略：通过 ./setup --prefix 或 ./setup --no-prefix 控制命令命名空间。在多技能包共存时建议使用前缀（/gstack-qa），单一使用时建议简化（/qa）。

团队模式配置：使用 ./setup --team 启用自动更新模式，避免版本漂移。通过 required 或 optional 参数控制队友是否必须安装 gstack。

浏览器隔离：/browse 使用独立的 Chromium 实例，通过 /setup-browser-cookies 导入真实浏览器的 Cookie 进行认证测试，避免污染主浏览器。

安全检查门：/cso 技能配置了 17 条误报排除规则和 8/10+ 置信度门槛，每个发现都包含具体利用场景描述。

持续检查点：设置 gstack-config set checkpoint_mode continuous 启用自动提交，使用 checkpoint_push=true（默认关闭）控制是否推送到远程，避免 CI 被 WIP 提交触发。

适用场景与权衡

gstack 模式最适合以下场景：技术创始人需要同时推进多个产品方向、小团队需要覆盖全栈开发流程、或者需要严格审查流程的关键系统。其 23 个角色的设计虽然全面，但也带来了学习成本 —— 建议从 /office-hours → /autoplan → /ship 的核心路径开始，逐步引入专业审查技能。

该架构的局限在于对 Claude Code 生态的深度绑定。虽然 gstack 也支持 Codex CLI、Cursor、OpenCode 等 10 个 AI 编码助手，但核心体验仍围绕 Claude Code 设计。此外，23 个角色的精细分工更适合复杂项目，对于简单原型可能显得过重。

资料来源

gstack GitHub 仓库

ai-systems

内容声明：本文无广告投放、无付费植入。

如有事实性问题，欢迎发送勘误至 i@hotdrydog.com。