在单一 AI assistant 与完全自主的多 agent 系统之间,存在一个尚未被充分探索的设计空间:如何让多个专业化 AI agents 像真实组织一样协同工作。Claude Code Game Studios 项目提供了一个实验性的答案 —— 通过模拟真实游戏工作室的层级结构,将 49 个 AI agents 组织为三层架构,并配以 72 个工作流技能和自动化质量门禁。这不是简单的 agent 累加,而是一套可复用的多智能体编排范式。
三层层级架构的设计逻辑
传统多 agent 系统通常采用扁平结构,所有 agent 平等协作或简单轮询,这忽视了真实组织中信息流动和决策权分配的结构性需求。该项目将 agents 划分为三个层级,每个层级对应不同的能力模型和职责范围。
第一层:Director 层(Opus 模型)。这一层包含三位总监 —— 创意总监、技术总监和制作人。他们的核心职责不是执行具体任务,而是守护项目愿景、制定技术标准和协调资源分配。Opus 模型在这里承担最复杂的推理任务,处理跨部门的战略决策。当游戏设计方向与技术实现产生冲突时,由对应的总监做出最终裁决。这种设计将模型的推理能力集中在真正需要全局视野的决策点上。
第二层:Department Leads 层(Sonnet 模型)。部门负责人的数量扩展到八位,涵盖游戏设计、编程、美术、音频、叙事、QA、发布和本地化。每个 lead 负责一个专业领域,将 Director 的战略意图转化为本部门的工作计划。Sonnet 模型在此层提供了足够的推理能力,同时保持了成本控制 —— 部门级别的协调不需要 Opus 的全部能力。
第三层:Specialists 层(Sonnet/Haiku 模型)。这是执行层面的主力军,包括游戏程序员、引擎程序员、AI 程序员、网络程序员、工具程序员、UI 程序员、系统设计师、关卡设计师、经济设计师、技术美术、音效设计师、作家、世界构建师、UX 设计师、原型工程师、性能分析师、运维工程师、数据分析师、安全工程师、QA 测试员、无障碍专家、运营设计师和社区经理。Specialists 直接处理具体工作,其模型选择根据任务复杂度灵活调整 —— 简单任务使用 Haiku 以降低成本,复杂实现切换到 Sonnet。
这种分层带来的直接收益是:每个任务自动路由到最合适的 agent 和模型,避免了对高级模型的过度调用。同时,层级间的委托关系清晰定义了什么决策可以下放、什么必须上报。
五大协调机制的具体实现
层级结构只是骨架,协调机制才是让系统运转的血液。该项目设计了五种核心协调机制,每一种都有明确的触发条件和处理流程。
垂直委托是最基础的机制:Director 向 Leads 下达目标,Leads 将目标拆解为具体任务分发给 Specialists。委托不是甩手掌柜 —— 每个上层 agent 需要明确下级的职责边界、交付标准和验收条件。在 Claude Code 的实现中,这通过 agent 定义文件中的 YAML frontmatter 完成,每个 agent 的 prompt 明确标注了向上汇报什么、何时需要升级决策。
水平咨询允许同层级 agent 相互请求建议,但咨询不等于授权。游戏设计师可以向系统设计师了解某项机制的可行性,系统设计师也可以向游戏设计师确认设计意图,但任何一方都不能单方面决定对方领域的事项。这一机制通过 agent prompt 中的 “协商协议” 章节实现,强制要求在跨域决策前必须获得对方明确同意。
冲突解决是当水平咨询无法达成一致时的升级路径。设计类冲突上报创意总监,技术类冲突上报技术总监,制作类冲突上报制作人。冲突解决的触发条件在 agent 定义中明确:连续两次协商未能达成一致即自动升级。升级时需要携带完整的争论要点和双方已尝试的解决方案,避免上级重复下级已经做过的工作。
变更传播处理跨部门影响。当某个部门的工作变更可能影响其他部门时,由制作人协调变更的时机、范围和适配方案。例如,核心玩法的重大调整需要同步通知 QA 团队更新测试计划,同时通知美术团队评估资源需求。制作人的协调权限确保了变更不会在真空中发生。
域边界是最容易被忽视但至关重要的机制。每个 agent 有明确的工作范围,未经明确授权不得修改其他域的文件。域边界的实现依赖两部分:一是 agent prompt 中的文件路径白名单,二是 Claude Code 的 settings.json 权限规则。例如,gameplay 程序员不能直接修改 src/core/ 目录下的核心引擎代码,必须通过引擎程序员的协作请求完成。这一机制防止了 “热心过度” 导致的意外破坏。
自动化安全:Hooks 与权限规则
人工协调无法覆盖所有边界情况,自动化安全机制提供了第二层防护。该项目包含 12 个自动化 hooks,嵌入到 Claude Code 的生命周期各个阶段。
PreToolUse Hooks在工具执行前触发验证。validate-commit.sh 检查提交信息是否符合规范、是否包含硬编码数值、是否存在 TODO 占位符、JSON 文件是否有效。validate-push.sh 对受保护分支的推送发出警告。validate-assets.sh 对 assets / 目录下的资源文件验证命名规范和 JSON 结构。这些 hook 的设计原则是 “快速失败”—— 如果检测到问题,立即终止工具执行并返回具体错误信息,而不是让问题流入后续流程。
PostToolUse Hooks在工具执行后进行追踪和补充验证。log-agent.sh 和 log-agent-stop.sh 构成了完整的 agent 审计追踪,记录每个子 agent 的启动时间、执行内容和工作时长。validate-skill-change.sh 在 skills 目录被修改后提醒运行测试。
Session Hooks覆盖整个会话周期。session-start.sh 显示当前分支和最近提交,帮助用户快速定位上下文。detect-gaps.sh 在项目缺少设计文档但已有代码时主动提示。session-stop.sh 在会话结束时归档进度并记录 git 活动。这些 hook 的触发频率较低,但每次执行都能显著提升会话的可追溯性。
权限规则通过 settings.json 配置,实现了更细粒度的安全控制。规则分为三类:自动允许(git status、test 运行等安全操作)、需要确认(可能存在风险的操作)和自动阻止(强制推送、删除目录、读取.env 文件等高危操作)。规则可以基于文件路径生效 —— 例如,针对 src/networking/** 目录的写入操作需要额外确认,因为网络代码的安全性至关重要。
可落地的多 agent 编排参数
将上述设计理念应用到自己的项目时,以下参数和阈值可作为初始配置参考。
模型分配策略:战略决策层(Director、重大冲突解决)使用 Opus 模型,单价约 $15 / 百万输入 token;部门协调层(Leads、跨域协商)使用 Sonnet 模型,单价约 $3 / 百万输入 token;任务执行层(Specialists、日常实现)默认 Sonnet,简单任务降级到 Haiku(单价约 $0.25 / 百万输入 token)。这种分层可以将平均单次会话成本降低约 60%。
任务升级阈值:水平咨询阶段允许最多 2 轮往返,超过后自动升级;升级时必须携带完整的上下文摘要(建议使用结构化模板:冲突点、已尝试方案、建议方案);被升级的决策在其父级解决后,相关信息需要在 24 小时内同步给所有相关方。
域边界配置建议:初始项目至少划分 5 个域(设计 / 编程 / 美术 / 音频 / 运营),每个域指定明确的前缀路径;跨域修改需要通过协作请求(Collaboration Request)机制,请求中必须包含目的说明、影响范围和回滚计划;每月审查一次域边界有效性,合并频繁跨域的职责或拆分职责过于集中的域。
Hook 验证强度:对于核心代码(src/core/、src/networking/),建议启用完整验证规则,包括类型检查、边界检查、安全扫描;对于原型代码(prototypes/**),验证规则最小化,仅保留必要的结构检查,允许快速迭代;生产发布前切换到 full 模式,运行完整的质量门禁检查。
监控指标:建议追踪 agent 调用深度(从 Director 到最终执行 Specialist 的调用层级)、决策升级频率(每月升级次数与总决策数的比例)、跨域协作请求数量及平均响应时间、hook 拦截率(被拦截的问题数与会话活跃度的比率)。这些指标可以帮助识别架构中的瓶颈和过度复杂区域。
与现有方案的差异化价值
与简单的多 agent 系统相比,该层级架构的核心差异在于引入了真实组织的协调机制。扁平式多 agent 系统面临的核心问题是 “谁来决定”—— 当多个 agent 对同一问题有不同见解时,缺乏仲裁者导致系统陷入协商僵局或产出不一致的决策。该项目通过明确的层级上报路径解决了这一问题:每个冲突都有唯一的仲裁者,最终决策权清晰。
另一个关键差异是域边界的显式定义。通用多 agent 系统倾向于让 agent 可以访问所有资源,这虽然在灵活性上有优势,但增加了意外破坏的风险。通过将访问权限与职责范围绑定,该架构在保持灵活性的同时建立了必要的防护栏。
最后,自动化 hooks 填补了人工监督的空白。即使是人类团队,也需要代码审查、静态分析等自动化工具的辅助。将这些实践移植到 AI agent 协作中,确保了系统不会因为 “AI 不会犯低级错误” 的假设而跳过必要的质量检查。
资料来源:本文核心事实与架构细节来自 GitHub 项目 Claude Code Game Studios(https://github.com/Donchitos/Claude-Code-Game-Studios),该项目采用 MIT 许可证开源。