很多独立开发者在使用 AI 辅助开发游戏时,都会遇到一个共性问题:单个对话窗口缺乏真正的项目管理结构。没有设计审查、没有代码质量门禁、没有版本控制之外的架构约束,AI 只会忠实地执行你给出的任何指令 —— 即使那个指令会导致魔法数字硬编码、或者让游戏循环逻辑与设计文档完全脱节。Claude-Code-Game-Studios 这个项目正是为了解决这个根本性缺陷而设计:它将一个 AI 对话窗口,变成了一家完整的游戏开发工作室。
三层级 Agent 架构:从创意总监到专职 Specialists
该项目最核心的设计理念是将 49 个 AI Agent 组织成真实游戏工作室的三层级结构。这种层级不是简单的命名游戏,而是对应着真实的决策权划分与信息流转逻辑。
第一层级:Director(导演层) 包含四个 Opus 级别的 Agent,分别负责创意方向、技术决策、制作管理和美术风格。Creative Director 守护游戏的核心理念,确保所有设计决策都围绕游戏支柱展开;Technical Director 掌控架构决策,保证代码质量和长期可维护性;Producer 追踪进度、识别阻塞项、协调跨部门协作;Art Director 定义并维护视觉风格的一致性。这四个 Agent 拥有最终的约束性决策权,任何跨越层级的复杂决定都必须经过这一层。
第二层级:Department Leads(部门主管层) 包含九个工作 Sonnet 级别的 Agent,负责具体领域的所有权与协调。Game Designer 拥有游戏机制和玩家体验的定义权;Lead Programmer 协调所有编程工作与代码架构;Narrative Director 管理故事、传说和角色发展;Audio Director 定义音频风格并协调音效设计;QA Lead 规划测试策略并确保质量标准;Release Manager 协调发布准备和部署;Localization Lead 管理翻译和地区适配;Systems Designer 设计数值系统和游戏平衡;Level Designer 创建关卡布局和遭遇设计。每个部门主管向下可以调用本领域的 Specialist,向上则向 Director 汇报。
第三层级:Specialists(专职层) 包含 36 个 Sonnet 或 Haiku 级别的 Agent,覆盖编程、设计、美术、音频、运营和 QA 六大领域。编程 Specialist 细分为游戏机制程序员、引擎程序员、AI 程序员、网络程序员、UI 程序员和工具程序员;设计 Specialist 包括 UX 设计师、世界构建师、编剧、原型工程师和性能分析师;美术与音频 Specialist 有技术美术和音效设计师;引擎 Specialist 则根据目标引擎提供完整套装 ——Godot 4 方向覆盖 GDScript、C#、着色器和 GDExtension,Unity 方向覆盖 DOTS/ECS、着色器 / VFX、Addressables 和 UI Toolkit,Unreal Engine 5 方向覆盖 GAS、蓝图、复制和 UMG/CommonUI;运营 Specialist 包括 DevOps 工程师、分析师工程师、Live-Ops 设计师、社区经理和经济设计师;QA Specialist 包括测试工程师、安全工程师和无障碍专家。
这种层级设计的核心价值在于:复杂决策永远流向具有相应专业知识的层级,日常工作高效分配给专职 Agent,而任何人做出的任何更改都会被该领域的负责人审核。
72 个 Slash 命令:11 大类别的全流程覆盖
如果说 Agent 层级是骨架,那么 72 个 slash 命令就是让整个系统运转的肌肉与神经。这些命令按照开发阶段组织成 11 个类别,每个类别对应游戏开发的一个核心环节。
入门与导航(5 个技能) 处理项目的初始状态识别。/start 提供引导式入职,询问开发者当前所处阶段并将工作流导向正确方向;/help 提供上下文感知的帮助,读取当前阶段并告知接下来应该做什么;/project-stage-detect 执行完整项目审计以确定当前开发阶段;/setup-engine 配置目标引擎、锁定版本并设置偏好;/adopt 对现有项目进行棕地审计并制定迁移计划。
游戏设计(6 个技能) 覆盖从概念到详细设计的全过程。/brainstorm 提供协作式头脑风暴,包含 MDA(机制、动态,体验)分析;/map-systems 将概念分解为带依赖关系的系统索引;/design-system 按章节引导式编写 GDD;/quick-design 为小型改动提供轻量级规格说明;/review-all-gdd 执行跨 GDD 一致性和设计理论审查;/propagate-design-change 在 GDD 变更时找出受影响的 ADR 和用户故事。
架构(4 个技能) 处理技术决策与文档化。/create-architecture 创建主架构文档;/architecture-decision 创建或改造架构决策记录(ADR);/architecture-review 验证所有 ADR 和依赖排序;/create-control-manifest 从已接受的 ADR 生成扁平的程序员规则。
故事与冲刺(8 个技能) 实现敏捷开发流程。/create-epics 将 GDD 和 ADR 翻译为史诗(每个模块一个);/create-stories 将单个史诗拆分为可执行的故事文件;/dev-story 实现故事并自动路由到正确的程序员 Agent;/sprint-plan 创建或管理冲刺计划;/sprint-status 快速生成 30 行冲刺快照;/story-readiness 验证故事是否已准备好实现;/story-done 执行 8 阶段故事完成审查;/estimate 进行带风险评估的工作量估算。
审查与分析(10 个技能) 提供质量门禁。/design-review 按 8 部分标准验证 GDD;/code-review 执行架构代码审查;/balance-check 分析游戏平衡公式;/asset-audit 验证资产命名、格式和大小;/content-audit 比较 GDD 规定的内容与实现;/scope-check 检测范围蔓延;/perf-profile 执行性能分析工作流;/tech-debt 扫描并优先级排序技术债务;/gate-check 正式阶段门禁并给出 PASS/CONCERNS/FAIL 判定;reverse-document 从现有代码生成设计文档。
QA 与测试(9 个技能) 构建完整的测试体系。/qa-plan 为冲刺或功能生成 QA 测试计划;/smoke-check QA 交接前的关键路径冒烟测试门禁;/soak-test 长时间游玩的浸泡测试协议;/regression-suite 绘制测试覆盖率并识别缺失的回归测试;/test-setup 搭建测试框架和 CI/CD 管道;/test-helpers 生成引擎特定的测试辅助库;/test-evidence-review 测试文件和手动证据的质量审查;/test-flakiness 从 CI 日志检测非确定性测试;/skill-test 验证技能文件的结构和行为正确性。
团队编排(9 个技能) 协调跨 Agent 的特性开发。/team-combat 从设计到实现协调战斗特性;/team-narrative 从结构到对话协调叙事内容;/team-ui 从 UX 规范到完善实现协调 UI 特性;/team-level 从布局到配置遭遇协调关卡;/team-audio 从方向到实现事件协调音频;/team-polish 协调涵盖性能、美术、音频和 QA 的完善过程;/team-release 协调涵盖构建、QA 和部署的发布流程;/team-live-ops 为季节性活动和留存规划 Live-ops;/team-qa 从策略到签收的完整 QA 周期。
制作管理(6 个技能) 处理项目运营。/milestone-review 里程碑进展和 go/no-go 推荐;/retrospective 冲刺回顾分析;/bug-report 结构化缺陷报告创建;/bug-triage 重新评估开放缺陷的优先级和严重性;/playtest-report 结构化玩家测试会话报告;/onboard 为新团队成员提供入职指导。
发布(5 个技能) 覆盖发布与发布后支持。/release-checklist 发布前验证;/launch-checklist 完整跨部门发布就绪状态;/changelog 自动生成内部变更日志;/patch-notes 面向玩家的补丁说明;/hotfix 紧急修复工作流并保留完整审计追踪。
创意(2 个技能) 提供快速原型和本地化。/prototype 在隔离的 worktree 中创建可丢弃的原型;/localize 字符串提取和验证。
协调系统:垂直委托、水平协商与冲突解决
49 个 Agent 不是一群各自为战的孤岛,而是一个有明确协调规则的系统。该系统的核心是三项协调原则。
垂直委托 意味着 Director 委托给 Leads,Leads 委托给 Specialists。这个委托链确保复杂决策获得适当级别的审核,日常工作高效流向专职 Agent。复杂决策永远不会被跳过任何层级,保持每个层级的问责制和专业知识。
水平协商 允许同一层级的 Agent 就跨领域输入进行协商,但他们无法在其领域之外做出约束性决定。例如,Game Designer 可以就可行性咨询 Lead Programmer,但未经 Technical Director 批准,不能承诺技术实现细节。
冲突解决 提供清晰的升级路径。当 Agent 之间产生分歧时,设计冲突升级到 Creative Director,技术冲突升级到 Technical Director,范围冲突升级到 Producer。这种设计防止死锁并确保分歧被高效解决。
项目还强制执行域边界规则:Agent 未经明确委托不能修改其领域之外的文件。这防止范围蔓延并确保更改由适当的 Specialist 审核。规则系统根据文件路径自动强制执行这些边界。
七阶段开发管道与质量门禁
该系统定义了包含正式门禁的完整七阶段开发管道。每个门禁必须通过才能进入下一阶段,确保基础工作在前进之前完成。
阶段一:概念 从「没有想法」或「模糊想法」走向结构化的游戏概念文档,包含定义的支柱和玩家旅程。/brainstorm 技能引导你完成使用 MDA 分析、玩家动机映射和目标受众定位的协作式构思,输出作为后续所有工作基础的概念文档。
阶段二:系统设计 创建定义游戏如何运作的所有设计文档。系统索引中识别的每个系统都有其自己的游戏设计文档(GDD),按章节编写,包含 8 个必需部分:概述、玩家幻想、详细规则、公式、边缘情况、依赖、调整旋钮和验收标准。/review-all-gdd 技能执行跨 GDD 一致性检查。
阶段三:技术设置 做出关键技术决策并将其记录为 ADR。/create-architecture 技能创建主架构文档,/architecture-decision 技能引导创建单个 ADR,/create-control-manifest 技能生成故事引用的扁平程序员规则。
阶段四:预制作 为关键屏幕创建 UX 原型,验证风险机制,并将设计文档转化为可执行的故事。/create-epics 和 /create-stories 技能将 GDD 转化为故事文件。在进入下一阶段之前,必须构建并测试垂直切片,验证核心循环是有趣的。
阶段五:制作 是核心生产循环。开发者以冲刺为单位工作,逐个故事实现特性。故事生命周期遵循:/story-readiness 验证故事状态,适当的程序员 Agent 进行实现,/story-done 执行 8 阶段完成审查。团队技能协调多个 Agent 开发跨领域特性。
阶段六:完善 游戏功能已经完成,现在需要使其变得更好。性能分析、平衡分析、资产审计和协调完善过程确保游戏达到质量标准。至少需要 3 次玩家测试,涵盖新玩家体验、中期系统和难度曲线。
阶段七:发布 游戏已完善并准备好发布。/release-checklist 和 /launch-checklist 技能确保完整的跨部门验证。/team-release 技能协调发布流程,/hotfix 为关键生产缺陷提供紧急工作流。
工程化保障:12 个 Hook 与 11 个路径规则
系统包含 12 个自动化 Hook,在特定触发条件下运行,提供 catch common mistakes 的安全网。
validate-commit.sh 在 Bash 工具使用前触发,检查硬编码值、TODO 格式和 JSON 有效性;validate-push.sh 在 Bash 工具使用前触发,警告向保护分支的推送;validate-assets.sh 在写 / 编辑后触发,验证命名约定和 JSON 结构;session-start.sh 在会话打开时显示当前分支和最近提交;detect-gaps.sh 在会话打开时检测新项目和缺失的设计文档;pre-compruit.sh 在压缩前保留会话进度笔记;post-compuit.sh 在压缩后提醒恢复会话状态;log-agent.sh 在 Agent 启动时开始审计追踪;log-agent-stop.sh 在 Agent 停止时结束审计追踪。
编码标准根据文件位置自动执行。src/gameplay/** 强制数据驱动值、增量时间使用和无 UI 引用;src/core/** 要求热路径零分配、线程安全和 API 稳定性;src/ai/** 强制性能预算、可调试性和数据驱动参数;src/networking/** 要求服务器授权、版本化消息和安全性;src/ui/** 强制无游戏状态所有权、本地化就绪和无障碍;design/gdd/** 要求 8 个必需部分、公式格式和边缘情况;tests/** 要求测试命名、覆盖率和夹具模式。
关键实践参数与监控建议
对于计划采用这套系统的团队,以下是值得关注的落地参数与监控指标。
在 Agent 数量配置上,项目文档提供了三种审查强度选项:full 模式执行所有门禁检查,适合中大型项目和需要严格质量控制的团队;lean 模式仅执行阶段门禁,适合小型项目和快速迭代;solo 模式不使用任何门禁,适合单人开发者和学习阶段。初期建议从 lean 模式开始,随着团队熟悉流程逐步升级到 full 模式。
在技能使用频率上,数据显示设计类技能(brainstorm、design-system、review-all-gdd)在概念和预制作阶段的使用频率最高,而审查类技能(code-review、balance-check、tech-debt)在制作阶段的使用频率显著上升。建议在冲刺计划中明确标注每个冲刺阶段应重点使用的技能集合。
在质量门禁通过率方面,/gate-check 技能的 PASS/CONCERNS/FAIL 判定结果应该被追踪。初始阶段 CONCERNS 的比例可能会比较高,这是正常的学习曲线信号。如果 FAIL 判定连续出现超过 3 次,应该暂停进入下一阶段,转而分析是设计文档不充分还是技术架构存在根本性问题。
在 Hook 拦截统计上,建议记录每种 Hook 的触发频率和拦截内容类型。validate-commit.sh 的高频触发通常意味着团队需要加强代码审查意识;detect-gaps.sh 在新项目阶段的频繁触发则表明项目初始化流程可能需要优化。
整体而言,Claude-Code-Game-Studios 提供了一套将 AI 辅助从「工具使用」提升到「流程治理」的完整方案。49 个 Agent 的层级设计确保决策在正确层级做出,72 个技能覆盖从概念到发布的全生命周期,12 个 Hook 和 11 个路径规则提供自动化质量保障。对于希望建立规范化游戏开发流程的独立团队或小型工作室,这套系统提供了可按需定制的完整骨架 —— 它不代替开发者的决策,但确保每个决策都经过适当的审查与验证。
资料来源:项目 GitHub 仓库(github.com/Donchitos/Claude-Code-Game-Studios)及 PyShine 教程页面。