刻意放慢的AI编程：用多模型审查换取代码质量的工程实践

在 AI 辅助编程的浪潮中，"vibe coding"（氛围编程）已成为一种流行范式 —— 开发者用自然语言描述需求，让 AI 生成数百行代码，快速合并，追求极致的交付速度。然而，这种 "slop cannon"（垃圾炮）式的开发模式正在引发越来越多的质疑：当代码产出速度超越理解速度时，技术债务以何种形式积累？Socket 公司的工程师 Nolan Lawson 提出了一种反直觉的实践路径：用 AI 写更好的代码，但更慢。

两种 AI 编程范式的分野

当前 AI 编程工具的使用呈现出明显的两极分化。一端是追求 "10 倍生产力" 的快速产出派，将 AI 视为代码生成器，目标是尽可能快地堆砌功能；另一端则是 Lawson 所倡导的深度理解派，将 AI 视为代码审查与质量保障的放大器。

这种分野的本质是工程价值观的差异。快速产出派将 AI 输出视为终稿，审查流于形式；而 Lawson 认为，"LLM 的输出只是初稿，真正的工程工作从代码审查开始"。这种认知转变决定了 AI 在开发流程中的定位 —— 它不是替代人类思考的自动化工具，而是增强人类判断力的认知伙伴。

多模型并行审查工作流

Lawson 的核心实践是一个精心设计的代码审查工作流。他构建了一个 Claude Skill，指令多个 AI 子代理并行分析 PR：Claude 子代理、OpenAI Codex、以及 Cursor Bugbot。每个代理独立扫描代码，按严重级别（Critical/High/Medium/Low）分类潜在问题，最后由主代理汇总并去重。

这个设计的关键在于模型多样性带来的交叉验证。单一模型容易产生幻觉或陷入特定偏见，但当多个独立模型对同一代码片段得出相似结论时，误报率显著降低。Lawson 的经验是，这种多模型审查的 "假阳性率接近零"。

审查范围不仅限于功能性 bug，还包括架构层面的问题：是否遵循 KISS（保持简单）和 DRY（不要重复）原则、HTML/JSX 的可访问性、SQL 查询是否正确使用索引等。这种广度的审查在人工代码审查中往往因时间压力而被压缩，但 AI 代理可以不知疲倦地扫描每一行代码。

慢下来才能发现的真实成本

多模型审查的副作用是暴露了大量历史遗留问题。当审查代理深入代码的 "失败模式"（failure modes）时，往往会发现当前 PR 之外的既有缺陷 —— 边界情况处理不当、过时的注释、潜在的性能瓶颈。这导致开发者陷入 Lawson 所说的 "支线任务"：为修复这些前置问题而编写单元测试、重构旧代码。

从传统效率指标看，这是 "速度下降" 的信号。但 Lawson 发现这种 "慢" 具有反脆弱性：它阻止了技术债务的进一步累积。当开发者被迫理解代码的假设边界和失效场景时，他们对系统的认知深度远超快速合并所能提供的。正如他所言，"复杂架构的快乐路径远不如其失败模式有趣"—— 理解系统在哪里会崩溃，是掌握系统的关键。

这种工作流还产生了一个意外收益：方案验证的前置化。有时多轮审查后会发现整个 PR 的方法论存在根本缺陷，此时放弃 PR 反而节省了后续返工的成本。这种 "早期失败" 机制在快速开发模式中很难实现，因为人类审查者往往缺乏时间和工具去深度质疑已实现的功能。

可落地的质量优先工作流

基于 Lawson 的实践，可以提炼出一套可操作的 "慢速 AI 编程" 工作流：

阶段一：多模型并行扫描

配置至少两个不同架构的模型（如 Claude + GPT/Codex）独立审查 PR
定义明确的审查维度：功能正确性、安全漏洞、性能、可维护性、可访问性
要求模型按严重级别分类问题，并提供具体代码位置

阶段二：人工验证与优先级排序

审查 AI 输出，排除明显的误报（尽管多模型已大幅降低此概率）
按 "修复收益 / 成本比" 排序：Critical/High 必须修复；Medium/Low 根据 ROI 决定
识别 "前置依赖"：当前 PR 是否暴露了需要优先处理的历史债务

阶段三：迭代修复与深度理解

使用 AI 辅助修复确认的问题，但要求解释修复原理
借助/grill-me类技能（如 Matt Pocock 开发的 Claude Skill）反向拷问 AI，直到完全理解 PR 的每个部分
必要时生成 Mermaid 图表等可视化文档，强制梳理数据流和依赖关系

阶段四：决策节点

如果 Critical/High 问题持续多轮无法清零，考虑放弃 PR 并重新设计方案
记录 "跳过的问题" 及其理由，建立技术债务追踪

工程文化的深层转向

Lawson 的实践指向一种更深层的工程文化转变：从 "交付速度" 到 "理解深度" 的范式迁移。在 AI 可以无限生成代码的时代，人类开发者的核心价值不再是打字速度，而是判断力和系统理解力。

这种文化与 "craftsmanship"（工匠精神）传统一脉相承。Lawson 将其描述为 "careful, methodical, quality-obsessed, focused on making things better for the next coder"（谨慎、有条理、质量至上、专注于为下一个开发者创造更好的条件）。AI 在这里扮演的角色不是取代这种工匠精神，而是将其规模化 —— 让单个开发者能够执行过去需要整个团队才能完成的深度审查。

这种慢速路径的代价是显性的：更多的 token 消耗、更长的开发周期、可能发现导致 PR 废弃的根本缺陷。但其收益同样真实：更低的长期维护成本、更健康的代码库、开发者对系统更深刻的理解。在技术债务复利效应显著的软件工程中，前期投入的审查时间往往能在后期获得数量级的回报。

结语

AI 编程工具的普及正在重新定义 "效率" 的内涵。当代码生成变得廉价时，理解、验证和质量保障成为新的瓶颈。Lawson 的 "慢速 AI 编程" 实践提供了一种思路：利用 AI 的并行处理能力放大人类的审查能力，而非替代人类的判断。

这种方法不会让你在 GitHub 贡献图上刷屏，也不会让你在社交媒体上炫耀 "一天写了一个 App"。但它可能让你在三年后维护这段代码时，感谢当初那个选择慢下来的自己。在软件工程的长期博弈中，深度理解永远是最高杠杆的投资。

参考来源

Nolan Lawson, "Using AI to write better code more slowly", 2026-05-25, https://nolanlawson.com/2026/05/25/using-ai-to-write-better-code-more-slowly/

ai-systems

内容声明：本文无广告投放、无付费植入。

如有事实性问题，欢迎发送勘误至 i@hotdrydog.com。