Hotdry.

Article

刻意放慢的AI编程:用多模型审查换取代码质量的工程实践

探讨反效率主义的AI编程哲学:通过多模型并行审查、深度理解优先于快速交付,建立质量导向的工程实践工作流。

2026-05-26ai-systems

在 AI 辅助编程的浪潮中,"vibe coding"(氛围编程)已成为一种流行范式 —— 开发者用自然语言描述需求,让 AI 生成数百行代码,快速合并,追求极致的交付速度。然而,这种 "slop cannon"(垃圾炮)式的开发模式正在引发越来越多的质疑:当代码产出速度超越理解速度时,技术债务以何种形式积累?Socket 公司的工程师 Nolan Lawson 提出了一种反直觉的实践路径:用 AI 写更好的代码,但更慢

两种 AI 编程范式的分野

当前 AI 编程工具的使用呈现出明显的两极分化。一端是追求 "10 倍生产力" 的快速产出派,将 AI 视为代码生成器,目标是尽可能快地堆砌功能;另一端则是 Lawson 所倡导的深度理解派,将 AI 视为代码审查与质量保障的放大器

这种分野的本质是工程价值观的差异。快速产出派将 AI 输出视为终稿,审查流于形式;而 Lawson 认为,"LLM 的输出只是初稿,真正的工程工作从代码审查开始"。这种认知转变决定了 AI 在开发流程中的定位 —— 它不是替代人类思考的自动化工具,而是增强人类判断力的认知伙伴。

多模型并行审查工作流

Lawson 的核心实践是一个精心设计的代码审查工作流。他构建了一个 Claude Skill,指令多个 AI 子代理并行分析 PR:Claude 子代理、OpenAI Codex、以及 Cursor Bugbot。每个代理独立扫描代码,按严重级别(Critical/High/Medium/Low)分类潜在问题,最后由主代理汇总并去重。

这个设计的关键在于模型多样性带来的交叉验证。单一模型容易产生幻觉或陷入特定偏见,但当多个独立模型对同一代码片段得出相似结论时,误报率显著降低。Lawson 的经验是,这种多模型审查的 "假阳性率接近零"。

审查范围不仅限于功能性 bug,还包括架构层面的问题:是否遵循 KISS(保持简单)和 DRY(不要重复)原则、HTML/JSX 的可访问性、SQL 查询是否正确使用索引等。这种广度的审查在人工代码审查中往往因时间压力而被压缩,但 AI 代理可以不知疲倦地扫描每一行代码。

慢下来才能发现的真实成本

多模型审查的副作用是暴露了大量历史遗留问题。当审查代理深入代码的 "失败模式"(failure modes)时,往往会发现当前 PR 之外的既有缺陷 —— 边界情况处理不当、过时的注释、潜在的性能瓶颈。这导致开发者陷入 Lawson 所说的 "支线任务":为修复这些前置问题而编写单元测试、重构旧代码。

从传统效率指标看,这是 "速度下降" 的信号。但 Lawson 发现这种 "慢" 具有反脆弱性:它阻止了技术债务的进一步累积。当开发者被迫理解代码的假设边界和失效场景时,他们对系统的认知深度远超快速合并所能提供的。正如他所言,"复杂架构的快乐路径远不如其失败模式有趣"—— 理解系统在哪里会崩溃,是掌握系统的关键。

这种工作流还产生了一个意外收益:方案验证的前置化。有时多轮审查后会发现整个 PR 的方法论存在根本缺陷,此时放弃 PR 反而节省了后续返工的成本。这种 "早期失败" 机制在快速开发模式中很难实现,因为人类审查者往往缺乏时间和工具去深度质疑已实现的功能。

可落地的质量优先工作流

基于 Lawson 的实践,可以提炼出一套可操作的 "慢速 AI 编程" 工作流:

阶段一:多模型并行扫描

  • 配置至少两个不同架构的模型(如 Claude + GPT/Codex)独立审查 PR
  • 定义明确的审查维度:功能正确性、安全漏洞、性能、可维护性、可访问性
  • 要求模型按严重级别分类问题,并提供具体代码位置

阶段二:人工验证与优先级排序

  • 审查 AI 输出,排除明显的误报(尽管多模型已大幅降低此概率)
  • 按 "修复收益 / 成本比" 排序:Critical/High 必须修复;Medium/Low 根据 ROI 决定
  • 识别 "前置依赖":当前 PR 是否暴露了需要优先处理的历史债务

阶段三:迭代修复与深度理解

  • 使用 AI 辅助修复确认的问题,但要求解释修复原理
  • 借助/grill-me类技能(如 Matt Pocock 开发的 Claude Skill)反向拷问 AI,直到完全理解 PR 的每个部分
  • 必要时生成 Mermaid 图表等可视化文档,强制梳理数据流和依赖关系

阶段四:决策节点

  • 如果 Critical/High 问题持续多轮无法清零,考虑放弃 PR 并重新设计方案
  • 记录 "跳过的问题" 及其理由,建立技术债务追踪

工程文化的深层转向

Lawson 的实践指向一种更深层的工程文化转变:从 "交付速度" 到 "理解深度" 的范式迁移。在 AI 可以无限生成代码的时代,人类开发者的核心价值不再是打字速度,而是判断力和系统理解力。

这种文化与 "craftsmanship"(工匠精神)传统一脉相承。Lawson 将其描述为 "careful, methodical, quality-obsessed, focused on making things better for the next coder"(谨慎、有条理、质量至上、专注于为下一个开发者创造更好的条件)。AI 在这里扮演的角色不是取代这种工匠精神,而是将其规模化 —— 让单个开发者能够执行过去需要整个团队才能完成的深度审查。

这种慢速路径的代价是显性的:更多的 token 消耗、更长的开发周期、可能发现导致 PR 废弃的根本缺陷。但其收益同样真实:更低的长期维护成本、更健康的代码库、开发者对系统更深刻的理解。在技术债务复利效应显著的软件工程中,前期投入的审查时间往往能在后期获得数量级的回报。

结语

AI 编程工具的普及正在重新定义 "效率" 的内涵。当代码生成变得廉价时,理解、验证和质量保障成为新的瓶颈。Lawson 的 "慢速 AI 编程" 实践提供了一种思路:利用 AI 的并行处理能力放大人类的审查能力,而非替代人类的判断。

这种方法不会让你在 GitHub 贡献图上刷屏,也不会让你在社交媒体上炫耀 "一天写了一个 App"。但它可能让你在三年后维护这段代码时,感谢当初那个选择慢下来的自己。在软件工程的长期博弈中,深度理解永远是最高杠杆的投资。


参考来源

ai-systems

内容声明:本文无广告投放、无付费植入。

如有事实性问题,欢迎发送勘误至 i@hotdrydog.com