从 vibe coding 到 agentic engineering：AI 编程范式的工程化演进与实践要点

在 2026 年的软件开发领域，一个核心议题正在重新定义工程师与 AI 工具之间的关系：究竟是继续拥抱「vibe coding」所带来的高速原型开发体验，还是转向更为结构化的「agentic engineering」模式？这个看似简单的二选一问题背后，隐藏着软件工程实践的根本性变革。Simon Willison 作为这两个概念的提出者，在近期播客访谈中分享了他的深度反思，其核心观点揭示了一个令人不安但又无法回避的事实 —— 这两种范式之间的边界正在迅速模糊，而工程社区必须为此做好系统性准备。

两种范式的本质差异

理解 vibe coding 与 agentic engineering 的区别，是把握这次范式迁移的前提。vibe coding 本质上是一种高信任度的 AI 使用方式：开发者将代码生成的主导权几乎完全交给 AI 模型，自己则退居到「产品经理」的角色 —— 描述需求、验证结果、在不工作时反馈问题。这种模式的核心特征包括不深入检查生成的代码、不关注代码质量细节、接受「能用就行」的实用主义哲学。Simon Willison 对此的经典定义是：vibe coding 适合个人工具场景，因为如果出现 bug，受影响的只有自己；但在面向他人交付的软件中使用 vibe coding，则是一种不负责任的行为，因为别人的信息安全和系统稳定性的代价不应当被如此轻率地对待。

与之相对，agentic engineering 代表了一种更为审慎的工程化路径。在这种模式下，开发者始终保持对代码的所有权和责任，利用 AI 代理作为放大自身能力的「强力工具」，而非替代自身判断的「黑盒」。关键区别体现在以下几个方面：工程师需要理解安全、可维护性、性能和运维等工程维度；AI 生成的代码必须经过测试、文档化和审查流程；架构决策和质量标准依然由人类工程师把控。Simon Willison 本人曾明确表示，他使用 agentic engineering 的目标是构建更高质量的系统 —— 不是以更快的速度生产更低质量的代码，而是以更快的速度生产更高质量的代码。

边界模糊：一次令人不安的收敛

然而，Simon Willison 在近期与 Joseph Ruscio 的对谈中抛出了一个颇具冲击力的观察：这两种范式在他自己的日常工作中已经开始重叠、交融，这让他感到「相当不安」。这一表态揭示了 AI 编码代理可靠性提升所带来的深层悖论。

Willison 描述了一个具体的心理困境：当他要求 Claude Code 构建一个执行 SQL 查询并返回 JSON 结果的 API 端点时，他清楚地知道这个模型「绝对会做对」。他会让代理添加自动化测试和文档，也知道结果一定会符合他的代码风格。但关键问题在于 —— 他不再逐行审查这些代码了。这种信任建立在过去无数次成功经验的基础上，但同时也意味着一种责任转移：代码的质量保证从人类工程师的主动审查，变成了对 AI 模型历史表现的被动信赖。

Willison 使用了一个极具启发性的类比：在大型科技公司中，当另一个团队交付一个图像调整大小的服务时，他不会逐行阅读对方的代码。他会查看文档、使用该服务、在出现问题时才会深入代码仓库。这种「半黑盒」的信任模式在人类团队之间是合理的，因为团队拥有专业声誉可以追责。但 AI 代理没有专业声誉，也无法为其产出承担法律责任。这里存在一个根本性的责任真空：当代码出现安全漏洞或严重 bug 时，追究责任的链条在 AI 代理处断裂。

这正是「常态化的偏差」（normalization of deviance）风险的核心。每次 AI 成功完成一个看似简单的任务而未被仔细审查，都可能为下一次过度信任埋下伏笔。工程师需要建立明确的心理边界：哪些类型的代码必须审查，哪些可以放心交给代理处理，以及如何设计制度化的检查点来防止信任膨胀。

瓶颈转移：从代码生产到系统工程

vibe coding 与 agentic engineering 的另一个关键区别，在于它们对软件开发生命周期各阶段的影响权重。当 AI 能够将代码生产速率从每天几百行提升到每天几千行时，原本被视为瓶颈的编码环节被彻底击碎，但整个流程的其他环节瞬间暴露为新的约束点。

Anthropic 设计负责人 Jenny Wen 在一次演讲中指出了这一变化的本质：传统的软件开发流程围绕「设计必须正确」这一假设构建，因为将错误的设计交给工程师需要三个月时间才能实现，一旦返工代价极其高昂。然而，当构建速度大幅提升后，设计阶段的容错空间也相应扩大 —— 如果犯错成本降低，那么设计过程可以变得更冒险、更快速迭代。

在实践层面，2026 年的工程团队普遍面临以下瓶颈转移：需求规范阶段成为新的摩擦点，不清晰的提示或不完整的规格说明会导致后期大量重写；测试套件和 QA 流程仍然以人类速度运行，但代码变更的到达速度已经远超传统测试周期的承载能力；集成复杂性急剧增加，AI 可以在短时间内生成大量文件和变更，但这也意味着更多的合并冲突、架构不一致和跨服务问题；治理和审查流程成为生产部署的卡点，人工审批、安全检查和合规验证需要明确的流程设计；调试和维护阶段面临代码理解困境，未经仔细审查的生成代码可能在后期产生技术债务和支持负担。

工程化实践参数与监控要点

面对这一范式迁移，工程团队需要在流程、工具和人员三个层面建立系统性的控制机制。以下是一套可操作的实践参数和监控框架。

在代码审查层面，建议根据代码影响范围建立分级审查策略。关键路径代码（涉及认证、支付、数据敏感操作）必须保持 100% 的人工审查覆盖率；基础设施代码（数据库 schema、API 路由、配置变更）至少需要两人审查；业务逻辑代码可采用抽样审查，但必须确保自动化测试覆盖率达到 85% 以上。对于 AI 代理生成的代码，应当追踪「未经审查直接合并」的比例，该指标超过 15% 时应当触发流程预警。

在测试体系建设方面，推荐采用「测试先行」的正确性验证模式。所有 AI 生成的代码必须配套生成对应的单元测试和集成测试，测试覆盖率纳入合并门禁。端到端测试应当覆盖核心用户路径，回归测试套件的执行时间应控制在每次合并后的 15 分钟以内。此外，建议为 AI 生成代码设立专项的模糊测试（fuzzing）环节，覆盖边界条件和异常输入。

在监控与可观测性层面，需要建立代理行为的追踪体系。记录 AI 代理的决策轨迹，包括使用的工具链、执行的命令、产生的代码差异；追踪代理生成代码的线上故障率，与人工编写的代码进行对比分析；监控「代码质量指标」的时间序列，包括圈复杂度、重复代码比例、文档完整度等。当代理生成代码的线上缺陷率超过基线 20% 时，应当暂停代理使用并进行根因分析。

在团队能力建设层面，vibe coding 与 agentic engineering 的差异本质上反映了工程师角色定位的变化。团队需要明确区分「探索性原型开发」和「生产级系统交付」两种场景的适用范式，并为工程师提供持续的 prompt 工程、代理配置和 AI 辅助调试培训。Simon Willison 的建议值得参考：如果你只想快速验证一个想法，vibe coding 是有效的捷径；但如果你在构建供他人使用的软件，请切换到 agentic engineering 模式，并始终对输出质量负责。

结语

vibe coding 与 agentic engineering 的收敛并非偶然，而是 AI 编码代理可靠性持续提升的必然结果。这一趋势对软件工程社区提出了双重挑战：一方面需要建立新的流程和工具来适应快速代码生成，另一方面需要重新定义工程师在 AI 时代的角色和责任。最终，无论采用哪种范式，工程的本质 —— 用系统性的方法构建可靠、可维护的软件 —— 始终不变。变化的是工具，是效率，是责任的边界，但不变的是对质量、安全和用户负责的工程精神。

资料来源：Simon Willison 关于 vibe coding 与 agentic engineering 的分析文章及其在 Heavybit High Leverage 播客中的对谈。

ai-systems