Hotdry.

Article

从 vibe coding 到 agentic engineering:AI 编程范式的工程化演进与实践要点

解析 AI 编程从提示驱动到代理驱动的范式迁移,聚焦工程实践差异、瓶颈转移路径与可落地的质量控制参数。

2026-05-06ai-systems

在 2026 年的软件开发领域,一个核心议题正在重新定义工程师与 AI 工具之间的关系:究竟是继续拥抱「vibe coding」所带来的高速原型开发体验,还是转向更为结构化的「agentic engineering」模式?这个看似简单的二选一问题背后,隐藏着软件工程实践的根本性变革。Simon Willison 作为这两个概念的提出者,在近期播客访谈中分享了他的深度反思,其核心观点揭示了一个令人不安但又无法回避的事实 —— 这两种范式之间的边界正在迅速模糊,而工程社区必须为此做好系统性准备。

两种范式的本质差异

理解 vibe coding 与 agentic engineering 的区别,是把握这次范式迁移的前提。vibe coding 本质上是一种高信任度的 AI 使用方式:开发者将代码生成的主导权几乎完全交给 AI 模型,自己则退居到「产品经理」的角色 —— 描述需求、验证结果、在不工作时反馈问题。这种模式的核心特征包括不深入检查生成的代码、不关注代码质量细节、接受「能用就行」的实用主义哲学。Simon Willison 对此的经典定义是:vibe coding 适合个人工具场景,因为如果出现 bug,受影响的只有自己;但在面向他人交付的软件中使用 vibe coding,则是一种不负责任的行为,因为别人的信息安全和系统稳定性的代价不应当被如此轻率地对待。

与之相对,agentic engineering 代表了一种更为审慎的工程化路径。在这种模式下,开发者始终保持对代码的所有权和责任,利用 AI 代理作为放大自身能力的「强力工具」,而非替代自身判断的「黑盒」。关键区别体现在以下几个方面:工程师需要理解安全、可维护性、性能和运维等工程维度;AI 生成的代码必须经过测试、文档化和审查流程;架构决策和质量标准依然由人类工程师把控。Simon Willison 本人曾明确表示,他使用 agentic engineering 的目标是构建更高质量的系统 —— 不是以更快的速度生产更低质量的代码,而是以更快的速度生产更高质量的代码。

边界模糊:一次令人不安的收敛

然而,Simon Willison 在近期与 Joseph Ruscio 的对谈中抛出了一个颇具冲击力的观察:这两种范式在他自己的日常工作中已经开始重叠、交融,这让他感到「相当不安」。这一表态揭示了 AI 编码代理可靠性提升所带来的深层悖论。

Willison 描述了一个具体的心理困境:当他要求 Claude Code 构建一个执行 SQL 查询并返回 JSON 结果的 API 端点时,他清楚地知道这个模型「绝对会做对」。他会让代理添加自动化测试和文档,也知道结果一定会符合他的代码风格。但关键问题在于 —— 他不再逐行审查这些代码了。这种信任建立在过去无数次成功经验的基础上,但同时也意味着一种责任转移:代码的质量保证从人类工程师的主动审查,变成了对 AI 模型历史表现的被动信赖。

Willison 使用了一个极具启发性的类比:在大型科技公司中,当另一个团队交付一个图像调整大小的服务时,他不会逐行阅读对方的代码。他会查看文档、使用该服务、在出现问题时才会深入代码仓库。这种「半黑盒」的信任模式在人类团队之间是合理的,因为团队拥有专业声誉可以追责。但 AI 代理没有专业声誉,也无法为其产出承担法律责任。这里存在一个根本性的责任真空:当代码出现安全漏洞或严重 bug 时,追究责任的链条在 AI 代理处断裂。

这正是「常态化的偏差」(normalization of deviance)风险的核心。每次 AI 成功完成一个看似简单的任务而未被仔细审查,都可能为下一次过度信任埋下伏笔。工程师需要建立明确的心理边界:哪些类型的代码必须审查,哪些可以放心交给代理处理,以及如何设计制度化的检查点来防止信任膨胀。

瓶颈转移:从代码生产到系统工程

vibe coding 与 agentic engineering 的另一个关键区别,在于它们对软件开发生命周期各阶段的影响权重。当 AI 能够将代码生产速率从每天几百行提升到每天几千行时,原本被视为瓶颈的编码环节被彻底击碎,但整个流程的其他环节瞬间暴露为新的约束点。

Anthropic 设计负责人 Jenny Wen 在一次演讲中指出了这一变化的本质:传统的软件开发流程围绕「设计必须正确」这一假设构建,因为将错误的设计交给工程师需要三个月时间才能实现,一旦返工代价极其高昂。然而,当构建速度大幅提升后,设计阶段的容错空间也相应扩大 —— 如果犯错成本降低,那么设计过程可以变得更冒险、更快速迭代。

在实践层面,2026 年的工程团队普遍面临以下瓶颈转移:需求规范阶段成为新的摩擦点,不清晰的提示或不完整的规格说明会导致后期大量重写;测试套件和 QA 流程仍然以人类速度运行,但代码变更的到达速度已经远超传统测试周期的承载能力;集成复杂性急剧增加,AI 可以在短时间内生成大量文件和变更,但这也意味着更多的合并冲突、架构不一致和跨服务问题;治理和审查流程成为生产部署的卡点,人工审批、安全检查和合规验证需要明确的流程设计;调试和维护阶段面临代码理解困境,未经仔细审查的生成代码可能在后期产生技术债务和支持负担。

工程化实践参数与监控要点

面对这一范式迁移,工程团队需要在流程、工具和人员三个层面建立系统性的控制机制。以下是一套可操作的实践参数和监控框架。

在代码审查层面,建议根据代码影响范围建立分级审查策略。关键路径代码(涉及认证、支付、数据敏感操作)必须保持 100% 的人工审查覆盖率;基础设施代码(数据库 schema、API 路由、配置变更)至少需要两人审查;业务逻辑代码可采用抽样审查,但必须确保自动化测试覆盖率达到 85% 以上。对于 AI 代理生成的代码,应当追踪「未经审查直接合并」的比例,该指标超过 15% 时应当触发流程预警。

在测试体系建设方面,推荐采用「测试先行」的正确性验证模式。所有 AI 生成的代码必须配套生成对应的单元测试和集成测试,测试覆盖率纳入合并门禁。端到端测试应当覆盖核心用户路径,回归测试套件的执行时间应控制在每次合并后的 15 分钟以内。此外,建议为 AI 生成代码设立专项的模糊测试(fuzzing)环节,覆盖边界条件和异常输入。

在监控与可观测性层面,需要建立代理行为的追踪体系。记录 AI 代理的决策轨迹,包括使用的工具链、执行的命令、产生的代码差异;追踪代理生成代码的线上故障率,与人工编写的代码进行对比分析;监控「代码质量指标」的时间序列,包括圈复杂度、重复代码比例、文档完整度等。当代理生成代码的线上缺陷率超过基线 20% 时,应当暂停代理使用并进行根因分析。

在团队能力建设层面,vibe coding 与 agentic engineering 的差异本质上反映了工程师角色定位的变化。团队需要明确区分「探索性原型开发」和「生产级系统交付」两种场景的适用范式,并为工程师提供持续的 prompt 工程、代理配置和 AI 辅助调试培训。Simon Willison 的建议值得参考:如果你只想快速验证一个想法,vibe coding 是有效的捷径;但如果你在构建供他人使用的软件,请切换到 agentic engineering 模式,并始终对输出质量负责。

结语

vibe coding 与 agentic engineering 的收敛并非偶然,而是 AI 编码代理可靠性持续提升的必然结果。这一趋势对软件工程社区提出了双重挑战:一方面需要建立新的流程和工具来适应快速代码生成,另一方面需要重新定义工程师在 AI 时代的角色和责任。最终,无论采用哪种范式,工程的本质 —— 用系统性的方法构建可靠、可维护的软件 —— 始终不变。变化的是工具,是效率,是责任的边界,但不变的是对质量、安全和用户负责的工程精神。

资料来源:Simon Willison 关于 vibe coding 与 agentic engineering 的分析文章及其在 Heavybit High Leverage 播客中的对谈。

ai-systems