CLI 环境中 HTML 的「不合理有效性」：超越格式化本身的范式优势

当我们谈论命令行工具的输出格式时，Markdown 几乎成为了默认选项。这个选择有其历史合理性：Markdown 足够简洁，标记符不干扰阅读，且在 GPT-4 时代有限的上下文窗口下，HTML 标签带来的额外 token 开销确实值得权衡。然而，Anthropic 工程师 Thariq Shihipar 提出的「HTML 的不合理有效性」论点，正在挑战这一既定认知 —— 在现代 AI 助手的语境下，HTML 不仅是「更多的格式化」，更是一种根本不同的信息表达范式。

为什么说「不合理」？

「不合理有效性」（Unreasonable Effectiveness）这一表述本身借鉴了数学与物理学中的经典概念 —— 某些工具或方法的效果远超其表面复杂度所暗示的范围。在 CLI 环境中，HTML 似乎是一个「过度」的选项：终端本质上是文本界面，ANSI 转义序列已经能够提供基本的颜色和样式支持，何必引入完整的 HTML 渲染？这种直觉正是「不合理」所在 —— 从表面复杂度看，HTML 确实是「杀鸡用牛刀」。

但这种判断忽略了关键维度：HTML 不仅仅是格式化工具，它是完整的文档模型。与 Markdown 相比，HTML 提供的远不止粗体、斜体或代码块 —— 它能够嵌入 SVG 矢量图、实现页面内导航、包含交互式组件、进行语义化的严重程度着色。这些能力在传统终端输出中要么完全不可能实现，要么需要复杂的 workaround。

结构化文本的本质优势

HTML 的核心优势在于它的「结构性」而非「展示性」。当 Claude Code 输出一个 HTML 文档时，它实际上在传递一个机器可解析、人类可阅读、且具备完整表现能力的文档对象。这个对象天然支持以下能力，而这些能力在纯文本或 Markdown 环境下要么缺失，要么需要额外工具链：

首先是语义化着色与可视化。传统的终端输出依赖 ANSI 颜色代码，但这些代码本质上是视觉层面的，没有语义含义。在 HTML 中，我们可以为不同严重程度的问题分配不同颜色 —— 安全漏洞用红色边框和警告图标，性能问题用橙色，问题用蓝色 —— 这种语义关联使得信息的消化速度大幅提升。更进一步，SVG 图示可以直接嵌入 HTML，这意味着 Claude 可以生成架构图、流程图或数据流向图，而不必依赖 ASCII 艺术的粗糙表达。

其次是内建导航能力。一个 HTML 文档天然支持锚点链接和目录结构，这意味着 Claude 可以为一个复杂的 PR 审查生成带有可点击目录的页面，读者能够快速跳转到感兴趣的章节。在传统的 Markdown 或终端输出中，这种导航能力要么缺失，要么需要读者自行搜索关键词。

第三是交互式元素。HTML 中的表单元素、可折叠区域、标签页等组件，为 Claude 提供了一种在静态文本中嵌入交互性的方式。例如，一个代码审查报告可以包含可点击展开的详细分析，或可切换视角的对比视图。这种能力在纯文本环境中完全不存在。

上下文窗口改变权衡

理解 HTML 有效性的另一个关键维度是_tokens 效率的演变。_在 GPT-4 时代，上下文窗口仅有 8192 个 token，Markdown 相比 HTML 节省的 token 数量确实具有实际意义 —— 在那个约束下，选择 Markdown 是一个工程上合理的决策。然而，当前模型的上下文窗口已经大幅扩展，token 效率不再是首要考量。当这个约束放松后，原本被压抑的需求 —— 更丰富的表达能力 —— 自然浮现。

Claude Code 拥有足以容纳完整 HTML 文档的上下文窗口，这意味着我们可以安全地请求更丰富的输出格式，而不必担心篇幅爆炸。这个条件的变化，使得「HTML 作为默认输出格式」从一个「不切实际的想法」变成了一个「值得认真考虑的选择」。

实践参数与提示模式

将这一理念付诸实践需要具体的操作模式。基于社区经验，以下是经过验证的提示词模式：

请求 PR 审查时，可以明确指定输出格式和关注点：「用 HTML artifact 描述这个 PR。我对 streaming/backpressure 逻辑不太熟悉，请重点关注。渲染实际的 diff，添加行边注注释，按严重程度着色，并用任何有助于传达概念的方式呈现。」这种请求方式明确告诉 Claude 输出应该是 HTML 格式，并指定了具体的展示需求。

请求代码解释时，可以强调交互性和丰富性：「详细解释这段代码。重格式化它，展开任何令人困惑的部分，深入分析其工作原理。输出 HTML，精致样式化，充分利用 HTML、CSS 和 JavaScript 的能力，使解释丰富、交互式且尽可能清晰。」

这些模式的核心共同点是：明确指定 HTML 作为目标格式，并具体说明期望的展示特性（导航、着色、图表、交互性）。

超越工具选择的认知转变

从更深层次看，HTML 在 CLI 环境中崛起反映了一种认知转变：我们不再将 AI 输出视为需要在某个特定界面中消费的「终端文本」，而是将其视为可以在多个环境中呈现的「结构化文档」。一份 HTML 输出既可以在终端的简化视图中查看，也可以在浏览器中打开以获得完整视觉体验 —— 这种多模态消费能力是纯文本输出无法提供的。

这种思路的延伸是：AI 生成的内容应该尽可能保留其完整信息，而不是被迫降级为某个特定消费场景的最低公分母。当我们要求 Claude 输出 HTML 时，我们实际上是在说「请用最能表达内容本质的格式来呈现」，而不是「请用我的终端能显示的最简单格式」。

Simon Willison 在他的实验中发现，当让 GPT-5.5 用 HTML 解释一个 Linux 提权漏洞时，生成的页面包含了高亮摘要、分步骤解析、对比表格 —— 这些元素在 Markdown 中也可以实现，但 HTML 提供了更自然的语义结构和样式控制能力。这个案例印证了 Thariq Shihipar 的核心论点：HTML 不仅仅是「更多颜色」，它是一种更完整的信息建模方式。

资料来源：本文参考了 Simon Willison 于 2026 年 5 月 8 日发布的文章《Using Claude Code: The Unreasonable Effectiveness of HTML》以及 Thariq Shihipar 关于 HTML 相比 Markdown 优势的分析讨论。

ai-systems

内容声明：本文无广告投放、无付费植入。

如有事实性问题，欢迎发送勘误至 i@hotdrydog.com。