当我们谈论命令行工具的输出格式时,Markdown 几乎成为了默认选项。这个选择有其历史合理性:Markdown 足够简洁,标记符不干扰阅读,且在 GPT-4 时代有限的上下文窗口下,HTML 标签带来的额外 token 开销确实值得权衡。然而,Anthropic 工程师 Thariq Shihipar 提出的「HTML 的不合理有效性」论点,正在挑战这一既定认知 —— 在现代 AI 助手的语境下,HTML 不仅是「更多的格式化」,更是一种根本不同的信息表达范式。
为什么说「不合理」?
「不合理有效性」(Unreasonable Effectiveness)这一表述本身借鉴了数学与物理学中的经典概念 —— 某些工具或方法的效果远超其表面复杂度所暗示的范围。在 CLI 环境中,HTML 似乎是一个「过度」的选项:终端本质上是文本界面,ANSI 转义序列已经能够提供基本的颜色和样式支持,何必引入完整的 HTML 渲染?这种直觉正是「不合理」所在 —— 从表面复杂度看,HTML 确实是「杀鸡用牛刀」。
但这种判断忽略了关键维度:HTML 不仅仅是格式化工具,它是完整的文档模型。与 Markdown 相比,HTML 提供的远不止粗体、斜体或代码块 —— 它能够嵌入 SVG 矢量图、实现页面内导航、包含交互式组件、进行语义化的严重程度着色。这些能力在传统终端输出中要么完全不可能实现,要么需要复杂的 workaround。
结构化文本的本质优势
HTML 的核心优势在于它的「结构性」而非「展示性」。当 Claude Code 输出一个 HTML 文档时,它实际上在传递一个机器可解析、人类可阅读、且具备完整表现能力的文档对象。这个对象天然支持以下能力,而这些能力在纯文本或 Markdown 环境下要么缺失,要么需要额外工具链:
首先是语义化着色与可视化。传统的终端输出依赖 ANSI 颜色代码,但这些代码本质上是视觉层面的,没有语义含义。在 HTML 中,我们可以为不同严重程度的问题分配不同颜色 —— 安全漏洞用红色边框和警告图标,性能问题用橙色,问题用蓝色 —— 这种语义关联使得信息的消化速度大幅提升。更进一步,SVG 图示可以直接嵌入 HTML,这意味着 Claude 可以生成架构图、流程图或数据流向图,而不必依赖 ASCII 艺术的粗糙表达。
其次是内建导航能力。一个 HTML 文档天然支持锚点链接和目录结构,这意味着 Claude 可以为一个复杂的 PR 审查生成带有可点击目录的页面,读者能够快速跳转到感兴趣的章节。在传统的 Markdown 或终端输出中,这种导航能力要么缺失,要么需要读者自行搜索关键词。
第三是交互式元素。HTML 中的表单元素、可折叠区域、标签页等组件,为 Claude 提供了一种在静态文本中嵌入交互性的方式。例如,一个代码审查报告可以包含可点击展开的详细分析,或可切换视角的对比视图。这种能力在纯文本环境中完全不存在。
上下文窗口改变权衡
理解 HTML 有效性的另一个关键维度是_tokens 效率的演变。_在 GPT-4 时代,上下文窗口仅有 8192 个 token,Markdown 相比 HTML 节省的 token 数量确实具有实际意义 —— 在那个约束下,选择 Markdown 是一个工程上合理的决策。然而,当前模型的上下文窗口已经大幅扩展,token 效率不再是首要考量。当这个约束放松后,原本被压抑的需求 —— 更丰富的表达能力 —— 自然浮现。
Claude Code 拥有足以容纳完整 HTML 文档的上下文窗口,这意味着我们可以安全地请求更丰富的输出格式,而不必担心篇幅爆炸。这个条件的变化,使得「HTML 作为默认输出格式」从一个「不切实际的想法」变成了一个「值得认真考虑的选择」。
实践参数与提示模式
将这一理念付诸实践需要具体的操作模式。基于社区经验,以下是经过验证的提示词模式:
请求 PR 审查时,可以明确指定输出格式和关注点:「用 HTML artifact 描述这个 PR。我对 streaming/backpressure 逻辑不太熟悉,请重点关注。渲染实际的 diff,添加行边注注释,按严重程度着色,并用任何有助于传达概念的方式呈现。」这种请求方式明确告诉 Claude 输出应该是 HTML 格式,并指定了具体的展示需求。
请求代码解释时,可以强调交互性和丰富性:「详细解释这段代码。重格式化它,展开任何令人困惑的部分,深入分析其工作原理。输出 HTML,精致样式化,充分利用 HTML、CSS 和 JavaScript 的能力,使解释丰富、交互式且尽可能清晰。」
这些模式的核心共同点是:明确指定 HTML 作为目标格式,并具体说明期望的展示特性(导航、着色、图表、交互性)。
超越工具选择的认知转变
从更深层次看,HTML 在 CLI 环境中崛起反映了一种认知转变:我们不再将 AI 输出视为需要在某个特定界面中消费的「终端文本」,而是将其视为可以在多个环境中呈现的「结构化文档」。一份 HTML 输出既可以在终端的简化视图中查看,也可以在浏览器中打开以获得完整视觉体验 —— 这种多模态消费能力是纯文本输出无法提供的。
这种思路的延伸是:AI 生成的内容应该尽可能保留其完整信息,而不是被迫降级为某个特定消费场景的最低公分母。当我们要求 Claude 输出 HTML 时,我们实际上是在说「请用最能表达内容本质的格式来呈现」,而不是「请用我的终端能显示的最简单格式」。
Simon Willison 在他的实验中发现,当让 GPT-5.5 用 HTML 解释一个 Linux 提权漏洞时,生成的页面包含了高亮摘要、分步骤解析、对比表格 —— 这些元素在 Markdown 中也可以实现,但 HTML 提供了更自然的语义结构和样式控制能力。这个案例印证了 Thariq Shihipar 的核心论点:HTML 不仅仅是「更多颜色」,它是一种更完整的信息建模方式。
资料来源:本文参考了 Simon Willison 于 2026 年 5 月 8 日发布的文章《Using Claude Code: The Unreasonable Effectiveness of HTML》以及 Thariq Shihipar 关于 HTML 相比 Markdown 优势的分析讨论。
内容声明:本文无广告投放、无付费植入。
如有事实性问题,欢迎发送勘误至 i@hotdrydog.com。