title: "工程化构建 AI Taste 校准机制:AI Tells 检测技能文件的实践路径" date: "2026-05-30T19:28:22+08:00" excerpt: "基于 stop-slop 技能文件,构建 AI 生成文本的" 品味 "校准框架,通过特征模式识别消除标志性 AI 痕迹,并提供可落地的五维评分与集成策略。" category: "ai-systems"
AI 生成文本的泛滥带来了一个隐蔽但关键的问题:内容虽然语法正确、逻辑通顺,却总带着某种难以名状的 "AI 味"。这种味道并非来自事实错误,而是源于模型训练过程中形成的固定表达模式 —— 可预测的短语结构、机械的节奏变化、以及过度礼貌的修辞习惯。工程化地识别和消除这些 "AI tells",成为提升生成内容质量的关键环节。
AI Tells 的特征工程:从模式识别到结构化分类
AI tells 并非随机出现,而是呈现出高度结构化的模式。通过对大量 AI 生成文本的观察,可以将其归纳为几个核心类别。
二元对比结构是最常见的 AI 痕迹之一。模型倾向于使用 "Not X, but Y"、"It's not about A, it's about B" 这类句式制造虚假的戏剧张力。这种结构的问题在于它通过否定来建立肯定,而非直接陈述观点。工程化的解决方案是强制要求直接表达核心观点,删除所有铺垫性的否定句式。
负面列举是另一种典型的模式化表达。AI 喜欢先列举 "这不是 X,也不是 Y,而是 Z",通过延迟揭示来制造悬念。这种修辞手法在人工写作中并不常见,反而暴露了内容的生成来源。检测规则应当标记所有以否定词开头的列举结构,要求作者直接陈述最终结论。
** 虚假主体(False Agency)** 是 AI 为规避责任而发展出的表达策略。模型会说 "数据告诉我们"" 决策浮现出来 ""市场奖励了",将动作归因于抽象概念而非具体的人。工程化的修正要求每个句子都必须有明确的人类主语执行动作,被动语态和无主语句式需要被标记和重写。
戏剧化断句表现为刻意的短句堆叠:"X. And Y. And Z." 或 "[名词]. That's it. That's the [事物]。" 这种人为制造的节奏感在真实写作中较为罕见。检测机制应当识别连续短句和刻意停顿的模式,建议合并为完整句式。
五维质量评分体系:量化 "品味" 的校准框架
消除 AI tells 不能仅依靠规则列表,还需要可量化的质量评估体系。一个有效的校准框架应当从五个维度对文本进行评分,每个维度 1-10 分,总分低于 35 分(满分 50)的内容需要重写。
** 直接性(Directness)** 衡量文本是否使用陈述句直接表达观点,而非通过 "Here's what""Think about it" 等引导句式进行铺垫。高分的文本应当让读者立即接触到核心信息,无需穿越层层修辞包装。
** 节奏(Rhythm)** 评估句子长度和段落结构的多样性。AI 生成内容往往呈现机械的节奏感 —— 三段式列举、每段结尾的警句式短句、过度使用 em-dash 进行停顿。高质量的文本应当打破这种可预测的模式。
** 信任度(Trust)** 检测文本是否尊重读者的理解能力。过度解释、过度使用 "实际上"" 真的 ""简单地" 等强调副词,以及 "每个人都"" 总是 ""从不" 等绝对化表达,都会降低信任评分。
** 真实性(Authenticity)** 判断文本是否听起来像人类写作。这包括避免 Wh - 开头的句子("What makes this hard is...")、避免元评论("The rest of this essay...")、以及避免 "没有人设计了这个" 这类脱离场景的抽象叙述。
** 密度(Density)** 检查文本中是否存在可删减的内容。AI 倾向于生成冗余的修饰语和重复性的强调,高密度的文本应当每句话都承载独立的信息价值。
技能文件的工程化实践:集成与部署策略
将 AI tells 检测机制工程化部署,需要构建结构化的技能文件(skill file)。这种文件本质上是一组系统提示词和参考规则,可以被集成到不同的 AI 工作流中。
Claude Code 集成是最直接的部署方式。将技能文件目录添加到 Claude Code 的技能库中,模型在处理写作任务时会自动加载并应用这些规则。这种方式的优势在于无需修改 API 调用,适合个人开发者和小团队。
Claude Projects 集成适用于需要持续应用质量校准的场景。将 SKILL.md 和参考文件上传到项目的知识库中,模型在每次生成内容时都会参考这些约束条件。这种方式适合内容创作团队和质量审核流程。
API 层集成提供了最大的灵活性。将 SKILL.md 的内容作为系统提示词的一部分,可以在任何支持自定义系统提示的模型上应用这些规则。参考文件可以通过 RAG(检索增强生成)机制按需加载,避免提示词过长导致的性能问题。
自动化检查流程可以进一步提升效率。在 CI/CD 管道中集成文本质量评分步骤,对生成的内容自动进行五维评分,低于阈值的文本触发重写流程或人工审核。这种机制特别适合需要大规模生成内容的场景,如营销文案、产品描述或技术文档。
局限与演进方向
技能文件方法虽然有效,但也存在固有的局限性。首先,规则的效力高度依赖于模型的遵循能力 —— 某些模型可能会忽略或误解复杂的约束条件。其次,过度应用这些规则可能导致文本失去原有的风格特色和修辞力度,特别是在创意写作场景中。
未来的演进方向可能包括:基于机器学习的 AI tells 检测器,自动从人工标注的样本中学习新的模式;动态评分权重,根据内容类型(技术文档 vs 营销文案)调整五维评分的重要性;以及多模型共识机制,通过多个独立模型的评分来降低单一模型的偏见。
工程化的 "品味" 校准不是要让 AI 生成内容变得千篇一律,而是要消除那些暴露机器来源的可预测痕迹,让技术真正服务于表达的本质需求。
参考来源
- Hardik Pandya, stop-slop: A skill file for removing AI tells from prose, GitHub, https://github.com/hardikpandya/stop-slop
- Leonxlnx, taste-skill, GitHub, https://github.com/Leonxlnx/taste-skill
内容声明:本文无广告投放、无付费植入。
如有事实性问题,欢迎发送勘误至 i@hotdrydog.com。