用 Skill File 架构检测并剥离 AI 生成文本的标志性语言模式

AI 生成文本的 "腔调" 问题正从学术讨论进入工程实践。当大型语言模型输出的内容充斥着 "Here's the thing""It turns out"等喉清开场白，或是"Not X, but Y"式的二元对比结构时，读者几乎能瞬间识别出机器痕迹。现有解决方案多聚焦于模型训练阶段的" 正向校准 "—— 通过微调或提示工程让模型少生成这类模式。而 stop-slop 项目选择了一条不同的路径：在生成后通过启发式规则集进行" 负向过滤 "，将检测与剥离 AI 标志性语言模式的能力封装为可复用的 skill file。

Skill File 的三层架构

stop-slop 采用模块化设计，核心由三个组件构成：SKILL.md 定义操作指令与评分体系，references/ 目录存放模式库，examples.md 提供前后对比样本。这种结构并非简单的规则清单，而是一套可嵌入 Claude Code、Claude Projects 或任意 API 调用流程的文本处理工作流。

SKILL.md 中定义的八条核心规则构成了过滤逻辑的骨架：删除填充短语与所有副词、打破公式化结构、强制使用主动语态、要求具体而非模糊的声明、让读者置身场景、变化句子节奏、信任读者智商、删除引用式表达。每条规则都配有可执行的检查清单，例如 "任何副词？删除"" 无生命物执行人类动作？点名到人 " 等十二项快速检查项，使规则从抽象原则转化为可逐项核对的实操步骤。

模式检测规则的分层实现

项目将 AI 标志性语言模式细分为三个检测层级。短语层识别八类禁用表达：喉清开场白（"Here's why""The truth is"）、强调拐杖（"Full stop""Let that sink in"）、商业行话（"navigate""unpack""lean into"）、所有副词（-ly 词及 really/just/simply 等）、元评论（"Hint:""Plot twist:"）、表演性强调（"I promise"）、告知而非展示、以及模糊声明（"The implications are significant"）。

结构层则聚焦十一类句式陷阱。二元对比（"Not X, but Y"）被标记为制造虚假戏剧感；负面列举（"Not A... Not B... C"）被视为修辞脱衣舞；戏剧化碎片化（名词句 +"That's it"）被判定为表演性简化；虚假能动性（"the decision emerges""the data tells us"）要求必须指明人类行动者；远距离叙述（"Nobody designed this""People tend to"）需转换为让读者入场的 "你" 视角。此外还包括被动语态、Wh - 开头句、破折号滥用、三件套列表等节奏与句法层面的约束。

句子层规则更为微观：禁止以 What/When/Where/Which/Who/Why/How 开头的句子，要求重构为主语或动词前置；禁止段落以 "So" 开头；禁止 "Look," 等居高临下的引导词。这些规则共同构成了一张细密的过滤网，覆盖从词汇选择到篇章结构的全流程。

五维评分与质量阈值

规则集的执行效果通过五维度评分体系量化：直接性（陈述而非宣告）、节奏（变化而非机械）、信任（尊重读者智商）、真实性（听起来像人写的）、密度（存在可删减内容）。每个维度 1-10 分，总分低于 35/50 的文本必须返工。

这一评分机制将主观写作质量转化为可度量的工程指标。在 Claude Code 等环境中，skill file 可在文本生成后自动触发评分流程，低于阈值的输出被标记为需修订，形成 "生成 - 检测 - 评分 - 修订" 的闭环。相较于依赖人工判断的传统编辑流程，这种自动化质检显著降低了规模化内容生产中的质量波动。

多场景集成方案

stop-slop 的 skill file 架构设计考虑了三种主要集成场景。在 Claude Code 中，可将整个文件夹添加为 skill，使命令行交互自动继承规则约束；在 Claude Projects 中，上传 SKILL.md 与 reference 文件至项目知识库，让特定项目下的所有对话遵循统一风格；在 API 调用中，将 SKILL.md 内容注入 system prompt，reference 文件按需加载。

这种分层集成策略意味着同一套规则集可服务于个人写作辅助、团队协作规范、以及自动化流水线等不同场景。对于内容平台而言，可将 skill file 嵌入发布前检查流程，自动标记或拦截高 "slop" 风险内容；对于写作工具开发者，可将其作为可插拔的风格过滤器，让用户按需启用。

局限与扩展方向

启发式规则集的优势在于可解释性与即时生效，无需重新训练模型即可改变输出风格。但其局限同样明显：规则维护成本随语言演变而累积，新出现的 AI 写作模式需要人工识别并补充至模式库；规则的语言特异性强，英文规则集无法直接迁移至中文或其他语言；过度过滤可能误伤特定文体所需的修辞手法。

未来的扩展方向可能包括：建立规则版本管理机制，允许用户选择严格或宽松模式；开发语言特定的规则变体；与 AI 检测器（如 GPTZero）形成互补，将统计检测与规则过滤结合；以及探索从用户反馈中自动提炼新规则的半自动化规则演进流程。

资料来源

stop-slop GitHub 仓库 - Hardik Pandya 开发的 skill file，用于检测并剥离 AI 生成文本的标志性语言模式

ai-systems

内容声明：本文无广告投放、无付费植入。

如有事实性问题，欢迎发送勘误至 i@hotdrydog.com。