AI 生成文本的 "腔调" 问题正从学术讨论进入工程实践。当大型语言模型输出的内容充斥着 "Here's the thing""It turns out"等喉清开场白,或是"Not X, but Y"式的二元对比结构时,读者几乎能瞬间识别出机器痕迹。现有解决方案多聚焦于模型训练阶段的" 正向校准 "—— 通过微调或提示工程让模型少生成这类模式。而 stop-slop 项目选择了一条不同的路径:在生成后通过启发式规则集进行" 负向过滤 ",将检测与剥离 AI 标志性语言模式的能力封装为可复用的 skill file。
Skill File 的三层架构
stop-slop 采用模块化设计,核心由三个组件构成:SKILL.md 定义操作指令与评分体系,references/ 目录存放模式库,examples.md 提供前后对比样本。这种结构并非简单的规则清单,而是一套可嵌入 Claude Code、Claude Projects 或任意 API 调用流程的文本处理工作流。
SKILL.md 中定义的八条核心规则构成了过滤逻辑的骨架:删除填充短语与所有副词、打破公式化结构、强制使用主动语态、要求具体而非模糊的声明、让读者置身场景、变化句子节奏、信任读者智商、删除引用式表达。每条规则都配有可执行的检查清单,例如 "任何副词?删除"" 无生命物执行人类动作?点名到人 " 等十二项快速检查项,使规则从抽象原则转化为可逐项核对的实操步骤。
模式检测规则的分层实现
项目将 AI 标志性语言模式细分为三个检测层级。短语层识别八类禁用表达:喉清开场白("Here's why""The truth is")、强调拐杖("Full stop""Let that sink in")、商业行话("navigate""unpack""lean into")、所有副词(-ly 词及 really/just/simply 等)、元评论("Hint:""Plot twist:")、表演性强调("I promise")、告知而非展示、以及模糊声明("The implications are significant")。
结构层则聚焦十一类句式陷阱。二元对比("Not X, but Y")被标记为制造虚假戏剧感;负面列举("Not A... Not B... C")被视为修辞脱衣舞;戏剧化碎片化(名词句 +"That's it")被判定为表演性简化;虚假能动性("the decision emerges""the data tells us")要求必须指明人类行动者;远距离叙述("Nobody designed this""People tend to")需转换为让读者入场的 "你" 视角。此外还包括被动语态、Wh - 开头句、破折号滥用、三件套列表等节奏与句法层面的约束。
句子层规则更为微观:禁止以 What/When/Where/Which/Who/Why/How 开头的句子,要求重构为主语或动词前置;禁止段落以 "So" 开头;禁止 "Look," 等居高临下的引导词。这些规则共同构成了一张细密的过滤网,覆盖从词汇选择到篇章结构的全流程。
五维评分与质量阈值
规则集的执行效果通过五维度评分体系量化:直接性(陈述而非宣告)、节奏(变化而非机械)、信任(尊重读者智商)、真实性(听起来像人写的)、密度(存在可删减内容)。每个维度 1-10 分,总分低于 35/50 的文本必须返工。
这一评分机制将主观写作质量转化为可度量的工程指标。在 Claude Code 等环境中,skill file 可在文本生成后自动触发评分流程,低于阈值的输出被标记为需修订,形成 "生成 - 检测 - 评分 - 修订" 的闭环。相较于依赖人工判断的传统编辑流程,这种自动化质检显著降低了规模化内容生产中的质量波动。
多场景集成方案
stop-slop 的 skill file 架构设计考虑了三种主要集成场景。在 Claude Code 中,可将整个文件夹添加为 skill,使命令行交互自动继承规则约束;在 Claude Projects 中,上传 SKILL.md 与 reference 文件至项目知识库,让特定项目下的所有对话遵循统一风格;在 API 调用中,将 SKILL.md 内容注入 system prompt,reference 文件按需加载。
这种分层集成策略意味着同一套规则集可服务于个人写作辅助、团队协作规范、以及自动化流水线等不同场景。对于内容平台而言,可将 skill file 嵌入发布前检查流程,自动标记或拦截高 "slop" 风险内容;对于写作工具开发者,可将其作为可插拔的风格过滤器,让用户按需启用。
局限与扩展方向
启发式规则集的优势在于可解释性与即时生效,无需重新训练模型即可改变输出风格。但其局限同样明显:规则维护成本随语言演变而累积,新出现的 AI 写作模式需要人工识别并补充至模式库;规则的语言特异性强,英文规则集无法直接迁移至中文或其他语言;过度过滤可能误伤特定文体所需的修辞手法。
未来的扩展方向可能包括:建立规则版本管理机制,允许用户选择严格或宽松模式;开发语言特定的规则变体;与 AI 检测器(如 GPTZero)形成互补,将统计检测与规则过滤结合;以及探索从用户反馈中自动提炼新规则的半自动化规则演进流程。
资料来源
- stop-slop GitHub 仓库 - Hardik Pandya 开发的 skill file,用于检测并剥离 AI 生成文本的标志性语言模式
内容声明:本文无广告投放、无付费植入。
如有事实性问题,欢迎发送勘误至 i@hotdrydog.com。