filtering ai text style with structured skill files

title: "用结构化技能文件过滤 AI 文本的"AI 味 "" date: "2026-05-27T04:49:32+08:00" excerpt: "介绍 stop-slop 项目如何通过结构化技能文件识别并过滤 AI 生成文本中的常见"AI 味 "特征，包含三层过滤机制与五维评分体系。" category: "ai-systems"

大语言模型生成的文本正在变得越来越 "好"—— 结构完整、用词准确、逻辑清晰。但正是这种过于完美的规整性，让有经验的读者能一眼识别出 "这是 AI 写的"。这种被称为 "AI 味" 的特征，本质上是模型训练过程中形成的可预测模式：特定的开场白、机械的二元对比、过度使用的副词，以及那种仿佛从远处观察而非身临其境的叙述视角。

stop-slop 是一个开源的技能文件项目，它尝试用结构化的方式解决这一问题。与让模型 "写得更好" 不同，它的目标是让模型 "写得更像人"—— 通过显式定义 AI 文本中的常见痕迹，并建立系统化的过滤机制。

三层过滤机制

stop-slop 的核心是一套三层过滤体系，分别针对短语、结构和句子三个层面。

第一层是禁用短语清单。 项目维护了一份详尽的 "AI 口头禅" 列表，包括 throat-clearing openers（如 "Here's the thing:""The truth is,"）、强调性赘词（如"Full stop.""Let that sink in."）、商业黑话（如 "navigate challenges""double down"），以及几乎所有的副词（-ly 结尾的词，如"really""just""literally"）。这些短语在 AI 输出中高频出现，却极少出现在自然人类写作中。

第二层是结构 clichés 识别。 AI 文本倾向于使用特定的修辞结构来制造戏剧效果，比如二元对比（"Not X, but Y"）、否定列举（"Not A... Not B... But C"）、戏剧化断句（"Noun. That's it. That's the thing."）等。这些结构本身并非错误，但它们的可预测性会暴露 AI 的作者身份。stop-slop 建议直接陈述观点，而非通过否定 - 转折的机械套路。

第三层是句子级规则。 包括禁用被动语态（要求每个句子都有明确的人类主语）、避免无生命物体执行人类动作（"the decision emerges" 应改为 "someone decides"）、禁止以 Wh - 词开头的句子（"What makes this hard is..." 应重构为直接陈述），以及完全禁用破折号（em-dash）。

五维质量评分

过滤之后如何评估效果？stop-slop 设计了一套五维评分体系，每个维度 1-10 分，总分低于 35 分则需要重写：

直接性（Directness）：是在陈述事实，还是在做公告？
节奏（Rhythm）：句子长度是否有变化，还是机械地保持一致？
信任（Trust）：是否尊重读者的智商，还是过度解释？
真实性（Authenticity）：读起来像人写的吗？
密度（Density）：是否有可以删减而不损失信息的内容？

这套评分体系的价值在于将主观的 "AI 味" 转化为可量化的指标。开发团队可以据此设定质量门槛，自动化筛选出需要人工二次编辑的内容。

集成到工作流

stop-slop 以技能文件（skill file）的形式设计，可以灵活集成到不同的 AI 工作流中：

对于 Claude Code 用户，可以将整个文件夹添加为技能；对于 Claude Projects 用户，上传 SKILL.md 和参考文件到项目知识库即可；对于 API 调用，将 SKILL.md 内容加入系统提示词，参考文件按需加载。

这种设计体现了一个重要思路：与其在模型层面微调，不如在提示层面显式编码写作规范。 技能文件本质上是可版本控制的 "写作风格规范"，团队可以基于 stop-slop 定制自己的规则集，并随项目迭代。

实践中的取舍

使用 stop-slop 需要注意几个边界条件。首先，规则集目前主要针对英文写作，中文或其他语言的 "AI 味" 可能有不同的表现形式，需要本地化适配。其次，过度过滤可能误伤 legitimate 的修辞选择 —— 并非所有二元对比都是机械的，并非所有副词都是赘词。建议将评分体系作为质量门禁而非硬性约束，允许高分内容保留其风格特征。

另外，"AI 味" 本身是一个移动靶。随着模型迭代，新的可预测模式会出现，旧的规则可能失效。stop-slop 的价值在于建立了一个可维护的规则框架，团队可以持续更新 phrases.md 和 structures.md 来跟进最新的 AI 写作特征。

部署检查清单

如果你计划在团队中引入类似的 AI 文本过滤机制，可以参考以下步骤：

基线评估：收集当前 AI 生成的文本样本，人工标注 "AI 味" 程度，建立评分基准
规则定制：基于 stop-slop 的参考文件，增删符合你业务场景的规则（技术文档、营销文案、客服回复的 "AI 味" 表现不同）
集成测试：在开发环境中测试过滤效果，记录假阳性案例
阈值调优：根据业务对 "自然度" 的要求，调整五维评分的通过阈值（35/50 是起点，非终点）
持续监控：定期抽样检查生产环境的输出，更新规则库

stop-slop 项目在 GitHub 上已获得近 5000 星标，反映出行业对 AI 内容质量控制的迫切需求。它提供的不只是一份禁用词列表，而是一种可工程化的文本质量治理思路 —— 将主观判断转化为结构化规则，将事后编辑转化为前置过滤。

资料来源

stop-slop GitHub 仓库: https://github.com/hardikpandya/stop-slop
SKILL.md 核心规则文件
references/phrases.md 禁用短语清单
references/structures.md 结构模式参考

general

内容声明：本文无广告投放、无付费植入。

如有事实性问题，欢迎发送勘误至 i@hotdrydog.com。