Hotdry.

Article

filtering ai text style with structured skill files

2026-05-27general

title: "用结构化技能文件过滤 AI 文本的"AI 味 "" date: "2026-05-27T04:49:32+08:00" excerpt: "介绍 stop-slop 项目如何通过结构化技能文件识别并过滤 AI 生成文本中的常见"AI 味 "特征,包含三层过滤机制与五维评分体系。" category: "ai-systems"

大语言模型生成的文本正在变得越来越 "好"—— 结构完整、用词准确、逻辑清晰。但正是这种过于完美的规整性,让有经验的读者能一眼识别出 "这是 AI 写的"。这种被称为 "AI 味" 的特征,本质上是模型训练过程中形成的可预测模式:特定的开场白、机械的二元对比、过度使用的副词,以及那种仿佛从远处观察而非身临其境的叙述视角。

stop-slop 是一个开源的技能文件项目,它尝试用结构化的方式解决这一问题。与让模型 "写得更好" 不同,它的目标是让模型 "写得更像人"—— 通过显式定义 AI 文本中的常见痕迹,并建立系统化的过滤机制。

三层过滤机制

stop-slop 的核心是一套三层过滤体系,分别针对短语、结构和句子三个层面。

第一层是禁用短语清单。 项目维护了一份详尽的 "AI 口头禅" 列表,包括 throat-clearing openers(如 "Here's the thing:""The truth is,")、强调性赘词(如"Full stop.""Let that sink in.")、商业黑话(如 "navigate challenges""double down"),以及几乎所有的副词(-ly 结尾的词,如"really""just""literally")。这些短语在 AI 输出中高频出现,却极少出现在自然人类写作中。

第二层是结构 clichés 识别。 AI 文本倾向于使用特定的修辞结构来制造戏剧效果,比如二元对比("Not X, but Y")、否定列举("Not A... Not B... But C")、戏剧化断句("Noun. That's it. That's the thing.")等。这些结构本身并非错误,但它们的可预测性会暴露 AI 的作者身份。stop-slop 建议直接陈述观点,而非通过否定 - 转折的机械套路。

第三层是句子级规则。 包括禁用被动语态(要求每个句子都有明确的人类主语)、避免无生命物体执行人类动作("the decision emerges" 应改为 "someone decides")、禁止以 Wh - 词开头的句子("What makes this hard is..." 应重构为直接陈述),以及完全禁用破折号(em-dash)。

五维质量评分

过滤之后如何评估效果?stop-slop 设计了一套五维评分体系,每个维度 1-10 分,总分低于 35 分则需要重写:

  • 直接性(Directness):是在陈述事实,还是在做公告?
  • 节奏(Rhythm):句子长度是否有变化,还是机械地保持一致?
  • 信任(Trust):是否尊重读者的智商,还是过度解释?
  • 真实性(Authenticity):读起来像人写的吗?
  • 密度(Density):是否有可以删减而不损失信息的内容?

这套评分体系的价值在于将主观的 "AI 味" 转化为可量化的指标。开发团队可以据此设定质量门槛,自动化筛选出需要人工二次编辑的内容。

集成到工作流

stop-slop 以技能文件(skill file)的形式设计,可以灵活集成到不同的 AI 工作流中:

对于 Claude Code 用户,可以将整个文件夹添加为技能;对于 Claude Projects 用户,上传 SKILL.md 和参考文件到项目知识库即可;对于 API 调用,将 SKILL.md 内容加入系统提示词,参考文件按需加载。

这种设计体现了一个重要思路:与其在模型层面微调,不如在提示层面显式编码写作规范。 技能文件本质上是可版本控制的 "写作风格规范",团队可以基于 stop-slop 定制自己的规则集,并随项目迭代。

实践中的取舍

使用 stop-slop 需要注意几个边界条件。首先,规则集目前主要针对英文写作,中文或其他语言的 "AI 味" 可能有不同的表现形式,需要本地化适配。其次,过度过滤可能误伤 legitimate 的修辞选择 —— 并非所有二元对比都是机械的,并非所有副词都是赘词。建议将评分体系作为质量门禁而非硬性约束,允许高分内容保留其风格特征。

另外,"AI 味" 本身是一个移动靶。随着模型迭代,新的可预测模式会出现,旧的规则可能失效。stop-slop 的价值在于建立了一个可维护的规则框架,团队可以持续更新 phrases.md 和 structures.md 来跟进最新的 AI 写作特征。

部署检查清单

如果你计划在团队中引入类似的 AI 文本过滤机制,可以参考以下步骤:

  1. 基线评估:收集当前 AI 生成的文本样本,人工标注 "AI 味" 程度,建立评分基准
  2. 规则定制:基于 stop-slop 的参考文件,增删符合你业务场景的规则(技术文档、营销文案、客服回复的 "AI 味" 表现不同)
  3. 集成测试:在开发环境中测试过滤效果,记录假阳性案例
  4. 阈值调优:根据业务对 "自然度" 的要求,调整五维评分的通过阈值(35/50 是起点,非终点)
  5. 持续监控:定期抽样检查生产环境的输出,更新规则库

stop-slop 项目在 GitHub 上已获得近 5000 星标,反映出行业对 AI 内容质量控制的迫切需求。它提供的不只是一份禁用词列表,而是一种可工程化的文本质量治理思路 —— 将主观判断转化为结构化规则,将事后编辑转化为前置过滤。


资料来源

general

内容声明:本文无广告投放、无付费植入。

如有事实性问题,欢迎发送勘误至 i@hotdrydog.com