检测与净化的分野
当前 AI slop 治理的主流思路是 "检测"—— 通过熵值分析、困惑度评分或语言特征识别来标记可疑文本。但检测只是第一步,真正的挑战在于如何在不损失信息的前提下移除 AI 痕迹。hardikpandya/stop-slop 项目提供了一个后处理视角:与其纠结于文本是否由 AI 生成,不如直接处理那些暴露 AI 身份的 "tells"(痕迹)。
这种思路的转变具有工程价值。检测类工具往往产生二元判断(是 / 否 AI 生成),而净化类工具输出的是可直接使用的改写文本。对于内容生产团队而言,后者才是可直接落地的交付物。
AI Tells 特征清单
基于语言学研究,AI 生成文本的标志性痕迹可分为六类:
1. 过度正式的限定语 "It is important to note that..."、"Generally speaking..." 这类开场白是 AI 安全训练的副产品。它们在不增加实质信息的情况下制造 "谨慎" 假象。
2. 模糊量化词 "a lot"、"several"、"many" 替代具体数据。人类写作者倾向于提供可验证的数值("37% 的增长"),而 AI 倾向于安全但空洞的概括。
3. 过度连接 "however"、"thus"、"therefore" 的密集使用。AI 模型被训练生成结构清晰的文本,结果往往是每句话都用连接词包裹,形成机械的节奏感。
4. 非承诺性结论 "more research is needed"、"this depends on context" 作为段落结尾。这种回避式收尾是 RLHF(人类反馈强化学习)的产物 —— 模型被训练避免过度自信。
5. 对冲语言 "perhaps"、"possibly"、"it may be" 等弱化语气的词汇。当陈述本身有数据支撑时,这些对冲词反而削弱说服力。
6. 模板化结构 "Firstly... Secondly... Finally..." 或 "In conclusion..." 的机械使用。AI 倾向于生成教科书式的段落结构,缺乏人类写作的有机流动感。
后处理流水线设计
stop-slop 采用 Skill File 格式(Claude 生态中的可复用指令包),将移除策略封装为可调用模块。流水线可分为三个阶段:
阶段一:规则匹配
建立正则表达式库识别高频 AI tells:
模式库示例:
- "It is important to note that" → 标记为冗余开场
- "^(First|Second|Third)ly" → 标记为机械结构
- "more research is needed" → 标记为回避结论
- "\b(many|several|a lot)\b" → 标记为模糊量化
匹配阈值设定为每 100 词出现 2 次以上同类模式时触发重写流程,避免过度处理。
阶段二:重写策略
对标记片段应用四种改写策略:
删除冗余:直接移除无信息量的限定语。"It is important to note that the system works" → "The system works"。
具体化:将模糊量化替换为具体数据或删除。"Many users reported issues" → "Users reported issues"(若无法提供具体数字)。
主动语态转换:"It was observed that..." → "We observed..." 或删除主语直接陈述。
结构打散:将 "Firstly... Secondly..." 列表转换为自然段落,保留逻辑但消除机械感。
阶段三:质量校验
重写后执行两项检查:
信息完整性校验:对比原文与改写后的实体提及(人名、机构、数据点),确保无信息丢失。
风格一致性校验:计算改写段落的可读性指标(Flesch-Kincaid),确保改写后文本与文档整体风格匹配。若偏离度超过 ±1.5 级,回退到人工审核队列。
可落地参数
触发阈值
- 单段落 AI tells 密度 ≥ 3 处 / 100 词时启动重写
- 整文档 AI tells 密度 ≥ 5% 时建议全文处理
重写规则优先级
- 删除类规则(零风险)
- 具体化规则(需数据支撑)
- 结构调整规则(需上下文判断)
人工审核点
- 涉及专业术语的改写(避免误删技术限定语)
- 引用内容的处理(保留原始表述)
- 法律 / 合规文本(某些对冲语言可能是必要的风险披露)
局限与适用边界
后处理净化并非万能。首先,过度移除可能损失准确性—— 某些对冲语言在不确定性高的场景下是必要的科学表述。其次,规则匹配可能误伤人类写作风格—— 学术写作本就偏好正式结构,不能简单等同于 AI 痕迹。
最适用的场景是营销文案、产品描述、内部报告等对可读性要求高但精确性要求适中的内容。对于学术论文、法律文件、医学报告等专业文本,建议仅应用删除类规则,保留必要的限定语。
参考来源
- https://github.com/hardikpandya/stop-slop
- https://roush.co.uk/does-this-sound-like-ai-linguistic-tells-and-mitigations
内容声明:本文无广告投放、无付费植入。
如有事实性问题,欢迎发送勘误至 i@hotdrydog.com。