引言:从内容过滤到规则工程
随着大语言模型的普及,AI 生成的 "slop" 内容 —— 那些充斥套话、缺乏实质信息的文本 —— 正在污染信息生态。与依赖机器学习模型的检测方案不同,基于规则引擎的检测系统提供了可解释性强、运行成本低、响应速度快的替代路径。DeSlop 项目展示了一种工程化的实现思路:通过三层加权模式匹配、600 + 正则模式库和可配置的评分阈值,在浏览器端实现零 API 调用的实时检测。
本文聚焦于规则引擎的核心工程实现,从模式库的组织架构到评分算法的参数调优,提供可直接落地的技术方案。
三层加权模式匹配架构
规则引擎的核心设计在于分层处理不同风险级别的文本特征。DeSlop 采用三层加权架构,每层对应不同的分值权重和触发条件:
Tier 1:AI 特定指标(3 分 / 命中) 这一层捕获最典型的 AI 生成文本特征,包括标志性短语如 "delve into"、"navigate the landscape"、"tapestry of"、"realm of possibilities" 等。此外还检测破折号过度使用、过度过渡词、"In today's fast-paced world..." 这类开场白,以及 "I'm excited to announce" 等社交媒体套话。这些模式在所有灵敏度级别下均激活,确保基础检测能力。
Tier 2:企业流行语(2 分 / 命中) 针对 LinkedIn 等平台的专业内容,检测 "synergy"、"leverage"、"circle back"、"low-hanging fruit"、"thought leadership" 等商务套话,以及 "AI-powered"、"blockchain-enabled" 等技术营销词汇。这一层在灵敏度 3 级以上激活。
Tier 3:营销垃圾(1 分 / 命中) 最宽泛的检测层,覆盖 "free"、"guaranteed"、"limited time offer"、"revolutionary" 等营销话术,以及 "basically"、"essentially"、"actually" 等填充词。仅在灵敏度 4 级以上生效,用于捕捉边缘案例。
正则模式库的工程组织
600 + 模式的管理需要系统化的组织策略。DeSlop 采用语言隔离和分类索引的双层架构:
语言隔离:模式按语言分离存储(en.js、es.js、fr.js 等),支持 11 种语言的本地化检测。每种语言维护独立的正则表达式集合,避免跨语言匹配干扰。
分类索引:在语言内部,模式按语义类别分组存储,便于维护和扩展。典型的分类包括:
- 填充词与过渡词
- 营销话术模板
- 社交媒体开场白
- 技术流行语
- Emoji spam 模式(166 个 emoji 相关规则)
动态注入机制:通过scripting权限和registry.js实现运行时模式加载,支持用户自定义模式的无缝集成。
语义特征提取与评分算法
单纯的模式匹配容易产生误报,因此需要结合多维度语义特征进行综合评分。DeSlop 的评分引擎整合以下指标:
模式密度计算:统计每 100 词中的命中模式数量,识别高密度 slop 区域。
聚类检测:分析短文本跨度内的多模式聚集,判断是否存在刻意堆砌套话的行为。
结构信号分析:
- 三词并列结构检测(三个形容词或名词通过逗号和 "and" 连接)
- 列表与正文比例(过度使用 bullet list 的 prose)
- 句子长度方差(AI 文本常呈现过于均匀的句子长度)
- 段落对称性(连续段落词数过于接近)
Humanize Score:8 维度写作质量分析,输出 0-100 的真实性评分,辅助人工判断。
评分公式采用加权累加:
SlopScore = Σ(Tier1_hits × 3) + Σ(Tier2_hits × 2) + Σ(Tier3_hits × 1) + Structural_penalty
灵敏度阈值与调优策略
阈值设计是平衡检测率与误报率的关键。DeSlop 提供 5 级灵敏度配置:
| 灵敏度 | 阈值 | 适用场景 |
|---|---|---|
| 1 | 15 分 | 极保守模式,仅检测明显 AI 内容 |
| 2 | 12 分 | 保守模式,适合高质量内容筛选 |
| 3 | 9 分 | 平衡模式(默认),兼顾 AI 和企业套话 |
| 4 | 6 分 | 激进模式,包含营销话术检测 |
| 5 | 4 分 | 核模式,最大检测覆盖 |
调优建议:
- 技术文档审核建议采用灵敏度 2-3,避免过度过滤专业术语
- 社交媒体内容监控可采用灵敏度 4-5,捕捉营销 spam
- 初次部署时建议从灵敏度 3 开始,根据误报反馈逐步调整
动态阈值调整:支持基于内容长度的自适应阈值,短文本(<100 字符)自动跳过检测以减少边界误报。
工程实现要点
实时检测流水线:
- 使用 MutationObserver 监控 DOM 变化,捕获无限滚动和 AJAX 加载的动态内容
- 平台特定选择器(如 LinkedIn 的
.feed-shared-update-v2、Twitter 的[data-testid="tweet"])精确定位内容区域 - 异步评分计算避免阻塞主线程
性能优化:
- 模式匹配采用 Trie 树预编译,将 600 + 正则的匹配复杂度从 O (n×m) 优化至接近 O (n)
- 已评分内容缓存至
chrome.storage.sync,避免重复计算 - 短内容快速跳过机制(<100 字符直接放行)
可扩展性设计:
- 模式注册表支持运行时热更新
- 自定义模式编辑器允许用户添加带权重的私有规则
- 导入 / 导出功能支持团队级规则集共享
局限性与改进方向
规则引擎方案存在固有局限:模式依赖人工维护,新出现的 AI 写作风格需要持续更新规则库;跨语言一致性难以保证,11 种语言的规则覆盖度存在差异;上下文理解能力有限,难以区分讽刺性使用和真诚套话。
改进方向包括:引入轻量级语义嵌入进行语义相似度计算,结合规则匹配与向量检索的混合架构;建立众包反馈机制,通过用户标注持续优化模式权重;探索基于少样本学习的自适应阈值调整算法。
总结
基于规则引擎的 slop 检测系统通过三层加权模式匹配、语义特征评分和可配置阈值,在浏览器端实现了高效的 AI 内容识别。这种方案特别适合对延迟敏感、隐私要求高的场景,为内容审核提供了一种轻量级且可解释的工程路径。
资料来源
- DeSlop GitHub 仓库:https://github.com/HxHippy/DeSlop
- AI Slop Detection Pattern Research 技术调研
内容声明:本文无广告投放、无付费植入。
如有事实性问题,欢迎发送勘误至 i@hotdrydog.com。