规则引擎驱动的AI文本Slop检测：正则模式、语义特征与阈值评分的工程实现

引言：从内容过滤到规则工程

随着大语言模型的普及，AI 生成的 "slop" 内容 —— 那些充斥套话、缺乏实质信息的文本 —— 正在污染信息生态。与依赖机器学习模型的检测方案不同，基于规则引擎的检测系统提供了可解释性强、运行成本低、响应速度快的替代路径。DeSlop 项目展示了一种工程化的实现思路：通过三层加权模式匹配、600 + 正则模式库和可配置的评分阈值，在浏览器端实现零 API 调用的实时检测。

本文聚焦于规则引擎的核心工程实现，从模式库的组织架构到评分算法的参数调优，提供可直接落地的技术方案。

三层加权模式匹配架构

规则引擎的核心设计在于分层处理不同风险级别的文本特征。DeSlop 采用三层加权架构，每层对应不同的分值权重和触发条件：

Tier 1：AI 特定指标（3 分 / 命中） 这一层捕获最典型的 AI 生成文本特征，包括标志性短语如 "delve into"、"navigate the landscape"、"tapestry of"、"realm of possibilities" 等。此外还检测破折号过度使用、过度过渡词、"In today's fast-paced world..." 这类开场白，以及 "I'm excited to announce" 等社交媒体套话。这些模式在所有灵敏度级别下均激活，确保基础检测能力。

Tier 2：企业流行语（2 分 / 命中） 针对 LinkedIn 等平台的专业内容，检测 "synergy"、"leverage"、"circle back"、"low-hanging fruit"、"thought leadership" 等商务套话，以及 "AI-powered"、"blockchain-enabled" 等技术营销词汇。这一层在灵敏度 3 级以上激活。

Tier 3：营销垃圾（1 分 / 命中） 最宽泛的检测层，覆盖 "free"、"guaranteed"、"limited time offer"、"revolutionary" 等营销话术，以及 "basically"、"essentially"、"actually" 等填充词。仅在灵敏度 4 级以上生效，用于捕捉边缘案例。

正则模式库的工程组织

600 + 模式的管理需要系统化的组织策略。DeSlop 采用语言隔离和分类索引的双层架构：

语言隔离：模式按语言分离存储（en.js、es.js、fr.js 等），支持 11 种语言的本地化检测。每种语言维护独立的正则表达式集合，避免跨语言匹配干扰。

分类索引：在语言内部，模式按语义类别分组存储，便于维护和扩展。典型的分类包括：

填充词与过渡词
营销话术模板
社交媒体开场白
技术流行语
Emoji spam 模式（166 个 emoji 相关规则）

动态注入机制：通过scripting权限和registry.js实现运行时模式加载，支持用户自定义模式的无缝集成。

语义特征提取与评分算法

单纯的模式匹配容易产生误报，因此需要结合多维度语义特征进行综合评分。DeSlop 的评分引擎整合以下指标：

模式密度计算：统计每 100 词中的命中模式数量，识别高密度 slop 区域。

聚类检测：分析短文本跨度内的多模式聚集，判断是否存在刻意堆砌套话的行为。

结构信号分析：

三词并列结构检测（三个形容词或名词通过逗号和 "and" 连接）
列表与正文比例（过度使用 bullet list 的 prose）
句子长度方差（AI 文本常呈现过于均匀的句子长度）
段落对称性（连续段落词数过于接近）

Humanize Score：8 维度写作质量分析，输出 0-100 的真实性评分，辅助人工判断。

评分公式采用加权累加：

SlopScore = Σ(Tier1_hits × 3) + Σ(Tier2_hits × 2) + Σ(Tier3_hits × 1) + Structural_penalty

灵敏度阈值与调优策略

阈值设计是平衡检测率与误报率的关键。DeSlop 提供 5 级灵敏度配置：

灵敏度	阈值	适用场景
1	15 分	极保守模式，仅检测明显 AI 内容
2	12 分	保守模式，适合高质量内容筛选
3	9 分	平衡模式（默认），兼顾 AI 和企业套话
4	6 分	激进模式，包含营销话术检测
5	4 分	核模式，最大检测覆盖

调优建议：

技术文档审核建议采用灵敏度 2-3，避免过度过滤专业术语
社交媒体内容监控可采用灵敏度 4-5，捕捉营销 spam
初次部署时建议从灵敏度 3 开始，根据误报反馈逐步调整

动态阈值调整：支持基于内容长度的自适应阈值，短文本（<100 字符）自动跳过检测以减少边界误报。

工程实现要点

实时检测流水线：

使用 MutationObserver 监控 DOM 变化，捕获无限滚动和 AJAX 加载的动态内容
平台特定选择器（如 LinkedIn 的.feed-shared-update-v2、Twitter 的[data-testid="tweet"]）精确定位内容区域
异步评分计算避免阻塞主线程

性能优化：

模式匹配采用 Trie 树预编译，将 600 + 正则的匹配复杂度从 O (n×m) 优化至接近 O (n)
已评分内容缓存至chrome.storage.sync，避免重复计算
短内容快速跳过机制（<100 字符直接放行）

可扩展性设计：

模式注册表支持运行时热更新
自定义模式编辑器允许用户添加带权重的私有规则
导入 / 导出功能支持团队级规则集共享

局限性与改进方向

规则引擎方案存在固有局限：模式依赖人工维护，新出现的 AI 写作风格需要持续更新规则库；跨语言一致性难以保证，11 种语言的规则覆盖度存在差异；上下文理解能力有限，难以区分讽刺性使用和真诚套话。

改进方向包括：引入轻量级语义嵌入进行语义相似度计算，结合规则匹配与向量检索的混合架构；建立众包反馈机制，通过用户标注持续优化模式权重；探索基于少样本学习的自适应阈值调整算法。

总结

基于规则引擎的 slop 检测系统通过三层加权模式匹配、语义特征评分和可配置阈值，在浏览器端实现了高效的 AI 内容识别。这种方案特别适合对延迟敏感、隐私要求高的场景，为内容审核提供了一种轻量级且可解释的工程路径。

资料来源

DeSlop GitHub 仓库：https://github.com/HxHippy/DeSlop
AI Slop Detection Pattern Research 技术调研

ai-systems

内容声明：本文无广告投放、无付费植入。

如有事实性问题，欢迎发送勘误至 i@hotdrydog.com。