构建浏览器层 AI 内容过滤系统：多层评分机制与工程实践

自 ChatGPT 公开发布以来，互联网正经历一场静默的内容质量危机。大量自动生成的文本、图像和视频涌入搜索结果与社交媒体，这些内容通常被称为 "slop"—— 它们被优化用于搜索引擎排名和点击获取，而非传递真实价值。当 noslopgrenade.com 这类讽刺站点用冗长空洞的 Redis 对比文章展示典型 slop 特征时，我们意识到：识别 AI 生成低质量内容已成为浏览体验的基础设施需求。

Slop 的典型特征与检测维度

从 noslopgrenade.com 的示例可以观察到，AI 生成的低质量内容往往呈现以下模式：过度使用过渡词（"首先"、"另一方面"、"综上所述"）、结构化的废话（"这是一个复杂的问题，需要考虑多个因素"）、缺乏实质洞见的冗长段落，以及模板化的结论句式。这些特征构成了内容特征层检测的基础。

然而，单纯依赖文本模式匹配存在明显局限。更可靠的方案需要引入多层评分机制：内容特征层分析文本本身的统计规律，来源信誉层评估域名和作者的历史质量，用户反馈层则通过众包标记持续优化模型。

现有方案分析：时间过滤的启示

Slop Evader 项目采用了一种简洁而有效的策略 —— 通过 Google Search API 过滤 2022 年 11 月 30 日（ChatGPT 首次公开发布日期）之前的内容。这种方法的优势在于零误报：预生成式 AI 时代的内容天然排除了 LLM 生成的可能性。

但时间过滤的局限同样明显：它无法处理 2023 年后的人类原创内容，也无法识别早期存在的模板化低质量内容。这提示我们需要在浏览器扩展或代理层实现更精细的实时检测机制。

多层评分机制设计

第一层：内容特征分析

在浏览器扩展的内容脚本中，可实时提取以下指标：

重复短语密度：计算 3-5 克短语的重复频率，AI 生成文本通常呈现异常的短语分布
过渡词密度：统计 "首先"、"此外"、"综上所述" 等模板化连接词的出现频率
句子长度方差：人类写作通常呈现长短句交替，而 AI 输出往往保持高度一致的句子长度
语义空洞度：通过本地轻量级模型检测缺乏实质信息的 "填充句"

建议阈值配置：重复短语密度超过 0.15、过渡词占比超过 8%、句子长度标准差低于 4 个字符时触发初步标记。

第二层：来源信誉评估

建立域名分级数据库，基于以下维度评分：

历史内容质量：爬取样本进行特征聚类
作者一致性：检测多篇文章的文体相似度异常
更新频率模式：识别异常高频的批量发布行为
外部引用质量：评估反向链接的来源可信度

域名评分采用 0-100 分制，低于 40 分的站点内容自动触发二次审查。

第三层：用户反馈循环

设计轻量级的用户标记机制，允许用户一键标记 "疑似 AI 生成"。反馈数据经脱敏后用于：

调整内容特征权重
更新域名信誉评分
训练本地轻量级分类器

浏览器扩展工程实现

架构设计

采用 Manifest V3 标准的三层架构：

Content Script：注入页面执行 DOM 分析和内容提取，使用 Intersection Observer 实现懒加载检测
Service Worker：处理跨域请求、管理域名数据库、执行轻量级模型推理
Popup UI：提供用户配置界面和标记反馈入口

性能优化参数

检测节流：对同一页面元素设置 500ms 防抖间隔
缓存策略：域名评分缓存 24 小时，内容特征缓存会话级
增量扫描：MutationObserver 监听 DOM 变化，仅扫描新增节点
模型量化：使用 INT8 量化的 3MB 轻量模型进行本地推理

代理层扩展

对于需要全网代理的场景，可部署本地 HTTP 代理（如基于 mitmproxy），在传输层拦截响应内容。代理层的优势在于可处理 HTTPS 流量，但需处理证书信任问题。建议配置白名单机制，仅对文本密集型域名（新闻、博客、问答平台）启用深度检测。

可落地配置清单

content_filter:
  trigram_density_threshold: 0.15
  transition_word_ratio: 0.08
  sentence_variance_min: 4.0
  semantic_hollowness_threshold: 0.6

domain_reputation:
  min_score_for_auto_pass: 70
  max_score_for_auto_flag: 40
  cache_ttl_hours: 24

performance:
  debounce_ms: 500
  max_concurrent_analysis: 3
  model_size_mb: 3

局限性与应对策略

当前方案面临两个核心挑战。首先是误报风险：高质量的人类作者可能使用清晰的结构化表达，而 AI 辅助编辑的优质内容不应被一概过滤。建议引入 "AI 辅助" 与 "AI 生成低质量" 的细分类别，后者才是过滤目标。

其次是检测特征的对抗性演化。随着生成模型针对检测器优化，静态特征规则将逐渐失效。应建立特征漂移监测机制，每月评估当前规则集的召回率变化，并预留模型热更新通道。

结语

构建有效的 slop 过滤系统需要在检测精度与性能开销之间寻找平衡。多层评分机制提供了可扩展的框架，而浏览器扩展的本地化推理能力则保护了用户隐私。随着生成式 AI 技术的持续演进，内容质量过滤将从可选功能变为浏览器的核心基础设施。

参考来源

Slop Evader 项目: https://tegabrain.com/Slop-Evader
noslopgrenade.com 示例内容

web

内容声明：本文无广告投放、无付费植入。

如有事实性问题，欢迎发送勘误至 i@hotdrydog.com。