AI 生成内容的质量控制正从 "事后审查" 转向 "实时干预"。开源社区涌现出两类代表性方案:一类通过启发式规则识别并移除 AI 文本痕迹(AI tells),另一类通过可调参数引导模型输出符合预期风格的内容。理解这两种路径的工程差异,有助于在实际场景中做出合理的技术选型。
负向过滤:启发式模式检测的工程实现
stop-slop 项目采用典型的负向过滤策略,其核心假设是 AI 生成文本具有可识别的模式特征。该项目将检测规则分为三个层级,形成从词汇到结构的完整过滤体系。
短语级检测针对高频出现的填充性表达。项目维护了一份禁用短语清单,涵盖 throat-clearing openers(如 "Here's the thing"、"The truth is")、强调性赘词(如 "Full stop"、"Let that sink in")、商业术语(如 "double down"、"deep dive")以及副词(所有 - ly 结尾的修饰词)。这些规则的本质是识别语言中的 "信号噪音"—— 那些不承载实质信息、仅用于过渡或强调的表达。
结构级检测关注段落层面的公式化模式。规则明确禁止二元对立结构("not X, it's Y")、否定列举、戏剧性断句、修辞性铺垫以及虚假主体性(inanimate objects performing human actions)。这类检测需要分析句子间的逻辑关系,识别出那些为了制造冲突感或戏剧效果而刻意设计的结构。
句子级检测则是最细粒度的规则集合:禁止以 Wh - 词开头的句子、禁用破折号、要求主动语态、避免三个连续句子长度相同。这些规则直接约束句法层面的输出特征。
该项目的质量门禁采用五维度评分机制(直接性、节奏感、读者信任度、真实性、信息密度),每个维度 1-10 分,总分低于 35 分的内容需要重写。这种量化评估为自动化过滤提供了明确的阈值标准。
正向校准:可调参数引导的质量控制
与 stop-slop 的 "减法" 逻辑不同,taste-skill 项目采用 "加法" 策略 —— 通过定义期望的设计品质,引导模型生成符合标准的内容。该项目面向前端设计场景,核心机制是三个可调参数(dials):
DESIGN_VARIANCE控制布局实验程度,低值对应居中 / 整洁的传统布局,高值对应不对称 / 现代的实验性布局。MOTION_INTENSITY调节动画深度,从简单的 hover 效果到复杂的滚动 / 磁性动画。VISUAL_DENSITY定义视口信息密度,从 spacious 的留白设计到 dense 的数据仪表板。
每个参数的取值范围为 1-10,用户可以在 skill 文件顶部直接调整这些数值,系统会根据参数组合生成相应风格的设计方案。这种设计将抽象的质量要求转化为可量化的控制变量,降低了风格调优的认知成本。
项目的 v2 版本引入了 "设计系统映射" 机制:在生成具体实现之前,先根据 brief 推断设计语言,建立从需求到风格的映射关系。这种前置推理确保了后续代码生成的一致性。
两种策略的工程权衡
从技术实现角度看,两种策略各有适用场景。
负向过滤的优势在于规则明确、可解释性强。当目标是从现有内容中 "清洗"AI 痕迹时,启发式检测提供了即插即用的解决方案。但其局限性同样明显:规则维护成本高,需要持续更新以应对模型迭代产生的新模式;过度过滤可能导致文本失去自然流畅性,或误伤特定文体风格(如学术写作中的某些被动语态表达)。
正向校准更适合从 0 到 1 的内容生成场景。通过参数化设计,可以在不修改底层模型的情况下实现风格迁移。但这种策略对参数设计者的审美能力要求较高,且参数之间的交互关系可能产生非预期的效果(如高 VARIANCE 与高 DENSITY 的组合可能导致视觉混乱)。
在实际工程中,两种策略并非互斥。可以在生成阶段使用正向校准设定风格基调,在审查阶段使用负向过滤检测明显的 AI 痕迹。这种 "双保险" 机制在 stop-slop 的评分体系与 taste-skill 的 redesign-skill 中均有体现 —— 后者专门用于审计和改进现有代码库,而非从零生成。
可落地的启发式规则设计
基于上述分析,以下是设计 AI 文本质量控制规则的实践建议:
规则分类清单
- 词汇层:建立禁用词表,按类别分组(填充词、强调词、术语、副词)
- 句法层:定义句式约束(主语要求、长度变化、标点限制)
- 结构层:识别段落模式(二元对立、否定列举、修辞铺垫)
- 语义层:检测元评论(自我指涉的结构说明)
参数设计原则
- 每个参数应有明确的取值范围和语义映射(如 1-10 对应具体风格描述)
- 参数之间应定义交互约束(如某些参数组合需要额外校验)
- 提供默认值和推荐配置,降低用户决策成本
质量评估机制
- 采用多维度评分而非单一指标
- 设定明确的阈值和触发条件(如低于某分需重写)
- 提供 before/after 示例,校准评估标准的一致性
无论采用哪种策略,核心目标都是将模糊的质量要求转化为可执行的技术规范。在 AI 生成内容日益普及的背景下,这种工程化能力将成为内容生产流程的关键基础设施。
参考来源
- hardikpandya/stop-slop: SKILL.md 核心规则与 phrases.md 禁用短语清单
- Leonxlnx/taste-skill: 可调参数设计与 v2 版本重写策略
内容声明:本文无广告投放、无付费植入。
如有事实性问题,欢迎发送勘误至 i@hotdrydog.com。