arXiv 引用幻觉禁令执行链路：提交预检与仲裁流程工程解析

在学术出版工作流中，引用伪造长期以来依赖同行评审的事后发现，处置周期以月为单位且影响范围有限。然而 arXiv 在 2026 年正式将引用幻觉列为违反行为准则的实质违规情形，并配套了以年为单位的投稿禁令 —— 这意味着整个执法链路必须在提交时或提交后极短时间内完成发现、认定与执行，否则平台将面临无法消化的积压争议。本文聚焦该禁令机制的工程实现层面：从 DOI 元数据交叉验证的自动化预检，到「不可反驳证据」的判定阈值设计，再到申诉仲裁与宽限期状态机的运转逻辑，拆解一个在学术界尚无先例可循的执法系统究竟如何落地。

禁令触发的前置条件：什么才算「不可反驳的证据」

理解禁令执行链路的第一步是澄清 arXiv 政策文本中最为模糊的地带：「不可反驳证据」（incontrovertible evidence）的操作化定义。目前公开的政策表述保留了相当大的解释空间，但在工程实现层面，任何自动化执法系统都必须将该模糊表述转化为可编程的判定规则。

从 Benchmark 数据（arXiv:2604.03159, Rao & Callison-Burch, 2026）来看，当前模型生成的 BibTeX 条目仅有 50.9% 完全正确，热门论文引用准确率虽高但一旦跨越到近期论文（指训练数据截止日期之后的论文），准确率骤降 27.7 个百分点。这意味着在量化层面，「不可反驳」不等于「有任何字段错误」。一个可操作的工程阈值至少需要区分两类失败模式：

整体条目替代（wholesale entry substitution）：即模型生成了一个根本不存在的论文条目，所有关键身份字段（作者、标题、年份、DOI）同时失效。这构成最高风险等级，因为没有任何真实文献可以对应上 —— 此类情形最容易达成「不可反驳」的判定标准。CrossRef API 返回 404、或语义检索命中零结果，即可作为自动化触发的置信信号。

孤立字段错误（isolated field error）：仅在单一字段（如年份或页码）出现偏差，其余身份字段仍可追溯到真实文献。这类错误在工程层面难以自动定级，因为可能源于作者手误而非模型幻觉，需要人工复核介入。

因此，禁令触发的合理前置条件应至少满足：全部身份字段无法通过 CrossRef 或 OpenAlex 匹配，且在学术数据库（ADS、Semantic Scholar）中无任何关联记录。这将「不可反驳」从政策模糊地带落实为三次独立 API 查询均返回负结果的结构化条件。

自动化预检管线：DOI 验证 API 与分层路由

禁令执行的第一步并非仲裁，而是提交时的自动化预检。arXiv 的提交接口可以在后端嵌入一层引用验证管线，其设计需要平衡误报率、延迟与可扩展性三个约束。

主流方案采用 CrossRef API 作为第一验证层，原因在于其覆盖了绝大多数通过正式出版社渠道发表的论文，且 API 响应稳定、字段结构完整。验证管线的基本逻辑如下：首先解析提交论文中的所有 BibTeX 条目，提取 DOI、作者姓氏、标题关键词等可索引字段；然后对每一条目并行向 CrossRef 发送查询，设定 3 秒超时以防止单次阻塞拖累整体提交流程；最后将返回结果与原始条目进行字段级差异比对。

该管线的关键工程挑战在于跨版本溯源。同一论文常存在预印本、正式发表版、会议版本等多个可引用版本，DOI 不一致但内容本质相同。arXiv:2604.03159 论文提出了「版本感知真实标签」（version-aware ground truth）方案，要求验证管线在无法精确匹配时，退回检索「同一论文的其他版本」而非直接判定为不存在。这将显著降低对近期论文的误报率 —— 因为热门模型在训练数据中记住了论文的核心信息，仅在 DOI 或出版年份等辅助字段上出现偏差。

分层路由设计则决定验证失败后的处置策略。根据 arXiv 公开的政策精神，可推断以下三级路由：

绿色通道：全部条目通过 CrossRef 验证或退回后存在有效替代版本，正常进入排队审阅流程。

黄色通道：存在孤立字段错误但身份字段可追溯，系统自动附加「引用准确性存疑」标注，要求作者在提交后 72 小时内补充说明或修正，不触发禁令但暂停分发。

红色通道：条目经三次独立溯源均无匹配记录，且存在整体替代特征，系统自动触发禁令流程，进入申诉仲裁阶段。

禁令执行的状态机设计：宽限期与解除条件

一旦某提交被路由至红色通道，禁令并非立即永久生效。从系统可用性角度，必须设计一个状态机来管理禁令的生命周期，包括宽限期、申诉窗口与解除条件。

宽限期（grace period）的存在理由是避免误伤。作者可能在提交前已做了合理核查但因工具链问题（例如 Zotero 的 CrossRef 翻译器临时故障）产生验证失败。宽限期建议设置为 7 个自然日，期间作者可以提交书面说明并补充验证记录。若说明通过复核，系统自动解除禁令标记并恢复投稿权限。

申诉仲裁环节则需要人工介入。鉴于大规模人工审核在计算资源上不可行，一个可行的工程方案是引入「分层仲裁池」：对于首次触发禁令且错误条目数量 ≤ 3 的情形，分配至自动化辅助仲裁流程，由审核员在参考验证管线输出结果的前提下做最终裁定；对于重复触发或错误条目数量 > 3 的情形，则进入专家仲裁流程，由领域志愿者或版主委员会做实质审查。

解除条件是状态机设计中最具政策争议的环节。arXiv 明确要求，禁令解除后重新投稿必须先经过「有声望的同行评审 venues 认可」。但「有声望」的认定标准未公开，在工程实现中这是最需要填补的空白。建议的量化参照是： venues 已在 DBLP 或 Semantic Scholar 中建立索引、具备可验证的 DOI 出版记录、且至少经历过一轮外部评审流程。平台可在申诉表单中提供「venue 验证清单」，要求作者声明 venue 满足上述条件并提供可查证的链接。

基准数据与系统参数对照

以下参数基于 arXiv:2604.03159 论文发布的评测基准整理，可作为系统调参的参照值。该基准包含 931 篇论文、三层引用难度（热门 / 低引用 / 近期）和 9 个 BibTeX 字段，覆盖 GPT-5、Claude Sonnet 4.6 与 Gemini-3 Flash 三款搜索增强模型的生成结果。

指标	基础模型（搜索增强）	clibib 两阶段修正后
字段级总准确率	83.6%	91.5%
全部字段正确条目占比	50.9%	78.3%
近期论文准确率下降幅度	-27.7 pp（相对热门论文）	大幅收窄
回归率（引入新错误）	基准	0.8%（两阶段）、4.8%（单阶段）

从上述数据可以得出一个关键系统设计结论：两阶段修正架构（基础条目生成 → 与权威记录交叉修订）比单阶段直接替换错误条目更能控制回归率（0.8% vs 4.8%）。这意味着在验证管线中，不应允许自动化修正工具直接覆盖原始条目，而应保留修正前后两个版本的对比日志，供仲裁员审查修正决策的合理性。

合规提交的操作清单

基于上述分析，作者在向 arXiv 提交论文时可以遵循以下最小化禁令风险的行动清单。该清单聚焦工程可操作环节，不涉及学术伦理层面的建议。

第一，提交前使用 CrossRef API 或 Zotero Translation Server 对全部 BibTeX 条目进行可解析性验证。重点检查 DOI 是否在 crossref.org 可直接访问、作者姓氏与论文标题是否在 Semantic Scholar 返回非零结果。

第二，对于训练数据截止日期之后发表的论文（即近期论文），在提交前额外使用 OpenAlex 进行标题精确检索，因为此类论文在 CrossRef 中可能尚未完成 DOI 映射。

第三，保留验证日志 —— 每次引用核查的 API 响应快照、截图或可导出文件，作为「已进行合理核查」的举证材料。在禁令触发后的申诉流程中，这将是仲裁庭评估作者是否存在主观过失的关键依据。

第四，若使用 LLM 辅助生成 BibTeX 条目，应强制在工具链中加入 clibib 类的两阶段修正环节：先由 LLM 生成初始条目，再用 Zotero Translation Server 的权威记录覆盖或修正，而非直接提交 LLM 输出。

第五，确保所有署名作者均了解论文全部引用内容。政策适用范围覆盖全部署名作者，而非仅限于实际提交操作者。

未定义的工程挑战与社区待解问题

禁令执行链路在实际运转中仍有若干未解决的工程问题，这些问题目前是社区争议的焦点，也将成为下一阶段政策细化的方向。

首先是规模化检测的可行性。arXiv 每日新增提交量级在数千篇，每篇论文平均包含 30–50 条引用，逐一进行深度验证在计算成本上并非不可行（CrossRef API 有免费层，商业化成本可控），但配合人工仲裁的混合管线在高峰期的响应延迟将显著增加作者等待时间。

其次是「训练数据污染」的边界问题。模型生成的错误条目有时并非完全虚构，而是混淆了相似论文的信息（例如将论文 A 的作者与论文 B 的标题组合）。这类「跨条目缝合」在技术上是否构成「引用幻觉」尚无共识，也影响着自动化管线将其归入黄色通道还是红色通道的判定。

最后是跨平台执法的一致性问题。禁令仅在 arXiv 范围内执行，但引用幻觉行为同样存在于其他预印本平台与期刊投稿系统。若缺乏跨平台信息共享机制，被 arXiv 禁投的作者仍可在其他平台继续提交类似内容，这在实质上削弱了禁令的威慑效果。

资料来源

Thomas Dietterich 推文（@tdietterich），2026 年 5 月，arXiv 行为准则更新公告
MindBento HN Top 摘要，2026 年 5 月 14 日，https://mindbento.com/hn-top/new-arxiv-policy-1year-ban-for-hallucinated-references
Rao, D. & Callison-Burch, C. (2026). BibTeX Citation Hallucinations in Scientific Publishing Agents: Evaluation and Mitigation. arXiv:2604.03159

ai-systems

内容声明：本文无广告投放、无付费植入。

如有事实性问题，欢迎发送勘误至 i@hotdrydog.com。