实时图异常检测在选举监控中的应用：协调非真实行为识别系统构建

选举期间社交媒体上的协调非真实行为（Coordinated Inauthentic Behavior, CIB）已成为威胁信息生态的关键风险。与单一账号的机器人检测不同，CIB 的核心特征在于关系与时间的双重同步—— 多个账号通过协调一致的操作制造虚假共识。本文基于图神经网络与网络科学的最新研究，梳理构建实时图分析系统的技术路径与可落地参数。

协调行为的图表示

CIB 的检测难点在于：单个账号的行为可能完全 "正常"，但集体层面却呈现异常模式。有效的检测需要将平台交互建模为时序图结构：

节点：用户账号（跨平台时需统一标识）
边：带时间戳的交互行为（转发、提及、链接分享）
边权重：基于行为相似度的动态计算

研究表明，协调账号在相似性网络中会形成高密度连通分量。2024 美国大选的分析显示，仅 1% 的 Telegram 协调账号却贡献了俄罗斯国家媒体链接近 50% 的传播量，这种 "少节点 - 大影响" 的特征正是图异常检测的敏感信号。

双层检测框架

第一层：域名推广检测（Co-URL 网络）

针对 "推广特定外部域名" 的协调策略，构建用户 - URL 二分图：

数据预处理
- 过滤低活跃度用户：至少分享 10 个独立 URL
- URL 展开：解析短链接至最终目标域名
- TF-IDF 向量化：行表示用户，列表示 URL，值经 TF-IDF 变换
相似性网络构建
- 计算用户间余弦相似度作为边权重
- 过滤极端高频 URL（90 分位数以上）以降低噪声
- 最小 URL 共现阈值设为 5 次
协调组件提取
- 使用网络密度作为核心指标，结合边权重分位数与特征向量中心性进行网格搜索
- 保守策略：选择使最低密度组件出现跃迁的阈值组合
- 典型参数：Telegram (99%, 99%)，X/Twitter (85%, 99%)

第二层：内容放大检测（文本相似性网络）

针对 "推动特定叙事" 的协调策略，构建文本相似性网络（TSN）：

文本预处理
- 排除纯转发内容
- 清洗标点、停用词、表情符号、URL
- 过滤少于 4 个词的内容
语义嵌入
- 使用 SentenceTransformer（如 stsb-xlm-r-multilingual）生成句子嵌入
- 计算用户间平均余弦相似度，仅考虑 1 天滑动窗口内的内容
协调判定
- 边过滤阈值：相似度 ≥ 0.95
- 节点过滤：特征向量中心性前 0.5%

跨平台协调追踪

跨平台分析的关键在于找到平台无关的关联实体。URL 作为统一标识符天然适合跨平台关联：

构建跨平台相似性网络：仅计算不同平台用户间的相似度
识别桥接节点：在平台间起连接作用的高影响力账号
监测巨型组件：跨平台协调网络往往呈现单一高密度连通分量

2024 大选研究发现，Telegram 与 X 之间存在显著的协调网络，而 Facebook 相对隔离。桥接账号通常具有高度政治化的个人简介，如 "为自由而战""Q 研究者 " 等标识。

工程化参数清单

参数类别	具体设置	说明
活跃度阈值	≥10 独立 URL	过滤噪声账号
URL 频率过滤	5-90 分位数	排除极罕见与极常见链接
时间窗口	1 天滑动窗口	捕捉同步行为
文本相似度阈值	≥0.95	高置信度内容协调
中心性阈值	前 0.5%-1%	保守检测策略
密度跃迁判定	最小组件密度突变	无监督阈值选择

局限与应对策略

假阳性风险：合法协调事件（如新闻报道同步发布）可能触发警报。应对方法包括：

引入基线对比：与已知正常事件（如官方辩论）的模式比对
多检测器集成：要求图异常、行为特征、内容特征至少两项吻合
人工审核回路：对高密度组件进行抽样验证

平台差异：不同平台的字符限制与内容格式导致跨平台文本分析困难。当前实践建议：

跨平台分析优先使用 URL 共享模式
文本相似性分析限制在平台内部

召回率约束：高置信度检测策略可能导致低召回（约 0.1）。在选举监控场景中，精确率优先是合理权衡，但需配合其他检测手段形成覆盖。

结论

图异常检测为选举监控提供了从 "单账号分析" 跃迁至 "集体行为识别" 的技术路径。核心洞察在于：协调行为的信号存在于关系结构而非个体属性。通过构建相似性网络、监测密度跃迁、追踪跨平台桥接，系统能够在协调活动产生广泛影响前实现早期预警。随着生成式 AI 降低协调内容的制作成本，实时图分析能力将成为选举诚信基础设施的关键组件。

资料来源

Cinus, F., Minici, M., Luceri, L., & Ferrara, E. (2025). Exposing Cross-Platform Coordinated Inauthentic Activity in the Run-Up to the 2024 U.S. Election. Proceedings of the ACM Web Conference 2025 (WWW '25).
Luceri, L., et al. (2024). Unmasking the web of deceit: Uncovering coordinated activity to expose information operations on Twitter. Proceedings of the ACM Web Conference 2024.

security

内容声明：本文无广告投放、无付费植入。

如有事实性问题，欢迎发送勘误至 i@hotdrydog.com。