从 MESA 泄露文档逆向工程 GFW DPI 签名并实现自定义协议混淆

在 2025 年 9 月 11 日，Great Firewall（GFW）发生了历史上最大规模的内部文档泄露事件，涉及 Geedge Networks 和中国科学院信息工程研究所 MESA 实验室的 500 多 GB 源代码、工作日志和通信记录。这一泄露为研究 GFW 的深度包检测（DPI）机制提供了宝贵资料，特别是针对加密网络流量的签名识别和主动探测技术。本文聚焦于从这些文档中逆向工程 GFW 的 DPI 签名，并探讨基于此的规避策略，强调通过自定义协议混淆实现对审查流量的保护。不同于泛泛的安全讨论，我们将提供可操作的参数和清单，确保工程化落地。

GFW DPI 签名的逆向工程概述

GFW 的 DPI 系统是其审查核心，通过分析数据包的模式、头部字段和负载特征来识别敏感流量。MESA 泄露文档揭示了 GFW 在检测 Shadowsocks、V2Ray 等工具时的具体签名，例如对 TLS/QUIC 协议的异常行为匹配。根据 GFW Report 的初步分析，这些签名包括对加密握手过程中的特定字节序列的扫描，以及对流量统计特征（如包大小分布）的统计模型。

逆向工程过程从泄露的源代码入手。文档中，MESA 的 SAPP 平台（一种大规模流分析架构）包含 DPI 引擎的实现细节。例如，GFW 使用状态机匹配协议指纹：对于 Shadowsocks，签名可能锁定在 AEAD 加密（如 chacha20-ietf-poly1305）下的初始握手包中，检测随机 IV（初始化向量）的模式。如果流量不符合标准 HTTP/HTTPS 行为，系统会触发 RST（重置）包或重定向。

证据显示，GFW 已进化到多层检测：第一层是浅层 DPI，检查端口和 IP；第二层是深度 DPI，解密部分负载（若可能）或分析熵值。泄露日志记录了 2023 年针对 V2Ray 的更新，其中签名扩展到 mKCP 传输的伪装失败案例，如头部填充不足导致的模式暴露。一份内部 Jira 票据详细描述了如何通过机器学习模型训练 DPI 规则，针对“腰斩”攻击（半开放连接检测）的阈值设置为连接持续时间超过 5 秒且无完整握手。

在实际逆向中，我们可以提取这些签名作为黑名单：例如，Shadowsocks 的典型签名包括 19 字节的盐值后跟加密数据，而 GFW 的匹配规则可能使用正则表达式如 /^[\x00-\xFF]{19}[加密负载]/。通过工具如 Wireshark 或自定义脚本解析泄露的 RPM 包仓库（repo.tar），开发者能重建这些规则，避免在设计时踩坑。

规避策略：自定义协议混淆的核心原理

理解签名后，规避的关键在于混淆：使审查流量伪装成合法协议，同时保持功能性。MESA 文档暴露了 GFW 对常见混淆的弱点，例如简单 XOR 加密易被熵分析识破。因此，推荐采用多层混淆框架：头部伪装 + 负载填充 + 动态密钥。

首先，头部伪装。GFW 的 DPI 常扫描 TCP/UDP 头部，若检测到非标准 SYN 包，会主动探测。策略：使用域名伪装（Domain Fronting）或 QUIC 伪装，将流量嵌入标准 TLS 1.3 握手中。泄露中，一份关于 SNI（Server Name Indication）阻塞的报告显示，GFW 通过缓存 SNI 字段匹配黑名单域名。规避参数：随机化 SNI 为合法 CDN 如 cloudflare.com，但实际路由至代理服务器；阈值：每 100 个连接轮换 5 个伪装域名，避免模式识别。

其次，负载填充。文档揭示 GFW 使用包长度直方图检测异常：正常 HTTPS 包大小在 100-1500 字节均匀分布，而代理流量常偏小。实现自定义填充：使用 chacha20 加密后，添加随机字节（长度 16-512，服从正态分布 μ=256, σ=100），模拟 WebSocket 数据。证据：泄露的测试日志显示，未填充的 V2Ray 流量在 10 秒内被阻断率达 95%，而填充后降至 20%。

最后，动态密钥与主动响应。GFW 的主动探测涉及发送假包测试响应，若代理回显特定模式即封锁。混淆策略：集成 TLS 指纹随机化（如 uTLS 库），并实现“哑响应”——对探测包返回随机噪声而非真实握手。参数清单：密钥轮换周期 300 秒；探测响应延迟 50-200 ms 随机；回滚机制：若检测到 RST 率 >10%，切换协议栈。

工程化实施：参数与监控清单

为落地自定义协议混淆，我们以 Go 语言为例构建一个简单 obfuscator 模块。核心组件包括加密层、填充器和伪装器。以下是关键参数配置：

加密参数：
- 算法：ChaCha20-Poly1305（GFW 文档显示对 AES 的优化检测较弱）。
- 密钥长度：32 字节，源自 HKDF（HMAC-based Key Derivation Function）派生。
- IV 生成：使用时间戳 + 客户端 ID 的 SHA256 哈希，前 12 字节作为 nonce。
填充与伪装参数：
- 最小填充：64 字节（避开 GFW 的小包阈值 40 字节）。
- 最大填充：1024 字节，分布：均匀随机或模拟 Poisson（λ=200）。
- 头部注入：前缀标准 HTTP/2 帧（类型 0x0，长度 9 字节），后跟加密负载。
- 端口选择：优先 443/80，备用 8080/8443；轮换频率：每小时。
监控与回滚清单：
- 指标：连接成功率 >90%、延迟 <500 ms、丢包率 <5%。
- 探测检测：监控 RST 包比例，若 >15%，触发警报。
- 测试环境：使用 isolated VM（如 QEMU 无网），模拟 GFW 探测脚本（基于泄露的 probing.py）。
- 部署清单：
  - 服务器端：安装 obfuscator 作为 Shadowsocks 插件，配置 tls_fingerprint: "chrome"。
  - 客户端：集成 uTLS，启用 padding: true，domain_front: ["example-cdn.com"]。
  - 回滚：默认 fallback 到 WireGuard（文档显示 GFW 对 UDP 加密的签名覆盖不足）。

在实施中，引用 GFW Report 的分析[1]，泄露确认了 GFW 对 QUIC 的 SNI 阻塞阈值约为 1000 次/分钟，我们的混淆可将此降至安全水平。另一个引用[2] 来自 Net4People 讨论，强调源代码中 DPI 状态机的有限状态（约 256 种），通过噪声注入可饱和其匹配。

风险考虑：GFW 持续更新，泄露虽揭示当前签名，但 2025 年后可能失效。建议定期审计流量日志，并限制在非敏感环境中测试。总体，此框架提供了一个从逆向到落地的闭环，确保 censored 网络流量的高可用性。

通过这些策略，开发者能有效对抗 GFW 的 DPI，维护信息自由。未来，随着更多泄露分析，混淆技术将进一步演进。

[1] GFW Report: Geedge & MESA Leak Analysis, 2025. [2] Net4People: MESA Leak Discussion, GitHub, 2025.

（字数：约 1050 字）