无 Cookie 浏览器追踪的 Favicon 指纹识别实现

Favicon 指纹识别是一种新兴的无 Cookie 浏览器追踪技术，它巧妙利用浏览器对网站图标（Favicon）的持久缓存机制，实现 cookie-less 用户标识。这种方法特别适用于广告追踪和反欺诈场景，因为它不依赖用户可轻易清除的存储空间，而是借助浏览器内置的缓存行为和资源计时 API 来持久化追踪跨会话的用户行为。

Favicon 指纹的核心原理

传统浏览器指纹如 Canvas 或 WebGL 依赖 JavaScript 渲染差异，但这些方法易受浏览器隐私设置影响。Favicon 指纹则不同，它基于浏览器对 Favicon 资源的自动缓存。浏览器在加载网页时，会自动请求 /favicon.ico 或通过指定的图标 URL，并将其缓存到专用 Favicon 缓存中。这种缓存独立于 HTTP 缓存，通常保持续期长达一年，且不受标准 “清除浏览数据” 操作影响，甚至在无痕模式下也能部分生效。

实现的关键在于服务器端设计多个 Favicon URL，每个 URL 对应一个 “位”（bit），形成 32 位唯一标识符。例如，服务器可提供 32 个不同的 Favicon 路径，如 /f1.ico 到 /f32.ico。首次访问时，网站通过 HTML 标签加载特定组合的 Favicon（如），浏览器会请求并缓存这些资源。服务器记录请求日志，生成用户专属的 32 位 ID（例如，位 1 和 5 被设置）。

后续访问时，浏览器不会重新请求已缓存的 Favicon，而是发送条件请求（如 If-None-Match 头携带 ETag）。服务器通过这些头信息重建缓存状态，从而恢复用户 ID。这种机制在 2 秒内即可完成指纹构建，且持久性强，因为 Favicon 缓存不易清除。

利用浏览器缓存行为和资源计时 API

浏览器缓存行为的利用是 Favicon 指纹的核心。Chrome 和 Safari 的 Favicon 缓存不隔离无痕模式，且 TTL（Time To Live）默认为 1 年。服务器需设置适当的 HTTP 头来强化缓存：

Cache-Control: public, max-age=31536000（1 年）
ETag: "unique-bit-value"（每个 Favicon 的唯一标签）
Last-Modified: 远古日期（如 1970-01-01），防止浏览器认为资源过期。

为了增强精度，可集成 Resource Timing API（Performance API）。在 JavaScript 中，使用 performance.getEntriesByType ('resource') 测量 Favicon 加载时间。从缓存加载的资源响应时间通常 < 10ms，而网络请求 > 100ms。通过阈值（如 50ms）区分缓存命中与否，进一步验证指纹位。

例如，代码片段：

const entries = performance.getEntriesByType('resource');
entries.forEach(entry => {
  if (entry.name.includes('/f')) {
    if (entry.responseEnd - entry.startTime < 50) {
      // 缓存命中，设置对应位
    }
  }
});

这种结合确保了跨会话的持久追踪，即使用户切换设备或 IP。

可落地参数与工程化配置

在实际部署中，需要优化参数以平衡追踪准确率和性能：

URL 设计：使用短路径如 /f {bit}.ico，避免 URL 过长导致缓存冲突。推荐 32 位方案，支持 2^32（约 42 亿）唯一 ID。每个 Favicon 文件大小控制在 1KB 以内，减少带宽消耗。
缓存头参数：
- Expires: 1 年后日期
- Cache-Control: immutable（Chrome 58+ 支持，标记资源永不过期）
- Vary: Origin（防止跨域缓存污染）
超时与阈值：
- 加载超时：200ms，若超过则视为未缓存。
- 位验证阈值：响应时间 <20ms 为命中，20-100ms 为不确定（需重试），>100ms 为未命中。
- 重试机制：首次失败时，延迟 500ms 后重测 3 次。
集成清单：
- 服务器端：使用 Node.js/Express 设置路由，返回对应 ETag 的 1x1 透明 PNG。
- 客户端：动态注入标签，仅在必要时加载。
- 监控点：日志记录请求头中的 If-None-Match，计算指纹重建率（目标 >95%）。
- 回滚策略：若指纹冲突率 >5%，切换到备用 Canvas 指纹。

这些参数确保系统在高并发下稳定运行，例如每日 1000 万访问，缓存命中率可达 98%。

风险评估与防御策略

尽管强大，Favicon 指纹也存在风险。首先，隐私侵犯：它绕过 GDPR/CCPA 的 Cookie 同意机制，可能导致罚款。其次，检测难度高，但可通过网络抓包工具（如 Wireshark）观察异常 Favicon 请求。浏览器厂商已响应：Chrome 计划隔离 Favicon 缓存，Safari 在 iOS 14+ 限制跨域 Favicon。

防御措施包括：

用户侧：使用 Brave 或 Firefox 的 resistFingerprinting 模式，随机化缓存行为；扩展如 uBlock Origin 阻挡 Favicon 请求。
开发者侧：避免第三方脚本加载 Favicon；实现服务器端检测，拒绝可疑 ETag 请求。
阈值监控：设置告警，若重建率异常下降，立即回滚到传统 Cookie。

总体而言，Favicon 指纹标志着浏览器追踪技术的演进，但也推动了隐私保护的进步。通过合理参数配置，它可在合法场景（如防欺诈）发挥作用，同时需警惕滥用。

资料来源

Solomos et al., "Tales of Favicons and Caches: Persistent Tracking in Modern Browsers," NDSS 2021. https://www.cs.uic.edu/~polakis/papers/solomos-ndss21.pdf
Supercookie GitHub 项目：https://github.com/jonasstrehle/supercookie
MDN Web Docs: Resource Timing API. https://developer.mozilla.org/en-US/docs/Web/API/Performance_API