Hotdry.
security

eBay AI 代购机器人检测与阻断:工程化拦截机制解析

从请求指纹到行为建模,拆解电商平台如何通过多维度信号识别并阻断未授权的 AI 代购行为,给出可落地的检测参数与配置建议。

2026 年 1 月 20 日,eBay 悄然更新了用户协议,新增条款明确禁止「buy-for-me agents、LLM 驱动的机器人,或任何未经人工审核直接下单的端到端流程」。这一看似简单的条款更新,实则是电商平台与 AI 代购工具之间军备竞赛的缩影。当越来越多的用户开始使用 ChatGPT Shopping、Perplexity「Buy with Pro」或类似的 AI 购物助手时,平台方不得不重新审视:如何从技术层面识别并阻断这些「看不见的买家」?

一、平台为何要对 AI 代理说不

在深入检测机制之前,有必要理解电商平台抵制 AI 代购的根本动机。eBay 的盈利模式中,「最终价值费」(Final Value Fee)是核心收入来源 —— 平台从每笔成交金额中抽取一定比例作为佣金。当 AI 代理以最优价格精准抢拍商品时,可能导致两种不利结果:其一,商品以低于市场预期的价格成交,平台抽成随之缩水;其二,AI 代理的批量操作可能扭曲供需关系,影响正常卖家的定价策略。

更深层的担忧在于用户体验的异化。传统电商平台依赖用户的浏览、对比、加购、结算等一系列行为来展示广告、推送推荐、收集数据。当用户直接告诉 AI「帮我买到这款相机,预算 500 美元」,整个决策链条被压缩成一个 API 调用,平台苦心经营的流量分发机制瞬间失效。这不仅是商业利益的损失,更是对平台商业模式的根本性挑战。

二、检测维度一:网络层指纹识别

AI 代购工具与人类用户最根本的区别在于交互介质的不同。人类通过浏览器访问页面,而 AI 工具通常通过 HTTP 客户端或无头浏览器发起请求。网络层指纹识别正是利用这一差异,从流量特征中提取异常信号。

TLS 指纹分析 是第一道关卡。当客户端与服务器建立 HTTPS 连接时,客户端会发送一组密码套件偏好列表(ClientHello)。不同的 HTTP 库和浏览器有着截然不同的指纹特征。例如,Python 的 requests 库默认发送的密码套件顺序与 Chrome、Safari 等主流浏览器有明显差异。无头浏览器如 Puppeteer 或 Playwright 虽然可以模拟真实浏览器行为,但其 TLS 握手细节仍可能留下机器操作的痕迹。平台可以通过维护一份已知库和工具的 TLS 指纹库,对新入站请求进行匹配和标记。

HTTP 头部一致性校验 是第二层防护。真实浏览器在发送请求时会携带一系列头部字段,包括 User-AgentAcceptAccept-Languagesec-ch-ua 系列等。AI 工具常常只携带最小化的头部集,或者使用固定的、容易识别的默认值。例如,一个声称来自 Chrome 的请求,如果缺少 sec-ch-uasec-ch-ua-mobile 等关键头部,或者这些头部的排列顺序与实际 Chrome 版本不符,就可以被标记为可疑。平台还可以检查 Accept-Encoding 是否仅包含 gzip,而缺少现代浏览器支持的 br(Brotli)或 zstd,这也是一个常见的自动化工具特征。

IP 与 AS 声誉评估 提供了宏观视角。数据中心 IP 地址(如 AWS、Google Cloud、阿里云等云服务商的 IP 段)访问电商平台的频率本身就是异常信号。正常用户的 ISP 地址分布在家庭宽带和移动网络,而 AI 工具通常部署在服务器或云函数中。平台可以订阅商业 IP 声誉数据库,对来自已知代理、VPN 或数据中心的流量实施更严格的审查策略。

三、检测维度二:JavaScript 环境探测

仅仅检查 HTTP 头部是不够的,因为 AI 工具可以通过配置无头浏览器来模拟真实浏览器的行为。这时候,平台需要通过 JavaScript 探测来验证请求是否来自一个「真实」的浏览器环境。

Canvas 指纹与 WebGL 渲染 是常用的检测手段。现代浏览器在渲染 Canvas 元素时,会受到底层硬件(GPU 型号、驱动版本)和浏览器实现的影响,从而产生微妙的像素差异。无头浏览器在渲染 Canvas 时,由于缺少真实的 GPU 加速环境,生成的指纹往往与真实浏览器不同。平台可以在页面中嵌入一个隐藏的 Canvas,读取其 toDataURL 结果,与已知的真实浏览器指纹库进行比对。如果匹配度极低,则判定为自动化工具。

Web API 可用性测试 则是另一把利器。真实浏览器完整实现了 navigatorwindowdocument 等全局对象的众多属性和方法,而无头浏览器往往对这些 API 的支持不完整或有缺陷。例如,检测 navigator.webdriver 属性是否为 true(Selenium 等工具的标志)、检查 navigator.plugins 数组是否为空、验证 performance.now() 是否返回单调递增的高精度时间戳等。平台还可以执行一段随机的 JavaScript 代码片段,期望得到特定的计算结果,以此判断执行环境是否符合预期。

四、检测维度三:行为序列建模

即使 AI 工具成功绑过了前两层检测,其行为模式仍然与人类用户存在本质区别。行为序列建模通过分析用户在页面上的交互轨迹,识别异常的操作模式。

鼠标轨迹与点击热图 是最直观的特征。人类操作鼠标时,移动轨迹呈现自然的加减速曲线,且终点往往有一定的抖动;点击之间的时间间隔(Inter-click Interval)呈现特定分布,且受页面内容复杂度影响。AI 工具的鼠标移动通常是直线或折线,点击间隔过于规律(如精确的 500 毫秒)。平台可以通过在页面上埋点记录鼠标移动事件,提取轨迹特征,训练分类模型来区分人类和机器人。

页面浏览路径分析 揭示了更深层的意图。人类用户的浏览路径通常遵循一定的逻辑:从搜索结果或分类页面开始,点击感兴趣的商品,浏览详情,比较不同商家的同类商品,最后决定是否下单。AI 工具则可能直接访问特定的商品详情页,或者按照固定的顺序遍历页面。平台可以构建用户会话的行为序列,使用 LSTM 或 Transformer 等序列模型进行异常检测。如果一个会话的浏览路径与正常用户的分布偏离度过大,就会被标记为可疑。

表单填写与交互模式 也蕴含丰富的信息。当用户手动填写收货地址、选择支付方式时,字符输入速度、键盘事件的时间间隔都会呈现特定的规律。AI 工具填写表单时,或者使用预填充的数据直接提交,或者通过脚本快速注入文本,行为特征截然不同。平台可以在关键的表单字段上监听 input 事件,提取输入节奏特征,辅助判断操作者的身份。

五、检测维度四:风险信号聚合与决策引擎

单一维度的检测信号往往不够可靠 —— 一个使用云服务器办公的正常用户可能被误判为机器人,而一个精心设计的 AI 工具可能绑过某一项检测。因此,平台需要构建一个多信号聚合的风险决策引擎。

实时特征计算与评分模型 是核心组件。平台为每个请求或会话计算一组实时特征,包括但不限于:网络层指纹的匹配度、JavaScript 探测的通过率、行为序列的异常程度、IP 声誉评分、请求频率等。这些特征输入到一个训练好的机器学习模型(可以是 XGBoost、LightGBM 或深度学习模型),输出一个 0 到 1 之间的风险分数。分数越高,是 AI 工具的可能性越大。

分级响应策略 使得平台可以在用户体验和风险控制之间取得平衡。对于低风险请求,正常放行;对于中等风险请求,实施挑战验证,如显示图形验证码或要求滑动拼图;对于高风险请求,直接阻断或要求额外的身份验证。挑战验证的设计需要精心平衡:太简单会被机器人绑过,太困难则会误伤正常用户。目前业界常用的方案包括基于行为特征的隐形验证码(如 reCAPTCHA v3)和生物特征验证(如鼠标移动模式分析)。

六、工程落地:关键配置参数

对于需要在自身平台实现类似检测机制的开发团队,以下参数可作为初始配置的参考基准。

请求频率控制 方面,建议对单个 IP 或账号的请求频率设置上限。正常用户的浏览请求间隔通常在 3 秒以上,瞬时请求速率不超过 5 次 / 秒。当某个来源的请求频率超过 20 次 / 分钟时,应触发行为分析;当超过 100 次 / 分钟时,应强制进入挑战验证流程。

会话行为阈值 方面,单个会话内的页面浏览数超过 50 页、下单尝试次数超过 3 次、页面停留时间标准差过小(操作过于规律),都应视为高风险信号。建议将「页面停留时间」的异常阈值设定为平均值减去 2 个标准差以下。

IP 信誉配置 方面,建议对已知数据中心的 IP 地址默认实施中等强度验证,对 Tor 出口节点、已知代理服务商的 IP 实施高强度验证,对被标记为恶意或存在大量投诉记录的 IP 直接拒绝服务。

JavaScript 探测强度 方面,建议在关键业务节点(如加购、结算)嵌入 2 到 3 个探测点,探测失败或结果异常时,不直接拒绝,而是提升该会话的风险评分,触发后续的挑战验证。

七、行业趋势与未来挑战

eBay 的政策更新标志着电商平台与 AI 代理之间的对抗进入新阶段。Google 推出的 Universal Commerce Protocol 试图为 AI 代理与零售商之间建立规范化的机器对机器接口,这或许是未来的妥协方向 —— 平台不再一味封禁,而是通过官方 API 的形式允许受控的 AI 代理访问,并从中获取分成或数据价值。

然而,技术对抗的本质是道高一尺、魔高一丈。随着 AI 模型的进化,AI 代理的行为模式将越来越接近人类。未来的检测系统可能需要引入更先进的生物特征分析(如打字节奏、眼动追踪)或多模态验证机制,在保护平台利益与维护用户便利之间持续寻找新的平衡点。

资料来源

  • Ars Technica:eBay bans illicit automated shopping amid rapid rise of AI agents(2026 年 1 月 22 日)
  • The Register:eBay updates legalese to ban AI-powered shop-bots(2026 年 1 月 22 日)
查看归档