2026-06-15 17:22:42 • 10 min read
2026-06-15 17:22:42 • 10 min read
导语
大型语言模型和工具调用协议正在改变互联网自动化的成本结构。过去,机器流量主要表现为固定脚本、批量请求和可预测的 DOM 解析;现在,Agent Bot 可以理解页面语义、调用浏览器或移动端工具、根据反馈调整下一步动作,并把代理、验证码处理、环境伪装等能力封装成标准化工具链。
这使企业风控进入更复杂的判断阶段。机器流量内部已经出现明显分化,其中既包含撞库、薅羊毛、数据窃取、库存抢占等攻击性自动化,也包含帮助用户完成比价、采购、旅行规划、企业知识库更新等任务的合法智能体。与此同时,人类流量的可信度也呈现出差异化特征。基于这一变化,企业需要围绕访问身份、行为特征、任务意图与业务影响建立更细致的评估机制。
因此,智能体时代的自动化对抗,不再是简单识别“是不是 Bot”,而是判断“这个机器行为是否有可信身份、合理意图、可接受风险和可控影响”。Agent Bot 与隐匿技术正在把攻防焦点从静态特征识别推向多层信任评估,企业需要同时看清流量身份、环境真实性、交互行为和业务意图。
读完这篇文章,你会清楚三件事:
第一,Bot 如何从传统脚本演进到 AI Crawler 与 Agent Bot;
第二,隐藏技术如何沿着浏览器、协议、设备与工具链持续升级;
互联网自动化程序的演进,是机器不断接近真实业务交互的过程。极验风控实验室将 Bot 的演进大致分为三个阶段:基于固定规则与状态机的传统 Bot、以大模型语料和实时信息为目标的 AI Crawler,以及具备自主规划与工具调用能力的 Agent Bot。
这三个阶段的差异,不只是代码架构不同,更体现在感知、决策和执行能力的变化:

在大型语言模型普及之前,互联网自动化主要由传统 Bot 统治。这类程序的核心逻辑建立在硬编码执行脚本、预设状态机和确定性 DOM 解析之上。在技术选型上,开发者通常依赖 Selenium、Puppeteer、Playwright 等自动化测试框架驱动 Headless Browser,也会直接使用 cURL、Python Requests 或 Go HTTP 客户端进行协议级批量请求。
传统 Bot 的核心应用场景高度集中在两个直接经济利益场景:
传统 Bot 的弱点在于僵化和上下文感知不足。面对动态渲染页面、频繁变更的 A/B 测试 UI 或细微 DOM 调整时,固定选择器很容易失效,导致自动化任务链中断。对防御方而言,这也意味着传统 Bot 往往会留下较明显的速率、路径、环境和交互异常。
生成式 AI 让自动化网络交互进入第二阶段:AI Crawler。这个阶段的关键变化,是抓取目标从结构化业务数据扩展到非结构化文本、图像、代码、评论、知识库和文档内容。这些数据既可能用于基础模型训练,也可能用于 RAG 检索增强、垂直知识库更新和实时信息补充。
典型 AI Crawler 包括 OpenAI 的 GPTBot、Meta 的 Meta-ExternalAgent 与 FacebookExternalHit,以及 Amazon、Google 等公司部署的数据收集程序。它们与传统搜索引擎爬虫相似,但抓取目的、抓取频率、内容范围和商业影响更复杂。
在更细的分类体系中,机器访问可以被拆成 AI Crawler、Search Engine Crawler、Page Preview、Monitoring Bot、Partner Integration 和恶意自动化等不同类别。真正值得关注的,在于它是否完成身份声明,是否遵循 robots.txt,是否控制抓取速率,是否尊重授权边界,以及是否会带来业务风险或版权风险。
AI Crawler 阵营内部已经出现明显分化。一类爬虫会透明声明身份、遵循站点政策并控制频率;另一类则会伪装成普通浏览器或移动端用户,绕过站点限制,抓取明确不希望被收录或训练的数据。后者才是反爬和内容保护系统需要重点识别的对象。
当前,自动化技术正在跨越第三道门槛:Agent Bot。Claude、Codex、DeepSeek、豆包、Qwen 等模型被赋予联网、浏览器控制、文件操作和工具调用能力后,开始从“读取页面”升级为“执行任务”。
这类 Agent 很快会遇到一个基础设施痛点:现代网页是为人类视觉消费设计的,其中充斥着 Cookie 弹窗、侧边导航、广告脚本、动态组件和装饰性 DOM 节点。直接把原始 HTML 投喂给 LLM,会浪费上下文窗口,也会增加模型误读页面结构的概率。
为解决模型与真实网络环境之间的沟通鸿沟,模型上下文协议(MCP) 等工具调用标准开始受到关注。MCP 化的影响在于,它把复杂的浏览器控制、页面提取、代理管理、验证码处理和数据回传抽象成标准工具。Agent 客户端只需表达任务意图,后端工具链就可以接管无头浏览器启动、CDP 通信、页面状态读取和动作执行。
这也带来了新的风险:过去需要熟练工程师才能搭建的自动化能力,正在被封装成普通模型也能调用的基础设施。自动化的门槛下降了,攻击规模化的速度也随之上升。
面对从粗糙脚本到高级 Agent 的流量混杂态势,企业防御侧需要先建立机器流量分类学。通过这一步,AI 训练爬虫、搜索引擎爬虫、用户触发的 AI 助手、通讯软件链接预览、恶意隐匿 Bot 都能进入清晰的分类体系,并分别匹配对应的策略池。这样,企业可以形成更精准的识别、更稳妥的放行与限制机制,以及更具可解释性的审计链路。
更适合 Agent 时代的分类方法,是先看运行形态,再看业务场景:


现代机器分类学中,把“机器访问”拆成可运营的标签体系。进入 Agent 时代后,企业真正需要的是一套同时支持识别、放行、限速、验证、降权和阻断的治理模型,而不是继续用单一 Bot 规则处理所有非人类流量。
在防御方不断织密天罗地网的同时,攻击方以及合规的自动化工具链也在不断进化。自动化程序从早期粗劣的 WebDriver 封装,一路狂奔至抛弃 Chrome 进程的定制化底层通信,展现出了一幅对抗技术不断向下层渗透的清晰演进图谱。

早期的无头浏览器环境使用未经伪装的原生 Playwright 或 Puppeteer,在现代风控面前如同裸奔。它们默认将 navigator.webdriver 强行置为 true,且缺乏真实的图形硬件渲染参数。
为掩盖这些特征,社区演化出了表层 JS 注入方案。在 Node.js 中,典型代表是 puppeteer-extra-plugin-stealth;在 Python 中,则是早期的 undetected-chromedriver。这些工具通过拦截页面加载事件,注入 JS 脚本覆写 navigator 对象或混淆指纹。undetected-chromedriver 还会通过二进制补丁修改 ChromeDriver 可执行文件中的特征变量名称,绕过一部分基于固定字符串和进程特征的探测逻辑。
然而,表层注入的防线很脆弱。JS 钩子在 iframe 嵌套、页面快速跳转、沙箱隔离或早期脚本执行时容易出现注入时序问题,导致自动化特征侧漏。
当意识到开源的简单补丁难以应对复杂的设备指纹探针时,黑灰产与高级自动化工具开始转向 AdsPower 和 BitBrowser 等商业化指纹浏览器。这类产品通过在浏览器内核层面进行修改,提供高度隔离的浏览器环境,并能对 Canvas、WebGL、字体、音频甚至 WebRTC 等数十个硬件特征参数进行细粒度的伪装欺骗。
这种商业化封装把原本分散的代理、指纹、账号、Cookie、环境隔离和批量任务管理整合成可运营平台。对攻击者而言,它降低了规模化门槛;对防御方而言,它让单一浏览器指纹或单一 IP 信誉的判断越来越不可靠。
长期以来,基于 WebDriver-CDP 混合模式运行的中间件始终是风控探测的重点对象,例如进程扫描、启动参数污染、调试端口暴露和驱动二进制特征。为了斩断与 WebDriver 的联系,新一代工具开始转向底层协议控制。
这促成了从间接控制到直接原生 Chrome-CDP 操控的技术飞跃,其中最具代表性且目前在 Python 社区备受推崇的是 Nodriver 框架。
作为 undetected-chromedriver 核心开发者打造的续作,Nodriver 在架构上移除了对 ChromeDriver 二进制文件的依赖。它的核心逻辑在于:Nodriver-CDP 模式以更接近普通用户的参数启动系统原生 Chrome 进程,随后利用异步 Python 代码通过 WebSocket 隧道与 Chrome DevTools Protocol 建立直连。
这种方式会显著削弱三类传统特征:ChromeDriver 进程特征、异常启动参数、以及 WebDriver 变量污染。它不等于完全不可识别,但会迫使防御方从“识别自动化框架”转向“评估会话、传输、环境和行为的一致性”。
当风控引擎开始利用时序分析、硬件特征和渲染差异进行检测时,Stealth 技术继续向更底层推进。
在 AI 智能体时代,LLM 本身不需要理解复杂的 Python Nodriver 脚本或浏览器指纹细节。最新的对抗演进,是把这些反侦测能力标准化为模型可调用的 API 工具集,也就是 MCP 化或类 MCP 化。
在这一阶段,真实环境劫持战术会进一步升级。部分高级框架会直接将目标应用运行在真实 Android 设备、深度虚拟化的 Android/iOS 环境或移动端托管环境中,并结合端口转发、调试通道、系统级自动化接口实现持续控制。相较于桌面无头浏览器中的参数模拟,这类方案能够提供更高的一致性与仿真度。
比如前一篇提到的AI Agent 为什么越来越青睐 iOS 模拟器:威胁深层剖析与企业级全链路防控方案,就属于这一类思路。
这类方案利用真实物理设备或高仿真环境作为底座,能够提高系统指纹的可信度。但它也带来新的检测机会:真实设备、账号、网络、行为和业务路径之间必须长期保持一致,一旦规模化运行,就会暴露出资源复用、行为模板、任务节奏和目标选择上的异常。
随着 Stealth 隐匿技术向浏览器内核、网络协议栈和移动端运行环境下沉,防御方不能再只依赖应用层 DOM 解析、JavaScript 环境探针或单一 User-Agent 规则。Agent 时代的反自动化体系,需要从“识别某个工具”升级为“验证整个会话是否可信”。
传输层指纹识别、端侧环境感知、行为生物识别,以及业务风险编排 对应的协议层识别能力、设备指纹的环境识别能力,行为验证的行为生物识别能力,以及风险决策引擎。极验的反自动化与人机识别能力,正是这样一整套的风控决策链路的方案。它可以作为关键业务节点中的验证与判断能力,帮助企业评估访问者的环境可信度、行为可信度与意图可信度。
在现代互联网中,几乎所有的重要通信都被 TLS/SSL 加密协议所包裹。然而,加密保护了内容,却无法掩饰通信行为本身的结构学特征。在 TLS 连接建立的最初始阶段(即客户端发送 ClientHello 握手数据包时),客户端会向服务器明文宣告其所支持的底层加密库(如 Chrome 使用的 BoringSSL、Firefox 依赖的 NSS、或是 Python 脚本常用的 OpenSSL)。由于不同软件栈的实现逻辑差异,通过提取这些在建立加密隧道之前就暴露的底层参数并生成唯一指纹,风控系统便能在不解密任何有效载荷的前提下,前置且精准地剥离出试图伪装成普通浏览器的 Python 爬虫脚本或 C2 控制恶意软件 。
在过去的数年中,行业广泛采用的基准技术是由 Salesforce 团队发明的 JA3 指纹。JA3 算法的核心原理在于,它从 ClientHello 报文中精确提取五个关键字段:TLS 版本号、支持的密码套件列表、支持的扩展项、椭圆曲线参数以及椭圆曲线点格式。随后,算法将这些字段对应的十进制代号严格按发送顺序拼接成一个超长字符串,并最终计算其 MD5 哈希值,生成一个 32 字符长度的定长指纹标识符 。 其算法逻辑可简化表达为:
JA3=MD5(TLSVersion,Ciphers,Extensions,EllipticCurves,EllipticCurvePointFormats)JA3=MD5(TLSVersion,Ciphers,Extensions,EllipticCurves,EllipticCurvePointFormats)
然而,随着对抗的加剧,JA3 暴露出了诸多致命的架构性缺陷。为了弥补这一短板,由原 JA3 联合发明者创办的 FoxIO 团队推出了革命性的 JA4 指纹标准。
传输层网络指纹追踪技术(JA3 vs. JA4)核心架构演进对比
传输层指纹的价值,是在内容解密之前提供第一层风险线索。但在高级 Agent Bot 面前,TLS 指纹不能单独承担最终决策。真正有效的做法,是把 JA3/JA4、IP 信誉、代理特征、设备指纹和行为轨迹合并到同一个风险评分体系中。
从 WebDriver 到 Nodriver,自动化工具大量转向 CDP(Chrome DevTools Protocol)与浏览器通信。许多攻击者误以为,只要避开 WebDriver 标识,就能绕过主要检测。事实上,只要任务目标需要与网页 UI 发生真实交互,例如点击按钮、填写表单、拖动滑块或完成验证,行为层仍然会暴露大量风险信号。
在此前的前端攻防中,普通的自动化脚本往往使用 JavaScript 的 element.click 来触发点击,这种事件对象中的 isTrusted 属性会被浏览器默认标记为 false,从而被简单的风控脚本瞬间拦截。
为了突破这层限制,高级 Bot 转而使用底层的 CDP 指令(如 Input.dispatchMouseEvent 或 Input.dispatchKeyEvent),因为从浏览器内核的角度看,这些指令伪造出的点击和按键等同于真实的物理硬件输入,能够生成 isTrusted = true 的无瑕事件。

这正是行为生物识别发挥作用的地方。以极验为代表的现代风控引擎不仅仅只关注静态属性,还会持续监控交互行为的微观动态模式。
因此,即便高级 Agent 或 AI 爬虫利用底层改造隐藏环境特征,并通过 CDP 生成 isTrusted = true 的点击事件,只要鼠标、键盘、触控和认知节奏缺乏人类交互的自然波动,行为识别引擎仍然可以把它纳入高风险队列,并触发动态验证、限速、业务降权或阻断。
Agent Bot 的防御难点不只在识别,还在决策。企业需要把传输层、环境层、行为层和业务层信号接入统一决策引擎,根据业务价值和风险强度采取不同动作。
对登录、注册、领券、支付、提现、内容批量访问、搜索结果抓取、库存查询等高价值节点,建议采用分层处置策略:
这也是现代反自动化能力与传统验证码最大的区别:验证码不应是孤立的弹窗,而应成为风险决策链路中的一个动态动作。只有当挑战结果、行为轨迹、设备可信度和业务上下文共同进入风控闭环,企业才能在放行合法 Agent、限制灰色自动化和阻断恶意 Bot 之间取得平衡。
从硬编码脚本、XPath 解析,到 AI Crawler 的内容抓取,再到具备工具调用和动态规划能力的 Agent Bot,互联网自动化正在从“请求自动化”升级为“任务自动化”。这意味着,传统依赖静态特征、固定规则和单点验证码的防御方式,会越来越难以覆盖真实风险。
企业需要接受一个新的现实:未来的访问者会同时包含真人、合法 Agent、灰色自动化和恶意 Bot。风控系统需要围绕机器流量建立可解释、可分层、可联动业务动作的信任评估机制,从而实现更精细的识别、决策与治理。
对安全、风控、反爬和增长团队来说,下一阶段建设重点可以收敛为四件事:
在这套体系中,以极验为代表的反自动化人机识别、设备风险识别、行为验证能力和决策引擎,适合承担“动态决策动作”和“行为可信判断”的角色。它可以帮助企业在智能体时代围绕每一次访问完成更细致的判断,包括访问是否可信、是否适合放行、是否需要触发验证、是否需要执行阻断。
Agent Bot 与隐匿技术仍将持续演进。面向这一趋势,防御方需要建设一套具备持续学习、持续分层与持续抬升攻击成本能力的信任基础设施,从而支撑长期治理、动态识别与策略联动。
极验
极验