geetest_logo

导语

当 GPT-4o 等多模态大模型能够解析复杂的视觉语义、编写代码甚至理解视频时,一个焦虑的声音浮现:

传统的行为验证,是不是已经拦不住 AI 了?

作为长期处于人机对抗前沿的实战方,极验的答案很明确:


  • 人机对抗没有终局,只有持续的升维对抗;
  • 我们率先论证并工程化落地了 SVG 动态验证(极验行为验证的第 9 种验证形式);
  • 极验的 SVG 动态验证,已在极端攻击场景中展现出极强的防御效果(以 55% 的自动化攻击降低比例,充分印证了其对抗 AI 攻击的有效性)。


过去一年,我们始终关注 AI 技术的发展走向,诚然,AI agent在多模态识别领域取得显著突破,传统“看图识物”式验证形式面临前所未有的压力。

但极验认为,2026年人机对抗的核心,已从单一的“视觉识别”较量,升级为 “逻辑推理”、“交互深度”与“工程成本” 的综合博弈。

本文旨在分享极验在这一方向的深度思考与工程实践:SVG 动态验证。



图 1:极验视觉识别类验证形式・滑动拼图 —— 无需复杂推理,核心依赖基础视觉识别,同时包含轨迹行为数据



图 2:极验逻辑推理类验证形式・消消乐—— 区别于单纯的视觉识别,需结合交互顺序、逻辑关联完成




图 3:极验新增第九种验证形态・SVG动态验证 —— 依托逻辑推理与复杂交互设计,专门应对更特殊、极端的 AI 攻击场景


2025 行业观察:黑产 AI 攻击的三大特征


回顾刚刚过去的 2025 年,互联网业务安全领域出现了一个显著的分水岭:

AI 技术不再是实验室里的 demo,而已成为黑灰产开展攻击的标准化工具,广泛应用于各类业务场景

通过一整年的行业攻防观察与实战对抗,我们发现AI 驱动下的黑产攻击已形成三大显著进化特征,正持续冲击企业现有安全防御体系:


进化特征一:高智商


人工智能对图形逻辑的理解能力,已经从“模糊识别”进化到了“深度理解”。

2025 年 10 月,美国第三方研究机构 Roundtable.ai 在其发布的最新测评报告 《Benchmarking LLMs on CAPTCHAs》 中,对Claude Sonnet 4.5(Anthropic)、Gemini 2.5 Pro(Google)和 GPT-5(OpenAI) 等多模态大模型进行了实测。

测试表明,新一代 AI 模型在处理主流验证码时具有极高的适应性。

  • 主流模型表现:Claude Sonnet 4.5在 Google reCAPTCHA v2 的挑战中成功率约为 60%,Gemini 2.5 Pro为 56%
  • 攻克“交叉切片”难题:即使在最复杂的“4x4 交叉切片(Cross-tile)”图像验证码中,这些 AI 模型也表现出比以往单纯的 OCR(字符识别)更强的逻辑推理能力。


图4: 各人工智能模型的总体成功率。Claude Sonnet 4.5 的成功率最高,达到 60%,其次是 Gemini 2.5 Pro,成功率为 56%,GPT-5 的成功率为 28%。


图5: 静态挑战呈现一个静态的 3x3 网格;动态刷新挑战会动态替换点击的图像;跨图块挑战使用一个 4x4 网格,对象可能跨越多个方格。表格显示了不同 CAPTCHA 类型的模型性能。由于成功率是在挑战级别而非试验级别计算的,因此其低于图 4 中的成功率


进化特征二:低成本


2025 年全球范围内的 “价格博弈”,拉低了黑产进入的门槛。

2025 年,以 DeepSeek 为代表的新生代力量与 OpenAI 及国内互联网巨头轮番下调 API 价格,将 AI 算力变成了随取随用的“自来水”:

DeepSeek 的“分位级”定价:2025 年初,DeepSeek V3 体系将百万 Token 的成本压低至 0.1 元人民币 左右。极低的价格让黑产在进行大规模自动化探测时,即便面临极高的封禁率,其经济损失也几乎可以忽略不计。

旗舰模型的“平民化”:OpenAI 在 2025 年对其最强推理模型 o3 降价 80%,并推出高性价比的 GPT-4.1 Mini。曾经昂贵的、涉及复杂逻辑推理的攻击任务,现在的执行成本仅为过去的五分之一。

国内大厂的持续下探:阿里巴巴、字节跳动在 2025 年相继推出大规模节省计划,部分模型降价幅度超过 80%。



图 6:路透社(北京)关于 2025 年全球 AI 模型 API 价格大幅下调的报道截图


进化特征三:工具化


在 2025 年 8 月的 USENIX Security 安全会议上,研究人员发布了通用验证码求解器 Halligan

与以往针对特定类型(如文本或特定图像)的破解工具不同,Halligan 被定义为首个通用型视觉验证码求解器

  • 核心原理:它基于多模态大模型(VLM),将验证码挑战简化为一个“搜索问题”。它先通过 CAPTCHA Abstraction(验证码抽象)将视觉挑战转化为实体模型,再解析指令并执行一系列动作(如点击、滑动、拖拽)。
  • 无需训练:它能够直接处理从未见过的验证码挑战,无需针对特定目标进行预训练或微调。
  • 高泛化能力:在包含 26 种主流验证码类型的 2,600 个测试挑战中,Halligan 的平均成功率达到了 60.7%。
  • 实测数据:研究人员通过渗透人类验证码众包平台(CAPTCHA farms),测试了 Halligan 解决现实世界中“从未见过”的验证码的能力,其成功率高达 70.6%。


图 7:2025 年 8 月 USENIX Security 安全会议发布的首个通用型视觉验证码求解器 Halligan 相关论文截图


02 AI 破解的真相:识别 ≠ 通过


结合2025年的实战攻防现状来看,在多模态大模型的加持下,黑灰产的工具箱确实完成了升级,但我们必须厘清一个核心误区:

让 AI 看懂一张图”,并不等于“让 AI 成功通过一次验证”。


在极验内部的AI 自动化测试中,我们引入了业内主流的多模态大模型进行高强度对抗测试。

数据揭示了一个有趣的现象:

大模型在“视觉理解”上表现优异,但在“交互执行”上却频频碰壁。


我们在持续的对抗测试与攻防观察中发现:


1.位置精度识别并非百分之百


即使是当前先进的多模态模型,在面对带有视觉残影、动态干扰或逻辑陷阱的图形时,仍会出现位置偏差、顺序误判等错误。这种像素级的误差,足以触发风控拦截。



图8:极验内部实验图--AI位置识别错误(偏了10多个像素),且图标识别不全


2.交互理解是主要失败点


当验证指令不再是简单的“点击目标”,而是涉及多步排序、空间关联或抽象逻辑组合时,AI 的执行成功率会出现明显的“断崖式”下跌。

面对需要即时理解语义并完成逻辑闭环的任务,大模型的 Token 消耗和误判率会显著上升。行为验证的对抗核心,已正式从单纯的“视觉识别”转向深层的“交互理解”。


3.成本与时间成为关键约束


大模型的调用,消耗高、响应慢,与验证场景所需的秒级响应天然冲突:

大模型进行图像分析、逻辑推理到生成指令,往往需要数秒时间,而验证码要求毫秒级的响应。这种时间差,不仅暴露了机器特征,更让攻击者的 Token 成本和计算成本,远远高于其破解带来的收益。

而SVG 动态验证正是针对这种时间挑战下的有力手段。


图9:极验实测--主流大模型在面对 SVG 复杂逻辑时,通过效率呈断崖式下跌。其中 Claude sonnet 4 通过率低于 2%,Gemini 3 Pro 则低于 5%,且单次验证平均耗时高达 2 分钟,远超业务容忍极限。


这些观察指向一个结论:仅仅让 AI “看得懂”不够,更要让其“做不对、做不快、做不起”。

未来的对抗将是视觉干扰、交互逻辑、时间约束的三维叠加。


02 SVG 动态验证:为复杂交互而生的第 9 种形态


面对2025年新型AI攻击浪潮,我们需在验证形态上提前储备更高维的对抗能力。

而 SVG 动态验证,正是我们在这一方向上的核心实践成果


SVG(Scalable Vector Graphics)动态验证并非简单替代现有形式,而是为极端攻击场景设计的一种“专属防御方案”。


SVG不仅是一种图形格式,在极验的安全体系中,它是一种能够承载高维对抗逻辑的技术形态,与传统的JPG/PNG 图片验证不同,SVG 动态验证具有天然的“反 AI”基因:


1、学术理论:打破视觉模型的 “语义天花板”


从学术视角看,大模型的视觉识别能力存在天然的 “空间逻辑短板”:擅长捕捉静态像素的固定规律,却极易在动态空间推理中陷入 “逻辑幻觉”。

极验在测试时针对主流多模态大模型的对抗测试中发现:


  • 陷入推理死循环:面对 SVG 实时生成的矢量路径,AI 往往无法构建有效的特征模型,导致其思维链(CoT)陷入无效的回答循环中,无法给出正确的交互指令。
  • 从“智能识别”退化为“概率撞大运”:在 SVG 的动态干扰下,AI 的识别准确率大幅跳水。实测显示,AI 只能依赖随机概率进行“盲选”,准确率跌至极低。
  • 全方位防御补丁:配合极验的频度限制与增强动态形变技术,我们成功将黑产的攻击速率压缩至冰点,彻底打破了 AI 的语义识别天花板。


图10:实测记录--大模型在尝试破解 SVG 逻辑时报错


2、工程实现:从 “素材博弈” 进化为 “算力博弈”


从工程角度看,SVG 验证彻底解决了传统验证形式静态资产易被爬取、交互简单易被破解的通病,核心体现在三点:


  • 代码生成替代静态图库:每一幅验证图形均由前端代码实时生成,必要时可加入随机变量,验证内容不再是固定的图片 URL,而是后端实时编译、即时下发的矢量指令,攻击者无法通过爬取图库建立 “题库”,从根本上提高自动化爬取门槛;
  • 承载复杂多步交互逻辑:依托 SVG 的灵活性,设计出包含点击、拖拽、路径绘制甚至多层逻辑判断的多步推理交互,并在验证中嵌入时序检测与坐标精度校验,让验证从简单 “选图” 变成需完成的 “逻辑题”;
  • 动态形式打造抗 AI 干扰:利用 SVG 的动态特性引入视觉残影、即时形变等效果,这种对人类肉眼完全友好的自然动画,对依赖静态帧分析的 AI 模型而言,却是难以过滤的巨大噪点和干扰。


最终实现让对抗从 “谁的素材库更全” 的素材博弈,升级为 “谁的算力能支撑多步逻辑和精准交互” 的算力博弈,大幅抬高 AI 的破解成本。


图11:SVG验证要求 AI 必须完成:视觉识别 - 语义理解 -空间推理 -路径规划 -模拟操作,每一个环节的增加,都会导致 AI 的推理失败率指数级上升。


3、案例实践:从主动监测到策略突围


SVG 验证的实际防御效果,并非只停留在实验室测试阶段,而是已在多个高频遭遇重度 AI 攻击的业务场景中完成实战验证。

  • 实战场景:某大型线上交互平台的高强度攻防对抗

该平台遭遇黑产针对性的自动化破解工具攻击后,传统验证形式在面对大规模自动化攻击时,防御压力骤增。极验后台监测数据显示:

上线SVG验证(12月24日)后,攻击通过请求大幅下降,对比常规验证(24日前),攻击量级平均下降55%

  • 策略应用:从 “常规设防” 到 “SVG 突围”

针对常规验证方案拦截效果持续下降的情况,极验立即触发高级防护策略。

SVG 动态验证作为备用防御方案紧急上线,凭借实时代码生成、非图片化呈现的特性,市面上现有的通用破解脚本和识别模型当即失效。

监测数据显示,在 24 日 SVG 策略上线后的极短时间内,整体攻击量级实现了 55% 的断崖式下降。



图13:实战监测(24 日上线前后数据):当常规防线遭遇通过率异常的高强度突破时,SVG 动态验证作为备用策略紧急介入,自动化攻击量直降 55%,迅速重塑防御壁垒。


03 不是替代,而是策略储备


无论是滑块、点选还是九宫格,极验现有的 8 种验证形式在当前绝大多数业务场景中,依然具备极高的安全性和体验优势。


图14:极验在SVG之前8大可配置的行为验证形式


极验的策略从来不是“赌”某一种形式能一劳永逸,SVG 验证是极验验证矩阵中的一种策略储备

我们不主张所有业务默认启用 SVG 验证,它真正的价值体现在应对极端、高烈度的攻防博弈场景,SVG 验证将凭借其动态生成、多路径交互和高逻辑门槛,在以下关键时刻为业务提供一道坚硬防线:


业务面临高强度、定制化 AI 攻击时


场景示例:顶流演唱会抢票 / 限量发售在这种“千军万马过独木桥”的瞬间,黑灰产往往提前准备好了自动化脚本,普通的验证形式在针对性训练的视觉识别模型面前,极易被毫秒级秒杀。SVG 的作用:通过“逻辑推理”强制拉长 AI 的交互时间。面对每秒上万次的并发请求,SVG 的复杂交互能让 AI 陷入“思考泥沼”,从而把宝贵的库存留给真人用户。


常规验证被突破,接口遭到批量滥用时场景示例:营销活动被“薅羊毛”或短信接口遭轰炸


当你发现营销资金(优惠券、红包)瞬间被领光,或者短信预算被莫名消耗,说明市面上可能出现了针对通用验证形式的低成本破解工具。SVG 的作用:作为“特种兵”紧急顶上。由于 SVG 是实时代码生成,市面上的通用脚本工具无法识别这种全新的、非图片的验证形式,能迅速切断黑产的自动化链路,立即止损。


黑灰产不计成本地训练专用模型时

场景示例:高价值游戏 / 金融账号被撞库
对于价值极高的账户,黑产愿意花费更高的成本去采集你的验证码图片,训练一个专门针对你业务的 YOLO 视觉模型。
SVG 的作用:SVG 的图形是“代码即时渲染”的,没有固定的图库可供采集。黑产会发现每一次生成的图形逻辑、结构都在变,根本无法构建稳定的训练集,导致“破解成本”远高于“盗号收益”。

然而,图形本身的复杂度只是第一道门槛,要应对体系化的攻击,关键在于后端多维度技术的组合与协同。


SVG 动态验证之所以强大,不仅因为它在台前展示了复杂的图形交互,更因为它植根于极验幕后的全栈防御体系之中:

  • 环境感知层

动态 JS 挑战与环境探测在验证交互加载的同时,系统会发起异步的 JS 挑战。通过对前端环境的静默扫描,实时评估当前终端的可信度。无论是隐藏的自动化框架(如 Selenium、Puppeteer)、模拟器,还是群控设备的指纹特征,都将在这一层被精准识别并拦截,确保交互发生在真实的客户端环境中。


  • 行为分析层

在用户进行 SVG 交互的短短 2 秒内,极验的决策引擎不仅在判断“题做得对不对”,更在分析操作轨迹、时序逻辑和响应一致性等多维信号,精准识别屏幕背后究竟是真实的“人”,还是伪装的“自动化脚本”。


end:在不确定的时代,给业务确定性的安全


有人问,AI 还会继续进化吗?答案是肯定的。

未来的验证形式会变成什么样?也许会更隐形,也许会更智能。

但在当下,极验希望传递给行业的是:我们不需要神化 AI 的攻击能力,也不必对安全前景感到悲观。

AI 不会让人机对抗终结,只会推动它向更深处演进,SVG 验证的推出,仅仅是我们探索 AI 时代新防御范式的开始。

未来,随着大模型推理能力与 Agent 自动化技术的持续演进,极验也将同步深化对 AI 原生对抗的研究,在每一个急速变化的时代节点,都能为客户提供超前一步、高度确定的安全选项。

人机对抗的下半场才刚刚开始,极验始终在场。


体验与交流

我们为关注前沿对抗技术的同仁提供了一个 SVG 验证的演示入口,您可在此亲身体验其交互逻辑与对抗设计。

👉 [点击这里,体验 SVG 验证 Demo]

我们已在此方向完成工程化探索与部署,这不是未来蓝图,而是可验证的现在进行时。

Start your free trial
Over 320,000 websites and mobile apps worldwide are protected by GeeTest captcha