2026-02-03 16:00:31 • 10 min read
2026-02-03 16:00:31 • 10 min read
当 GPT-4o 等多模态大模型能够解析复杂的视觉语义、编写代码甚至理解视频时,一个焦虑的声音浮现:
传统的行为验证,是不是已经拦不住 AI 了?
作为长期处于人机对抗前沿的实战方,极验的答案很明确:
过去一年,我们始终关注 AI 技术的发展走向,诚然,AI agent在多模态识别领域取得显著突破,传统“看图识物”式验证形式面临前所未有的压力。
但极验认为,2026年人机对抗的核心,已从单一的“视觉识别”较量,升级为 “逻辑推理”、“交互深度”与“工程成本” 的综合博弈。
本文旨在分享极验在这一方向的深度思考与工程实践:SVG 动态验证。

图 1:极验视觉识别类验证形式・滑动拼图 —— 无需复杂推理,核心依赖基础视觉识别,同时包含轨迹行为数据

图 2:极验逻辑推理类验证形式・消消乐—— 区别于单纯的视觉识别,需结合交互顺序、逻辑关联完成
图 3:极验新增第九种验证形态・SVG动态验证 —— 依托逻辑推理与复杂交互设计,专门应对更特殊、极端的 AI 攻击场景
回顾刚刚过去的 2025 年,互联网业务安全领域出现了一个显著的分水岭:
AI 技术不再是实验室里的 demo,而已成为黑灰产开展攻击的标准化工具,广泛应用于各类业务场景。
通过一整年的行业攻防观察与实战对抗,我们发现AI 驱动下的黑产攻击已形成三大显著进化特征,正持续冲击企业现有安全防御体系:
人工智能对图形逻辑的理解能力,已经从“模糊识别”进化到了“深度理解”。
2025 年 10 月,美国第三方研究机构 Roundtable.ai 在其发布的最新测评报告 《Benchmarking LLMs on CAPTCHAs》 中,对Claude Sonnet 4.5(Anthropic)、Gemini 2.5 Pro(Google)和 GPT-5(OpenAI) 等多模态大模型进行了实测。
测试表明,新一代 AI 模型在处理主流验证码时具有极高的适应性。

图4: 各人工智能模型的总体成功率。Claude Sonnet 4.5 的成功率最高,达到 60%,其次是 Gemini 2.5 Pro,成功率为 56%,GPT-5 的成功率为 28%。

图5: 静态挑战呈现一个静态的 3x3 网格;动态刷新挑战会动态替换点击的图像;跨图块挑战使用一个 4x4 网格,对象可能跨越多个方格。表格显示了不同 CAPTCHA 类型的模型性能。由于成功率是在挑战级别而非试验级别计算的,因此其低于图 4 中的成功率
2025 年全球范围内的 “价格博弈”,拉低了黑产进入的门槛。
2025 年,以 DeepSeek 为代表的新生代力量与 OpenAI 及国内互联网巨头轮番下调 API 价格,将 AI 算力变成了随取随用的“自来水”:
DeepSeek 的“分位级”定价:2025 年初,DeepSeek V3 体系将百万 Token 的成本压低至 0.1 元人民币 左右。极低的价格让黑产在进行大规模自动化探测时,即便面临极高的封禁率,其经济损失也几乎可以忽略不计。
旗舰模型的“平民化”:OpenAI 在 2025 年对其最强推理模型 o3 降价 80%,并推出高性价比的 GPT-4.1 Mini。曾经昂贵的、涉及复杂逻辑推理的攻击任务,现在的执行成本仅为过去的五分之一。
国内大厂的持续下探:阿里巴巴、字节跳动在 2025 年相继推出大规模节省计划,部分模型降价幅度超过 80%。

图 6:路透社(北京)关于 2025 年全球 AI 模型 API 价格大幅下调的报道截图
在 2025 年 8 月的 USENIX Security 安全会议上,研究人员发布了通用验证码求解器 Halligan。
与以往针对特定类型(如文本或特定图像)的破解工具不同,Halligan 被定义为首个通用型视觉验证码求解器。
图 7:2025 年 8 月 USENIX Security 安全会议发布的首个通用型视觉验证码求解器 Halligan 相关论文截图结合2025年的实战攻防现状来看,在多模态大模型的加持下,黑灰产的工具箱确实完成了升级,但我们必须厘清一个核心误区:
“让 AI 看懂一张图”,并不等于“让 AI 成功通过一次验证”。
在极验内部的AI 自动化测试中,我们引入了业内主流的多模态大模型进行高强度对抗测试。
数据揭示了一个有趣的现象:
大模型在“视觉理解”上表现优异,但在“交互执行”上却频频碰壁。
我们在持续的对抗测试与攻防观察中发现:
即使是当前先进的多模态模型,在面对带有视觉残影、动态干扰或逻辑陷阱的图形时,仍会出现位置偏差、顺序误判等错误。这种像素级的误差,足以触发风控拦截。

图8:极验内部实验图--AI位置识别错误(偏了10多个像素),且图标识别不全
当验证指令不再是简单的“点击目标”,而是涉及多步排序、空间关联或抽象逻辑组合时,AI 的执行成功率会出现明显的“断崖式”下跌。
面对需要即时理解语义并完成逻辑闭环的任务,大模型的 Token 消耗和误判率会显著上升。行为验证的对抗核心,已正式从单纯的“视觉识别”转向深层的“交互理解”。
大模型的调用,消耗高、响应慢,与验证场景所需的秒级响应天然冲突:
大模型进行图像分析、逻辑推理到生成指令,往往需要数秒时间,而验证码要求毫秒级的响应。这种时间差,不仅暴露了机器特征,更让攻击者的 Token 成本和计算成本,远远高于其破解带来的收益。
而SVG 动态验证正是针对这种时间挑战下的有力手段。
.png)
图9:极验实测--主流大模型在面对 SVG 复杂逻辑时,通过效率呈断崖式下跌。其中 Claude sonnet 4 通过率低于 2%,Gemini 3 Pro 则低于 5%,且单次验证平均耗时高达 2 分钟,远超业务容忍极限。
这些观察指向一个结论:仅仅让 AI “看得懂”不够,更要让其“做不对、做不快、做不起”。
未来的对抗将是视觉干扰、交互逻辑、时间约束的三维叠加。
面对2025年新型AI攻击浪潮,我们需在验证形态上提前储备更高维的对抗能力。
而 SVG 动态验证,正是我们在这一方向上的核心实践成果。
SVG(Scalable Vector Graphics)动态验证并非简单替代现有形式,而是为极端攻击场景设计的一种“专属防御方案”。
SVG不仅是一种图形格式,在极验的安全体系中,它是一种能够承载高维对抗逻辑的技术形态,与传统的JPG/PNG 图片验证不同,SVG 动态验证具有天然的“反 AI”基因:
从学术视角看,大模型的视觉识别能力存在天然的 “空间逻辑短板”:擅长捕捉静态像素的固定规律,却极易在动态空间推理中陷入 “逻辑幻觉”。
极验在测试时针对主流多模态大模型的对抗测试中发现:
.gif)
从工程角度看,SVG 验证彻底解决了传统验证形式静态资产易被爬取、交互简单易被破解的通病,核心体现在三点:
最终实现让对抗从 “谁的素材库更全” 的素材博弈,升级为 “谁的算力能支撑多步逻辑和精准交互” 的算力博弈,大幅抬高 AI 的破解成本。

图11:SVG验证要求 AI 必须完成:视觉识别 - 语义理解 -空间推理 -路径规划 -模拟操作,每一个环节的增加,都会导致 AI 的推理失败率指数级上升。
SVG 验证的实际防御效果,并非只停留在实验室测试阶段,而是已在多个高频遭遇重度 AI 攻击的业务场景中完成实战验证。
该平台遭遇黑产针对性的自动化破解工具攻击后,传统验证形式在面对大规模自动化攻击时,防御压力骤增。极验后台监测数据显示:
上线SVG验证(12月24日)后,攻击通过请求大幅下降,对比常规验证(24日前),攻击量级平均下降55%
针对常规验证方案拦截效果持续下降的情况,极验立即触发高级防护策略。
SVG 动态验证作为备用防御方案紧急上线,凭借实时代码生成、非图片化呈现的特性,市面上现有的通用破解脚本和识别模型当即失效。
监测数据显示,在 24 日 SVG 策略上线后的极短时间内,整体攻击量级实现了 55% 的断崖式下降。

图13:实战监测(24 日上线前后数据):当常规防线遭遇通过率异常的高强度突破时,SVG 动态验证作为备用策略紧急介入,自动化攻击量直降 55%,迅速重塑防御壁垒。
无论是滑块、点选还是九宫格,极验现有的 8 种验证形式在当前绝大多数业务场景中,依然具备极高的安全性和体验优势。

图14:极验在SVG之前8大可配置的行为验证形式
极验的策略从来不是“赌”某一种形式能一劳永逸,SVG 验证是极验验证矩阵中的一种策略储备。
我们不主张所有业务默认启用 SVG 验证,它真正的价值体现在应对极端、高烈度的攻防博弈场景,SVG 验证将凭借其动态生成、多路径交互和高逻辑门槛,在以下关键时刻为业务提供一道坚硬防线:
场景示例:顶流演唱会抢票 / 限量发售在这种“千军万马过独木桥”的瞬间,黑灰产往往提前准备好了自动化脚本,普通的验证形式在针对性训练的视觉识别模型面前,极易被毫秒级秒杀。SVG 的作用:通过“逻辑推理”强制拉长 AI 的交互时间。面对每秒上万次的并发请求,SVG 的复杂交互能让 AI 陷入“思考泥沼”,从而把宝贵的库存留给真人用户。
当你发现营销资金(优惠券、红包)瞬间被领光,或者短信预算被莫名消耗,说明市面上可能出现了针对通用验证形式的低成本破解工具。SVG 的作用:作为“特种兵”紧急顶上。由于 SVG 是实时代码生成,市面上的通用脚本工具无法识别这种全新的、非图片的验证形式,能迅速切断黑产的自动化链路,立即止损。
场景示例:高价值游戏 / 金融账号被撞库
对于价值极高的账户,黑产愿意花费更高的成本去采集你的验证码图片,训练一个专门针对你业务的 YOLO 视觉模型。
SVG 的作用:SVG 的图形是“代码即时渲染”的,没有固定的图库可供采集。黑产会发现每一次生成的图形逻辑、结构都在变,根本无法构建稳定的训练集,导致“破解成本”远高于“盗号收益”。
然而,图形本身的复杂度只是第一道门槛,要应对体系化的攻击,关键在于后端多维度技术的组合与协同。
SVG 动态验证之所以强大,不仅因为它在台前展示了复杂的图形交互,更因为它植根于极验幕后的全栈防御体系之中:
动态 JS 挑战与环境探测在验证交互加载的同时,系统会发起异步的 JS 挑战。通过对前端环境的静默扫描,实时评估当前终端的可信度。无论是隐藏的自动化框架(如 Selenium、Puppeteer)、模拟器,还是群控设备的指纹特征,都将在这一层被精准识别并拦截,确保交互发生在真实的客户端环境中。
在用户进行 SVG 交互的短短 2 秒内,极验的决策引擎不仅在判断“题做得对不对”,更在分析操作轨迹、时序逻辑和响应一致性等多维信号,精准识别屏幕背后究竟是真实的“人”,还是伪装的“自动化脚本”。
有人问,AI 还会继续进化吗?答案是肯定的。
未来的验证形式会变成什么样?也许会更隐形,也许会更智能。
但在当下,极验希望传递给行业的是:我们不需要神化 AI 的攻击能力,也不必对安全前景感到悲观。
AI 不会让人机对抗终结,只会推动它向更深处演进,SVG 验证的推出,仅仅是我们探索 AI 时代新防御范式的开始。
未来,随着大模型推理能力与 Agent 自动化技术的持续演进,极验也将同步深化对 AI 原生对抗的研究,在每一个急速变化的时代节点,都能为客户提供超前一步、高度确定的安全选项。
人机对抗的下半场才刚刚开始,极验始终在场。
体验与交流
我们为关注前沿对抗技术的同仁提供了一个 SVG 验证的演示入口,您可在此亲身体验其交互逻辑与对抗设计。
极验
极验