【极验黑科技】文生图大模型在极验人机对抗领域的应用

2023-05-09 15:10:08 • 10 min read

【极验黑科技】文生图大模型在极验人机对抗领域的应用

2023-05-09 15:10:08 • 10 min read

文生图模型原理

图片生成过程中存在的一些问题和解决办法

2.1 准确性

2.2 可控性

2.3 规模性

文生图大模型的人机对抗的实践应用

结语

Start your free trial

Over 320,000 websites and mobile apps worldwide are protected by GeeTest captcha

支持灵活可视化配置、科学模拟测试

极验 • 2 min read

极验荣登2024铸基计划服务全景图及解决方案集

极验 • 2 min read

如何在享受流量红利的同时，有效防范黄牛的侵蚀？

极验 • 2 min read

WUHAN JIYI NETWORK TECHNOLOGY CO., LTD.

武汉极意网络科技有限公司

鄂ICP备12016193号-1

增值电信业务经营许可证鄂 B2-20170058

【极验黑科技】文生图大模型在极验人机对抗领域的应用

【极验黑科技】文生图大模型在极验人机对抗领域的应用

文生图模型原理

图片生成过程中存在的一些问题和解决办法

2.1 准确性

2.2 可控性

2.3 规模性

文生图大模型的人机对抗的实践应用

结语

热门文章：

【极验黑科技】文生图大模型在极验人机对抗领域的应用

【极验黑科技】文生图大模型在极验人机对抗领域的应用

Neural style transfer 原理图

将“语意理解”与“Neural style transfer”相结合而得出的新的验证过程

专利号：ZL 201830130077.X

随着大规模文生图模型已经成熟，极验也在技术前沿探索，并将新技术进一步应用到人机对抗领域，今天我们主要分享一下这方面的相关过程和进展，以及一些实验数据。

文生图模型原理

文生图模型是一种多模态深度学习模型，它可以从文本描述生成与描述相匹配的图像。其核心原理是将自然语言文本转换为图像空间，同时将视觉特征与语言信息相互联系起来，以实现自然语言文本与图像之间的映射。

文生图模型通过大量成对的文本描述和相应图像的数据集进行训练。在训练过程中，模型学习从文本中提取相关特征，并将它们映射到图像中相应的视觉特征。这个过程涉及到语义理解和图像合成。

一旦模型训练完成，它就可以用于从它以前没有见过的新文本描述中生成图像。为此，模型首先将文本描述编码为一个特征向量，然后使用生成器网络合成与该特征向量相对应的图像。

文生图模型可用于各种应用，例如为电子商务网站生成真实的产品图像，为残障人士创建视觉辅助工具，为虚拟和增强现实应用程序生成图像以及验证码图片素材的制作。

图片生成过程中存在的一些问题和解决办法

图片的生成过程，主要面临着图片的准确性、可控性、规模性三方面。

2.1 准确性

大部分开源预训练模型是基于英文构建的，翻译的过程中会产生歧义，从而产生图文不匹配的情况。

第一张图为某文生图模型demo展示的效果，原因是“起重机”被翻译成了“Crane”，而这个单词的另一个含义是“仙鹤”。

下面这张图，我们将模型更换为卡通风格，提示词依然是(electric, mouse)。这次很“幸运”，同时集齐了歧义和敏感两个要素。

2.2 可控性

敏感素材以及公平和偏见的问题，这类问题可以通过safety-checker解决一部分，但无法杜绝，可以考虑通过如下方式进行规避：

1）数据采集：在训练模型之前，需要使用多样化的数据集来确保生成的图像不具有偏见或歧视。数据集应包括各种背景、文化和种族的人物和场景，以确保生成的图像不会出现偏见或歧视。

3）监督和审核：在模型训练和图像生成过程中，需要进行人工审核和监督，以确保生成的图像符合伦理和道德标准。审核人员应该接受适当的培训，以了解文化敏感性和歧视问题，并对可能引起争议的图像进行审查。

4）避免敏感主题：为了避免潜在的歧视问题，可以避免生成与种族、性别、宗教、政治或其他敏感主题相关的图像。

5）公开透明：需要公开透明地展示如何训练模型、使用数据集和进行审核，以便公众和业内人士能够了解这些技术的使用和潜在影响。

2.3 规模性

大批量素材生成涉及到计算资源投入产出比问题，以及后续gpu资源的调度和扩展。这里我们有三个诉求：

1）模型服务化，尤其是涉及到大模型，必然会存在gpu的调用，这部分资源在云上成本比较高。

2）在初期，为了把控一次性投入，希望既能使用到gpu资源又能按量付费，避免昂贵的月租，提高资源利用率。

3）模型服务代码量尽可能小，且便于横向扩展。

为此我们基于Ray和K8s构建了如下的模型服务：

通过上图所示架构，我们可以以最小的代码量来部署一个模型服务，这部分以后有机会可以展开说明。

文生图大模型的人机对抗的实践应用

以上图片均为文生图大模型AI自动化生成，并在线上得到应用的场景

结语

那么，前面介绍了我们在文生图大模型的投入，效果如何呢？我们将在下一期的文章中介绍：

1、文生图大模型的实际对抗数据分享

2、文生图大模型的验证防破解优势

我们下期再见～

热门文章：

扫一扫关注

极验微信公众号