0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AIGC时代的ImageNet!百万生成图片助力AI生成图片检测器研发

CVer 来源:CVer 2023-07-04 15:53 次阅读

1 引言:

在这个AIGC爆发的时代,人人都可以利用AI算法生成高质量的文本,图像,音频内容。其中,由Midjourney, Stable Diffusion等图像生成方法制作的图像,其逼真程度让人赞叹。人眼已经难以对其真假进行区分了。这不禁唤起了人们的隐忧:大量虚假图片将会在互联网上广泛传播。虚假图片的泛滥会引发多种社会安全问题。例如,虚假新闻会扰乱社会秩序,混淆视听。恶意的人脸图片造假则会引发金融欺诈,造成信任危机。例如,下图为Midjourney生成的特朗普被捕图片。这类图片在社交媒体上广泛传播,对政治领域造成了不良影响。因此,对这些AI生成的图像进行有效监管是非常有必要的。

cc0de970-1828-11ee-962d-dac502259ad0.jpg

图2 AI生成的特朗普被捕图片,来源于https://news.sina.com.cn/c/2023-04-15/doc-imyqmchz0199110.shtml

考虑到人眼已经难以对真假图片进行区分,我们急需一种AI生成图像检测器以区分AI制作的图像和真实的图像。然而,现在大规模数据集的缺失妨碍了检测器的开发。因此,我们提出了百万量级的GenImage数据集,致力于构建AIGC时代的ImageNet。

2 数据集介绍:

cc65a674-1828-11ee-962d-dac502259ad0.jpg

表1 虚假图片检测数据集概览

过去业界也有推出一些数据集。他们主要有三个特点。第一个是数据规模小,第二个是都是基于GAN的,第三个是局限于人脸数据。随着时间推移,数据规模慢慢地在增加,生成器也从GAN时代过渡到Diffusion时代,数据的范围也在增加。但是一个大规模的,以Diffusion模型为主的,涵盖各类通用图像的数据集仍然是缺失的。

基于此,我们提出一个对标imagenet的genimage数据集。真实的图片采用了ImageNet。虚假的图片采用ImageNet的标签进行生成。我们利用了八个先进的生成器来生成,分别是Midjourney, Stable Diffusion V1.4, Stable Diffusion V1.5, ADM, GLIDE, Wukong,VQDM和BigGAN。这些生成器生成的图片总数基本与真实图片一致。每个生成器生成的图片数量也基本一致。每一类生成的图片数量基本一致。

这个数据集具有以下优势:

1. 大量的数据:超过百万对图片对。

2. 丰富的图片内容:利用ImageNet进行构建,具有丰富的标签
3. 先进的生成器:覆盖Midjourney, Stable Diffusion等Diffusion生成器。

在真实世界中检测器往往会遇到各种各样的困难。我们经过实验发现,检测器往往在两种情况下性能下降严重。第一种是面对训练集中未出现的生成器生成的图片时。第二种是面对退化的图像。例如,CNNSpot在Stable Diffusion V1.4上训练后,在Midjourney上测试仅有52.8的准确率。当训练和测试生成器同为Stable Diffusion V1.4,在面对模糊的图像时,CNNSpot准确率仅仅为77.9。基于此,我们在这个数据集基础上对检测器提出两个挑战:

1. 交叉生成器:检测器在一种生成器生成的数据上训练,在其他生成器生成的数据上验证。这个任务目的是考察检测器在不同生成器上的泛化能力。

2. 退化图像识别:检测器需要对于低分辨率,模糊和压缩图像进行识别。这个任务主要考察检测器在真实条件(如互联网上传播)中面对低质量图像时的泛化问题。

我们相信这个数据集的提出将大大有助于人们开发AI生成图片检测器。

3 实验:

我们做了一些实验来考察这个数据集,我们发现在某个生成器上训练的ResNet-50模型在其他的测试准确率会明显降低。然而在真实情况下我们难以得知遇到的图像的生成器是什么。因此检测器对于不同生成器生成图片的泛化能力很重要。

cc9d592a-1828-11ee-962d-dac502259ad0.jpg

表2 使用ResNet 50在不同生成器上交叉验证

我们对比了现有方法在Stable Diffusion V1.4上训练,然后在各种生成器上测试的结果,见图3。我们也评测了各种生成器上训练,然后在各种生成器上测试的结果。见图4。图4中,Testing Subset那一列中的每一个数据点,都是在八个生成器上训练,然后在一个生成器上测试得到的平均结果。然后我们将这些测试集上的结果平均,得到最右侧的平均结果。

cccf86d4-1828-11ee-962d-dac502259ad0.jpg

表3 在Stable Diffusion V1.4上训练,不同测试集上测试

cce87dce-1828-11ee-962d-dac502259ad0.jpg

表4 在不同生成器上训练,不同测试集上测试

我们对测试集进行退化处理,采用不同参数下的低分辨率,JPEG压缩和高斯模糊,评测结果如下

cd47e6b0-1828-11ee-962d-dac502259ad0.jpg

表5 在不同退化图像上验证结果

那么采集这么多数据是不是有用呢?我们做了相关实验,证明通过提升数据类比和每类的图片数量,我们是可以提高性能的。

cd8a9c3a-1828-11ee-962d-dac502259ad0.jpg

表6 提升图片数量的结果

针对GenImage数据集对于不同图片的泛化能力,我们发现他对于人脸和艺术类图片也能达到很好的效果。

cdb835f0-1828-11ee-962d-dac502259ad0.jpg

表7 泛化到艺术类和人脸类图片的结果

cdf037de-1828-11ee-962d-dac502259ad0.jpg

图3 测试所用的艺术类和人脸类图片展示

4 展望

随着AI生成图片能力的不断提升,对于AI生成的图片实现有效检测的需求将会越来越迫切。本数据集致力于为真实环境下的生成图片检测提供有效训练数据。我们使用ResNet-50在本数据集中训练,然后在真实推文中进行检测。如下图4,ResNet-50能够有效识别真图和假图。这个结果证明了GenIamge可以用于训练模型以判别真实世界的虚假信息。我们认为,该领域未来值得努力的方向是不断提升检测器在GenImage数据集上的准确率,并进而提升其在真实世界面对虚假信息的能力。

ce1fd2a0-1828-11ee-962d-dac502259ad0.jpg

图4.1 真实推文展示(真图)

ce5e4cd8-1828-11ee-962d-dac502259ad0.jpg

图4.2 真实推文展示(假图)

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 检测器
    +关注

    关注

    1

    文章

    860

    浏览量

    47655
  • 数据集
    +关注

    关注

    4

    文章

    1205

    浏览量

    24650
  • AIGC
    +关注

    关注

    1

    文章

    358

    浏览量

    1515

原文标题:AIGC时代的ImageNet!百万生成图片助力AI生成图片检测器研发

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    LABVIEW怎么生成图片,然后调用图片

    ,然后把这个图片保存起来,以便别的地方调用。六个输入项中,第一个是分类选择,因为这种分子式结构一共有6类。1.第一个的分类选择,是为了选结构形式,如下一共有六种:2.选择完参数后 生成图片如下:3.把
    发表于 12-08 11:21

    改进的基于混沌理论的检测器生成算法

    为提高抗体的生成速度,依据人工免疫系统的混沌特性,提出一种基于混沌方法的新的检测器生成算法,利用混沌的遍历性,并结合信息论中熵的概念来产生均匀的初始检测器集合,利
    发表于 12-25 12:45 17次下载

    基于VC++的生成公章图片的简易工具

    学习VC也没多久,将我做的这个小工具和大家分享一下。其主要功能就是可以自定义生成公章图形并保存为bmp图片,希望对大家有点用。具体实现的方法如下: 步骤一:生成
    发表于 10-29 11:56 19次下载

    DTFM信号生成检测 (2)

    本文介绍DTFM信号生成检测之二,DTMF检测器实现。
    发表于 03-11 13:15 1446次阅读
    DTFM信号<b class='flag-5'>生成</b>与<b class='flag-5'>检测</b> (2)

    16、24、32全套字库图片生成应用程序软件免费下载

    本文档的主要内容详细介绍的是16、24、32全套字库图片生成应用程序软件免费下载。
    发表于 09-19 16:04 19次下载
    16、24、32全套字库<b class='flag-5'>图片</b><b class='flag-5'>生成</b>应用程序软件免费下载

    电子印章图片生成器的应用程序免费下载

    本文档的主要内容详细介绍的是电子印章图片生成器的应用程序免费下载。
    发表于 07-03 08:00 334次下载
    电子印章<b class='flag-5'>图片</b><b class='flag-5'>生成</b>器的应用程序免费下载

    如何使用TensorFlow Hub的ESRGAN模型来在安卓app中生成超分图片

    从一张低分辨率的图片生成一张对应的高分辨率图片的任务通常被称为单图超分(Single Image Super Resolution - SISR)。尽管可以使用传统的插值方法(如双线性
    的头像 发表于 11-26 09:40 3474次阅读

    条件生成对抗模型生成数字图片的教程

    这次我们在上次的例子中在提升一下,这次我们选用条件生成对抗模型(Conditional Generative Adversarial Networks)来生成数字图片
    的头像 发表于 12-10 18:36 729次阅读

    AIGC最新综述:从GAN到ChatGPT的AI生成历史

    本调查全面回顾了生成模型的历史、基本组件、AIGC 从单模态交互和多模态交互的最新进展。我们从单峰性的角度介绍了文本和图像的生成任务和相关模型。我们从多模态的角度来介绍上述模态之间的交叉应用。最后,我们讨论了
    的头像 发表于 03-13 10:13 2742次阅读

    GTC 2023主题直播:使用Picasso服务构建图片和视频生成式模型

    我们很高兴Getty Images将使用Picasso服务构建Edify图片和Edify视频生成式模型。
    的头像 发表于 03-22 11:31 844次阅读
    GTC 2023主题直播:使用Picasso服务构建<b class='flag-5'>图片</b>和视频<b class='flag-5'>生成</b>式模型

    智慧有数 浪潮信息发布生成AI存储解决方案

    与管理瓶颈,浪潮信息在"数智未来"AIGC数据应用创新论坛上,正式发布面向生成AI的存储解决方案,该方案以极致融合、极致性能、极致节能,和热温冷冰四级数据全生命周期管理,助力开启
    的头像 发表于 07-11 09:46 408次阅读

    IBM 谢东:IBM watsonx 助力生成AI 的企业应用

    ,企业在探索利用生成AI 促进自身业务发展时所面临的挑战以及应对措施。 以下是他的发言摘要: IBM 全球副总裁、IBM 大中华区首席技术官 谢东 (图片来源:2023 中国 AIGC
    的头像 发表于 09-06 18:20 590次阅读
    IBM 谢东:IBM watsonx <b class='flag-5'>助力</b><b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b> 的企业应用

    AIGC与传统内容生成的区别

    AIGC(Artificial Intelligence Generated Content,人工智能生成内容)与传统内容生成在多个方面存在显著区别。以下是对这两者的对比: 一、数据类型与处理
    的头像 发表于 10-25 15:13 296次阅读

    AIGC生成内容的优势与挑战

    人工智能生成内容(AIGC,Artificial Intelligence Generated Content)是指利用人工智能技术自动生成文本、图像、音频和视频等内容的过程。随着深度学习、自然语言
    的头像 发表于 10-25 15:36 343次阅读

    AIGC与传统内容生成的区别 AIGC的优势和挑战

    AIGC(Artificial Intelligence Generated Content,生成内容)与传统内容生成在多个方面存在显著区别,同时AIGC也展现出其独特的优势和面临的挑
    的头像 发表于 11-22 16:04 157次阅读