0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达的StyleGAN仅需小样本就可以做到图像到图像的转换!

DPVg_AI_era 来源:lq 2019-05-11 09:13 次阅读

前一阵子英伟达的StyleGAN可谓是火了一把,近日又出大招了!以往图像到图像转换需要大量的图像做训练样本,但是在英伟达的这项工作中,仅需小样本就可以做到图像到图像的转换(代码已开源)!

小样本,大成就!

当我们看到一只站着的老虎时,我们很容易想象出来它躺着的样子。

这是因为我们根据其它动物平躺的姿势就是可以做联想。

然而,对于机器来说就没有这么简单了。在现存的非监督图像到图像转换模型需要大量的训练图像。

不仅如此,一个模型能够转换图像的另一个前提是图像中的对象必须在训练集中存在。

近期,英伟达、康纳尔大学和阿尔托大学联合发表了一篇文章——小样本(few-shot)非监督图像到图像转换。

论文地址:

https://arxiv.org/pdf/1905.01723.pdf

简单来说,就是输入一只金毛,在训练过程当中,即便第一次看到一种新动物,也能让它像金毛那样吐舌头、闭嘴巴、歪头。

若是输入一张炒面的图,该模型也可以让其它食物变成炒面。

这项工作还提供了在线测试,新智元小编们便拿自家的猫主子“西瓜”和“多比”做了一下测试:

输入“西瓜”得到的结果

输入“多比”得到的结果

在线测试连接如下,读者们快快玩起来吧:

https://nvlabs.github.io/FUNIT/petswap.html

该项目的代码也已开源,地址如下:

https://github.com/NVlabs/FUNIT

FUNIT:2阶段图像转换,非常有趣!

我们提出的FUNIT框架旨在通过利用在测试时可用的几个目标类图像,将源类的图像映射到目标类的类似图像。

为了训练FUNIT,我们使用来自一组对象类(例如各种动物物种的图像)中的图像,称为源类(source classes)。我们不假设任何两个类之间存在配对的图像(即,不同物种的任何两个动物都不会是完全相同的姿势)。

我们使用源类里的图像来训练一个multi-class无监督图像到图像转换模型。

在测试过程中,我们从一个称为目标类(target class)的新对象类中提供少量几张图像。模型必须利用少量的目标图像来将源类里的任何图像转换为目标类里的类似图像。

图1

训练。训练集由各种对象类(源类)的图像组成。我们训练了一个模型在这些源对象类之间转换图像。

部署。我们向训练模型显示极少量目标类里的图像,这就足以将源类的图像转换为目标类的类似图像了,即使模型在训练期间从未见过目标类的任何图像。

需要注意的是,FUNIT生成器有两个输入:1)一个内容图像;2)一组目标类图像。它的目的是生成与目标类图像相似的输入图像的转换。

我们的框架由一个有条件的图像发生器G和一个多任务对抗性鉴别器D组成。

与现有无监督image-to-image translation框架中有条件的图像生成器不同,它们是将一张图像作为输入,而我们的生成器G需要同时将一张内容图像x和一组K类图像{y1, ..., yK}作为输入,生成输出图像x¯,公式如下:

实验结果:姿态和种类一起转换,超越基准模型

主要结果

如表1所示,FUNIT框架在Animal Faces和North American Birds两个数据集的所有性能指标都优于用于小样本无监督图像到图像转换任务的基线模型。

FUNIT在Animal Faces数据集的1-shot和5-shot设置上分别达到82.36和96.05 的Top-5 测试精度,以及在North American Birds数据集上分别达到60.19和75.75的Top-5 测试精度。

这些指标都明显优于相应的基准模型。

表1:FUNIT与基线模型的性能比较。↑表示数值越大越好,↓表示越小越好。

在图2中,我们对FUNIT-5计算的few-shot translation的结果进行了可视化。

图2:无监督图像-图像转换结果的可视化。计算结果采用FUNIT-5模型。

从上到下分别是来自动物面孔、鸟、花和食物数据集的结果。每个示例随机展示了2张目标类中的图像,输入内容图像x,以及转换后的输出图像x¯。

结果表明,模型能够成功地将源类的图像转换为新的类中的相似图像。对象在输入内容图像x和相应输出图像x¯中的姿态基本保持不变。输出图像也非常逼真,类似于目标类中的图像。

图3提供FUNIT与基线模型的结果比较。可以看到,FUNIT生成了高质量的图像转换输出。

图3:小样本图像到图像转换效果的比较。

从左到右的列分别是输入内容图像x,两个输入目标类图像y1,y2,来自不公平的StarGAN基线的转换结果,来自公平的StarGAN基线的转换结果,以及来自FUNIT框架的结果。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像
    +关注

    关注

    2

    文章

    1082

    浏览量

    40394
  • 代码
    +关注

    关注

    30

    文章

    4733

    浏览量

    68294
  • 英伟达
    +关注

    关注

    22

    文章

    3727

    浏览量

    90758

原文标题:一图生万物!英伟达推超强图像转换神器,小样本一秒猫变狗

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    英伟推出Eagle系列模型

    英伟最新推出的Eagle系列模型,以其1024×1024像素的高分辨率处理能力,重新定义了视觉信息处理的边界。该模型通过多专家视觉编码器架构,每个编码器专注于特定任务训练,极大地增强了图像理解的深度和广度。这一创新不仅提升了
    的头像 发表于 09-03 16:13 404次阅读

    DSP教学实验箱_数字图像处理操作_案例分享:5-13 灰度图像二值化

    一比较就可以了。 程序流程 程序流程设计中首先读取工程目录下的BMP图像,接着进行二值化处理,最后保存图像。 三、操作现象 实验设备 本实验所需硬件为实验板、仿真器、LCD和电源。 先来了解一下DSP
    发表于 07-25 15:03

    英伟TITAN AI显卡曝光,性能狂超RTX 409063%!# 英伟# 显卡

    显卡英伟
    jf_02331860
    发布于 :2024年07月24日 17:18:28

    FPGA设计经验之图像处理

    可以说是类似于CPU里面的Cache,但Cache不是你能完全控制的,但Block Ram是完全可控的,可以用它实现各种灵活的运算处理。这样FPGA通过缓存若干行图像数据就可以
    发表于 06-12 16:26

    请问CX3能否进行图像过滤?

    ;相等\" (有一定的灵活性)的图像。 这样,我们就可以减少 USB 3.0 管道的使用,同时节省主机应用程序的容量。 我们是否可以图像存储在 CX3 中,然后与新
    发表于 05-22 07:19

    【Longan Pi 3H 开发板试用连载体验】给ChatGPT装上眼睛,并且还可以语音对话:7,图像采集与物体识别

    图像采集与物体识别 上一篇中完成了所有音频相关的输入输出,先在要开始尝试视频的相关操作了。我们可以利用手机上的摄像头,将其变成一个网络摄像头,然后再在Longan Pi上获取图像就可以
    发表于 04-16 16:56

    算力市场掀起价格风暴 英伟A800租赁价跳水

    在这场价格风暴中,英伟A800的租赁价格跳水至2元/时,无疑成为了市场的焦点。
    的头像 发表于 04-03 16:43 2383次阅读

    针对激光雷达,Seyond图通与英伟达达成合作

    来源:激光雷达老炮,谢谢 编辑:感知芯视界 Link Seyond图通与英伟合作,正式入驻DriveWorks和Omniverse平台 今日,全球图像级激光雷达解决方案提供商Sey
    的头像 发表于 03-22 09:15 618次阅读

    图像采集卡的工作原理是什么?

    的工作原理是通过将模拟信号输入ADC(模数转换器)中,将其转换为数字信号,然后通过DMA(直接内存访问)技术将数据传输到计算机内存中。这样就可以实现对
    的头像 发表于 03-20 12:01 684次阅读
    <b class='flag-5'>图像</b>采集卡的工作原理是什么?

    英伟是哪个国家的品牌?

    英伟(NVIDIA)总部位于美国加利福尼亚州的圣荷西市。因此,可以英伟是一个美国的品牌。
    的头像 发表于 03-01 16:36 1.4w次阅读

    如何实现PIL和OpenCV之间图像数据的转换呢?

    PIL图像数据格式转换成OpenCV图像数据格式
    的头像 发表于 02-25 13:43 1139次阅读

    图像采集卡的工作原理及其与图像处理软件的区别介绍

    图像采集卡是一种用于将模拟图像信号转换号的设备。它在计算机视觉和图像处理领域中起着关键作用,被广泛应用于监控系统、医学影像、机器视觉等领域。图像
    的头像 发表于 01-10 16:35 881次阅读
    <b class='flag-5'>图像</b>采集卡的工作原理及其与<b class='flag-5'>图像</b>处理软件的区别介绍

    图像标注如何提升效率?

    图像标注是通过一定方式对图像进行标记分类,是对数据集的图像进行标记以训练机器学习模型的过程。当图像数量可控时,用人工标注就可以很快完成任务,
    的头像 发表于 12-19 08:29 434次阅读
    <b class='flag-5'>图像</b>标注如何提升效率?

    了解这些就可以搞懂 IGBT

    了解这些就可以搞懂 IGBT
    的头像 发表于 11-24 15:47 2922次阅读
    了解这些<b class='flag-5'>就可以</b>搞懂 IGBT

    #英伟 #显卡 英伟全新旗舰显卡RTX 5090性能暴涨70%

    显卡英伟
    深圳市浮思特科技有限公司
    发布于 :2023年11月20日 14:19:25