0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种利用两个轻型的卷积神经网络来学习获取任意迁移矩阵的方法

nlfO_thejiangme 来源:未知 作者:李倩 2018-08-31 11:16 次阅读

艺术风格转换算得上是AI最有趣的应用之一了,你可以将梵高的名画风格添加到自己的照片中,也可以个自己的头像来一幅映像派的油画。它同时处理风格图像和内容图像来进行合成,使得生成的结果在保持了内容的前提下获得了风格图像的质感与美学特征。但目前的算法模型实现比较庞大,同时会消耗很大的计算资源,在一定程度上限制了人工智能对于美的创造。

近日,来自英伟达的研究人员与加州大学默塞德分校的研究人员们共同提出了一种新的风格迁移算法,不仅大幅提高了风格迁移的效率,同时实现了任意图片的风格转换,这使得AI对于图像的创造迈向了更广阔的天地。

对于提供的随机图片,这一算法可以将参考图片中的任意风格进行抽取并基于内容图片进行合成输出。近来的任意风格转换算法主要通过内容图片特征与预先计算得到的转化矩阵相乘。但这些算法十分消耗计算,同时合成的图像有时也不尽如人意。为了解决这些问题,研究人员们从理论上得到了迁移矩阵的表达形式,并给出了一种利用两个轻型的卷积神经网络来学习获取任意迁移矩阵的方法,这种基于学习的迁移矩阵可以通过不同层次的风格损失来控制,在保持内容图像的情况下灵活地结合多层次风格。同时,算法的实现具有很高的效率。

这一工作的主要贡献在于以下三个方面:

1.提出了一种线性迁移的通用方法,其优化过程同时可以最小化风格重建损失;

2.提出了一种速度高达140fps的迁移矩阵学习方法,可灵活的在单一迁移矩阵中结合多层次风格,并在迁移过程中保持内容特征;

3.基于上述灵活性,这一方法可以广泛用于包括美学风格迁移、视频图像实际风格迁移以及领域迁移等很多任务中。

在这一研究中,研究人员提出的模型包括两个前向卷积网络、一个对称的编码、解码图像重建结构以及迁移学习模块和损失模块等四个部分。

其中编码器和解码器主要用于重建输入的图像,事先训练好后就固定下来作为网络的基础用于后续的训练过程。(编码器用于抽取输入图像中的特征,分别对内容和风格图像提取特征图Fc,Fs,而解码器则用于从抽取重建图像。)

迁移模块主要包含了两个小卷积网络,用于从前面的编码器输出中抽取特征,并输出迁移矩阵T. 随后图像迁移通过内容图像与迁移矩阵的线性乘法来实现,随后利用解码其重建合成图像。在网络的最后,一个与训练并固定的VGG-19网络用于计算多层次的风格损失以及内容损失。整个网络是纯粹的前向传播卷积神经网络,对于GPU的运算十分友好,可以实现高达140fps的高效率风格迁移。

在网络中,只有蓝色的压缩和解压模块,以及绿色的迁移单元是可以学习的,而其他的模块都是固定的。

研究人员先从理论上探讨了风格转换、学习转换矩阵的模型、高效计算的模型以及无损风格转换的表达。对于风格转换来说,其目标就是最小化迁移后的特征Fc和期望的虚拟特征phis之间的中心协方差,所以风格损失函数可以写为下面的形式:

但绝对值中的两项差为0时可以实现最小化。同时可以利用线性约束和分解计算出风格迁移矩阵T,

其主要用内容和特征图像的特征的协方差决定的。为了计算出T,需要选择合适的模型来进行学习。

T矩阵是由内容和风格图像共同决定的,研究人员认为一种可能的方法便是利用神经网络同时将输入的两张图像转换为C*C的T矩阵输出。在这一工作中,主要利用了两个相互隔离的CNNs来实现。为了获取这一输出,其输入包含了三种不同的形式:内容和风格图像、内容和风格特征图、内容和风格特征图的协方差。下图是三种不同输入的情况下的风格转换结果,可以看到将编码器特征图的协方差作为全连接输入进行风格迁移的效果更好:

研究人员选择了利用协方差来生成C*C的中间矩阵,随后得到T矩阵。首先T矩阵与输入的维数不相干,并在不同分辨率下保持一致。同时需要全连接层在卷积的顶部进行处理。利用协方差作为模型的输出将对更一般地风格迁移得到更好的结果。

为了实现高效的模型,研究人员们将以往算法中耗时的矩阵分解工作用前向网络代替,将耗时的计算从GPU中移除。研究显示T可以通过CNNs模块和一个全连接层方便的训练得到。同时利用学习的方法得到了包含多层次特征单个T矩阵。T可以通过与不同风格重建损失的结合来实现丰富的表达。

基于线性迁移的风格转换还具有较强的内容保留特性,通过这种特性和浅层自编码器,可以实现较好的无失真图像迁移。保证了在风格迁移的过程中内容图像的内容不会产生畸变。

在深入研究了各个方面后,研究人员按照前述的架构构建了神经网络,并在不同任务上进行了验证。其数据集来自于MS-COCO和WikiArt进80000张图像。利用Pytorch在TitanXP上训练需要约2小时。下图是本文提出算法与不同算法的比较结果:

其中视频和照片的实际场景风格迁移,将拍摄到的图像迁移到期望的场景中区,具有十分广阔的应用,这将会生成更为有效的滤镜和产品

研究人员表示这将给内容生产者提供更多的创意,并将在实际生活中产生更多有趣的应用,将周围的场景实时渲染成期望的样子。

最后,研究人员们还验证了这种方法在不同领域间迁移的有效性。通过将Cityscapes中的图像作为风格图,GTA游戏场景数据中的图作为内容图,并利用在Cityscapes上训练的PSPNet来进行语义风格。研究结果显示,进行风格迁移后的图像具有比原图更好的语义分割效果。

这也为低成本获取语义分割数据集训练提供了可行的手段。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 编码器
    +关注

    关注

    45

    文章

    3562

    浏览量

    133912
  • 神经网络
    +关注

    关注

    42

    文章

    4732

    浏览量

    100374
  • 英伟达
    +关注

    关注

    22

    文章

    3707

    浏览量

    90601

原文标题:NVIDIA研究人员提出新的风格迁移算法,可大幅提高风格迁移的效率,同时实现任意图片的风格转换

文章出处:【微信号:thejiangmen,微信公众号:将门创投】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    非局部神经网络,打造未来神经网络基本组件

    ,非局部运算将某处位置的响应作为输入特征映射中所有位置的特征的加权和进行计算。我们将非局部运算作为高效、简单和通用的模块,用于获取
    发表于 11-12 14:52

    【PYNQ-Z2试用体验】神经网络基础知识

    神经网络的计算。对于多层多节点的神经网络,我们可以使用矩阵乘法表示。在上面的神经网络中,我们将权重作为
    发表于 03-03 22:10

    基于赛灵思FPGA的卷积神经网络实现设计

    ,看下 FPGA 是否适用于解决大规模机器学习问题。卷积神经网络一种深度神经网络 (DNN)
    发表于 06-19 07:24

    卷积神经网络卷积的处理过程

    。本文就以卷积神经网络为例谈谈怎么步优化卷积神经网
    发表于 12-23 06:16

    卷积神经网络模型发展及应用

    十余年来快速发展的崭新领域,越来越受到研究者的关注。卷积神经网络(CNN)模型是深度学习模型中最重要的一种经典结构,其性能在近年来深度学习
    发表于 08-02 10:39

    卷积神经网络简介:什么是机器学习

    列文章将只关注卷积神经网络 (CNN)。CNN的主要应用领域是输入数据中包含的对象的模式识别和分类。CNN是一种用于深度学习的人工神经网络
    发表于 02-23 20:11

    一种卷积神经网络和极限学习机相结合的人脸识别方法_余丹

    一种卷积神经网络和极限学习机相结合的人脸识别方法_余丹
    发表于 01-08 11:20 0次下载

    一种改进的基于卷积神经网络的行人检测方法

    为了在行人检测任务中使卷积神经网络(CNN)选择出更优模型并获得定位更准确的检测框,提出一种改进的基于卷积神经网络的行人检测
    发表于 12-01 15:23 0次下载
    <b class='flag-5'>一种</b>改进的基于<b class='flag-5'>卷积</b><b class='flag-5'>神经网络</b>的行人检测<b class='flag-5'>方法</b>

    卷积神经网络的主要两个特征

    卷积神经网络(CNN)是一种目前计算机视觉领域广泛使用的深度学习网络,与传统的人工神经网络结构不同,它包含有非常特殊的
    的头像 发表于 05-04 18:24 1.3w次阅读

    卷积神经网络三大特点

    一种基于图像处理的神经网络,它模仿人类视觉结构中的神经元组成,对图像进行处理和学习。在图像处理中,通常将图像看作是二维矩阵,即每个像素点都
    的头像 发表于 08-21 16:49 5303次阅读

    卷积神经网络层级结构 卷积神经网络卷积层讲解

    卷积神经网络层级结构 卷积神经网络卷积层讲解 卷积神经网络
    的头像 发表于 08-21 16:49 7197次阅读

    卷积神经网络的介绍 什么是卷积神经网络算法

    的深度学习算法。CNN模型最早被提出是为了处理图像,其模型结构中包含卷积层、池化层和全连接层等关键技术,经过多个卷积层和池化层的处理,CNN可以提取出图像中的特征信息,从而对图像进行分类。
    的头像 发表于 08-21 16:49 1783次阅读

    卷积神经网络训练的是什么

    、训练过程以及应用场景。 1. 卷积神经网络的基本概念 1.1 卷积神经网络的定义 卷积神经网络
    的头像 发表于 07-03 09:15 298次阅读

    卷积神经网络分类方法有哪些

    卷积神经网络(Convolutional Neural Networks,CNN)是一种深度学习模型,广泛应用于图像分类、目标检测、语义分割等计算机视觉任务。本文将详细介绍
    的头像 发表于 07-03 09:40 353次阅读

    卷积神经网络的实现原理

    、训练过程以及应用场景。 卷积神经网络的基本原理 1.1 卷积操作 卷积神经网络的核心是卷积操作
    的头像 发表于 07-03 10:49 469次阅读