0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于GANs的新型自拍卡通化方法

nlfO_thejiangme 来源:lq 2019-05-06 09:57 次阅读

刚刚假期归来的你,一定在手机里存了美美的自拍。如果可以把这些自拍变成卡通效果的美照,在朋友圈里一定会独树一帜。

这样的画风比起自拍多了些艺术的气息。但是要实现高质量的卡通艺术p图没有一定的美术基础很难做出令人满意的效果。那近日,来自京东AI研究院的研究人员们提出了一种基于GANs的新型自拍卡通化方法,在保证五官和面部表情细节的前提下,通过三种不同的损失函数将自拍像转换为高质量的卡通化图像。相比于传统方法在细节和保留和局部纹理的抽象上都有了大幅度的提升。卡通化的自拍在日常生活中一直有着很大的需求。人们可以将卡通化的自拍作为社交网络的头像,在彰显个性的同时也在一定程度上保护隐私。此外在在线游戏和艺术海报、插画设计中也十分重要。但高质量的卡通化自拍需要画师花费大量的时间,如何高效的生成高质量的自拍图像成为摆在研究人员面前需要解决的问题。对于这个问题,目前的方法主要分为两类。传统方法主要基于草图抽取的方法,并基于一定的颜色和形状后处理来生成卡通化自拍,这种方法在很多拍照app中广泛使用。谷歌应用商店里就有许许多多类似的应用。

但这些方法常常需要人类工程师精心设计算法,对于不同的风格都需要进行特殊的算法设计和调整,同时在细节方面与插画师还有很大距离。这些方法一般通过人脸识别分割出五官位置,随后利用卡通的渲染方法或特殊滤波器来对图像处理得到卡通化图像。虽然这些方法可以在手机上实现实时处理,但他们对于面部的细节保持和图像抽象还不完善。近年来深度学习的发展给出了新的解决方案。神经风格迁移(Neural Style Transfer,NST)可以将风格图像的风格迁移到内容图像中去。但通用的NST在应用于卡通化时缺乏针对性的风格化能力。另一种基于生成对抗网络的方法通过对抗的方法来实现图像域迁移,研究人员们相继提出了pix2pix、Bicycle等方法将图像从一个域映射到另一个域中。然而其最大的缺点在于需要大量的配对数据来实现训练,这对于很多图像迁移任务来说很不现实。为了解决这一问题,研究人员们又开发出了CycleGAN和UNIT等非监督的域迁移方法来使用非配对数据训练模型。对于图像卡通化,CartoonGAN、DAGAN等模型已经进行了很多有益的探索,但在捕捉图像细节、特别是对于自拍图像生成高质量结果方面还存在很多问题。如何尽可能的保留面部特征细节同时保持艺术作品的风格化是研究人员们需要解决的问题。针对自拍卡通化任务,目前主要面临三个挑战:缺乏针对人类自拍像以及对应卡通像的公开数据集;如何保留卡通化风格,包括内容的抽象和纹理特征的简化;最后在生成卡通像时,如何保持最主要的面部轮廓特征,同时又要避免引入大量无用的细节问题?

Selfie Cartoonization GANs

为了解决这一问题,研究人员基于GAN的架构和循环注意力损失提出了针对自拍像卡通化的架构scGANs,充分利用了注意力对抗网络来强化面部特定区域同时忽视低层次的纹理细节。模型的架构如下图所示:

架构图中显示了自拍到卡通的训练过程,省略了卡通到自拍的过程。

生成器首先将自拍转换为手绘卡通图像,最后另一个生成器又将生成的手绘卡通转换会自拍照。对于卡通图像来说也基于同样的过程来训练模型。考虑到卡通图像的纹理特征和数据集的大小,模型中使用了Unet的架构,可以更好的保证面部及五官的边缘特征。判别器则使用了基于图像片的方法,不仅需要判别卡通形式的对抗损失,在模型的另一方面训练中还需要判断真实图像的对抗损失。除了对抗损失外研究人员在这一架构中加入了三项新的损失,分别是注意力循环损失、总变分损失和感知损失。受到cycleGAN中循环连续损失的启发,研究人员提出了注意力循环损失来引导生成更好的生成面部的主要细节。例如眼影、瞳孔、鼻翼、嘴角等。针对这些面部区域网络给予更多的注意。在这一工作中,研究人员利用人脸识别方法标记出了4个区域,分别是完整自拍、眼睛、鼻子和嘴。针对每个区域设置对应的权重来构造损失。

此外由于卡通图像具有高度简化的特征和均匀的颜色,需要在像素级损失上进行引导。研究人员观察到画师的作品(左)仅仅在边缘具有较大的梯度变化,而大多数区域中梯度变化较小。生成的图像则全局都具有杂乱的梯度场。

从上面的梯度图中可以看出,要生成高质量的卡通化自拍,还需要在保持主要边缘梯度的情况下移除其他区域的提出。所以研究人员提出了总变分作为损失来最小化合成图像与手绘图像间的梯度差,这一方法可以很好的移除脸颊处的阴影,更精确的刻画鼻子。最后为了保留输出图像中的空间结构和内容特征,研究人员利用VGG中conv4_4层来计算生成图像与对应图像间的感知损失。最后的损失函数如下所示:

为了训练模型,研究人员通过谷歌图片搜索利用关键词搜索了3524张肖像照,同时从在线绘画商店中下载了手绘、水彩和动漫等不同风格共计4580张卡通图像。通过训练后,下图是与目前几种基于深度学习方法的对比:

最后一列是本文提出的方法

可以看到这种方法在整体上优于目前的深度学习方法。NST虽然保留了面部细节但无法有效学习风格特征,cartoonGAN生成的效果则无法保留原始图像中的内容信息,特别是眼部特征丢失严重。UNIT和cycleGAN的效果稍好,但是在脸颊、嘴和鼻子等位置还有很多令人不满意的地方。下表是本文方法的感知评断得分表,明显好于其他几种方法:

研究人员随后还对三种损失进行了消融性分析。下图中的be没有加总变分损失tv,而cf则加入了总变分损失。可以看到加入损失后眼线更加清晰、脸颊也更加平滑无影。这对于现实情况中复杂的光照和背景十分有用。

对于注意力循环和感知损失的消融性分析,可以看到在只使用循环损失时效果并不好,而加入了注意力循环损失后五官的生成质量得到了提升,感知损失同时保留了更多低层级的重要特征(眉毛和唇色)。

最后让我们在来体会下各种卡通的自拍照吧,看看动漫的头像:

或者来个水彩风格:

今天开工了,给自己换个美丽的头像好好加油啊!!


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像
    +关注

    关注

    2

    文章

    1086

    浏览量

    40492
  • 函数
    +关注

    关注

    3

    文章

    4333

    浏览量

    62706
  • 数据集
    +关注

    关注

    4

    文章

    1208

    浏览量

    24726

原文标题:假期归来,安利一款玩转自拍的黑科技给你:基于GANs的新型自拍卡通化方法

文章出处:【微信号:thejiangmen,微信公众号:将门创投】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    自拍不再困难 Stikbox手机壳变身自拍

    【路之遥电子网】无论你多么支持自拍杆,你都难以抵抗这件酷炫的集合自拍杆、手机壳和支架为一体的手机配件的魅力。乍眼一看,Stikbox不过是一款普通的手机壳,背后附有一根光滑可伸缩的铝管条。然而,如果
    发表于 12-21 15:05

    城会玩?!现代显示器第一届全民创意自拍大赛正式开启

    在这个自拍风靡的时代,谁还没两张自拍照啊。,除了以往的美、艳、帅、趣,有越来越多人加入了自己的巧思,让自拍照变换出无穷创意。登山者爬到山顶自拍,飞行员在几千米的高空
    发表于 01-11 08:05

    吓死人的自拍神器——手臂自拍

    来自设计师Justin Crowe等人的创意,整个结构和风靡一时的自拍杆类似,只是,这货看上去就像是一只手,而你在用它自拍的时候,成片的效果,也就像是你握着某人拍下的照,满满的bigger than
    发表于 03-22 21:41

    【ELF灵翼自拍无人机测评】之开箱整体测评

    无处不在了,今天这里主要为大家介绍一款新型可用于自拍的无人机--ELF(灵翼)迷你自拍无人机。ELF(灵翼)无人机是由恩孚电子研发的,恩孚电子是一家致力于自拍无人机和开源硬件的创新主导
    发表于 05-06 01:29

    自拍无人机来袭 无人机能否颠覆自拍市场

    随着现在互联网的发展,玩转社交平台已经是大家生活中必不可少的一部分,然而这其中最常见的可能就是自拍了,从最早的大头照到半身照,从剪刀手到45度仰望天空,人们审美眼光也在提高,不同的自拍需求也就
    发表于 06-23 14:16

    基于CSU8DL3510的自拍防丢器设计

    低功耗技术的推出,一颗纽扣电池就能工作一年,使蓝牙防丢器成为不二选择。本文介绍一种基于芯海CSU8DL3510的蓝牙4.0防丢器方案,该设计还附带自拍功能。1、系统方案2、详细设计a、防丢功能的实现
    发表于 08-09 09:31

    基于蓝牙技术的自拍杆设计

    蓝牙技术的蓝牙自拍杆可以进行远距离拍照,不用担心因为线材等因素的约束,且本方案无需专门的手机APP,可直接使用系统内的蓝牙连接。该方案在开发、测试、使用操作阶段都较简单且操作迅速,能够适用大部分
    发表于 11-26 06:48

    基于嵌入式芯片的自拍神器自拍

    曾几何时,自拍杆风靡世界。火当然是有原因的,这么一个小装备,极大的满足了人们爱拍照的需求,方便好用、经济实惠。恰巧我手上也有一个,收起来时很小、不占地方打开后可随意调节拍照同时它有个隐藏式三脚架功能
    发表于 10-27 17:07

    使用 MSPM0 MCU 设计单轴和三轴自拍

    目前市场上有两种主要的自拍杆产品:单轴自拍杆和三轴自拍杆。自拍杆如何保证手机的拍摄稳定性?摄影师手抖会导致一轴或三轴自拍杆抖动,
    发表于 04-12 14:02

    CP卡通讯介绍

    CP卡通讯介绍常用CP卡安装使用介绍~~~~~
    发表于 06-08 15:13 4次下载

    张艺兴教你玩自拍 御用“自拍神器”大曝光

    最近张艺兴热搜不断,前有全新蜡像亮相北京杜莎夫人蜡像馆,后有出席品牌活动现场自拍狂圈粉,这只热爱自拍的“小绵羊”,颜值与镜头感真是没得说,粉丝通通拜倒在他的“羊毛”下。不过你要知道,自拍就是“三分天
    发表于 09-11 17:12 884次阅读

    GANs之父”被爆已从Google离职,不知 GoodFellow下一站又将转投何处?

    Ian Goodfellow 是 Yoshua Bengio 的得意弟子,因提出了生成对抗网络(GANs),即用生成式模型和判别式模型进行对抗并实现机器学习训练的过程,也因此被誉为“GANs之父”。
    的头像 发表于 04-04 15:58 5797次阅读

    GANs领域值得深入研究的七个问题,让我们得以窥视GANs未来的发展走向

    如果样本中的元素被模型设置了0概率,那么惩罚将会变成无穷大!而GANs则通过间接的方式设置0概率,惩罚将会缓和的多。另一个方法来自于归一化流(normalized flows),研究人员认为这是对于特定函数的一种低效表达,但目前对于这一领域还没有深入的研究。讨论完流模型后
    的头像 发表于 04-22 14:26 5552次阅读

    谷歌采用GANs与神经网络打造图像压缩新算法

    还在为图像加载犯愁吗? 最新的好消息是,谷歌团队采用了一种GANs与基于神经网络的压缩算法相结合的图像压缩方式HiFiC,在码率高度压缩的情况下,仍能对图像高保真还原。
    的头像 发表于 09-14 09:26 2102次阅读

    生成对抗网络(GANs)的原理与应用案例

    生成对抗网络(Generative Adversarial Networks,GANs)是一种由蒙特利尔大学的Ian Goodfellow等人在2014年提出的深度学习算法。GANs通过构建两个
    的头像 发表于 07-09 11:34 1083次阅读