0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种可以编辑图像或重建已损坏图像的深度学习方法

DPVg_AI_era 来源:未知 作者:李倩 2018-04-26 15:19 次阅读

英伟达的研究人员发布了一种可以编辑图像或重建已损坏图像的深度学习方法,实现了一键P图,而且“毫无ps痕迹”。通过使用“部分卷积”层,该方法优于其他方法。

计算机视觉研究领域,NVIDIA常常让人眼前一亮。

比如“用Progressive Growing的方式训练 GAN,生成超逼真高清图像”,“用条件 GAN 进行 2048x1024 分辨率的图像合成和处理”的pix2pixHD项目,或者脑洞大开的让晴天下大雨、小猫变狮子、黑夜转白天的“无监督图像翻译网络”(Unsupervised Image-to-Image Translation Networks)。

近日,NVIDIA在arXiv放出一篇今年ICLR的论文,同样很厉害。论文题为“Image Inpainting for Irregular Holes Using Partial Convolutions”,即使用“Partial Convolutions”进行图像修复。

视频中左侧的操作界面,只需用工具将图像中不需要的内容简单涂抹掉,哪怕形状很不规则,NVIDIA的模型能够将图像“复原”,用非常逼真的画面填补被涂抹的空白。可谓是一键P图,而且“毫无ps痕迹”。

该研究来自Nvidia的Guilin Liu等人的团队,他们发布了一种可以编辑图像或重建已损坏图像的深度学习方法,即使图像穿了个洞或丢失了像素。这是目前state-of-the-art的方法。

该方法还可以通过移除图像中的某些内容,并填补移除内容后造成的空白,从而实现编辑图像。

这个过程叫做“image inpainting”,可以在图片编辑软件中实现去除不需要的内容,同时用计算机生成的逼真的替代方式填补空白。

图:被遮盖的图像,及使用基于部分卷积的网络得到的修复结果

“我们的模型可以很好地处理任何形状、大小、位置或距离图像边界任何距离的空白。以前的深度学习方法主要集中在位于图像中心附近的矩形区域,并且通常需要依赖成本很高的后期处理。“英伟达的研究人员在他们的研究报告中写道,“此外,我们的模型能够很好地处理越来越大的空白区域。”

为了训练神经网络,研究团队首先生成了55116个随机色条、形状和大小任意的masks,用于训练。他们还生成了25000个图像用于测试。为了提高重建图像的精度,研究人员根据相对于输入图像的大小,将这些训练图像进一步分为6类。

图:一些用于测试的masks

使用NVIDIATeslaV100GPU和cuDNN加速的PyTorch深度学习框架,该团队通过将生成的mask应用在ImageNet数据集Places2和CelebA-HQ两个数据集的图像,训练其神经网络。

图:ImageNet上的测试结果对比

图:Place2数据集上的测试结果对比

在训练阶段,将空白或缺失的部分引入上述数据集的完整训练图像中,以使网络能够学习重建缺失的像素。

在测试阶段,另一批没有在训练期间使用的空白或缺失部分被引入数据集里的测试图像,以对重建的图像的精度进行无偏验证。

图:基于典型卷积层的结果(Conv)和“部分卷积”层的结果(PConv)对比

研究人员表示,现有的基于深度学习的图像修复方法不够好,因为丢失像素的输出必然取决于输入的值,而这些输入必须提供给神经网络,以找出丢失的像素。这就导致图像中出现诸如颜色差异或模糊之类的artifacts。

为了解决这个问题,NVIDIA团队开发了一种方法,确保丢失像素的输出不依赖于为这些像素提供的输入的值。这种方法使用一个“部分卷积”层,根据其对相应的接受域(receptivefield)的有效性,对每个输出进行重新归一化(renormalization)。这种重新归一化可以确保输出值与每个接受域中缺失像素的值无关。

该模型是利用这些部分卷积实现的UNet架构构建的。使用一组损失函数,匹配VGG模型的特征损失以及风格损失,进而训练模型以产生逼真的输出。

表:各种不同方法的结果对比

研究团队称,该模型优于以前的方法。

“据我们所知,我们是第一个在不规则形状的孔洞上展示深度学习图像修复模型效果的人,”NVIDIA的研究人员说。

研究人员还在论文中提及,相同的框架也可以用来处理图像超分辨率任务。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4762

    浏览量

    100517
  • 图像
    +关注

    关注

    2

    文章

    1083

    浏览量

    40410
  • 深度学习
    +关注

    关注

    73

    文章

    5491

    浏览量

    120958

原文标题:震撼!英伟达用深度学习做图像修复,毫无ps痕迹

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    通过深度学习图像三维物体重建研究方案

    假设 为物体的多张RGB图片。三维重建可以总结为学习预测算子的过程,输入
    发表于 02-13 09:31 742次阅读

    讨论纹理分析在图像分类中的重要性及其在深度学习中使用纹理分析

    地执行基于纹理特征的分类任务。为了让深度学习在基于纹理的数据上更好地工作,需要有一种方法可以图像中提取纹理特定的特征,并将其传递给全连接
    发表于 10-26 16:57

    基于深度图像重建Matlab代码

    本文档内容介绍了基于深度图像重建Matlab代码,供网友参考。
    发表于 09-15 10:03 21次下载
    基于<b class='flag-5'>深度图像</b><b class='flag-5'>重建</b>Matlab代码

    单帧图像重建方法

    针对小波域超分辨率方法重建图像存在的模糊效应,提出一种结合离散小波变换( DWT)、平稳小波变换(SWT)和非局部平均(NLM)的单帧图像
    发表于 02-02 15:06 1次下载
    单帧<b class='flag-5'>图像</b><b class='flag-5'>重建</b><b class='flag-5'>方法</b>

    基于邻域特征学习的单幅图像超分辨重建

    针对图像重建过程中待插值点灰度估计不准确的问题,提出一种基于邻域特征学习的单幅图像超分辨回归分析方法
    发表于 02-07 15:59 1次下载
    基于邻域特征<b class='flag-5'>学习</b>的单幅<b class='flag-5'>图像</b>超分辨<b class='flag-5'>重建</b>

    一种新型分割图像中人物的方法,基于人物动作辨认

    图像分割的方法是先对物体进行检测,然后用边界框对画中物体进行分割。最近,例如Mask R-CNN的深度学习方法也被用于
    的头像 发表于 04-10 15:02 5606次阅读
    <b class='flag-5'>一种</b>新型分割<b class='flag-5'>图像</b>中人物的<b class='flag-5'>方法</b>,基于人物动作辨认

    NVIDIA一种先进的深度学习方法可用于对图像进行编辑

    研究人员表示,当前基于深度学习图像修复方法成效有限,因为针对丢失像素的输出必然取决于为找出丢失像素而必须提供给神经网络的输入值。这就会导致图像
    的头像 发表于 05-09 16:43 4676次阅读

    到底谁可以产生更好的图像修复结果?什么是图像修补?

    在自动识别方法中:排名第的是深度学习方法-基于生成的图像修复方法。但这不是
    的头像 发表于 10-18 14:27 1.2w次阅读

    使用多孔卷积神经网络解决机器学习图像深度不准确的方法说明

    针对在传统机器学习方法下单幅图像深度估计效果差、深度值获取不准确的问题,提出了一种基于多孔卷积神经网络(ACNN)的
    发表于 10-30 14:58 10次下载
    使用多孔卷积神经网络解决机器<b class='flag-5'>学习</b>的<b class='flag-5'>图像</b><b class='flag-5'>深度</b>不准确的<b class='flag-5'>方法</b>说明

    深度学习图像分割的方法和应用

    介绍使图像分割的方法,包括传统方法深度学习方法,以及应用场景。 基于人工智能和深度
    的头像 发表于 11-27 10:29 3130次阅读

    详解深度学习图像分割

    基于人工智能和深度学习方法的现代计算机视觉技术在过去10年里取得了显著进展。如今,它被用于图像分类、人脸识别、图像中物体的识别、视频分析和分类以及机器人和自动驾驶车辆的
    的头像 发表于 01-06 15:50 3657次阅读

    图像分割的方法,包括传统方法深度学习方法

    许多计算机视觉任务需要对图像进行智能分割,以理解图像中的内容,并使每个部分的分析更加容易。今天的图像分割技术使用计算机视觉深度学习模型来理解
    的头像 发表于 01-08 14:44 9278次阅读

    一种多粒度融合的模糊规则系统图像特征学习算法

    大规模的数据,且通常被视汋黑盦模型,解释性较差。针对上述挑战,以基于模糊规则推理的TSK模糊系统(TSK-FS)为基础,提出了一种适用于不同规模数据集且易于理解的特征学习方法多粒度融合的模糊规则系统
    发表于 03-31 14:04 9次下载
    <b class='flag-5'>一种</b>多粒度融合的模糊规则系统<b class='flag-5'>图像</b>特征<b class='flag-5'>学习</b>算法

    一种改进的基于LRC-SNN的图像重建与识别算法

    图像集分类算法种类较多,但多数存在运算繁琐、计算成本高和时效性差的问题。为此,提出一种改进的图像重建与识别算法,利用线性回归分类和共享最近邻子空间分类理论进行
    发表于 04-01 10:28 4次下载
    <b class='flag-5'>一种</b>改进的基于LRC-SNN的<b class='flag-5'>图像</b><b class='flag-5'>重建</b>与识别算法

    一种无需训练的深度电阻抗图像重建方法

    近日,记者从中国科学技术大学获悉,该校杜江峰院士领衔的中科院微观磁共振重点实验室刘东研究员等,提出了一种无需训练的深度电阻抗图像重建方法
    的头像 发表于 02-21 09:57 1045次阅读