一种可以编辑图像或重建已损坏图像的深度学习方法-电子发烧友网

英伟达的研究人员发布了一种可以编辑图像或重建已损坏图像的深度学习方法，实现了一键P图，而且“毫无ps痕迹”。通过使用“部分卷积”层，该方法优于其他方法。

在计算机视觉研究领域，NVIDIA常常让人眼前一亮。

比如“用Progressive Growing的方式训练 GAN，生成超逼真高清图像”，“用条件 GAN 进行 2048x1024 分辨率的图像合成和处理”的pix2pixHD项目，或者脑洞大开的让晴天下大雨、小猫变狮子、黑夜转白天的“无监督图像翻译网络”（Unsupervised Image-to-Image Translation Networks）。

近日，NVIDIA在arXiv放出一篇今年ICLR的论文，同样很厉害。论文题为“Image Inpainting for Irregular Holes Using Partial Convolutions”，即使用“Partial Convolutions”进行图像修复。

在视频中左侧的操作界面，只需用工具将图像中不需要的内容简单涂抹掉，哪怕形状很不规则，NVIDIA的模型能够将图像“复原”，用非常逼真的画面填补被涂抹的空白。可谓是一键P图，而且“毫无ps痕迹”。

该研究来自Nvidia的Guilin Liu等人的团队，他们发布了一种可以编辑图像或重建已损坏图像的深度学习方法，即使图像穿了个洞或丢失了像素。这是目前state-of-the-art的方法。

该方法还可以通过移除图像中的某些内容，并填补移除内容后造成的空白，从而实现编辑图像。

这个过程叫做“image inpainting”，可以在图片编辑软件中实现去除不需要的内容，同时用计算机生成的逼真的替代方式填补空白。

图：被遮盖的图像，及使用基于部分卷积的网络得到的修复结果

“我们的模型可以很好地处理任何形状、大小、位置或距离图像边界任何距离的空白。以前的深度学习方法主要集中在位于图像中心附近的矩形区域，并且通常需要依赖成本很高的后期处理。“英伟达的研究人员在他们的研究报告中写道，“此外，我们的模型能够很好地处理越来越大的空白区域。”

为了训练神经网络，研究团队首先生成了55116个随机色条、形状和大小任意的masks，用于训练。他们还生成了25000个图像用于测试。为了提高重建图像的精度，研究人员根据相对于输入图像的大小，将这些训练图像进一步分为6类。

图：一些用于测试的masks

使用NVIDIATeslaV100GPU和cuDNN加速的PyTorch深度学习框架，该团队通过将生成的mask应用在ImageNet数据集Places2和CelebA-HQ两个数据集的图像，训练其神经网络。

图：ImageNet上的测试结果对比

图：Place2数据集上的测试结果对比

在训练阶段，将空白或缺失的部分引入上述数据集的完整训练图像中，以使网络能够学习重建缺失的像素。

在测试阶段，另一批没有在训练期间使用的空白或缺失部分被引入数据集里的测试图像，以对重建的图像的精度进行无偏验证。

图：基于典型卷积层的结果（Conv）和“部分卷积”层的结果（PConv）对比

研究人员表示，现有的基于深度学习的图像修复方法不够好，因为丢失像素的输出必然取决于输入的值，而这些输入必须提供给神经网络，以找出丢失的像素。这就导致图像中出现诸如颜色差异或模糊之类的artifacts。

为了解决这个问题，NVIDIA团队开发了一种方法，确保丢失像素的输出不依赖于为这些像素提供的输入的值。这种方法使用一个“部分卷积”层，根据其对相应的接受域（receptivefield）的有效性，对每个输出进行重新归一化（renormalization）。这种重新归一化可以确保输出值与每个接受域中缺失像素的值无关。

该模型是利用这些部分卷积实现的UNet架构构建的。使用一组损失函数，匹配VGG模型的特征损失以及风格损失，进而训练模型以产生逼真的输出。

表：各种不同方法的结果对比

研究团队称，该模型优于以前的方法。

“据我们所知，我们是第一个在不规则形状的孔洞上展示深度学习图像修复模型效果的人，”NVIDIA的研究人员说。

研究人员还在论文中提及，相同的框架也可以用来处理图像超分辨率任务。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4787

浏览量
101373
图像

图像

+关注

关注
2

文章
1090

浏览量
40612
深度学习

深度学习

+关注

关注
73

文章
5523

浏览量
121718

原文标题：震撼！英伟达用深度学习做图像修复，毫无ps痕迹

文章出处：【微信号：AI_era，微信公众号：新智元】欢迎添加关注！文章转载请注明出处。

通过深度学习的图像三维物体重建研究方案

假设为物体的一张或多张RGB图片。三维重建可以总结为一个学习预测算子的过程，输入

发表于 02-13 09:31 •815次阅读

讨论纹理分析在图像分类中的重要性及其在深度学习中使用纹理分析

地执行基于纹理特征的分类任务。为了让深度学习在基于纹理的数据上更好地工作，需要有一种方法，可以从图像中提取纹理特定的特征，并将其传递给全连接

发表于 10-26 16:57

基于深度图像重建Matlab代码

本文档内容介绍了基于深度图像重建Matlab代码，供网友参考。

发表于 09-15 10:03 •21次下载

基于<b class='flag-5'>深度图像</b><b class='flag-5'>重建</b>Matlab代码

单帧图像重建方法

针对小波域超分辨率方法中重建图像存在的模糊效应，提出一种结合离散小波变换（ DWT）、平稳小波变换（SWT）和非局部平均（NLM）的单帧图像

发表于 02-02 15:06 •1次下载

单帧<b class='flag-5'>图像</b><b class='flag-5'>重建</b><b class='flag-5'>方法</b>

基于邻域特征学习的单幅图像超分辨重建

针对图像重建过程中待插值点灰度估计不准确的问题，提出一种基于邻域特征学习的单幅图像超分辨回归分析方法

发表于 02-07 15:59 •1次下载

一种新型分割图像中人物的方法，基于人物动作辨认

图像分割的一般方法是先对物体进行检测，然后用边界框对画中物体进行分割。最近，例如Mask R-CNN的深度学习方法也被用于

发表于 04-10 15:02 •5754次阅读

NVIDIA一种先进的深度学习方法可用于对图像进行编辑

研究人员表示，当前基于深度学习的图像修复方法成效有限，因为针对丢失像素的输出必然取决于为找出丢失像素而必须提供给神经网络的输入值。这就会导致图像

发表于 05-09 16:43 •4766次阅读

到底谁可以产生更好的图像修复结果？什么是图像修补？

在自动识别方法中：排名第一的是深度学习方法-基于生成的图像修复方法。但这不是

发表于 10-18 14:27 •1.2w次阅读

使用多孔卷积神经网络解决机器学习的图像深度不准确的方法说明

针对在传统机器学习方法下单幅图像深度估计效果差、深度值获取不准确的问题，提出了一种基于多孔卷积神经网络（ACNN）的

发表于 10-30 14:58 •10次下载

深度学习中图像分割的方法和应用

介绍使图像分割的方法，包括传统方法和深度学习方法，以及应用场景。基于人工智能和深度

发表于 11-27 10:29 •3272次阅读

详解深度学习之图像分割

基于人工智能和深度学习方法的现代计算机视觉技术在过去10年里取得了显著进展。如今，它被用于图像分类、人脸识别、图像中物体的识别、视频分析和分类以及机器人和自动驾驶车辆的

发表于 01-06 15:50 •3757次阅读

图像分割的方法，包括传统方法和深度学习方法

许多计算机视觉任务需要对图像进行智能分割，以理解图像中的内容，并使每个部分的分析更加容易。今天的图像分割技术使用计算机视觉深度学习模型来理解

发表于 01-08 14:44 •9395次阅读

一种多粒度融合的模糊规则系统图像特征学习算法

大规模的数据，且通常被视汋黑盦模型，解释性较差。针对上述挑战，以基于模糊规则推理的TSK模糊系统（TSK-FS）为基础，提出了一种适用于不同规模数据集且易于理解的特征学习方法—一多粒度融合的模糊规则系统

发表于 03-31 14:04 •9次下载

一种改进的基于LRC-SNN的图像重建与识别算法

图像集分类算法种类较多，但多数存在运算繁琐、计算成本高和时效性差的问题。为此，提出一种改进的图像重建与识别算法，利用线性回归分类和共享最近邻子空间分类理论进行

发表于 04-01 10:28 •4次下载

一种无需训练的深度电阻抗图像重建方法

近日，记者从中国科学技术大学获悉，该校杜江峰院士领衔的中科院微观磁共振重点实验室刘东研究员等，提出了一种无需训练的深度电阻抗图像重建方法

发表于 02-21 09:57 •1158次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

一种可以编辑图像或重建已损坏图像的深度学习方法

评论

通过深度学习的图像三维物体重建研究方案

讨论纹理分析在图像分类中的重要性及其在深度学习中使用纹理分析

基于深度图像重建Matlab代码

单帧图像重建方法

基于邻域特征学习的单幅图像超分辨重建

一种新型分割图像中人物的方法，基于人物动作辨认

NVIDIA一种先进的深度学习方法可用于对图像进行编辑

到底谁可以产生更好的图像修复结果？什么是图像修补？

使用多孔卷积神经网络解决机器学习的图像深度不准确的方法说明

深度学习中图像分割的方法和应用

详解深度学习之图像分割

图像分割的方法，包括传统方法和深度学习方法

一种多粒度融合的模糊规则系统图像特征学习算法

一种改进的基于LRC-SNN的图像重建与识别算法

一种无需训练的深度电阻抗图像重建方法