0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA一种先进的深度学习方法可用于对图像进行编辑

NVIDIA英伟达企业解决方案 来源:未知 作者:李倩 2018-05-09 16:43 次阅读

NVIDIA研究团队研发出了一种先进的深度学习方法,可用于对图像进行编辑,或对有空白或像素缺失的受损图像进行重建。

应用该方法,研究人员能够通过先清除内容再填充所产生的空白这样的操作,对图像进行编辑。这个“图像修复”的过程,可灵活应用于图片编辑软件中,用以移除不需要的内容,同时用计算机生成的逼真图像进行填充。

“我们的模型能够很好地处理任何形状、大小、位置、或与图像边界的任意距离的空白,之前的深度学习方法主要集中于图像中心的矩形区域,且通常依赖成本颇高的后期处理,”NVIDIA研究人员在其研究报告中指出。“此外,我们的模型能够更好地处理更大的空白区域。”

为准备训练其神经网络,团队首先生成了55116个任意形状和大小的随机条纹和空白。他们还生成了近25000个条纹和空白用于测试。根据其相对于输入图像的大小,这些均被进一步分为六类,以期提高图像重建的准确性。

生成的用于训练的蒙版示例

使用NVIDIA Tesla V100 GPU和cuDNN加速的PyTorch深度学习框架,团队通过将生成的蒙版应用于来自ImageNet、Places2和CelebA-HQ数据集的图像,对神经网络进行训练。

在训练阶段,将空白或缺失部分引入上述数据集的完整训练图像中,使网络能够学会重建缺失的像素。

在测试阶段,将未应用于训练期间的不同空白或缺失部分引入数据集中的测试图像,以对图像重建的准确性进行无偏验证。

最新AI成像技术重建照片示例

研究人员表示,当前基于深度学习的图像修复方法成效有限,因为针对丢失像素的输出必然取决于为找出丢失像素而必须提供给神经网络的输入值。这就会导致图像中出现诸如颜色差异和模糊等伪像。

为解决这一问题,NVIDIA团队开发了一种方法,确保了丢失像素的输出不再有赖于为这些像素提供的输入值。此方法采用了“部分卷积”层,可根据其相应感受野(receptive field)的有效性,对每个输出进行“重新规格化”,确保输出值不依赖于每个感受野中缺失像素的值。该模型基于通过这些部分卷积实施的UNet架构而构建。使用一组能够将特征损失、以及风格损失与VGG模型相匹配的损失函数,可对模型进行训练,以生成逼真的输出。

因此,“该模型胜过早前的方法,”NVIDIA研究团队表示。

NVIDIA研究人员表示, “据我们所知,我们首次证实了针对不规则形状空白进行深度学习图像修复模型的有效性,”

研究人员还在其论文中(Image Inpainting for Irregular Holes Using Partial Convolutions,还提及了他们可应用相同的框架来处理图像超分辨率任务。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4978

    浏览量

    102988
  • 图像
    +关注

    关注

    2

    文章

    1083

    浏览量

    40449
  • 深度学习
    +关注

    关注

    73

    文章

    5500

    浏览量

    121111

原文标题:PS新神器:NVIDIA全新AI成像技术重建效果逼真的照片

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    什么是深度学习?使用FPGA进行深度学习的好处?

    ) 来解决更复杂的问题,深度神经网络是一种将这些问题多层连接起来的更深层网络。这称为深度学习。目前,深度
    发表于 02-17 16:56

    一种随机的人工神经网络学习方法

    针对复杂网络环境下网络流监测(分类)问题,为实现多个类别直接分类以及提高学习方法的训练速度,提出了一种随机的人工神经网络学习方法。该方法借鉴平面高斯(PG)神经网络模型,引入随机投影思
    发表于 12-05 15:26 0次下载

    模型驱动深度学习的标准流程与学习方法解析

    模型驱动的深度学习方法近年来,深度学习在人工智能领域系列困难问题上取得了突破性成功应用。
    的头像 发表于 01-24 11:30 4920次阅读
    模型驱动<b class='flag-5'>深度</b><b class='flag-5'>学习</b>的标准流程与<b class='flag-5'>学习方法</b>解析

    一种模糊森林学习方法

    针对随机森林学习方法训练数据时存在的过拟合问题,通过改进各决策节点的决策函数设计一种模糊森林学习方法。利用高斯隶属度函数构建决策树上各节点的决策函数,将确定决策路径转换为模糊决策路径。根据样本从根
    发表于 02-23 11:09 1次下载

    一种新型分割图像中人物的方法,基于人物动作辨认

    图像分割的方法是先对物体进行检测,然后用边界框对画中物体进行分割。最近,例如Mask R-CNN的
    的头像 发表于 04-10 15:02 5655次阅读
    <b class='flag-5'>一种</b>新型分割<b class='flag-5'>图像</b>中人物的<b class='flag-5'>方法</b>,基于人物动作辨认

    一种可以编辑图像或重建已损坏图像深度学习方法

    为了解决这个问题,NVIDIA团队开发了一种方法,确保丢失像素的输出不依赖于为这些像素提供的输入的值。这种方法使用个“部分卷积”层,根据其对相应的接受域(receptive fiel
    的头像 发表于 04-26 15:19 5463次阅读

    Abacus展示了一种用于深度学习的新方法的技术

    与1月份的最后次重大公告样,该公司还展示了一种用于深度学习的新
    的头像 发表于 07-22 10:26 5040次阅读

    深度讨论集成学习方法,解决AI实践难题

    集成学习方法先进的机器学习方法,这类方法训练多个学习器并将它们结合起来解决
    发表于 08-16 11:40 774次阅读
    <b class='flag-5'>深度</b>讨论集成<b class='flag-5'>学习方法</b>,解决AI实践难题

    深度学习图像分割的方法和应用

    介绍使图像分割的方法,包括传统方法深度学习方法,以及应用场景。 基于人工智能和深度
    的头像 发表于 11-27 10:29 3169次阅读

    深度学习:四利用少量标注数据进行命名实体识别的方法

    整理介绍四利用少量标注数据进行命名实体识别的方法。 面向少量标注数据的NER方法分类 基于规则、统计机器学习
    的头像 发表于 01-03 09:35 1w次阅读
    <b class='flag-5'>深度</b><b class='flag-5'>学习</b>:四<b class='flag-5'>种</b>利用少量标注数据<b class='flag-5'>进行</b>命名实体识别的<b class='flag-5'>方法</b>

    图像分割的方法,包括传统方法深度学习方法

    许多计算机视觉任务需要对图像进行智能分割,以理解图像中的内容,并使每个部分的分析更加容易。今天的图像分割技术使用计算机视觉深度
    的头像 发表于 01-08 14:44 9311次阅读

    一种多粒度融合的模糊规则系统图像特征学习算法

    大规模的数据,且通常被视汋黑盦模型,解释性较差。针对上述挑战,以基于模糊规则推理的TSK模糊系统(TSK-FS)为基础,提出了一种用于不同规模数据集且易于理解的特征学习方法多粒度
    发表于 03-31 14:04 9次下载
    <b class='flag-5'>一种</b>多粒度融合的模糊规则系统<b class='flag-5'>图像</b>特征<b class='flag-5'>学习</b>算法

    一种基于块对角化表示的多视角字典对学习方法

    字典学习作为一种高效的特征学习技术被广泛应用于多视角分类中。现有的多视角字典学习方法大多只利用多视角数据的部分信息,且只
    发表于 04-20 14:04 1次下载

    使用深度学习方法对音乐流派进行分类

    电子发烧友网站提供《使用深度学习方法对音乐流派进行分类.zip》资料免费下载
    发表于 02-08 10:02 1次下载
    使用<b class='flag-5'>深度</b><b class='flag-5'>学习方法</b>对音乐流派<b class='flag-5'>进行</b>分类

    深度学习中的无监督学习方法综述

    深度学习作为机器学习领域的个重要分支,近年来在多个领域取得了显著的成果,特别是在图像识别、语音识别、自然语言处理等领域。然而,
    的头像 发表于 07-09 10:50 683次阅读