0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于编码器-解码器的架构来从水下图像重建出清晰的图像

nlfO_thejiangme 来源:lq 2019-08-02 15:33 次阅读

水下图像在海洋研究和水下机器人领域都具有重要的应用,观察海洋生物、进行水下作业都需要清晰的图像。然而由于水的折射和水中悬浮颗粒的散射对光造成大幅度的衰减,同时水体的多样性也造成了水下图像的质量不尽如人意,很多视觉任务都会在质量较低的水下图像上失效。

来自德州农工大学的研究人员们提出了一种可以在多种水体条件下实现水下图像增强的方法。通过解耦水体种类与图像的内容特征,利用水体无关的内容特征来生成高质量的清晰图像,实现了多种水体通用的水下图像增强。通常水对于长波的光吸收比较强,所以水下的照片都会呈现出蓝色或者绿色的色调;同时不同水质中的微小颗粒也会在图像中引入一系列噪声。此外水下图像的分布由于水质的不同使得图像的分布比较广泛,不同水质中的图像有很大的差别,深海图像与浅水图像有着显著的差别。

要建立针对不同水质下图像提升的通用模型是十分困难的,先前的研究工作都集中在不同光谱衰减和微粒散射上,还没有工作对不同水质下水下图像提升进行系统的研究。

虽然有研究用多个模型来分别处理不同的Jerlov水体模型,但这种方法效率较低并且强烈依赖于水体的先验知识。此外水下图像提升的另一挑战在于没有真实世界中采集的基准数据集,使得研究人员们很难获得真实情况下的水体对成像造成的衰减。

为了解决这一系列问题,研究人员们提出了基于编码器-解码器的架构来从水下图像重建出清晰的图像,同时利用卷积网络实现对于水体的分类。

研究人员首先充分考虑了水下成像过程中的波长相关衰减、光散射和水体的影响,合成了丰富的数据用于模型训练;随后解决水体多样性的挑战,需要利用编码器分离出与水质无关的特征。

训练编码器得到可以重建清晰图像的编码,同时也让编码尽量与水体类别无关,充分训练后就可以得到针对多种水体的图像增强模型了。

UIE-DAL

由于这一研究的目标不仅仅是水下图像质量提升,更重要的是希望得到能在多种水质下稳定工作的单一模型,这就需要从水下图像中学习出与水体种类无关的编码表示,这意味着不同水体条件下从同一场景抽取出的编码要尽可能相同,这样解码器才能从场景相关的特征中重建出清晰的图像。

模型的架构,其中的彩色箭头表明了各种梯度传播的方向和更新的部分。

为了实现这一目标,研究人员在网络中引入了一个作为判别器(nuisance classifier)的分类器,用于从隐变量中区分出水体的种类。这一工作的创造性在于,利用分类器的的不确定性来作为对抗损失训练编码器。如果编码的隐变量让这一分类器的不确定性越高,那就说明编码与水体种类的相关性越低。对抗损失将驱动编码器学习到与水类型无关的编码。在模型中包含了三种损失、包括重建损失、分类器损失和对抗损失。其中重建损失是重建的清晰图像与基准间的均方误差,分类器损失则是水体目标类型与分类器预测水体种类的交叉熵,这一损失仅仅更新分类器本身。

这一模型最重要的损失是整个网络的对抗损失,它的目的在于增加分类器的不确定性(熵),研究人员尝试减少分类器的确定性来实现。这一对抗损失由分类器从隐变量中预测水体类型分布的负熵来构成,这部分的损失仅仅在编码器上进行更新,目的是使得编码器尽可能编码出与水体类型无关的表示。研究人员首先对模型中的编码器和解码器进行了训练,用于保证模型的编码中包含了图像中有意义的信息;随后加入分类器对整个网络进行联合对抗训练。尤为重要的是需要保证分类器足够强大,这样才能够学习出分类器特征迫使编码器编码出与水体类型无关的特征。

算法流程如下图所示:

其中编码器解码器基于U-Net架构,而分类器则利用了如下图所示的7层结构,最后输出水体分类为Jerlov十种水体类型中的六种。训练数据基于NYU-V2数据和水体类型合成而来,真实数据则UIEBD(Underwater Image Enhancement Benchmark Dataset)数据集。

结果

下图显示了模型在合成数据集上的表现,左边是不同水质下的合成数据,中间是算法的结果,右边是基准图像。

下图显示了真实水体下的图像提升效果,可以看到模型对于不同的水体质量都有较好的表现:

最后研究人员还分析了对抗损失对于图像增强的效果,最右侧是加入了与水质无关的损失后得到的结果,比中间原始U-Net输出结果要好:

对于目标检测结果的提升:

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 编码器
    +关注

    关注

    45

    文章

    3645

    浏览量

    134575
  • 图像
    +关注

    关注

    2

    文章

    1085

    浏览量

    40479
  • 数据集
    +关注

    关注

    4

    文章

    1208

    浏览量

    24713

原文标题:潜得深更要看得清,“海王”也需要的水下图像增强方法

文章出处:【微信号:thejiangmen,微信公众号:将门创投】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    怎么理解真正的编码器解码器

      在进入关于编码器解码器的现实之前,让我们对复用进行简要的思考。通常我们会在需要将一些输入信号一次一个地加载到一个单独负载的应用程序中。选择输入信号中的一个输入信号的过程称为多路复用。这种操作
    发表于 09-01 17:48

    编码器解码器的区别是什么,编码器用软件还是硬件好

    编码器指的是对视频信号进行压缩,解码器主要是将压缩的视频信号进行解压缩。目前做直播的很多都是采用的编码器,客户端可以采用解码器或软件播放
    发表于 08-02 17:23 3.4w次阅读

    高清解码器的作用

    高清解码器(xunwei)的主要作用在于接收前端高清编码图像或网络摄像头信号并解码,然后通过自身的各种视频输出接口,如HDMI、DVI、SDI、VGA、BNC输出显示到显示设备上。
    的头像 发表于 12-10 15:47 1.3w次阅读
    高清<b class='flag-5'>解码器</b>的作用

    基于改进残差网络的水下图像重建修复

    自然水体成像中湍流及悬浮颗粒等环境因素会造成水下采集的图像存在扭曲失真、分辨率低、背景模糊等问题,为了解决上述问题并进一步提高图像重建和复原的质量,提出了一种改进的基于残差网络的
    发表于 06-17 15:37 10次下载

    改进自适应GACV的水下图像分割算法研究

    改进自适应GACV的水下图像分割算法研究(通信电源技术20年第13期)-基于改进自适应GACV的水下图像分割算法研究摘要论文针对水下彩色图像对比度低、模糊、偏色等退化问题,研究了几何活
    发表于 09-22 15:32 11次下载
    改进自适应GACV的<b class='flag-5'>水下图像</b>分割算法研究

    PyTorch教程10.6之编码器-解码器架构

    电子发烧友网站提供《PyTorch教程10.6之编码器-解码器架构.pdf》资料免费下载
    发表于 06-05 18:12 0次下载
    PyTorch教程10.6之<b class='flag-5'>编码器</b>-<b class='flag-5'>解码器</b><b class='flag-5'>架构</b>

    PyTorch教程-10.6. 编码器-解码器架构

    。 图 10.6.1编码器-解码器架构。¶ 让我们以英语到法语的机器翻译为例。给定一个英文输入序列:“They”、“are”、“watching”、“.”,这种
    的头像 发表于 06-05 15:44 862次阅读
    PyTorch教程-10.6. <b class='flag-5'>编码器</b>-<b class='flag-5'>解码器</b><b class='flag-5'>架构</b>

    基于transformer的编码器-解码器模型的工作原理

    与基于 RNN 的编码器-解码器模型类似,基于 transformer 的编码器-解码器模型由一个编码器和一个
    发表于 06-11 14:17 2268次阅读
    基于transformer的<b class='flag-5'>编码器</b>-<b class='flag-5'>解码器</b>模型的工作原理

    基于 RNN 的解码器架构如何建模

     T5、Bart、Pegasus、ProphetNet、Marge 等,但它们所使用的网络结构并没有改变。 本文的目的是  详细  解释如何用基于 transformer 的编码器-解码器架构
    的头像 发表于 06-12 17:08 823次阅读
    基于 RNN 的<b class='flag-5'>解码器</b><b class='flag-5'>架构</b>如何建模

    基于 Transformers 的编码器-解码器模型

    基于 transformer 的编码器-解码器模型是 表征学习 和 模型架构 这两个领域多年研究成果的结晶。本文简要介绍了神经编码器-解码器
    的头像 发表于 06-16 16:53 898次阅读
    基于 Transformers 的<b class='flag-5'>编码器</b>-<b class='flag-5'>解码器</b>模型

    神经编码器-解码器模型的历史

    基于 transformer 的编码器-解码器模型是 表征学习 和 模型架构 这两个领域多年研究成果的结晶。本文简要介绍了神经编码器-解码器
    的头像 发表于 06-20 15:42 899次阅读
    神经<b class='flag-5'>编码器</b>-<b class='flag-5'>解码器</b>模型的历史

    详解编码器解码器电路

    编码器解码器是组合逻辑电路,在其中,主要借助布尔代数实现组合逻辑。今天就大家了解一下编码器解码器电路,分别从定义,工作原理,应用,真值表几个方面讲述一下。
    的头像 发表于 07-14 09:07 3261次阅读
    详解<b class='flag-5'>编码器</b>和<b class='flag-5'>解码器</b>电路

    视频编码器解码器的应用方案

    视频解码器和视频编码器在数字通讯、音视频压缩领域有着广泛的应用。视频编码器作为视频源的发送端,若接收端如果是 PC 机或显示设备就需要通过解码器进行
    的头像 发表于 08-14 14:38 1357次阅读
    视频<b class='flag-5'>编码器</b>与<b class='flag-5'>解码器</b>的应用方案

    YXC丨视频编码器解码器的应用方案

    视频解码器和视频编码器是数字信号处理中常用的设备,它们在数据的传输和转换中发挥着重要作用。
    的头像 发表于 08-23 09:40 677次阅读
    YXC丨视频<b class='flag-5'>编码器</b>与<b class='flag-5'>解码器</b>的应用方案

    视频编码器解码器的应用方案

    视频解码器和视频编码器是数字信号处理中常用的设备,它们在数据的传输和转换中发挥着重要作用。
    的头像 发表于 08-28 11:31 598次阅读
    视频<b class='flag-5'>编码器</b>与<b class='flag-5'>解码器</b>的应用方案