0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种新的基于可学习的双边网格的代价空间上采样模块

新机器视觉 来源:3D视觉工坊 作者:3D视觉工坊 2021-06-27 09:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

高精度的实时立体匹配网络是时下研究的一个热点,它在自动驾驶机器人导航和增强现实等领域中有着广泛的应用。虽然近年来对立体匹配网络的研究已经取得了显著的成果,但要同时兼顾实时性和高精度仍然是一个挑战。现有的高精度立体匹配网络,通常需要在较高的分辨率建立代价空间。比如,GANet在1/3分辨率建立代价空间,PSMNet在1/4分辨率,但这会影响网络的效率(GANet处理一对1242×375的图像,需要1.8s,PSMNet需要0.41s)。

本文的动机是期望寻求一种解决方案:用高分辨率代价空间预测视差图,以保持高的精度,同时要保持高的计算效率。

[CVPR 2021] Bilateral Grid Learning for Stereo Matching Networks

徐彬1,徐玉华1,2,*,杨晓立1,贾伟2,郭裕兰3

( 1奥比中光,2合肥工业大学,3国防科技大学)

论文链接: https://arxiv.org/pdf/2101.01601.pdf

代码开源: https://github.com/3DCVdeveloper/BGNet

1.创新点

(1)本文提出一种新的基于可学习的双边网格的代价空间上采样模块(Cost volume Upsampling in the learned Bilateral Grid, CUBG)。基于这个具有边缘保持特性的上采样模块,通过无参数的切片层(slicing layer)可以高效地从低分辨率的代价空间获得高质量的高分辨率代价空间。这样,费时的代价聚合只需要在低分辨率执行。该模块能够无缝嵌入到许多现有的立体匹配网络(如GCNet,PSMNet,GANet等)中,在保持相当精度的条件下取得4-29倍的加速。据我们所知,这是可微双边网格首次在立体匹配网络中的应用。

(2)基于本文提出的代价空间上采样模块,我们设计了一个高精度的实时立体匹配网络(称为BGNet),该网络在KITTI数据集的分辨率下能够达到39fps,且精度超过了之前所有实时立体匹配网络。

2. 相关工作

基于深度学习的立体匹配网络研究已经持续了很多年。MC-CNN [1]首次使用卷积神经网络(CNN)来计算两个图像块之间的匹配代价,但后续步骤(如代价聚合、视差后处理等)仍然使用传统方法。DispNetC [2]是第一个端到端的立体匹配网络,后续的工作引入了残差优化模块,对网络预测的视差图做一步的优化。GCNet [6]首次使用3D卷积学习构建4D代价空间,并使用soft argmin操作进行视差回归。

基于3D卷积的立体匹配网络在各大数据集榜单上都取得了很好的结果,但是 3D卷积比2D卷积计算量大的多,现有的基于3D卷积的实时立体匹配网络[7, 8]都是对低分辨率代价空间进行代价聚合,得到低分辨率的视差图,然后对视差图进行逐级上采样和优化,这种策略不如使用高分辨率代价空间计算视差图的方法精度高。

我们的工作受到双边网格[9]的启发。双边网格最早用于加速双边滤波器,主要包含三个步骤,即splat,blur和slice。splat操作对图像进行下采样构建双边网格,blur操作对双边网格进行平滑滤波,最后通过slice操作将滤波后的双边网格上采样到高分辨率。slice操作主要涉及在高分辨率引导图的指引下进行线性插值,因此其计算是非常高效的。

3. 方法描述

双边网格代价空间上采样

本文采用的思路是使用3D卷积在低分辨率构建双边网格代价空间,并通过提出的上采样模块(CUBG)得到高质量的高分辨率代价空间,在高分辨率代价空间进行视差回归。

如图1所示,CUBG模块的输入是一个低分辨率的代价空间和高分辨率的图像特征,输出是高分辨率的代价空间,该模块包含双边网格的生成和slicing上采样操作。

给定一个维度为 的低分辨率的代价空间。其中, 分别表示图像宽度,图像高度,视差范围和特征通道数。我们使用一个3*3*3的3D卷积完成向双边网格的转换,其中的维度为 , 为引导特征的通道数。

为了得到维度为 的三维高分辨率的代价空间(其中 和 分别是图像宽度和高度, 是给定的最大视差值),我用双边网络中的slicing操作进行上采样。slicing操作一种基于引导图的无参数插值算法。slicing的操作可以表示为公式(1):

6b41d962-d6e4-11eb-9e57-12bb97331649.png

其中为低分辨率代价空间相对于高分辨率代价空间的宽度或者高度比例, 是生成的引导图特征,范围为[0,255]。不同于双边网格[9]原文,我们的双边网格是从低分辨率的代价空间中学习得到的。在本文的所有试验,我们设置双边网格的维度为 。

嵌入式模块

CUBG模块可以无缝嵌入到许多现有的立体匹配网络结构中。在本文中,我把CUBG模块嵌入到四种具有代表性的网络,分别是GCNet, PSMNet, GANet和DeepPrunerFast。嵌入后的模型用后缀BG表示。比如,GCNet-BG表示在GCNet中嵌入了CUBG模块后的网络结构。

对于前三种网络结构,我们分别在1/8, 1/8, 1/6分辨率上重新建立代价空间,然后用CUBG模块把滤波后的代价空间分别上采样到1/2, 1/4和1/3分辨率。对于DeepPrunerFast,类似PatchMatch的视差上、下界估计模块和窄代价空间被1/8分辨率的完整的代价空间所代替。然后,用CUBG把滤波后的代价空间上采样到1/2分辨率。网络其余的结构都保持不变。

BGNet

基于CUBG模块,我们设计了一个高精度实时立体匹配网络。该网络主要包含四个模块:特征提取,代价空间聚合,代价空间上采样和残差优化模块。在不使用残差优化的情况下(对应BGNet),对于KITTI分辨率,速度为39fps。使用残差优化时(对应BGNet+),速度为30fps。

4.实验结果

消融实验

为了验证所提出CUBG上采样模块的有效性,我们在SceneFlow、Middlebury 2014数据集上进行了消融实验。可见无论是在合成数据集还是在真实数据集上,CUBG都优于线性插值上采样(LU)。尤其是在深度边缘附近区域,CUBG优势更加明显(EPE-edge)。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 自动驾驶
    +关注

    关注

    795

    文章

    15053

    浏览量

    181968
  • 卷积神经网络

    关注

    4

    文章

    375

    浏览量

    12963

原文标题:【CVPR2021】用于立体匹配的可学习双边网格

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    网格为王,仿真破界——Altair HyperMesh 重塑CAE工程设计新范式?

    在CAE(计算机辅助工程)领域,有个共识:工程师80%的时间都耗费在有限元模型的建立、几何清理与网格划分,而真正的仿真求解仅占20%。这行业痛点,催生了对高效、精准、灵活的仿真前
    发表于 04-23 14:47

    [VirtualLab] 配置文件编辑工具:速度与精度

    个场所需的采样(例如在空间域中),将提取系列的1D切线数据,并使用傅立叶变换将其转换为K域。基于这些信息,VirtualLab考虑了用于场尺寸估计的功率部分的配置值。计算出k域中所需的场大小。由于
    发表于 04-14 08:29

    一种基于低噪声电源管理架构的射频采样系统设计方案

    本期为大家带来的是《雷达应用中射频转换器的无杂波电源(第 1 部分)》,介绍了一种基于低噪声电源管理架构的射频采样系统设计方案,以解决相控阵雷达和 5G 通信应用中因开关电源噪声耦合导致的 ADC 动态性能下降问题。
    的头像 发表于 03-25 08:10 5043次阅读
    <b class='flag-5'>一种</b>基于低噪声电源管理架构的射频<b class='flag-5'>采样</b>系统设计方案

    一种可跨不同领域的异常检测通用模型UniOD介绍

    本研究提出了一种可跨不同领域、适用于特征维度各异且特征空间异构的数据集的异常检测通用模型。
    的头像 发表于 03-18 09:09 638次阅读
    <b class='flag-5'>一种</b>可跨不同领域的异常检测通用模型UniOD介绍

    探索SGM48759双路双边模拟开关:特性、应用与设计要点

    探索SGM48759双路双边模拟开关:特性、应用与设计要点 在硬件设计的领域中,模拟开关是一种至关重要的器件,它能够在不同的电路路径之间切换信号,广泛应用于各种电子设备中。今天,我们要深入探讨
    的头像 发表于 03-17 14:35 253次阅读

    SN74LV4066A:款高性能的四通道双边模拟开关

    SN74LV4066A:款高性能的四通道双边模拟开关 在电子工程师的日常设计工作中,模拟开关是一种常用的基础元件,它在信号切换、多路复用等方面发挥着重要作用。今天,我们就来详细探讨
    的头像 发表于 01-19 11:45 1081次阅读

    深入了解SN74LVC1G66单双边模拟开关

    深入了解SN74LVC1G66单双边模拟开关 在电子设计领域,模拟开关是一种常见且关键的元件,它在信号路由、切换等方面发挥着重要作用。今天我们就来详细探讨下德州仪器(TI)的SN74LVC1G66
    的头像 发表于 01-16 10:35 783次阅读

    深入解析 SN74LVC2G66 双双边模拟开关

    深入解析 SN74LVC2G66 双双边模拟开关 在电子设计领域,模拟开关是一种常用的器件,它在信号切换、多路复用等方面发挥着重要作用。今天我们要深入探讨的是德州仪器(Texas
    的头像 发表于 01-16 10:35 1088次阅读

    电能质量在线监测装置的采样模块有哪些类型?

    。现代装置通常采用多通道同步采样架构,核心由高精度 ADC 芯片和信号调理电路组成。 、电压采样模块类型 1. 电阻分压型(最常用) 原理 :通过精密电阻网络将高电压按比例降低至测
    的头像 发表于 12-17 15:48 1421次阅读
    电能质量在线监测装置的<b class='flag-5'>采样</b><b class='flag-5'>模块</b>有哪些类型?

    汽车尾流区域体网格细化方法

    本文将介绍一种汽车尾流区域体网格细化的方法。当用户已经获得初步的计算结果时,可以在 META 中将尾流负压区以等值面的形式导出。然后将其导入 ANSA 中,基于此等值面设置网格细化区域。
    的头像 发表于 12-11 10:25 847次阅读
    汽车尾流区域体<b class='flag-5'>网格</b>细化方法

    如何使用多个 EADC 采样模块个 EADC 通道进行采样,以实现最大采样频率?

    使用多个 EADC 采样模块个 EADC 通道进行采样,以实现最大采样频率。
    发表于 08-20 07:04

    一种无序超均匀固体器件的网格优化方法

    近日,天津大学精密仪器与光电子工程学院的光子芯片实验室研发了一种无序超均匀固体器件的网格优化方法,成果获中国发明专利(ZL202410659505.2)授权。
    的头像 发表于 07-28 16:10 1160次阅读
    <b class='flag-5'>一种</b>无序超均匀固体器件的<b class='flag-5'>网格</b>优化方法

    如何使用sizefield功能进行CFD网格细化

    本文旨在对ANSA中的CFD网格细化策略进行简单介绍。首先介绍如何使用sizefield功能进行网格细化,之后在下篇文章中将继续介绍其他CFD网格细化方法。
    的头像 发表于 07-14 09:52 1310次阅读
    如何使用sizefield功能进行CFD<b class='flag-5'>网格</b>细化

    基于Matlab与FPGA的双边滤波算法实现

    前面发过中值、均值、高斯滤波的文章,这些只考虑了位置,并没有考虑相似度。那么双边滤波来了,既考虑了位置,有考虑了相似度,对边缘的保持比前几个好很多,当然实现也是复杂很多。本文将从原理入手,采用Matlab与FPGA设计实现双边
    的头像 发表于 07-10 11:28 4931次阅读
    基于Matlab与FPGA的<b class='flag-5'>双边</b>滤波算法实现

    网格布局介绍

    概述 网格布局是由“行”和“列”分割的单元格所组成,通过指定“项目”所在的单元格做出各种各样的布局。网格布局具有较强的页面均分能力,子组件占比控制能力,是一种重要自适应布局,其使用场景有九宫格
    发表于 06-25 06:27