0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

三维目标检测失效的情况下如何实现避障

CVer 来源:CVer 作者:CVer 2022-10-10 16:53 次阅读

本文是对我们CoRL 2022被接收的文章SurroundDepth: Entangling Surrounding Views for Self-Supervised Multi-Camera Depth Estimation的介绍。在这个工作中,我们利用transformer融合环视的多视角特征,提升模型性能,并提出SfM预训练和联合位姿估计来实现真实尺度的深度图。很荣幸地,我们的文章被CoRL 2022收录,目前项目代码已开源,欢迎大家试用。

概述

近年来随着人工智能的发展,自动驾驶技术飞速发展。以特斯拉为首的视觉派抛弃激光雷达,只依赖于图像进行三维感知。作为纯视觉感知方案的基石任务,基于图像的三维目标检测天然存在长尾问题。模型很可能会对数据集中没见过的类别物体漏检,而这种漏检往往是致命的。重建出整个三维场景可以作为一种安全冗余,在三维目标检测失效的情况下依然可以实现避障。

作为最简单直接且不需要点云标签的三维场景重建方式,在这个工作中我们重点研究自监督环视深度估计这个任务。自监督深度估计是一个很经典的领域,早在17年就有相关的工作,但大部分工作都是基于单目图像的。与单目图像不同,环视图像的各个视角之间存在overlap,因此可以将多个视角之间的信息进行融合得到更准确的深度图预测。除此之外,自监督单目深度估计存在尺度歧义(scale-ambiguity)问题,换句话说,预测出的深度图会与深度真值差一个尺度系数。这是因为如果位姿和深度图同时乘以一个相同的尺度,会使得光度一致性误差(photometric loss)相同。与单目深度估计不同,假设我们可以知道多个相机之间的外参,这些外参我们可以比较容易的通过标定得到,外参中包含了世界真实尺度的信息,因此理论上我们应该可以预测得到真实尺度的深度图。

我们根据环视视觉的特点提出了SurroundDepth,方法的核心是通过融合环视多视角信息以自监督的方式得到高精度且具有真实尺度的深度图。我们设计了跨视角transformer以注意力机制的形式对多视角的特征进行融合。为了恢复出真实尺度,我们在相邻视角上利用SfM得到稀疏伪点云对网络进行预训练。之后我们提出联合位姿估计去显示地利用外参信息,对深度和位姿估计网络进行联合训练。在DDAD和nuScenes数据集上的实验验证了我们的方法超过了基线方法,达到了当前最佳性能。

方法

a82166a0-485c-11ed-a3b6-dac502259ad0.png

1) 跨视角Transformer (CVT)

a852d08c-485c-11ed-a3b6-dac502259ad0.png

2) SfM预训练

这一步的目的是为了挖掘外参包含的真实世界尺度信息。一个自然的做法是以外参作为位姿估计结果,在空域上利用photometric loss得到带有真实尺度的深度图。但环视图像之间的overlap比较小,这会使得在训练开始阶段,大部分的像素都会投影到overlap区域外,导致photometric loss无效,无法提供有效的真实尺度的监督。为了解决这个问题,我们用SIFT描述子对相邻视角的图像提取correspondences,并利用三角化转换成具有真实尺度的稀疏深度,并利用这些稀疏深度对深度估计网络进行预训练,使其可以预测带有真实尺度的深度图。但由于环视多视角之间的overlap较小,视角变化较大,因此描述子的准确度和鲁棒性有所降低。为了解决这个问题,我们首先预估出overlap区域,具体为每个视角图像左右1/3部分的图像,我们只在这些区域提取correspondences。进一步地,我们利用对极约束筛掉噪点:

a88478b2-485c-11ed-a3b6-dac502259ad0.png

a89bd5ca-485c-11ed-a3b6-dac502259ad0.png

3)联合位姿估计

大部分深度估计方法用PoseNet估计时序上相邻两帧的位姿。拓展到环视深度估计上,一个直接的方法是对每个视角单独预测位姿。但这种方法没有利用视角之间的几何变化关系,因此无法保证位姿之间的多视角一致性。为了解决这个问题,我们将位姿估计分解为两块。首先我们预测全局位姿,具体而言,我们将所有视角图像送入PoseNet encoder,将特征平均之后再送入decoder:

a8b1cb6e-485c-11ed-a3b6-dac502259ad0.png

a8c3cd00-485c-11ed-a3b6-dac502259ad0.png

实验结果

我们在DDAD(Dense Depth for Automated Driving) [1]以及nuScenes [2]上均进行了实验,使用了与Monodepth2 [3]相同的backbone网络(ImageNet pretrained ResNet34)与pose estimation网络来构建SurroundDepth。在两个数据集上的实验结果如下:

a8da159c-485c-11ed-a3b6-dac502259ad0.jpg

其中,我们对比了两种最先进的单目深度估计方法(Monodepth2 [3] and PackNet-SfM [4])以及一种多相机深度估计方法FSM [5]。我们在相同的测试环境下对比了所有的方法,可以看出,SurroundDepth在两个数据集上均取得了最好的性能。

此外,由于利用了环视相机之间的交互,SurroundDepth相比其他方法的一大优势在于可以取得绝对深度估计。针对绝对深度,我们在两个数据集上进行了相关实验。可以发现,仅仅利用spatial photometric loss无法使网络学习到绝对深度。通过我们提出的SfM pretraining方法,网络才能有效地预测绝对深度。

a8eaf89e-485c-11ed-a3b6-dac502259ad0.jpg

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 三维
    +关注

    关注

    1

    文章

    502

    浏览量

    28946
  • 代码
    +关注

    关注

    30

    文章

    4753

    浏览量

    68368
  • 数据集
    +关注

    关注

    4

    文章

    1205

    浏览量

    24649

原文标题:CoRL 2022 | 清华&天津大学提出SurroundDepth:自监督环视深度估计网络

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    如何快速高效的完成汽车前盖板的三维检测

    如何快速高效的完成汽车前盖板的三维检测?行业背景汽车的前盖板在生产出来后往往因为焊接和零件的误差难以装配,检测便成了生产和安装两个环节之间的重要步骤。缩短检测时间提高
    发表于 08-11 14:16

    广西扫描服务三维检测三维扫描仪

    检测结果。无空间上的使用限制,手持式三维扫描仪的便携性及易用性,使得操作人员可以自由灵活转移在各个车间现场,在工件难以移动的情况下完成检测。关键词:广西扫描服务广西
    发表于 08-29 14:42

    解读机器人的几大技术

    到妨碍其通行的静态或动态物体,然后按照一定的方法进行有效,最终到达目标点。实现与导航的必
    发表于 12-12 16:04

    三维立体成像X射线显微镜在元器件失效分析中的应用

    、C-SAM、X射线检查等等。近几年,三维立体成像X射线显微镜(显微CT)逐渐进入电子元器件分析领域,推动了电子元器件非破坏性分析技术的快速发展。拥有一台显微CT,就像拥有一双“透视眼”,在无损状态
    发表于 08-31 10:07

    Handyscan汽车三维扫描服务尺寸检测的应用

    `Handyscan汽车三维扫描服务尺寸检测的应用 汽车发动机连杆是将活塞和曲轴连接起来,作为汽车发动机关键传动机构的一部分,将作用于活塞顶部的膨胀气体压力传给曲轴,使活塞的往复直线运动可逆地转
    发表于 08-04 16:07

    三维可视化的应用和优势

    的整体态势。  比如设备在偏僻区域(海、深山、沙漠、分布全国各地等),可以实现无人检测,无需消耗人力物力进行检测,通过三维数据的分析可以直
    发表于 12-02 11:52

    水上机器人三维实时算法研究

    水上机器人(Unmanned Surface Vehicle,USV)用于近海环境实时监测、资源探测、海洋灾害预警和防治等多种用途。USV 必须在三维环境中进行处理,所以本文在USV上布置两层声纳来
    发表于 12-19 15:37 8次下载

    智能循迹小车设计与实现

    智能循迹小车设计与实现
    发表于 06-06 08:48 307次下载

    无人机智能

    操作,实现无人机自主驾驶的阶段!  第阶段,无人机能够对飞行区域建立地图模型然后规划合理线路!这个地图不能仅仅是机械平面模型,而应该是一个能够实时更新的三维立体地图!这将是目前无人机
    发表于 04-27 20:24 1140次阅读

    三维数字化集成检测系统实现关键技术分析

    如何实现真正的无图化、无纸化的三维数字化集成检测,是当前制造业的一个重要发展方向,本文在三维数字化检测规划的基础上,对
    发表于 11-30 11:11 10次下载
    <b class='flag-5'>三维</b>数字化集成<b class='flag-5'>检测</b>系统<b class='flag-5'>实现</b>关键技术分析

    港中文和商汤研究员提出高效的三维点云目标检测​新框架

    与二图像中会相互遮挡的物体不同,三维点云中的物体都是天然分离的,使得三维目标内部各个部分的相对位置可以精确获取,这些方法将有效提高目标
    的头像 发表于 08-02 14:18 3484次阅读
    港中文和商汤研究员提出高效的<b class='flag-5'>三维</b>点云<b class='flag-5'>目标</b><b class='flag-5'>检测</b>​新框架

    手持式三维扫描仪对工业三维检测应用铸造模具冲压模具三维扫描与检测

    手持式三维扫描仪对工业三维检测应用 手持式三维扫描设备因其灵巧,便携,高精度的特点,不受工厂复杂环境的影响,既能满足其检测要求,又能极大的提
    发表于 04-20 09:38 1788次阅读

    基于激光雷达点云的三维目标检测算法

    文中提出了一种基于激光雷达点云的三维目标检测算法 Voxeircnn( Voxelization Region-based Convolutional Neural Networks),该算
    发表于 05-08 16:35 45次下载

    基于多视角融合的夜间无人车三维目标检测

    基于多视角融合的夜间无人车三维目标检测 来源:《应用光学》,作者王宇岚等 摘 要:为了提高无人车在夜间情况下对周围环境的物体识别能力,提出一种基于多视角通道融合网络的无人车夜间
    发表于 01-23 15:15 803次阅读

    智慧城市_实景三维|物业楼三维扫描案例分享_泰来三维

    三维激光扫描技术是近年来发展的新型测量方法,通过三维扫描获取大量全面点云数据,形成三维立体模型,实现快速掌握被测目标信息。
    的头像 发表于 05-16 13:56 1010次阅读
    智慧城市_实景<b class='flag-5'>三维</b>|物业楼<b class='flag-5'>三维</b>扫描案例分享_泰来<b class='flag-5'>三维</b>