0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于激光雷达的全稀疏3D物体检测器

CVer 来源:CVer 作者:明月不谙离苦 2022-11-15 14:59 次阅读

介绍一下我们组前段时间的一个微小工作

3d56525e-64a4-11ed-8abf-dac502259ad0.png

Fully Sparse 3D Object Detection (NeurIPS 2022)

Authors:Lue Fan,王峰, 王乃岩,Zhaoxiang Zhang

论文:https://arxiv.org/abs/2207.10035

代码已经开源在:

https://github.com/tusen-ai/SST

长话短说,我们提出了一种基于激光雷达的全稀疏3D物体检测器,在Waymo数据集和Argoverse 2数据集上都达到了不错的精度和速度。下面是一个简要的介绍。

一、导言

目前以SECOND,PointPillars以及CenterPoint为代表的主流一阶段点云物体检测器都或多或少依赖致密特征图(dense feature map)。这些方法基本都会把稀疏体素特征“拍成“dense BEV feature map。这样做可以沿用2D检测器的很多套路,取得了非常不错的性能。但是由于dense feature map的计算量和检测范围的平方成正比,使得这些检测器很难scale up到大范围long-range检测场景中。比如新出的Argoverse 2数据集具有[-200, 200] x [-200, 200]的理论检测范围,比常用的不超过[-75. 75] x [-75, 75]的范围大了许多。于是便引出了本文想解决的一个痛点问题:

如何去掉这些dense feature map,把检测器做成fully sparse的,以此高效地实现 long-range LiDAR detection?

这里补一句:全稀疏其实并不是一个新概念,在点云物体检测发展的早期,以PointRCNN为代表的众多纯point-based 方法天生就是全稀疏的。但由于Neighborhood query和FPS的存在,纯point-based方法在大规模点云数据上的效率不是很理想。这就导致纯point-based方法在点云规模较大的benchmark上性能表现不佳(没办法用较大的模型和分辨率。)

而去掉dense feature map的一个直接问题就是会导致物体中心特征的缺失(center feature missing)。这是由于点云常常分布在物体的侧表面,对于大物体尤其如此。在dense detector中,多层的卷积会把物体边缘的有效特征扩散到物体中心,因此这些检测器不存在直接的中心特征缺失问题,可以使用已被证明非常有效的center assignment。下图展示了特征扩散的过程:

3d8a4cd0-64a4-11ed-8abf-dac502259ad0.jpg

为了解决在全稀疏结构下中心特征缺失的问题,我们有一个基本想法:

既然中心特征缺失了,那么就不依靠中心特征做预测,而是依靠物体整体的有效特征做预测。

二、方法

顺着上面的基本想法,一个具体的思路就是先把物体分割出来,再将物体当作一个整体,并用稀疏的方式提取特征。第一步的分割在全稀疏的结构下很好实现,接下来物体特征的提取也可以通过众多成熟的point-based方法实现。那么我们的方法就呼之欲出了:

sparse voxel encoder作为backbone和segmentor来分割物体并预测每个点所对应的物体中心

对预测出来的众多中心点进行聚类,得到一个一个的instance。这一步类似VoteNet,但我们采用了connected component labeling的方式来聚类,这一点其实对大物体性能挺重要的。

对于每一个instance用稀疏的方式提取整体特征,并进行该instance外接框的reasoning。

前两步都很简单直接,但第三步稍有麻烦。对instance提取特征最常用的选择就是在instance内部做point-based operation, 但是之前提到这类方法效率较低。因此我们试图规避其中诸如neighborhood query和FPS这种比较耗时的操作。我们的想法是,既然已经得到了一个个instance,何不直接将instance作为一个一个独立neighborhood group,扔掉进一步的ball query或者KNN操作。

这样做实质上是把instance当成了“voxel”来处理,因为instance和voxel本质上都属于对整个点云的一种non-overlapping划分。那么我们就可以直接套用提取单个体素特征那一套方案来提取instance特征,比如Dynamic VFE。具体而言,就是对instance内的每个点做MLP,再做instance-wise的pooling得到instance feature。instance feature又可以重新assign到instance内部的每个point上,这一过程可以不断重复。这本质上是多个简单的PointNet叠加,也可以换成其他更强力的操作。值得强调的是,由于3D空间里instance之间天然不会重叠(正如同voxel),以上的pooling操作可以通过torch中scatter operation来高效地动态实现(无需对每个组进行padding或者设置点数上限)。

得到最终的instance feature之后,直接预测对应instance的外接框和类别即可,我们将整个对instance进行处理的模块称之为 Sparse Instance Recognition (SIR)。

方法总体框架如下图所示:

3d9d7c60-64a4-11ed-8abf-dac502259ad0.png

Overall Pipeline

这其中还包含着一些后续操作,比如对重新分割出比聚类得到的更准确的instance,感兴趣的读者可以查看原文。

三、结果

提出的方法在Waymo的单帧单模型标准赛道上达到了SOTA的性能

3de4ad74-64a4-11ed-8abf-dac502259ad0.jpg

Waymo validation 上的性能,截图不全,感兴趣的读者可查看原论文

同时也在新出的Argoverse 2数据集上超越了主流的CenterPoint(虽然还没几个人刷。。)。

值得多提一嘴的是我们的方法在长距离检测上有巨大的效率优势,如下图所示

3dfb29f0-64a4-11ed-8abf-dac502259ad0.jpg

这是用SST backbone测的,用SparseConv的backbone效果更佳

四、一些特性

我们的方法不受sparse backbone的类型限制,比如文中我们就使用了sparse transformer和sparse conv两种结构。这一点使得FSD可以作为sparse backbone方面研究的一个strong baseline。

该方法虽然暂时聚焦在检测任务,但已经有了multi task的影子,可以把segmentation和detection一体化。

前向速度很快,再加上收敛也极快,Waymo上训练6个epoch就可以达到准sota水平。这在8 x 3090上只需要不到半天时间,其他方法达到相同性能可能需要至少2天的训练时间。这应该会给大家的快速实验迭代提供很大便利。

我们相信稀疏化是将来的一个趋势。在很多场景下,sparse feature都比相比笨重的dense feature map具有更高的可操作性和灵活性,欢迎大家试用我们的模型。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 检测器
    +关注

    关注

    1

    文章

    860

    浏览量

    47654
  • 激光雷达
    +关注

    关注

    967

    文章

    3943

    浏览量

    189628

原文标题:NeurIPS 2022 | 中科院&图森未来提出FSD:全稀疏的3D目标检测器

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    激光雷达在SLAM算法中的应用综述

    SLAM算法运行的重要传感。基于激光雷达的SLAM算法,对激光雷达SLAM总体框架进行介绍,详细阐述前端里程计、后端优化、回环检测、地图构建模块的作用并总结所使用的算法;按由2
    的头像 发表于 11-12 10:30 293次阅读
    <b class='flag-5'>激光雷达</b>在SLAM算法中的应用综述

    产品介绍 满足功能安全认证要求:SIL 2安全防护型激光雷达GS1-5

    激光雷达作为移动机器人的重要传感,对物流机器人实现物体检测,帮助机器人识别和避让行人、其他车辆等功能有重要意义。 欧镭激光历时三年自主研发的安全
    的头像 发表于 11-08 10:38 168次阅读
    产品介绍  满足功能安全认证要求:SIL 2安全防护型<b class='flag-5'>激光雷达</b>GS1-5

    激光雷达技术的基于深度学习的进步

    一、激光雷达技术概述 激光雷达技术是一种基于激光的遥感技术,通过发射激光脉冲并接收反射回来的光来测量物体的距离和速度。与传统的
    的头像 发表于 10-27 10:57 307次阅读

    激光雷达技术的发展趋势

    ,都有着广泛的应用。 激光雷达技术的发展趋势 引言 随着科技的不断进步,激光雷达技术已经成为现代遥感技术中不可或缺的一部分。它通过发射激光脉冲并接收其反射,能够精确地测量目标物体的距离
    的头像 发表于 10-27 10:44 595次阅读

    TS高速数字化仪在激光雷达系统中的应用

    一、基本介绍 50多年前,激光技术的发展催生了激光雷达 (LIDAR) 系统,该系统在距离计算方式上取得了突破。激光雷达的原理与雷达所使用的原理非常相似。主要区别在于
    的头像 发表于 09-20 11:13 350次阅读
    TS高速数字化仪在<b class='flag-5'>激光雷达</b>系统中的应用

    lidar激光雷达扫描仪有什么用

    于各个领域。 LiDAR激光雷达扫描仪的基本原理 LiDAR激光雷达扫描仪通过发射激光脉冲并接收反射回来的激光信号,来测量物体与扫描仪之间的
    的头像 发表于 08-29 16:58 636次阅读

    晶振在激光雷达系统中的作用有哪些

    激光雷达系统需要用精确的时间测量来计算距离和生成高分辨率的3D图像。晶振在激光雷达系统中起着关键作用,主要用于提供稳定的时钟信号和高精度的时间基准。
    的头像 发表于 05-29 11:45 560次阅读

    Hokuyo Automatic发布新款3D激光雷达(LiDAR)传感YLM-10LX

    据麦姆斯咨询报道,光学半导体技术先驱Lumotive近日携手传感和自动化领域的全球领先企业Hokuyo Automatic发布新款3D激光雷达(LiDAR)传感YLM-10LX。
    的头像 发表于 05-29 09:14 1196次阅读

    机载单光子激光雷达系统用于实现高分辨率3D成像

    据麦姆斯咨询报道,近日,中国科学技术大学合肥微尺度物质科学国家研究中心的研究团队开发出了一种结构紧凑、重量轻的单光子机载激光雷达系统,可以用低功率激光获取高分辨率的3D图像。
    的头像 发表于 05-06 09:05 809次阅读
    机载单光子<b class='flag-5'>激光雷达</b>系统用于实现高分辨率<b class='flag-5'>3D</b>成像

    LG Innotek发布高性能激光雷达,可检测250米外物体

    组成部分。LG Innotek的高性能激光雷达可以检测250米外的物体。随着检测距离的增加,车辆可以确保更长的制动距离,从而实现更快的自动驾驶。该设备可确保所有角度的高分辨率成像,传感
    的头像 发表于 04-12 08:45 211次阅读

    大陆集团的3D Flash激光雷达有何优势?

    在这一技术革命的前沿,激光雷达成为了不可或缺的一环。而在这其中,大陆集团的3D Flash激光雷达引人瞩目。
    发表于 04-11 10:28 339次阅读
    大陆集团的<b class='flag-5'>3D</b> Flash<b class='flag-5'>激光雷达</b>有何优势?

    激光雷达LIDAR基本工作原理

    一、激光雷达LiDAR工作原理激光雷达LiDAR的全称为LightDetectionandRanging激光探测和测距,又称光学雷达激光雷达
    的头像 发表于 03-05 08:11 4850次阅读
    <b class='flag-5'>激光雷达</b>LIDAR基本工作原理

    华为激光雷达参数怎么设置

    的基本原理。激光雷达通过发射激光束并测量返回的光的时间延迟来测量物体到传感的距离。传感还可以根据返回光的强度和角度来获取有关
    的头像 发表于 01-19 14:17 1694次阅读

    激光雷达测量技术与应用

    的原理和基本构造 激光雷达利用激光的特性进行测量。激光是一种具有高频率和单色性的电磁波,它可以被定向聚焦成一个非常细小的光束。激光雷达工作时,通过发射
    的头像 发表于 12-15 11:03 1109次阅读

    单线激光雷达和多线激光雷达区别

    单线激光雷达和多线激光雷达区别  单线激光雷达和多线激光雷达是两种常用的激光雷达技术。它们在激光
    的头像 发表于 12-07 15:48 4297次阅读