0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

用于处理三维点云的深度学习方法的分析

3D视觉工坊 来源:arxiv 作者:Yulan Guo, Hanyun Wan 2022-11-02 15:07 次阅读

3D点云学习( Point Clouds)作为近年来的研究热点之一,受到了广泛关注,每年在各大会议上都有大量的相关文章发表。当前,点云上的深度学习变得越来越流行,人们提出了许多方法来解决这一领域的不同问题。国防科技大学郭裕兰老师课题组新出的这篇论文对近几年点云深度学习方法进行了全面综述,是第一篇全面涵盖多个重要点云相关任务的深度学习方法的综述论文,包括三维形状分类、三维目标检测与跟踪、三维点云分割等,并对点云深度学习的机制和策略进行全面的归纳和解读,帮助读者更好地了解当前的研究现状和思路。也提供了现有方法在几个可公开获得的数据集上的全面比较,最后也介绍了未来的研究方向。

a98b47ca-4ca5-11ed-a3b6-dac502259ad0.png

对于3D点云,数据正在迅速增长。大有从2D向3D发展的趋势,比如在opencv中就已经慢慢包含了3D点云的处理的相关模块,在数据方面点云的获取也是有多种渠道, 无论是源于CAD模型还是来自LiDAR传感器或RGBD相机的扫描点云,无处不在。另外,大多数系统直接获取3D点云而不是拍摄图像并进行处理。因此,在深度学习大火的年代,应该如何应用这些令人惊叹的深度学习工具,在3D点云上的处理上达到对二维图像那样起到很好的作用呢?

3D点云应用深度学习面临的挑战。首先在神经网络上面临的挑战:

(1)非结构化数据(无网格):点云是分布在空间中的XYZ点。没有结构化的网格来帮助CNN滤波器

(2)不变性排列:点云本质上是一长串点(nx3矩阵,其中n是点数)。在几何上,点的顺序不影响它在底层矩阵结构中的表示方式,例如, 相同的点云可以由两个完全不同的矩阵表示。如下图所示:

(3)点云数量上的变化:在图像中,像素的数量是一个给定的常数,取决于相机。然而,点云的数量可能会有很大的变化,这取决于各种传感器。

a99ae824-4ca5-11ed-a3b6-dac502259ad0.png

在点云数据方面的挑战:

(1)缺少数据:扫描的模型通常被遮挡,部分数据丢失。
(2)噪音:所有传感器都是嘈杂的。有几种类型的噪声,包括点云扰动和异常值。这意味着一个点有一定的概率位于它被采样的地方(扰动)附近的某一半径范围内,或者它可能出现在空间的任意位置(异常值)。
(3)旋转:一辆车向左转,同一辆车向右转,会有不同的点云代表同一辆车。

a9bc9942-4ca5-11ed-a3b6-dac502259ad0.png

点云学习近年来受到越来越多的关注,因为它在许多领域都有广泛的应用,比如计算机视觉自动驾驶机器人技术。作为人工智能的主要技术之一,深度学习已经成功地用于解决各种二维视觉问题。然而,由于使用深度神经网络处理点云所面临的独特挑战,对点云的深度学习仍处于起步阶段。最近,点云上的深度学习变得越来越流行,人们提出了许多方法来解决这一领域的不同问题。为了激发未来的研究,本文对点云深度学习方法的最新进展进行了综述。它涵盖了三个主要任务,包括三维形状分类,三维目标检测和跟踪以及三维点云分割。我们还提供了一些可公开获得的数据集的比较结果,以及有见地的观察和启发性的未来研究方向。

引言

3D数据在不同的领域有许多应用,包括自动驾驶、机器人、遥感、医疗和设计行业[4]。近年来,深度学习技术在计算机视觉、语音识别、自然语言处理(NLP)、生物信息学等研究领域占据主导地位。但是,在三维点云上进行深度学习仍然面临数个重大挑战[5],例如数据集规模小,维数高和三维点云的非结构化性质。在此基础上,本文重点分析了用于处理三维点云的深度学习方法。

一些公开的数据集也被发布,例如ModelNet [6],ShapeNet [7],ScanNet [8],Semantic3D [9]和KITTI Vision Benchmark Suite[10]。这些数据集进一步推动了对三维点云的深度学习研究,提出了越来越多的方法来解决与点云处理相关的各种问题,包括三维形状分类、三维目标检测与跟踪、三维点云分割等。

这篇论文是第一个专门针对点云的深度学习方法的综述。此外,论文全面涵盖了分类,检测,跟踪和分割等不同应用。图1显示了三维点云的现有深度学习方法的分类。

a9ee28f4-4ca5-11ed-a3b6-dac502259ad0.png

图1:三维点云深度学习方法分类。

这项工作的主要贡献可以概括如下:

· 1)据我们所知,这是第一篇全面涵盖多个重要点云相关任务的深度学习方法的综述论文,包括三维形状分类、三维目标检测与跟踪、三维点云分割等。

·2)相对于已有的综述[11],[12],我们特别关注三维点云的深度学习方法,而不是所有类型的三维数据。

· 3)本文介绍了点云深度学习的最新进展。因此,它为读者提供了最先进的方法。

·4)提供了现有方法在几个可公开获得的数据集上的全面比较(例如,表1、2、3、4),并提供了简要的总结和深入的讨论。

本文的结构如下。第2节回顾了三维形状分类的方法。第3节概述了现有的三维目标检测和跟踪方法。第4节介绍了点云分割的方法,包括语义分割、实例分割和部件分割。最后,第5节总结了论文。

论文还在以下网址上提供了定期更新的项目页面:

https://github.com/QingyongHu/SoTA-Point-Cloud

aa0112f2-4ca5-11ed-a3b6-dac502259ad0.png

图2:三维形状分类网络的时间顺序概览。

aa0c5c70-4ca5-11ed-a3b6-dac502259ad0.png

图3:PointNet的体系结构。

aa29f758-4ca5-11ed-a3b6-dac502259ad0.png

图4:点的局部邻居的连续和离散卷积的图解。(a)代表一个局部邻居;(b)和(c)分别表示三维连续卷积和离散卷积。

aa31cb18-4ca5-11ed-a3b6-dac502259ad0.png

图5:基于图的网络的图解。

aa36f8c2-4ca5-11ed-a3b6-dac502259ad0.png

表1:在ModelNet10/40基准上比较三维形状分类结果。这里,我们只关注基于点的网络,“#params”表示相应模型的参数数量。“OA”表示总体精度,“mAcc”表示表中的平均精度。符号“-”表示结果不可用。

aa5fe07a-4ca5-11ed-a3b6-dac502259ad0.png

图6:按时间顺序概述的最相关的基于深度学习的三维目标检测方法。

aa7d59b6-4ca5-11ed-a3b6-dac502259ad0.png

图7:三类三维目标检测方法的典型网络。从上到下:(a)基于多视图,(b)基于分割,(c)基于视锥的方法。

aab5ab86-4ca5-11ed-a3b6-dac502259ad0.png

表2:在KITTI测试三维检测基准上的三维目标检测结果对比。

aad4ce6c-4ca5-11ed-a3b6-dac502259ad0.png

表3:在KITTI test BEV检测基准上三维目标检测结果对比。

ab10723c-4ca5-11ed-a3b6-dac502259ad0.png

图8:按时间顺序概述了一些最相关的基于深度学习的点云语义分割方法。

ab2c5cea-4ca5-11ed-a3b6-dac502259ad0.png

图9:基于投影方法的中间表示图。

ab9ae250-4ca5-11ed-a3b6-dac502259ad0.png

图10:PointNet++[27]框架的示意图。

aba1da10-4ca5-11ed-a3b6-dac502259ad0.png

图11:有代表性的三维点云实例分割方法的年代概述。

未来方向

表4展示了现有方法在公共基准测试上的结果,包括S3DIS[176]、Semantic3D[9]、ScanNet[102]、SemanticKITTI[177]。需要进一步研究的问题有:

·基于点的网络是最常被研究的方法。然而,点表示自然不具有显式的邻近信息,现有的大多数基于点的方法不得不借助于昂贵的邻近搜索机制(如KNN[52]或ball query [27])。这从本质上限制了这些方法的效率,因为邻居搜索机制既需要很高的计算成本,又需要不规则的内存访问[214]。

·从不平衡数据中学习仍然是点云分割中一个具有挑战性的问题。虽然有几种的方法取得了显著的综合成绩[42]、[170]、[182],但它们在类标很少的情况下表现仍然有限。例如,RandLA-Net[95]在Semantic3D的reduced-8子集上获得了76.0%的整体IoU,而在hardscape类上获得了41.1%的非常低的IoU。

·大多数现有的方法[5]、[27]、[52]、[170]、[171]都适用于小点云(如1m*1m,共4096个点)。在实际中,深度传感器获取的点云通常是巨大的、大规模的。因此,有必要进一步研究大规模点云的有效分割问题。

·已有少数文献[145]、[146]、[167]开始研究动态点云的时空信息。预期时空信息可以帮助提高后续任务的性能,如三维目标识别、分割和完成。

abd31800-4ca5-11ed-a3b6-dac502259ad0.png

表4:S3DIS(包括Area5和6-fold cross validation)[176]、Semantic3D(包括semantic-8和reduced-8子集)[9]、ScanNet[8]和SemanticKITTI[177]数据集的语义分割结果对比。

结论

本文介绍了最先进的三维理解方法,包括三维形状分类,三维目标检测和跟踪,以及三维场景和目标分割。对这些方法进行了全面的分类和性能比较。介绍了各种方法的优缺点,并提出了今后的研究方向。

作者:Yulan Guo, Hanyun Wang, Qingyong Hu, Hao Liu, Li Liu, and Mohammed Bennamoun

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机
    +关注

    关注

    19

    文章

    7413

    浏览量

    87695
  • 自动驾驶
    +关注

    关注

    783

    文章

    13679

    浏览量

    166110
  • 深度学习
    +关注

    关注

    73

    文章

    5492

    浏览量

    120961

原文标题:3D点云分割、目标检测、分类

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    建筑物边缘感知和边缘融合的多视图立体三维重建方法

    航空建筑深度估计是三维数字城市重建中的一项重要任务,基于深度学习的多视图立体(MVS)方法在该领域取得了较好的成果。目前的主要
    的头像 发表于 11-07 10:16 128次阅读
    建筑物边缘感知和边缘融合的多视图立体<b class='flag-5'>三维</b>重建<b class='flag-5'>方法</b>

    基于深度学习三维分类方法

    近年来,云表示已成为计算机视觉领域的研究热点之一,并广泛应用于自动驾驶、虚拟现实、机器人等许多领域。虽然深度学习技术在处理常规结构化的二
    的头像 发表于 10-29 09:43 202次阅读
    基于<b class='flag-5'>深度</b><b class='flag-5'>学习</b>的<b class='flag-5'>三维</b><b class='flag-5'>点</b><b class='flag-5'>云</b>分类<b class='flag-5'>方法</b>

    什么是三维分割

    是世界的一种非结构化三维数据表示,通常由激光雷达传感器、立体相机或深度传感器采集。它由一系列单个组成,每个
    的头像 发表于 10-29 09:21 126次阅读

    友思特方案 基于三维实现PCB装配螺丝视觉检测

    三维是完成精密化 PCB 检测的最新视觉技术。友思特 Saccde Vision 视觉扫描系统,采用先进的三维成像技术和算法输出直观点云图,进一步确保了PCB生产的可靠性与稳定性能
    的头像 发表于 08-28 16:35 262次阅读
    友思特方案  基于<b class='flag-5'>三维</b><b class='flag-5'>点</b><b class='flag-5'>云</b>实现PCB装配螺丝视觉检测

    起点,经过,终点,三点xyz,画三维圆弧。

    大家好!已知,起点,经过,终点,三点xyz,画三维圆弧。在三维图片框里面画。该如何实现?甚至三维
    发表于 07-17 21:33

    深度学习中的无监督学习方法综述

    应用中往往难以实现。因此,无监督学习深度学习中扮演着越来越重要的角色。本文旨在综述深度学习中的无监督
    的头像 发表于 07-09 10:50 487次阅读

    泰来三维 三维扫描古建筑-苏巴什佛寺遗址数字化保护

    首先对苏巴什佛寺古遗迹外部三维数据采集,获取精准三维数据。数据采集之后进行内业处理,数据成果包括高精模型和全彩
    的头像 发表于 07-03 13:43 298次阅读
    泰来<b class='flag-5'>三维</b> <b class='flag-5'>三维</b>扫描古建筑-苏巴什佛寺遗址数字化保护

    友思特案例 | 自研创新!三维工件尺寸测量及处理解决方案

    3D相机等新型传感器的发展克服了传统工件尺寸测量的各种局限,可获取丰富的三维数据。友思特提供了一种工件3D尺寸测量和
    的头像 发表于 06-13 14:13 341次阅读
    友思特案例 | 自研创新!<b class='flag-5'>三维</b>工件尺寸测量及<b class='flag-5'>点</b><b class='flag-5'>云</b><b class='flag-5'>处理</b>解决方案

    泰来三维|数字化工厂_煤矿三维扫描数字化解决方案

    采用大空间三维激光扫描仪对厂区内部进行架站式精准三维扫描。厂区外部采用无人机倾斜摄影的方式获取彩色模型数据,采集控制坐标与三维
    的头像 发表于 05-29 11:55 427次阅读
    泰来<b class='flag-5'>三维</b>|数字化工厂_煤矿<b class='flag-5'>三维</b>扫描数字化解决方案

    泰来三维|三维扫描服务_三维激光扫描仪测量山体滑坡建模

    中,建模不仅能快速地构建准确的三维数字模型,而且能够支持参考与对比,依据模型数据的分析处理有效得到地质灾害的风险评估结果。同时,
    的头像 发表于 05-15 16:32 251次阅读
    泰来<b class='flag-5'>三维</b>|<b class='flag-5'>三维</b>扫描服务_<b class='flag-5'>三维</b>激光扫描仪测量山体滑坡<b class='flag-5'>点</b><b class='flag-5'>云</b>建模

    泰来三维|三维扫描服务_三维扫描助力园区改造公园

    三维激光扫描仪利用激光反射测距原理,通过接受和返回的信号,获取三维空间坐标。这种测量方式可以无接触快速获取大型建筑三维空间数据,实现实体
    的头像 发表于 05-07 11:44 240次阅读
    泰来<b class='flag-5'>三维</b>|<b class='flag-5'>三维</b>扫描服务_<b class='flag-5'>三维</b>扫描助力园区改造公园

    泰来三维|三维扫描数据怎么处理如何建模

    faro premium 350三维激光扫描仪最终采集的数据以云和图像的形式储存在扫描仪设备里,运用专门进行一定处理后,能获取建筑物的相对位置信息、尺寸、纹理和形状,进而建立真实的物体数据模型。
    的头像 发表于 04-23 13:53 301次阅读

    泰来三维|文物三维扫描,文物三维模型怎样制作

    制作的呢,今天和大家聊聊,三维扫描技术文物三维扫描文物三维模型的建立。 1、数据采集与处理 工作流程 ➤原始三维数据采集
    的头像 发表于 03-12 11:10 544次阅读
    泰来<b class='flag-5'>三维</b>|文物<b class='flag-5'>三维</b>扫描,文物<b class='flag-5'>三维</b>模型怎样制作

    泰来三维|见过三维扫描乌贼吗?三维扫描助力仿生设计学研究

    利用双光源手持3D扫描仪EinScan H2三维扫描仪对乌贼整体 重点躯干进行扫描,获取乌贼三维扫描模型。扫描过程中通过软件可以实时看到扫描进度以及扫描数据质量。
    的头像 发表于 01-26 11:25 361次阅读

    基于深度学习三维重建技术

    多视图立体几何(Multi-View Stereo,MVS)是计算机视觉中重要的研究领域,也是迈入三维计算机视觉研究的重点问题。它通过利用多张互相重叠的图像恢复出原始三维场景的几何结构和纹理信息,是现实中拍摄照片的逆过程。
    的头像 发表于 12-04 10:08 867次阅读
    基于<b class='flag-5'>深度</b><b class='flag-5'>学习</b>的<b class='flag-5'>三维</b>重建技术