港中文和商汤研究员提出高效的三维点云目标检测新框架-电子发烧友网

激光雷达在自动驾驶、无人机和机器人领域受到越来越多的关注，对于点云的分类、检测和分割的视觉任务也在高速发展。但由于激光雷达产生的点云十分稀疏且不规则，图像领域的方法无法有效地拓展到三维点云的分析和处理中。

为了有效处理这一问题，来自香港中文大学和商汤的研究人员们通过对目标的部分感知和聚合对点云特征进行抽取和分析，提出了可以精确预测目标内部相对位置并给出三维候选框的网络架构；同时利用可差分的ROI-aware池化和点云聚合网络对内部信息进行提取和聚合；最后在目标内部各部分空间相关信息的辅助下实现了高效的三维点云目标检测算法Part-A^2 Net(Part-Aware and Aggregation)。

图中可以看到预测出的结果不仅包含了每个框的坐标，目标内部点的颜色还表示了每个点的相对位置，对于提高目标检测的性能十分重要。

目前的三维检测算法主要集中在以下几个方法。

一类方法将点云投影到鸟瞰视图下并利用2D的卷积网络进行特征抽取从而实现三维目标检测；

另一类方法则将三维空间划分为规则的体素，并利用三维(稀疏)卷积进行特征抽取；

还有的方法利用点云与图像结合，在二维图像中检测出目标bbox随后利用PointNet基于2D结果对点云进行裁剪和处理并获取三维框。

但这些方法都会受到来自投影过程、体素量化过程或2D目标检测器造成信息损失的影响，无法精确有效地进行三维点云的目标检测。为了更有效地处理三维点云，研究人员们开始尝试直接从点云中抽取特征生成3D候选框，利用三维bbox标注直接生成对前景和背景进行有效分离的标签。在此过程中研究人员发现三维bbox不仅提供了分割的标签，同时还精确地给出了目标内部各部分精确的相对位置。

与二维图像中会相互遮挡的物体不同，三维点云中的物体都是天然分离的，使得三维目标内部各个部分的相对位置可以精确获取，这些方法将有效提高目标检测方法的性能。基于这样的观察结果，研究人员提出了一个部分感知和聚合的网络结构来进行三维点云目标检测。

研究人员从三维标注数据获得的目标内部各部分的相对位置标签和分割标签来辅助三维候选框的生成过程，随后对每个候选框内的3D目标部分位置进行聚合来为bbox评分并对框的位置进行优化。这种方法为点云处理提供了新的视角，并帮助算法在目标检测中取得更好的结果。

上图中可以看到算法分为了两个主要的部分，部分感知模块用于精确估计目标内部各个部分/点间的相对位置，同时给出三维的候选框；聚合部分针对每个候选框内的点进行ROI池化和分组，实现特征抽取；随后利用聚合网络来对框进行评测并给予内部的相对空间信息对位置进行优化。

估计对象内各部分的位置

为了有效分离出点云中的前景和背景并预测出对象内部各部分的相对位置，需要从点云中获取可分辨的逐点特征。

研究人员首先使用了体素化的三维空间并利用卷积对非空的体素进行特征抽取。每个体素的中心被视为一个新的点，这些点构成了一个与原始点云近似的新点云（体素大小5cm5cm10cm，空间大小70m80m4m)。在使用的KITTI数据中每个数据样本包含了大概16000非空的体素。

用于特征抽取额U-Net架构和对应的上采样模块

为了对稀疏的体素信息进行高效的处理，研究人员利用U-Net的架构对点云进行了下采样和特征抽取。为了得到前景分割和各部分位置的预测，还需要对进行上采样解码。模块中同时对隐含特征和底层特征进行融合，最后通过稀疏逆卷积实现下采样。

对象内各部分的相对位置信息是网络对目标进行识别和检测的保证。例如车辆的侧面几乎是垂直于地面的，而轮子是与地面相接触的。通过学习和估计前景分割和目标内部各个点的相对位移关系将使得网络可以学会推理出目标的位姿和形态，提高检测性能。在U-Net主干网络的基础上，模型通过两个分支分别进行前景分割和目标内部个部分的位置预测。针对目标内部的点，需要先将全局的三维坐标转换为局部的坐标进行分析。在三维点云的bbox中天然的包含了框中每一个点在对象内部的坐标。研究人员通过将目标内部的点转换到框原点坐标系中并利用框的w,l.h来归一化，得到了内部点在内部坐标系下的新表示，并作为预测内部各部分点相对位置的标签。网络将通过优化二值化的交叉熵来实现对于每一个对象内部点相对位置的预测。

最后为了生成三维候选框来聚合各个目标内部的位置信息，研究人员在U-Net的特征图位置补充了一个RPN(regional proposal network)结构，通过对1/8下采样的特征图和不同高度融合的鸟瞰特征图进行处理生成3D候选区域。

具有ROI感知的点云特征池化

在得到目标内部各个的相对位置和一系列的三维候选框后，将要对box进行评分，并通过聚合同一候选框内的所有点的相对信息来实现候选框的位置优化。

为了避免池化带来了信息损失和模糊，研究人员提出了ROI感知的点云池化模块，将3D候选分配到固定大小(14*14*14)的均匀体素中去。体素中的特征通过(最大池化，均值池化)聚合内部点的特征来得到，并将空体素的特征设置为0。池化过程中联合编码空体素。这一过程将不同的三维候选框归一化到了相同的坐标系下，其中每个体素都编码了对应候选框中栅格特征。

内部位置的聚合与三维bbox的优化

研究人员通过聚合候选框内部所有三维点的内部相对位置来评价候选框的质量，并通过基于学习的优化方法来解决这一问题。

针对每个三维候选框，首先通过平均池化预测每个点的位置，通过最大池化获取每个点的特征。随后通过逐级处理的方式来最终预测最终的得分与优化后的bbox坐标。

结果

在实验过程中，研究人员结合了三部分的损失函数来对模型进行了训练，分别是复杂前景分割的focal损失，负责回归每个内部点相对位移的二进制交叉熵以及负责进行三维候选框生成的平滑L1损失。

针对聚合阶段还包括了IoU回归的二进制交叉熵以及位置优化的平滑L1。研究人员在KITTI上进行了实现，下表显示了这一方法在平均精度上显著高于先前的解决方案。

同时消溶性分析还显示这一方法通过对于特征的有效学习有效提高了召回率和精度。

最终的结果可以看到对于场景中车辆的预测性能优异，而每个框内的部分位置也实现了较为精确的预测。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

激光雷达

激光雷达

+关注

关注
968

文章
4024

浏览量
190369
三维检测

三维检测

+关注

关注
0

文章
15

浏览量
2186

原文标题：深度解析 | 港中文和商汤研究员提出高效的三维点云目标检测新框架

文章出处：【微信号：thejiangmen，微信公众号：将门创投】欢迎添加关注！文章转载请注明出处。

基于深度学习的三维点云配准方法

基于深度学习的三维点云配准方法成为研究的主流，并随之诞生了DeepVCP、DGR、Predator等著名的方法。

发表于 11-29 11:41 •1881次阅读

精密铸造+三维扫描=机械制造完美解决方案

；step3.数模与扫描数据进行拟合对齐，进行三维检测分析；step4.根据检测数据对产品外形进行修正优化。/ 04 /扫描数据结果▼铸件连杆扫描数据▲铸件连杆的点

发表于 08-09 11:17

如何快速高效的完成汽车前盖板的三维检测？

如何快速高效的完成汽车前盖板的三维检测？行业背景汽车的前盖板在生产出来后往往因为焊接和零件的误差难以装配，检测便成了生产和安装两个环节之间的重要步骤。缩短

发表于 08-11 14:16

三维检测汽车零件帮助汽车性能达标

]三维点云及stl数据STEP4：数模与扫描数据进行拟合对齐，进行检测分析[img][/img]三维检测

发表于 08-21 10:48

三维快速建模技术与三维扫描建模的应用

的HANDYSCAN三维激光扫描仪采集它的三维点云信息，然后利用Vxelements软件对多站式点云

发表于 08-07 11:14

一种基于概率框架的三维点云生成模型PointFlow

作为三维数据的重要形式，点云由于较高的分辨率和对复杂细节更好的表达越来越受到研究人员的青睐。有效的点云

发表于 08-02 14:32 •6423次阅读

基于深度学习的三维点云语义分割研究分析

近年来，深度传感器和三维激光扫描仪的普及推动了三维点云处理方法的快速发展。点云语义分割作为理解

发表于 04-01 14:48 •16次下载

基于激光雷达点云的三维目标检测算法

文中提出了一种基于激光雷达点云的三维目标检测算法 Voxeircnn（ Voxelization

发表于 05-08 16:35 •45次下载

点云的概念以及与三维图像的关系

点云概念点云与三维图像的关系：三维图像是一种特殊的信息表达形式，其特征是表达的空间中

发表于 08-17 09:18 •7377次阅读

基于三维激光点云的目标识别与跟踪研究

基于三维激光点云的目标识别与跟踪研究来源：《汽车工程》，作者徐国艳等［摘要］针对无人车环境感知中的障碍物

发表于 01-17 11:22 •812次阅读

基于三维激光点云的目标识别与跟踪研究

基于三维激光点云的目标识别与跟踪研究来源：《汽车工程》，作者徐国艳等［摘要］针对无人车环境感知中的障碍物

发表于 02-15 13:36 •3058次阅读

三维点云数据的两种结构Kdtree和Octree

三维点云数据用于表征目标表面的海量点集合，但是各个离散点之间并没有拓扑关系，一般通过建立

发表于 03-14 10:57 •7634次阅读

什么样的点可以称为三维点云中的关键点呢？

本工作受D2-Net启发，提出了一种新的三维点云关键点定义方式，将其与三维点的特征描述子关联起来

发表于 11-22 09:46 •1374次阅读

三维计算视觉研究分析

三维计算视觉研究内容包括： 1）三维匹配：两帧或者多帧点云数据之间的匹配，因为激光扫描光束受物体遮挡的原因，不可能通过一次扫描完成对整个物

发表于 06-19 11:06 •721次阅读

友思特方案基于三维点云实现PCB装配螺丝视觉检测

三维点云是完成精密化 PCB 检测的最新视觉技术。友思特 Saccde Vision 视觉扫描系统，采用先进的三维成像技术和算法输出直观点云

发表于 08-28 16:35 •348次阅读

搜索历史

港中文和商汤研究员提出高效的三维点云目标检测新框架

评论

基于深度学习的三维点云配准方法

精密铸造+三维扫描=机械制造完美解决方案

如何快速高效的完成汽车前盖板的三维检测？

三维检测汽车零件帮助汽车性能达标

三维快速建模技术与三维扫描建模的应用

一种基于概率框架的三维点云生成模型PointFlow

基于深度学习的三维点云语义分割研究分析

基于激光雷达点云的三维目标检测算法

点云的概念以及与三维图像的关系

基于三维激光点云的目标识别与跟踪研究

基于三维激光点云的目标识别与跟踪研究

三维点云数据的两种结构Kdtree和Octree

什么样的点可以称为三维点云中的关键点呢？

三维计算视觉研究分析

友思特方案基于三维点云实现PCB装配螺丝视觉检测

搜索历史

港中文和商汤研究员提出高效的三维点云目标检测​新框架

评论

港中文和商汤研究员提出高效的三维点云目标检测新框架