0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

什么样的点可以称为三维点云中的关键点呢?

3D视觉工坊 来源:3D视觉工坊 作者:秦岭北麓小丹童 2022-11-22 09:46 次阅读

0.笔者个人体会:

这个工作来自于香港科技大学和香港城市大学。我们知道,随着三维传感器以及相关扫描技术的进步,三维点云已经成为三维视觉领域内一项十分重要的数据形式。并且随着深度学习技术的发展,许多经典的点云深度学习处理方法被提出来。但是,现有的大多数方法都关注于点云的特征描述子学习。并且,在稠密的点云数据帧中,如果对所有点云都进行处理,将会带来巨大的计算和内存压力。

针对这种问题,提取部分具有代表性的关键点则成为一种自然而且有效的策略。但是,什么样的点可以称为三维点云中的关键点呢?这个问题仍然是一个开放的、没有明确答案的问题。 本工作受D2-Net启发,提出了一种新的三维点云关键点定义方式,将其与三维点的特征描述子关联起来,有效的回答了什么是三维点云中的关键点,并验证了该方法检测到的关键点的可重复性。

但是,本方法的不足也十分明显。正是由于它将关键点的检测定义在三维点云点特征上,因此,在检测关键点时,需要对输入点云的所有点都提取相应的点特征。这样的话,即使此方法检测到的关键点可以有效用于后续任务,但此方法本身仍需处理完整点云中的所有点,并不能在关键点提取阶段就有效的降低计算和内存压力。

1、论文相关内容介绍:

论文标题: D3Feat: Joint Learning of Dense Detection and Description of 3D Local Features

摘要:

成功的点云配准通常取决于通过有区分性的3D局部特征鲁棒地建立稀疏匹配。尽管基于学习的3D特征描述子发展迅速,但很少有人关注3D特征检测器的学习,更不用说两个任务的联合学习。

在本文中,我们将3D全卷积网络用于 3D点云,并提出了一种新颖实用的学习机制,可以稠密预测每个3D点的检测分数和描述特征。特别是,我们提出了一种关键点选择策略,该策略克服了3D点云的固有密度变化,并进一步提出了一种由训练期间的动态特征匹配结果引导的自监督检测器损失。

最后,我们的方法在3DMatch和KITTI数据集上进行了评估,在室内和室外场景中都取得了最先进的结果,并在ETH数据集上显示了其强大的泛化能力。在实际使用中,结果表明,通过采用可靠的特征检测器,采样较少数量的特征就足以实现准确和快速的点云对齐。

主要贡献:

1.我们利用基于KPConv的全卷积网络,并采用联合学习框架进行3D局部特征检测和描述,无需构建对偶结构,从而可以进行快速推理。

2. 我们提出了一种新的密度不变关键点选择策略,这是获得3D点云可重复性高的关键点的关键。 3. 我们提出了一种自监督检测器损失,它在训练期间从动态特征匹配结果中获取有意义的引导,从而保证了紧密耦合的描述子和检测器的收敛。

方法介绍:

D2-Net是一种最近提出的一种2D 图像匹配方法,受其启发,我们没有为关键点检测和描述训练单独的网络,而是设计了一个具有双重作用的单个神经网络:稠密特征描述符和关键点检测器。

然而,由于点云的不规则性和不同的稀疏性,将D2-Net的思想应用于3D领域并非易事。在下方法,我们将首先描述对不规则 3D点云进行特征描述子提取和和关键点检测的基本步骤,然后解释我们的方法在3D领域中处理稀疏性变化的策略。

65efa5a0-69f2-11ed-8abf-dac502259ad0.png

Fig1:(左)D3Feat的网络架构。每个块表示一个使用KPConv代替图像卷积的ResNet块。除了最后一层之外的所有层都使用Batch Normalization和ReLU。(右)关键点检测。在稠密点特征提取之后,我们通过应用显著性分数和通道最大分数来计算关键点检测分数。

一、稠密特征描述子提取

为了解决不规则点的卷积问题并更好地捕获局部几何信息,KPConv方法被提出来,它使用带卷积权重的核点来模拟二维卷积中的核像素,然后在原始点云上定义卷积操作。我们采用KPConv作为我们的骨干网络来执行稠密特征提取操作。下面我们先简单回顾一下KPConv的方法。 以矩阵形式表示给定的一组点662b244a-69f2-11ed-8abf-dac502259ad0.png和一组特征663860c4-69f2-11ed-8abf-dac502259ad0.png,令xi和fi分别表示中的第i个点及其在6643704a-69f2-11ed-8abf-dac502259ad0.png中相应的特征。定义在核g上的x点的卷积为 66529c5a-69f2-11ed-8abf-dac502259ad0.png 其中66668d5a-69f2-11ed-8abf-dac502259ad0.png是x点的半径邻域,xi是该邻域的支撑点。核函数定义为 66739dd8-69f2-11ed-8abf-dac502259ad0.png 其中 是核点66885caa-69f2-11ed-8abf-dac502259ad0.png和支持点之间的相关性函数,669ac8cc-69f2-11ed-8abf-dac502259ad0.png是核点66885caa-69f2-11ed-8abf-dac502259ad0.png 的权重矩阵,K是核点的个数。

我们建议读者参考KPConv原始论文了解更多详细信息。 KPConv的原始公式不是对点云密度不变的,因此,我们在以上公式中添加了一个密度归一化项,它总结了x附近的支持点的数量,以确保卷积是稀疏不变的的: 66c09372-69f2-11ed-8abf-dac502259ad0.png

基于归一化核点卷积,我们采用带有跨层连接和残差块的类似UNet的结构来构建全卷积网络,如图1(左)所示。 与仅支持稀疏特征描述子的基于块的方法不同,我们的网络能够在完卷积设置下执行稠密的特征描述子提取。我们网络的输出是二维矩阵66d16b0c-69f2-11ed-8abf-dac502259ad0.png形式的稠密特征图,其中c是特征向量的维度。点的描述子记为66df9de4-69f2-11ed-8abf-dac502259ad0.png66f3f0aa-69f2-11ed-8abf-dac502259ad0.png 其中67044a9a-69f2-11ed-8abf-dac502259ad0.png表示二维矩阵的第i行,特征描述子被L2归一化到单位长度。

二、稠密关键点检测

D2-Net在特征图的空间和通道维度上的局部最大值,并使用softmax来评估像素的局部最大值以检测二维图像关键点。由于图像的规则结构,他们的方法只是选择相邻像素作为邻域。为了将他们的方法扩展到 3D,这种策略可能会被半径邻域所取代,以处理点云的非均匀采样设置。

但是,半径邻域中的相邻点的数量可能会有很大差异。在这种情况下,如果我们简单地使用softmax来评估空间维度上的局部最大值,那么点较少的局部区域本来就会有更高的分数。为了解决这个问题,我们提出了一个密度不变的显著性分数来评估某个点与其局部邻域相比的显著性。给定稠密特征图66d16b0c-69f2-11ed-8abf-dac502259ad0.png,我们认为为3D响应 671f92a0-69f2-11ed-8abf-dac502259ad0.png的集合: 67341838-69f2-11ed-8abf-dac502259ad0.png 其中67489cd6-69f2-11ed-8abf-dac502259ad0.png表示二维矩阵的第 k 列。点为关键点的原则是 675aa85e-69f2-11ed-8abf-dac502259ad0.png 其中677195aa-69f2-11ed-8abf-dac502259ad0.png是xi的半径邻域。这表示 首先选择最显著的通道,然后通过它是否是该特定响应图678248aa-69f2-11ed-8abf-dac502259ad0.png上其空间局部邻域的最大值来验证。在训练期间,我们通过应用两个分数来使上述过程可微以使其可训练,如图 1(右)所示。

1.密度不变显著性得分:

该分数旨在评估一个点与其局部邻域中的其他点相比的显著性。在 D2-Net中,评估局部最大值的分数定义为xi 6792040c-69f2-11ed-8abf-dac502259ad0.png 然而,这个公式对于稀疏性不是不变的。因为分数是通过总和归一化的,这使得稀疏区域固有的比稠密区域具有更高的分数。

因此,我们设计了一个密度不变的显著性分数,如下所示: 67a401ca-69f2-11ed-8abf-dac502259ad0.png 在这个公式中,一个点的显著性分数被计算为其特征与其局部邻域的平均特征之间的差异。因此,它测量了中心点相对于局部区域中支持点的相对显著性。此外,使用平均响应代替总和可以防止分数受到邻域中点数的影响。

2.通道最大得分:

该分数旨在为每个点挑选最显著的通道: 67aecaf6-69f2-11ed-8abf-dac502259ad0.png 最后,将两个分数都考虑到最终的关键点检测得分: 67bed5ae-69f2-11ed-8abf-dac502259ad0.png 因此,在获得输入点云的关键点得分图后,我们选择得分最高的点作为关键点。

三、联合优化特征描述子提取器和关键点检测器

设计合适的监督信号是联合优化特征描述子提取器和关键点检测器的关键。在本节中,我们将首先描述描述子的度量学习损失,然后从自监督的角度设计检测器损失。

1.特征描述子提取损失函数

为了优化特征描述子提取网络,许多工作尝试使用度量学习策略,如对比损失和三元组损失。我们这里将使用对比损失,因为从我们的实验中可以发现它可以提供更好的收敛性能。至于采样策略,我们采用的是hardest in batch策略,使网络专注于最难的点对。 给定一对部分重叠的点云碎片P和Q,以及一个包括n对对应3D点的集合。假设67d343cc-69f2-11ed-8abf-dac502259ad0.png是一个对应对,对应的两点的描述子记为67e52c40-69f2-11ed-8abf-dac502259ad0.png67f5d522-69f2-11ed-8abf-dac502259ad0.png,得分记为6801616c-69f2-11ed-8abf-dac502259ad0.png68126836-69f2-11ed-8abf-dac502259ad0.png,然后将正样本对之间的距离定义为它们的描述子之间的欧几里得距离,即 682098e8-69f2-11ed-8abf-dac502259ad0.png 负样本对之间的距离被定义为: 682d5038-69f2-11ed-8abf-dac502259ad0.png 其中R是安全半径,6845ef26-69f2-11ed-8abf-dac502259ad0.png是位于真实对应安全半径之外的最难负样本。对比损失定义为 68567dfa-69f2-11ed-8abf-dac502259ad0.png 其中686d1574-69f2-11ed-8abf-dac502259ad0.png是正对的边界,687de818-69f2-11ed-8abf-dac502259ad0.png是负对的边界。

2.关键点检测器损失函数

为了优化关键点检测器网络,我们寻求一种损失公式,鼓励容易匹配的对应点比难以匹配的对应点具有更高的关键点检测分数。D2-Net提出了对三元组边界损失的扩展,以联合优化特征描述子提取和关键点检测器: 688db252-69f2-11ed-8abf-dac502259ad0.png

其中M是三元组边界。然而,这个损失并没有为分数项提供明确的引导,并且这个原始损失公式并不能保证在我们的方法收敛。

因此,我们设计了一个损失项来明确引导分数的梯度。从自监督的角度来看,我们使用on-the-fly特征匹配结果来评估每个对应点的判别性,这将引导每个关键点的得分的梯度传播。

如果对应点在当前描述子提取网络下可以匹配,我们希望其得分更高,反之亦然。具体来说,我们将关键点检测器损失定义为 68c67cd6-69f2-11ed-8abf-dac502259ad0.png 直观地说,如果68d6be0c-69f2-11ed-8abf-dac502259ad0.png,则表明该对应点可以使用最近邻搜索正确匹配,并且损失项将鼓励对应的两点获得的分数68e8c8ea-69f2-11ed-8abf-dac502259ad0.png68fcd164-69f2-11ed-8abf-dac502259ad0.png更高。相反,如果690cfa44-69f2-11ed-8abf-dac502259ad0.png ,则对应点的描述子不足以使它们建立对应关系,因此损失将鼓励降低其得分。








审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 检测器
    +关注

    关注

    1

    文章

    860

    浏览量

    47651
  • ETH
    ETH
    +关注

    关注

    0

    文章

    66

    浏览量

    3485
  • 卷积网络
    +关注

    关注

    0

    文章

    42

    浏览量

    2156

原文标题:什么样的点可以称为三维点云的关键点?

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基于深度的关键匹配算法实现单步多人绝对三维姿态

    对于二信息,我们采用与 OpenPose 相同的表示方式。关键热度图(Heatmaps)表示关键位于某个像素的概率,
    的头像 发表于 09-02 17:03 4898次阅读

    基于深度学习的三维云配准方法

    基于深度学习的三维云配准方法成为研究的主流,并随之诞生了DeepVCP、DGR、Predator等著名的方法。
    发表于 11-29 11:41 1758次阅读

    起点,经过,终点,三点xyz,画三维圆弧。

    大家好!已知,起点,经过,终点,三点xyz,画三维圆弧。在三维图片框里面画。该如何实现?甚至三维
    发表于 07-17 21:33

    如何运用LabVIEW中的三维控件

    如何运用LabVIEW中的三维控件?我想将excel中的数据在LabVIEW中显示出来,显现出三维定点的效果
    发表于 05-15 16:28

    三维快速建模技术与三维扫描建模的应用

    `三维快速建模技术与三维扫描建模的应用随着数字化测量的发展,三维激光扫描仪能够快速地以多角度、高效、高精度方式获取物体的表面三维数据,可以
    发表于 08-07 11:14

    想问下如果知道一个物体的三维集,labview有没有哪个部件,能够用给出的集绘制成三维图,类似3dmax的效果

    想问下如果知道一个物体的三维集,labview有没有哪个部件,能够用给出的集绘制成三维图,类似3dmax的效果如题
    发表于 07-02 18:26

    视频运动捕获系统中多标记三维跟踪算法

    针对视频运动参数捕获系统中标记无法被正确匹配及跟踪的问题,提出一种多目标三维立体跟踪算法。该算法通过二三维卡尔曼滤波预测来标记的位置
    发表于 04-08 09:00 21次下载

    港中文和商汤研究员提出高效的三维云目标检测​新框架

    与二图像中会相互遮挡的物体不同,三维云中的物体都是天然分离的,使得三维目标内部各个部分的相对位置可以
    的头像 发表于 08-02 14:18 3477次阅读
    港中文和商汤研究员提出高效的<b class='flag-5'>三维</b><b class='flag-5'>点</b>云目标检测​新框架

    便携式三维扫描仪反光标记

    便携式三维扫描仪反光标记 手持式三维激光扫描仪激光反光标记可以定制:3mm、3.5mm、4mm、5mm、6mm、8mm、10mm、12m
    发表于 04-10 11:43 3422次阅读

    计算机视觉:三维云数据处理学习内容总结

    三维计算视觉研究内容包括: 1)三维匹配:两帧或者多帧云数据之间的匹配,因为激光扫描光束受物体遮挡的原因,不可能通过一次扫描完成对整个物体的三维
    的头像 发表于 11-27 10:32 4795次阅读

    通过多模态特征融合来设计三维云分类模型

    针对云数据本身信息量不足导致现有三维云分类方法分类精度较低的问题,结合多模态特征融合,设计一种三维云分类模型。通过引入投影图对
    发表于 03-11 14:09 3次下载
    通过多模态特征融合来设计<b class='flag-5'>三维</b><b class='flag-5'>点</b>云分类模型

    基于深度学习的三维云语义分割研究分析

    近年来,深度传感器和三维激光扫描仪的普及推动了三维云处理方法的快速发展。云语义分割作为理解三维场景的
    发表于 04-01 14:48 16次下载
    基于深度学习的<b class='flag-5'>三维</b><b class='flag-5'>点</b>云语义分割研究分析

    云的概念以及与三维图像的关系

    逆向工程设备都将物体采样成云)。和二图像相比,三维图像借助第个维度的信息,可以实现天然的物体——背景解耦。
    的头像 发表于 08-17 09:18 7142次阅读
    <b class='flag-5'>点</b>云的概念以及与<b class='flag-5'>三维</b>图像的关系

    三维云数据的两种结构Kdtree和Octree

    三维云数据用于表征目标表面的海量集合,但是各个离散之间并没有拓扑关系,一般通过建立云的空间索引来实现基于邻域关系的快速查找。在
    的头像 发表于 03-14 10:57 7324次阅读

    什么是三维云分割

    云是世界的一种非结构化三维数据表示,通常由激光雷达传感器、立体相机或深度传感器采集。它由一系列单个组成,每个由 x、y 和 z 坐标定义。
    的头像 发表于 10-29 09:21 125次阅读