0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

通过场景landmark做定位的新思路(CVPR 2022)

3D视觉工坊 来源:3D视觉工坊 作者:3D视觉工坊 2022-12-16 11:32 次阅读

主要内容:提出了一种基于学习的相机定位算法,其无需存储图像特征和场景三维点云,降低了存储限制,通过识别场景中稀疏但显著有代表性的landmark来找到2D-3D对应关系进行后续的鲁棒姿态估计,通过训练检测landmark的场景特定的CNN来实现所提出的想法,即回归输入图像中对应landmark的2D坐标。

634694fc-7ce5-11ed-8abf-dac502259ad0.png

创新点与Contributions:1)与大多数landmark通常可见的人体姿态估计不同,由于相机视野有限并且无法同时观察场景的不同部分,相机姿态估计任务中大多数场景landmark不会同时可见,文章通过提出一种新的神经方位估计器(Neural Bearing Estimator,NBE)来解决这一问题,该估计器可以直接回归相机坐标系中场景landmark的3D方位向量,NBE学习全局场景表示的同时学习预测场景landmark的方向向量,即使它们不可见。 2)提出了一个新的室内定位数据集,INDOOR-6,相对于传统的7-Scenes室内数据集,包含更多变化的场景、昼夜图像和强烈的照明变化 3)与现有的无存储定位方法相比,具有低存储的优点且性能较好 文章提出了两种预测图像中场景landmark的方法,在第一种方法中训练了一个模型来识别图像中的2D场景地标,称之为场景地标检测器(SLD),由于假设已知的相机内参,这些2D检测可以转换为3D方位矢量或射线。在第二种方法中训练了一个不同的模型直接预测相机坐标系中landmark的3D方位向量,称之为神经方位估计器(NBE)。注:使用SLD,只能检测到相机视场(FoV)中可见的landmark,而NBE预测所有landmark的方位,包括相机视场外不可见的landmark。

63d732a0-7ce5-11ed-8abf-dac502259ad0.png

首先会有一个SFM构建的点云模型,会在这些点云中挑选出有代表性的点云子集,用这些子集以及建图时SFM算法生成的数据库图像的伪真值来训练两个提出的网络模型。SLD:SLD被设计为将RGB图像I作为输入并输出一组像素似然图(热图)表示每个可见地标的位置,其模型架构如下:

68351844-7ce5-11ed-8abf-dac502259ad0.png

由四个主要组件组成:使用ResNet-18为backbone,删除最后三个最大池化层以保留高分辨率特征图(输出分辨率为输入图像分辨率的四分之一),其次在ResNet-18之后使用扩张卷积块,扩张率设置为1、2、3和4,接下来转置卷积层执行上采样,并负责生成分辨率为输入图像一半的热图,最后一层由1×1卷积组成,预测L个热图通道,每个地标一个。 训练损失:

684cdd6c-7ce5-11ed-8abf-dac502259ad0.png

在推断过程中,假设当其最大热图值超过阈值τ=0.2时表明检测到地标,利用亚像素精度计算热图峰值位置处裁剪的17×17 patch的期望值。NBE:设计了一个模型在给定图像I的情况下回归全部场景landmark(即使它不可见)的方位向量。 CNN将图像I作为输入以生成深度特征图,然后是多个MLP(多层感知器)块,每个块输出指向landmark的方向向量,MLP包含两个全连接层,具有128个ReLU激活节点。

686f7782-7ce5-11ed-8abf-dac502259ad0.png

6899dd88-7ce5-11ed-8abf-dac502259ad0.png

训练好两个模型后,将每个查询图像输入SLD网络以获得2D检测,然后根据内参将其转换为一组landmark方位向量B1,如果检测到超过八个场景landmark,使用鲁棒最小解算器(P3P+RANSAC)计算相机姿态,然后使用基于Levenberg-Marquardt的非线性细化。如果没有8个,将相同的图像输入NBE网络并获得预测方位B2,然后合并方位估计B1和B2的集合以形成新的集合B3,当集合B1和B2中的方位指向同一地标时,保留来自B1的估计,因为SLD通常比NBE更准确。最后使用上面描述的相同过程但使用B3计算相机姿态。如何从点云中选择有代表性的场景landmark提供给网络进行训练?从SfM点云P中找到L个场景landmark的最佳子集是一个组合问题,其中评估每个子集都是困难的。本文受之前以贪婪的方式寻找有区别的关键点或场景元素工作的启发,去选择鲁棒性(具有更长的轨迹)、可重复性(在多个场景中看到)和可概括性(从许多不同的观看方向和深度观察)的场景landmark,测量轨迹长度大于阈值t的3D点x的显著性得分A(x),如下所示:

68d42042-7ce5-11ed-8abf-dac502259ad0.png

除了最大化总体显著性得分之外还寻找在空间上覆盖3D场景的场景landmark以便从场景内的任何地方都可以看到一些地标,例如无论摄像机在场景中的哪个位置都希望一些地标可见。为此使用算法1中描述的约束贪婪方法

68e57806-7ce5-11ed-8abf-dac502259ad0.png

下图表述一些挑选到的landmark在二维图像中的投影的裁剪patch

68fb4a1e-7ce5-11ed-8abf-dac502259ad0.png

实验:训练模型的细节可去论文中查看 实验数据集是在自己提出的INDOOR-6数据集和7Scenes数据集上

69223e26-7ce5-11ed-8abf-dac502259ad0.png

评估了单独使用NBE, SLD,联合使用NBE+SLD, NBE+SLD(E)(是更紧凑的网络),和SOTA的基于分层定位方法结合HLoc+SLD Baseline为Posenet、DSAC、HLoc 在INDOOR-6数据集上的结果:

697d9d3e-7ce5-11ed-8abf-dac502259ad0.png

69c240b0-7ce5-11ed-8abf-dac502259ad0.png

存储比较和消融研究:

6a35e38a-7ce5-11ed-8abf-dac502259ad0.png

7Scenes数据集上的实验结果:

6a53983a-7ce5-11ed-8abf-dac502259ad0.png

总结:算法是一种存储要求低但精度高的方法。主要见解是在人和物体姿态估计中广泛用于关键点检测的现代CNN架构也适用于检测显著的、场景特定的3D landmark。 实验结果表明,其方法优于以前的无存储方法,但不如HLoc(顶级检索和匹配方法之一)准确,但是HLoc需要高存储。而且基于landmark的2D–3D对应关系补充了HLoc的对应关系,并且在计算姿态之前结合这些对应关系进一步提高了HLoc精度。局限性:首先神经网络是特定于场景的,像其他学习方法一样每个场景需要许多训练图像,而且在使用之前需要仔细选择场景landmark集。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4773

    浏览量

    100890
  • 算法
    +关注

    关注

    23

    文章

    4620

    浏览量

    93047
  • cnn
    cnn
    +关注

    关注

    3

    文章

    353

    浏览量

    22246

原文标题:通过场景landmark做定位的新思路(CVPR 2022)

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    蓝牙人员定位技术:场景化应用与优势分析

    在当今智能化、数字化的时代,蓝牙人员定位技术凭借其低功耗、高精度和易于部署的特点,在众多场景中发挥着重要作用。云酷科技将结合具体场景,探讨蓝牙人员定位技术的优势和应用价值。 一、智能制
    的头像 发表于 12-31 16:51 92次阅读

    激光锡焊视觉定位技术的应用场景

    本文主要介绍视觉定位概念、一种基于视觉定位的激光焊接系统的结构和组成,及该焊接系统在某些特定场景的具体应用。
    的头像 发表于 12-13 09:10 163次阅读
    激光锡焊视觉<b class='flag-5'>定位</b>技术的应用<b class='flag-5'>场景</b>

    无线室内定位系统是通过什么技术实现的呢?

    无线室内定位系统作为现代科技的重要组成部分,广泛应用于智能家居、企业管理、医疗护理等多个领域。这些系统通过不同的技术手段实现高精度的室内定位,为用户带来便捷与高效。那么,无线室内定位
    的头像 发表于 09-10 09:28 411次阅读
    无线室内<b class='flag-5'>定位</b>系统是<b class='flag-5'>通过</b>什么技术实现的呢?

    单北斗定位终端的优势在哪些场景下更加凸显

    的准确性与可靠性,还通过实时动态追踪与短报文通信功能,为安全管理与高效作业提供了强有力的技术支持。单北斗定位终端单北斗定位终端的优势在多个场景下更加凸显,以下是一
    的头像 发表于 08-21 10:29 480次阅读
    单北斗<b class='flag-5'>定位</b>终端的优势在哪些<b class='flag-5'>场景</b>下更加凸显

    人员定位技术有哪些?10种人员定位技术原理及应用场景介绍

    人员定位是一种通过使用各种技术手段来确定人员位置和轨迹的方法。它在许多领域具有广泛的应用,包括安全监控、紧急救援、物流管理、室内导航等。本文将介绍一些常见的人员定位技术,并探讨它们的工作原理和应用
    的头像 发表于 08-19 10:32 1015次阅读
    人员<b class='flag-5'>定位</b>技术有哪些?10种人员<b class='flag-5'>定位</b>技术原理及应用<b class='flag-5'>场景</b>介绍

    高精度蓝牙aoa定位原理和应用场景

    定位技术的定位精度可达10厘米到30厘米,‌功能实现包括人员实时定位、‌施工人员数量统计点名、‌电子围栏、‌一键呼救、‌危险情况预警等。是通过阵列天线感知发射节点信号的到达方向,‌计算
    的头像 发表于 08-05 21:51 752次阅读

    电厂人员定位怎么?分享电厂人员定位系统解决方案

    人员定位技术广泛应用在各个行业,对于电厂来说,人员定位能够提升电厂人员管理效率,保障电厂员工人身安全。电厂人员定位怎么呢?我们一起来看看。 电厂人员
    的头像 发表于 07-29 11:46 698次阅读
    电厂人员<b class='flag-5'>定位</b>怎么<b class='flag-5'>做</b>?分享电厂人员<b class='flag-5'>定位</b>系统解决方案

    园区人员定位怎么?分享智慧园区人员定位系统解决方案

    如今人工智能、物联网、大数据、云计算等技术高速发展,将逐渐形成一个万物互联智能化的新时代,应用智慧化技术参与园区的规划、建设和运营,打造新型智慧园区是大势所趋。 打造智慧园区可通过部署人员定位系统来
    的头像 发表于 07-29 11:44 1395次阅读
    园区人员<b class='flag-5'>定位</b>怎么<b class='flag-5'>做</b>?分享智慧园区人员<b class='flag-5'>定位</b>系统解决方案

    人员定位系统于不同场景的实际应用

    人员定位系统的应用,尽管还没有做到大范围的普及,但是这一系统在不同企业,不同单位的实际应用效果还是很好的,所以人员定位系统也应用于不同场景当中了,那么,本文就来讲讲这一系统在不同场景
    的头像 发表于 07-08 16:53 353次阅读

    “技术故障”背刺巴菲特,金融大模型到底靠不靠谱?

    英特尔® 至强® CPU Max系列处理器在硬件能力、软件优化、生态适配、总拥有成本优势等方面都与金融场景非常契合,不失为业界大模型落地的一种新思路
    的头像 发表于 06-28 23:05 214次阅读
    “技术故障”背刺巴菲特,金融大模型到底靠不靠谱?

    OpenCV携Orbbec 3D相机亮相CVPR 2024,加速AI视觉创新

    在科技发展的浪潮中,一年一度的IEEE国际计算机视觉与模式识别会议(CVPR)无疑是视觉技术领域的一大盛事。今年的CVPR 2024于6月17日至21日在美国西雅图盛大举行,吸引了全球超过1.2万名参会者,这一数字打破了历史记录,让此次盛会成为了“史上最火爆的
    的头像 发表于 06-21 10:15 639次阅读

    北斗高精度定位手持终端在哪些场景中应用

    定位精度、稳定性和便携性,为各行各业提供了强有力的支持。北斗高精度定位手持终端北斗高精度定位手持终端在多个场景中都有广泛的应用方案,以下是一些主要
    的头像 发表于 06-04 14:32 513次阅读
    北斗高精度<b class='flag-5'>定位</b>手持终端在哪些<b class='flag-5'>场景</b>中应用

    北斗高精度定位终端适用于什么行业场景

    北斗高精度定位终端,凭借其卓越的定位精度和广泛的应用场景,正逐渐成为现代科技领域的璀璨明星。无论是在复杂多变的自然环境中,还是在高精尖的科技应用中,北斗高精度定位终端都以其出色的性能和
    的头像 发表于 05-23 11:47 408次阅读
    北斗高精度<b class='flag-5'>定位</b>终端适用于什么行业<b class='flag-5'>场景</b>

    云知声携手耘途教育成立云知学院福建分院,探索智慧教育新思路

    近日,云知声与耘途教育联合成立云知学院福建分院,深入探索智慧教育新模式、新思路
    的头像 发表于 05-11 15:52 564次阅读
    云知声携手耘途教育成立云知学院福建分院,探索智慧教育<b class='flag-5'>新思路</b>

    人员定位的行业应用以及五种定位技术大盘点

    人员定位技术是指通过利用不同的技术手段来实时获取、跟踪和定位人员的位置信息。它可以帮助用户准确了解某个人的具体位置,以实现人员管理、安全控制、资源调度等目的。人员定位技术通常基于一系列
    的头像 发表于 01-11 13:34 1878次阅读
    人员<b class='flag-5'>定位</b>的行业应用以及五种<b class='flag-5'>定位</b>技术大盘点