关于3D视觉定位技术详细解析-电子发烧友网

【摘要】3D视觉定位指的是根据事先构建的3D模型及相关信息，计算取得某张图像在拍摄时相机的位置和姿态。这是3D视觉的一项十分重要的技术，可以用来帮助实现人员定位与导航。本博文将基于2019年CVPR论文From Coarse to Fine： Robust Hierarchical Localization at Large Scale所采用的分级定位方案对该技术进行简要的介绍。基本原理3D.。.

引言

所谓3D视觉定位指的是根据事先构建的3D模型及相关信息，计算取得某张图像在拍摄时相机的位置和姿态。这是3D视觉的一项十分重要的技术，可以用来帮助实现人员定位与导航。本博文将基于2019年CVPR论文From Coarse to Fine： Robust Hierarchical Localization at Large Scale所采用的分级定位方案对该技术进行简要的介绍。

基本原理

3D视觉定位的直接目标是计算当前图像的照相机位姿，解决该问题的直接方案是建立3D点与2D点之间的匹配关系，通过二者的匹配关系估计相机位姿，这一问题被称作PnP（Pespective-n-Point）问题。求解PnP问题的方法有很多，常见的有P3P、EPnP、UPnP等，具体的如何实现本文不做介绍，读者可以自行搜索PnP问题的相关理论。而视觉定位需要解决的一大关键问题是如何建立3D点与2D点之间的匹配关系。对于这一点，论文作者Sarlin提出过一种分级定位的方案，以下将详细介绍该方案。

分级定位

分级定位的框架大约可以分成三步：预检索、共视聚类、局部匹配与定位。

预检索

预检索的意义在于获取前k张与当前图像最相似的图像，判断相似的依据通常是通过匹配图像的全局特征。一般而言，产生全局特征的方法可以依赖于局部特征所组成的词袋，不过近些年，一些深度学习方案也被引入了进来，例如NetVLAD或更加轻量级的MobileNetVLAD。最终通过获取当前图像的全局特征的k个最近邻来获取预检索得到的相近图集。

共视聚类

然而由于可能产生的错误匹配，所获取到的预检索图集并不一定全部都面向同一场景，这时就需要先将面向不同场景的图像区分开来，这项技术就被称作共视聚类，简而言之就是将具有共视关系的图像聚成一类。

这一过程实际十分简单，它是通过匹配同名点来获取的，这些同名点在早先进行的3D建模过程中通过特征的提取与匹配已经建立了对应的关系。若两个图像中存在稳定的同名点，则认为二者共视，分成一类，否则分成两类。

局部匹配与定位

一般认为图像数量较多的类所对应的场景是正确场景的可能性较大。因此从这一场景开始，尝试获取相机位姿。获取的方式主要依赖求解PnP问题，因此需要首先构建当前图像的2D关键点在3D模型中的坐标位置。在尚不知道相机姿态前，这一信息的获取需要首先匹配当前图像和场景内的图像，特别要匹配那些能够对应到3D位置的2D特征点，若能够匹配上则确定了当前图像中的2D点和3D点的对应关系，继而即可通过对PnP问题的求解获取相机位姿。

总结

本博文基于当前被广泛采用的分级视觉定位方法对在3D视觉领域广泛使用的视觉定位方法进行了简要介绍，其主要可以被分为三个步骤，即预检索、共视聚类、局部匹配与定位，最终通过求解PnP问题来获取当前图像的位姿，从而确定拍摄者的位置。笔者后续将继续保持对3D视觉领域的研究和关注，并继续输出相关博文。
编辑：lyn

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

定位

定位

+关注

关注
5

文章
1337

浏览量
35415
3D模型

3D模型

+关注

关注
1

文章
72

浏览量
15765
3D视觉

3D视觉

+关注

关注
4

文章
434

浏览量
27555

3D 视觉定位技术：汽车零部件制造的智能变革引擎

在汽车零部件制造领域，传统工艺正面临着前所未有的挑战。市场对于零部件精度与生产效率近乎苛刻的要求，促使企业寻求突破之道。而 3D 视觉定位技术，为汽车零部件制造开启了精准

发表于 12-10 17:28 •335次阅读

<b class='flag-5'>3D</b> <b class='flag-5'>视觉</b><b class='flag-5'>定位</b><b class='flag-5'>技术</b>：汽车零部件制造的智能变革引擎

探索3D视觉技术在活塞杆自动化抓取中的应用

随着工业4.0时代的到来，智能制造成为工业发展的重要趋势。作为智能制造的关键技术之一，3D视觉技术在活塞杆抓取领域的应用前景十分广阔。

发表于 09-07 15:38 •286次阅读

适用于3D机器视觉的高度可扩展的TI DLP技术

电子发烧友网站提供《适用于3D机器视觉的高度可扩展的TI DLP技术.pdf》资料免费下载

发表于 08-23 09:57 •0次下载

适用于<b class='flag-5'>3D</b>机器<b class='flag-5'>视觉</b>的高度可扩展的TI DLP<b class='flag-5'>技术</b>

3D视觉技术广阔的应用前景

随着工业自动化领域的迅猛进步，对制造过程中抓取作业的精度与效率提出了更为严苛的要求。作为机械构造中的核心组件，活塞杆的精准抓取成为了保障产品质量、提升生产效率的关键环节。在此背景下，3D视觉技术以其独到的优势，在活塞杆抓取应用中

发表于 07-29 15:56 •363次阅读

<b class='flag-5'>3D</b><b class='flag-5'>视觉</b><b class='flag-5'>技术</b>广阔的应用前景

裸眼3D笔记本电脑——先进的光场裸眼3D技术

效果的用户，这款笔记本电脑都能满足你的需求。一、卓越的3D模型设计能力英伦科技裸眼3D笔记本电脑采用最新的光场裸眼3D技术，使用户无需佩戴3D

发表于 07-16 10:04 •576次阅读

苏州吴中区多色PCB板元器件3D视觉检测技术

3D视觉检测相较于2D视觉检测，有其独特的优势，不受产品表面对比度影响，精确检出产品形状，可以测出高度（厚度）、体积、平整度等。在实际应用中可以与2

发表于 06-14 15:02 •431次阅读

3D视觉引导方案解决工厂产线上下料难题

3D视觉引导方案，下料器的摆放精度直接关系到产品的最终质量和生产效率。如何在繁忙的生产线上，确保下料器能够精准无误地将工件放置在指定位置，成为了摆在我们面前的一大挑战。今天，我们就来揭秘我们的

发表于 05-27 15:47 •455次阅读

技术突破：铝合金板件正面保护与3D视觉引导的完美结合

在铝合金板件加工的涂油过程中，如何确保板件正面不受任何接触和污染，一直是业界的一大难题。同时，如何高效、精准地完成涂油作业，也考验着技术的智慧。接下来我们分享关于铝合金板件正面保护与3D视觉

发表于 05-23 16:41 •383次阅读

3D视觉技术在惯性环上料领域的未来发展

随着制造业的智能化和自动化水平不断提升，惯性环作为汽车发动机减震器中的核心组件，其精准、高效的上料过程显得尤为关键。作为实现这一目标的重要技术手段，3D视觉技术在惯性环上料领域的应用前

发表于 05-21 16:06 •318次阅读

3D视觉技术无序抓取引导活塞杆

随着工业4.0时代的到来，智能制造成为工业发展的重要趋势。作为智能制造的关键技术之一，3D视觉技术在活塞杆抓取领域的应用前景十分广阔。

发表于 05-13 13:40 •300次阅读

奥比中光携多款3D相机深度参与国内3D视觉最高规格会议

4月19日-21日，国内3D视觉最高规格会议China 3DV 2024大会在深圳举行。奥比中光作为大会铂金赞助商，携多款不同技术路线的3D

发表于 04-24 09:26 •462次阅读

解决方案|基于3D视觉技术的铝合金板件刷油烘干自动化上下料

针对铝合金板件刷油烘干上下料过程中的自动化需求，我们提出了一套基于3D视觉引导的解决方案。该方案通过引入先进的3D视觉技术，实现了对板件的高

发表于 04-20 17:45 •349次阅读

3C薄片自动化上料，3D视觉技术如何赋能？

随着制造业的快速发展，3C行业对薄片类零件的上料需求日益增长。传统的上料方式往往依赖于人工操作，效率低下且存在误差。为了解决这一问题，3D视觉技术应运而生，为

发表于 04-17 14:29 •468次阅读

工业自动化，3D视觉在五金件上下料中的应用

3D视觉引导五金件上下料是一种先进的自动化解决方案，结合了3D视觉技术和机器人技术，实现对五金件

发表于 02-21 11:38 •505次阅读

技术基因＋自主创新，光鉴科技塑造3D视觉感知新范式

感知技术已经渗透到智能汽车、工业机器人、服务机器人、智慧城市、新零售和智能家居等广泛领域，凭借精度高、速度快、适配性强、抗干扰能力强等突出优势，3D视觉感知技术迅猛发展之势已经不可阻挡

发表于 01-16 00:22 •1334次阅读