0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

关于3D视觉定位技术详细解析

新机器视觉 来源:华为云社 作者:景末 2021-04-03 14:39 次阅读

【摘要】3D视觉定位指的是根据事先构建的3D模型及相关信息,计算取得某张图像在拍摄时相机的位置和姿态。这是3D视觉的一项十分重要的技术,可以用来帮助实现人员定位与导航。本博文将基于2019年CVPR论文From Coarse to Fine: Robust Hierarchical Localization at Large Scale所采用的分级定位方案对该技术进行简要的介绍。基本原理3D.。.

引言

所谓3D视觉定位指的是根据事先构建的3D模型及相关信息,计算取得某张图像在拍摄时相机的位置和姿态。这是3D视觉的一项十分重要的技术,可以用来帮助实现人员定位与导航。本博文将基于2019年CVPR论文From Coarse to Fine: Robust Hierarchical Localization at Large Scale所采用的分级定位方案对该技术进行简要的介绍。

基本原理

3D视觉定位的直接目标是计算当前图像的照相机位姿,解决该问题的直接方案是建立3D点与2D点之间的匹配关系,通过二者的匹配关系估计相机位姿,这一问题被称作PnP(Pespective-n-Point)问题。求解PnP问题的方法有很多,常见的有P3P、EPnP、UPnP等,具体的如何实现本文不做介绍,读者可以自行搜索PnP问题的相关理论。而视觉定位需要解决的一大关键问题是如何建立3D点与2D点之间的匹配关系。对于这一点,论文作者Sarlin提出过一种分级定位的方案,以下将详细介绍该方案。

分级定位

e7de8e74-92a7-11eb-8b86-12bb97331649.png

分级定位的框架大约可以分成三步:预检索、共视聚类、局部匹配与定位。

预检索

预检索的意义在于获取前k张与当前图像最相似的图像,判断相似的依据通常是通过匹配图像的全局特征。一般而言,产生全局特征的方法可以依赖于局部特征所组成的词袋,不过近些年,一些深度学习方案也被引入了进来,例如NetVLAD或更加轻量级的MobileNetVLAD。最终通过获取当前图像的全局特征的k个最近邻来获取预检索得到的相近图集。

共视聚类

然而由于可能产生的错误匹配,所获取到的预检索图集并不一定全部都面向同一场景,这时就需要先将面向不同场景的图像区分开来,这项技术就被称作共视聚类,简而言之就是将具有共视关系的图像聚成一类。

ea0522da-92a7-11eb-8b86-12bb97331649.png

这一过程实际十分简单,它是通过匹配同名点来获取的,这些同名点在早先进行的3D建模过程中通过特征的提取与匹配已经建立了对应的关系。若两个图像中存在稳定的同名点,则认为二者共视,分成一类,否则分成两类。

局部匹配与定位

一般认为图像数量较多的类所对应的场景是正确场景的可能性较大。因此从这一场景开始,尝试获取相机位姿。获取的方式主要依赖求解PnP问题,因此需要首先构建当前图像的2D关键点在3D模型中的坐标位置。在尚不知道相机姿态前,这一信息的获取需要首先匹配当前图像和场景内的图像,特别要匹配那些能够对应到3D位置的2D特征点,若能够匹配上则确定了当前图像中的2D点和3D点的对应关系,继而即可通过对PnP问题的求解获取相机位姿。

总结

本博文基于当前被广泛采用的分级视觉定位方法对在3D视觉领域广泛使用的视觉定位方法进行了简要介绍,其主要可以被分为三个步骤,即预检索、共视聚类、局部匹配与定位,最终通过求解PnP问题来获取当前图像的位姿,从而确定拍摄者的位置。笔者后续将继续保持对3D视觉领域的研究和关注,并继续输出相关博文。
编辑:lyn

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 定位
    +关注

    关注

    5

    文章

    1300

    浏览量

    35336
  • 3D模型
    +关注

    关注

    1

    文章

    72

    浏览量

    15682
  • 3D视觉
    +关注

    关注

    4

    文章

    429

    浏览量

    27484
收藏 人收藏

    评论

    相关推荐

    适用于3D机器视觉的高度可扩展的TI DLP技术

    电子发烧友网站提供《适用于3D机器视觉的高度可扩展的TI DLP技术.pdf》资料免费下载
    发表于 08-23 09:57 0次下载
    适用于<b class='flag-5'>3D</b>机器<b class='flag-5'>视觉</b>的高度可扩展的TI DLP<b class='flag-5'>技术</b>

    3D视觉技术广阔的应用前景

    随着工业自动化领域的迅猛进步,对制造过程中抓取作业的精度与效率提出了更为严苛的要求。作为机械构造中的核心组件,活塞杆的精准抓取成为了保障产品质量、提升生产效率的关键环节。在此背景下,3D视觉技术以其独到的优势,在活塞杆抓取应用中
    的头像 发表于 07-29 15:56 278次阅读
    <b class='flag-5'>3D</b><b class='flag-5'>视觉</b><b class='flag-5'>技术</b>广阔的应用前景

    裸眼3D笔记本电脑——先进的光场裸眼3D技术

    效果的用户,这款笔记本电脑都能满足你的需求。 一、卓越的3D模型设计能力 英伦科技裸眼3D笔记本电脑采用最新的光场裸眼3D技术,使用户无需佩戴3D
    的头像 发表于 07-16 10:04 454次阅读

    苏州吴中区多色PCB板元器件3D视觉检测技术

    3D视觉检测相较于2D视觉检测,有其独特的优势,不受产品表面对比度影响,精确检出产品形状,可以测出高度(厚度)、体积、平整度等。在实际应用中可以与2
    的头像 发表于 06-14 15:02 358次阅读
    苏州吴中区多色PCB板元器件<b class='flag-5'>3D</b><b class='flag-5'>视觉</b>检测<b class='flag-5'>技术</b>

    3D视觉引导方案解决工厂产线上下料难题

    3D视觉引导方案,下料器的摆放精度直接关系到产品的最终质量和生产效率。如何在繁忙的生产线上,确保下料器能够精准无误地将工件放置在指定位置,成为了摆在我们面前的一大挑战。今天,我们就来揭秘我们的
    的头像 发表于 05-27 15:47 332次阅读
    <b class='flag-5'>3D</b><b class='flag-5'>视觉</b>引导方案解决工厂产线上下料难题

    技术突破:铝合金板件正面保护与3D视觉引导的完美结合

    在铝合金板件加工的涂油过程中,如何确保板件正面不受任何接触和污染,一直是业界的一大难题。同时,如何高效、精准地完成涂油作业,也考验着技术的智慧。接下来我们分享关于铝合金板件正面保护与3D视觉
    的头像 发表于 05-23 16:41 344次阅读
    <b class='flag-5'>技术</b>突破:铝合金板件正面保护与<b class='flag-5'>3D</b><b class='flag-5'>视觉</b>引导的完美结合

    解决方案|基于3D视觉技术的铝合金板件刷油烘干自动化上下料

    针对铝合金板件刷油烘干上下料过程中的自动化需求,我们提出了一套基于3D视觉引导的解决方案。该方案通过引入先进的3D视觉技术,实现了对板件的高
    的头像 发表于 04-20 17:45 286次阅读
    解决方案|基于<b class='flag-5'>3D</b><b class='flag-5'>视觉</b><b class='flag-5'>技术</b>的铝合金板件刷油烘干自动化上下料

    3C薄片自动化上料,3D视觉技术如何赋能?

    随着制造业的快速发展,3C行业对薄片类零件的上料需求日益增长。传统的上料方式往往依赖于人工操作,效率低下且存在误差。为了解决这一问题,3D视觉技术应运而生,为
    的头像 发表于 04-17 14:29 407次阅读
    <b class='flag-5'>3</b>C薄片自动化上料,<b class='flag-5'>3D</b><b class='flag-5'>视觉</b><b class='flag-5'>技术</b>如何赋能?

    工业自动化,3D视觉在五金件上下料中的应用

    3D视觉引导五金件上下料是一种先进的自动化解决方案,结合了3D视觉技术和机器人技术,实现对五金件
    的头像 发表于 02-21 11:38 460次阅读
    工业自动化,<b class='flag-5'>3D</b><b class='flag-5'>视觉</b>在五金件上下料中的应用

    技术基因+自主创新,光鉴科技塑造3D视觉感知新范式

    感知技术已经渗透到智能汽车、工业机器人、服务机器人、智慧城市、新零售和智能家居等广泛领域,凭借精度高、速度快、适配性强、抗干扰能力强等突出优势,3D视觉感知技术迅猛发展之势已经不可阻挡
    的头像 发表于 01-16 00:22 1260次阅读
    <b class='flag-5'>技术</b>基因+自主创新,光鉴科技塑造<b class='flag-5'>3D</b><b class='flag-5'>视觉</b>感知新范式

    一文了解3D视觉和2D视觉的区别

    一文了解3D视觉和2D视觉的区别 3D视觉和2D
    的头像 发表于 12-25 11:15 2859次阅读

    2D3D视觉技术的比较

    作为一个多年经验的机器视觉工程师,我将详细介绍2D3D视觉技术的不同特点、应用场景以及它们能够
    的头像 发表于 12-21 09:19 1055次阅读

    图漾科技发布3D工业视觉应用开发平台Vision++

    2023年12月20日,全球领先的3D机器视觉企业图漾科技发布了3D工业视觉应用开发平台Vision++,集成了简单易用的图形化低代码开发环境、丰富的2
    的头像 发表于 12-20 16:46 815次阅读
    图漾科技发布<b class='flag-5'>3D</b>工业<b class='flag-5'>视觉</b>应用开发平台Vision++

    3D视觉的三大优势

    康耐视的In-Sight 3D-L4000凭借突破性的3D视觉技术、无斑点蓝色激光照明系统和小巧外形重新定义了3D
    的头像 发表于 12-07 10:53 1178次阅读
    <b class='flag-5'>3D</b><b class='flag-5'>视觉</b>的三大优势

    深度解析3D视觉成像几种典型方案

    类似于ToF相机、光场相机这类相机,可以归类为单相机3D成像范围,它们体积小,实时性好,适合Eye-in-Hand系统执行3D测量、定位和实时引导。
    发表于 12-05 12:24 914次阅读
    深度<b class='flag-5'>解析</b><b class='flag-5'>3D</b><b class='flag-5'>视觉</b>成像几种典型方案