0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浅谈语义在SLAM中的应用

新机器视觉 来源:涛涛CV 作者:涛涛CV 2021-06-15 13:18 次阅读

Simultaneous Localization And Mapping(同时建图与定位)

可以分为四大部分:initialization, tracking, local mapping, global optimization

视觉SLAM主要涉及的知识

多视角几何:投影几何,相机模型

图像处理:特征提取,特征点跟踪

优化算法:非线性优化算法(Levenberg-Marquardt法)

INITIALIZATION

一般将第一张图像进入系统时的相机位姿作为V-SLAM系统的参考坐标系

选取之后输入的某张图像计算和第一张图像匹配角点并三角化获取深度,生成候选的初始化MAP

重投影计算误差,如果误差太大则重新选取图像

直到误差小于阈值,进行一次优化,得到初始化MAP

TRACKING

计算当前图像和之前相近图像的关系(特征点匹配,光流法,边缘跟踪等等)

根据计算出的关系,通过相应算法估计当前相机的大概位置

其中“直接法”将前面两部合并为一步来执行

LOCAL MAPPING

可以采取滑动窗口的方式或者挑选某些关键帧来建立局部地图

当某一帧图像根据策略算法选为关键帧后,添加到局部地图的关键帧队列中

管理局部地图中存在的点云

进行局部的Bundle Adjustment(BA)

最后进行关键帧的管理

GLOBAL OPTIMIZATION

利用BOW挑选出候选回环帧

对候选回环帧进行验证,确保是正确的回环

根据回环帧计算累积漂移误差

最后进行全局优化

语义SLAM

为什么要语义?

对环境的鲁棒性(动态环境)

获取地图的先验信息,得到更高精度(添加语义约束)

更好地回环检测

人机交互(如CAD制图)

poYBAGDIOiuADxblAAE1k4-MlT0144.jpg

传统回环检测

目前比较主流的回环检测方法一般都依赖于BoW(bag of visual words)方法

开源库:DBoW2: https://github.com/dorian3d/DBoW2(当然还有DBoW3,fbow)

连续帧匹配DLoopDetector:https://github.com/dorian3d/DLoopDetector

ORB-SLAM,VINS等都使用了DBoW2

其他检索方式还有LSH(Locality-Sensitive Hashing)以及

LLC(Locality-constrained Linear Coding)

语义能够给SLAM系统带来的好处

支持中长期的tracking

环境适应性更强(鲁棒性)

潜在的人机交互特性

语义SLAM系统和传统SLAM系统对比

pYYBAGDIOiSAXcocAAC_etSKNcA215.jpg

由于我们 人类见过大量的图像,形成了一种天生的直觉,对大部分场景都有一个直观的距离感 (空间感),它可以帮助我们判断图像中物体的远近关系。

1.平移之后才能计算深度

2.无法确定真实尺度

原因是通过单张图像无法确定深度。

深度相机(称RGB-D相机)最大的特点是可以通过红外结构光或Time-of-Flight(ToF) 原理,像激光传感器那样,通过主动向物体发射光并接收返回的光,测出物体与相机之间的距离。这部分是通过物理的测量手段来解决的,所以不需要大量的算力。

ToF

基本原理是通过连续发射光脉冲(一般为不可见光)到被观测物体上,然后用传感器接收从物体返回的光,通过探测光脉冲的飞行(往返)时间来得到目标物距离。

pYYBAGDIOh2AVTlIAABI93r9pxY207.jpg

结构光

结构光测距是用一个光源(常用是红外)将一定的图案投射到物体上,再用摄像头收集变形后的图案进行深度计算。

poYBAGDIOhaAaLXPAABQnZsNWSc032.jpg

这种方法比纯双目匹配好的地方在于,参考图像不是获取的,而是经过专门设计的图案 ,因此特征点是已知的,而且更容易从测试图像中提取。结构光采用三角视差测距,基线(光源与镜头光心的距离)越长精度越高。由于是主动光,无法在室外使用。

不论是一般结构光还是散斑结构光,缺点是它所使用的激光器发出的编码光斑容易被太阳光淹没掉, 工作距离短,室外阳光下不工作。

结构光方案中的激光器寿命较短,难以满足7x24小时的长时间工作要求,其长时间连续工作很容易损坏。而因为单目镜头和激光器需要进行精确的标定,一旦损坏,替换激光器时重新进行两者的标定是非常困难的,所以往往导致整个模块都要一起被换掉。

现在多数 RGB-D 相机还存在测量范围窄、噪声大、视野小、易受日光干扰、无法测量透射材质等诸多问题,在 SLAM 方面,主要用于室内,室外则较难应用。

立体视觉

pYYBAGDIOg6AKaWtAACYEf1BI2Y459.jpg

双目相机 的距离估计是比较左右眼的图像获得的,并不依赖其他传感设备,所以它既可以应用在室内,亦可应用于室外。

双目立体视觉是纯视觉的方法,需要逐像素计算匹配;同时,为了保证匹配结果比较鲁棒,算法中会增加大量的错误剔除策略,因此对算法要求较高,计算量较大。

VSLAM(Mono)

优势:成本低、搭建简单

劣势:

1) 需要专门初始化

2) 尺度问题

在单张图片里,无法确定一个物体的真实大小。它可能是一个很大但很远的物体,也可能是一个很近很小的物体。

3) 深度计算存在缺陷

a. 3D假图问题

b. 机器学习的样本问题

VSLAM(Stereo)

优势:

1) 不需要专门初始化

2) 能够计算深度

3) 能够用于室内和室外

劣势:

1) 标定较为复杂

2) 视差计算比较耗资源,需要GPU/FPGA 或 专门的ASIC芯片 协助。

责任编辑:lq6

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • SLAM
    +关注

    关注

    23

    文章

    425

    浏览量

    31862

原文标题:语义SLAM与深度相机

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    利用VLM和MLLMs实现SLAM语义增强

    语义同步定位与建图(SLAM)系统在对邻近的语义相似物体进行建图时面临困境,特别是复杂的室内环境。本文提出了一种面向对象
    的头像 发表于 12-05 10:00 217次阅读
    利用VLM和MLLMs实现<b class='flag-5'>SLAM</b><b class='flag-5'>语义</b>增强

    最新图优化框架,全面提升SLAM定位精度

    同时定位与地图构建(SLAM)是一项关键技术,允许移动机器人在部分或完全未知的环境自主导航。它包括使用机载传感器同时估计机器人状态和构建传感器检测到的环境地图。SLAM可以根据传感器和地图构建技术
    的头像 发表于 11-12 11:26 484次阅读
    最新图优化框架,全面提升<b class='flag-5'>SLAM</b>定位精度

    激光雷达SLAM算法的应用综述

    一、文章概述 1.1 摘 要 即时定位与地图构建(simultaneous localization and mapping,SLAM)是自主移动机器人和自动驾驶的关键 技术之一,而激光雷达则是支撑
    的头像 发表于 11-12 10:30 819次阅读
    激光雷达<b class='flag-5'>在</b><b class='flag-5'>SLAM</b>算法<b class='flag-5'>中</b>的应用综述

    MG-SLAM:融合结构化线特征优化高斯SLAM算法

    同步定位与地图构建 (SLAM) 是计算机视觉的一个基本问题,旨在在同时跟踪相机姿势的同时对环境进行地图构建。基于学习的密集 SLAM 方法,尤其是神经辐射场 (NeRF) 方法,
    的头像 发表于 11-11 16:17 356次阅读
    MG-<b class='flag-5'>SLAM</b>:融合结构化线特征优化高斯<b class='flag-5'>SLAM</b>算法

    从算法角度看 SLAM(第 2 部分)

    作者: Aswin S Babu 正如我们[第 1 部分]中所讨论的,SLAM 是指在无地图区域中估计机器人车辆的位置,同时逐步绘制该区域地图的过程。根据使用的主要技术,SLAM 算法可分为三种
    的头像 发表于 10-02 16:39 354次阅读
    从算法角度看 <b class='flag-5'>SLAM</b>(第 2 部分)

    图像语义分割的实用性是什么

    图像语义分割是一种重要的计算机视觉任务,它旨在将图像的每个像素分配到相应的语义类别。这项技术许多领域都有广泛的应用,如自动驾驶、医学图
    的头像 发表于 07-17 09:56 455次阅读

    图像分割与语义分割的CNN模型综述

    图像分割与语义分割是计算机视觉领域的重要任务,旨在将图像划分为多个具有特定语义含义的区域或对象。卷积神经网络(CNN)作为深度学习的一种核心模型,图像分割与语义分割中发挥着至关重要的
    的头像 发表于 07-09 11:51 1011次阅读

    深度解析深度学习下的语义SLAM

    随着深度学习技术的兴起,计算机视觉的许多传统领域都取得了突破性进展,例如目标的检测、识别和分类等领域。近年来,研究人员开始视觉SLAM算法引入深度学习技术,使得深度学习SLAM系统
    发表于 04-23 17:18 1321次阅读
    深度解析深度学习下的<b class='flag-5'>语义</b><b class='flag-5'>SLAM</b>

    工程实践VINS与ORB-SLAM的优劣分析

    ORB-SLAM是一种基于特征的单目视觉SLAM系统,广泛用于实时三维地图构建和机器人定位。该系统使用ORB特征进行高效的视觉识别和地图重建,支持关键帧技术和回环检测来优化地图的准确性。
    的头像 发表于 04-08 10:17 2986次阅读
    工程实践<b class='flag-5'>中</b>VINS与ORB-<b class='flag-5'>SLAM</b>的优劣分析

    什么是SLAMSLAM算法涉及的4要素

    SLAM技术可以应用在无人驾驶汽车、无人机、机器人、虚拟现实等领域中,为这些领域的发展提供了支持。SLAM技术的发展已经逐渐从单纯的定位和地图构建转向了基于场景理解的功能。
    发表于 04-04 11:50 2506次阅读

    什么是SLAM?基于3D高斯辐射场的SLAM优势分析

    基于NeRF的SLAM算法采用全局地图和图像重建损失函数,通过可微分渲染捕获稠密的光度信息,具有高保真度。
    的头像 发表于 04-01 12:44 764次阅读

    浅谈配电节能技术医院建筑的应用

    浅谈配电节能技术医院建筑的应用 张颖姣 安科瑞电气股份有限公司 上海嘉定 201801 摘要:本文旨在探讨电气节能技术医院建筑的应用
    的头像 发表于 02-27 15:15 379次阅读
    <b class='flag-5'>浅谈</b>配电节能技术<b class='flag-5'>在</b>医院建筑<b class='flag-5'>中</b>的应用

    从基本原理到应用的SLAM技术深度解析

    LSD-SLAM 即 Large-Scale Direct SLAM,兼容单目相机和双目相机。LSD-SLAM是一种基于光流跟踪的直接法SLAM,但是实现了半稠密建图,建图规模大,可以
    发表于 02-26 09:41 9426次阅读
    从基本原理到应用的<b class='flag-5'>SLAM</b>技术深度解析

    动态环境基于神经隐式表示的RGB-D SLAM

    神经隐式表示已经被探索用于增强视觉SLAM掩码算法,特别是提供高保真的密集地图方面。
    的头像 发表于 01-17 10:39 919次阅读
    动态环境<b class='flag-5'>中</b>基于神经隐式表示的RGB-D <b class='flag-5'>SLAM</b>