基于视觉SLAM的研究现状

自动驾驶车辆在不同的驾驶环境中需要精确的定位和建图解决方案。在这种背景下，SLAM技术是一个很好的解决方案。LIDAR和相机传感器通常用于定位和感知。然而，经过十年或二十年的发展，激光雷达SLAM方法似乎没有太大变化。与基于激光雷达的方案相比，视觉SLAM具有低成本和易于安装的优点，具有较强的场景识别能力。事实上，人们正试图用相机代替激光雷达传感器，或者在自动驾驶领域中基于相机集成其他传感器。

基于视觉SLAM的研究现状，本文对视觉SLAM技术进行了综述。特别是，论文首先说明了视觉SLAM的典型结构。其次全面回顾了视觉和基于视觉（即视觉-惯性、视觉-LIDAR、视觉-LIAR-IMU）SLAM的最新研究，并将论文之前工作的定位精度与公共数据集上的知名框架进行了比较。最后，讨论了用于自动驾驶车辆的视觉SLAM技术的关键问题和未来发展趋势。

01 简介

随着机器人技术和人工智能（AI）技术的发展，自动驾驶车辆（汽车）已成为工业界和学术界的一个热门话题（Badue等人，2021）。为了安全导航，它需要为周围环境创建一个准确的表示，并估计其中的自车状态（即自车定位）。传统的定位方法基于GPS或实时动态（RTK）定位系统（Cadena等人，2016b）。然而，由于信号反射、时间误差和大气条件，GPS的测量误差限制在十几米以内，这对于车辆导航来说是不可接受的，尤其是当车辆在隧道和城市峡谷场景中行驶时（Cheng等人，2019）。RTK能够通过固定校准基站的内部校正信号来校正这些误差，但这种系统依赖于成本较高的附加基础设施（Infotip Service GmbH，2019）。

SLAM方法被认为是自动驾驶车辆定位和导航的良好解决方案，它可以实时估计移动车辆的姿态，同时构建周围环境的地图（Durrantwhyte和Bailey，2006）。根据传感器类型的不同，SLAM方法主要分为两类：LIDAR SLAM和视觉SLAM。由于激光雷达SLAM比视觉SLAM启动得早，因此在自动驾驶仪的应用中相对成熟（Debeunne和Vivet，2020a）。与相机相比，激光雷达传感器对光照和夜间的变化不太敏感。此外，它还可以提供具有更大视野（FOV）的3D地图信息。然而难以负担的成本和大规模的长开发周期导致激光雷达传感器难以普及。相比之下，视觉SLAM具有信息丰富、易于安装的优点，并且使系统更便宜、更轻。

目前视觉SLAM系统可以在微型个人计算机（PC）和嵌入式设备中运行，甚至可以在智能手机等移动设备中运行（Klein和Murray，2009）。与室内或室外移动机器人不同，自动驾驶车辆具有更复杂的参数，尤其是当车辆在城市环境中自动驾驶时。例如，环境的面积更大，有动态障碍，因此视觉SLAM方法的性能不够准确和鲁棒（Cadena等人，2016a）。

诸如误差累积和照明变化以及快速运动等问题导致有问题的估计。已经考虑了各种方法来解决与自动驾驶车辆相关的这些问题。例如用于视觉里程（VO）的基于特征点/直接/半直接/点线融合的算法（Singandhupe和La，2019），以及用于姿态估计的扩展卡尔曼滤波器（EKF）/基于图的优化算法（Takleh等人，2018）。同时，基于视觉的多传感器融合方法也为提高自主系统的精度而引起了极大的关注。在基于视觉的SLAM系统中，除了建图模块之外，传感器数据的收集（如相机或惯性测量单元（IMU）、VO和视觉惯性里程计（VIO）系统）在前端完成，而优化、闭环在后端完成。重定位始终被认为是提高视觉SLAM系统准确性的附加模块（Taketomi等人，2017）。

本文综述了视觉SLAM方法。这主要是从视觉SLAM系统的定位精度方面考虑的，并且已经尽可能详细地研究了可能应用于自动驾驶场景的方法，包括纯视觉SLAM方法、视觉-惯性SLAM方法和视觉-LIDAR-惯性SLAM方法，并且将论文先前工作的定位精度与公共数据集上的已知方法进行了比较。这篇综述对视觉SLAM技术进行了详细的综述，可以为自动驾驶汽车领域的新研究人员提供友好的指南。此外，它可以被视为一本词典，供有经验的研究人员在未来的工作中寻找可能的方向。

02 视觉SLAM原理

视觉SLAM系统的经典结构可分为五个部分：相机传感器模块、前端模块、后端模块、回环模块和建图模块。如图1所示，相机传感器模块负责收集图像数据，前端模块负责跟踪两个相邻帧之间的图像特征，以实现初始相机运动估计和局部建图，后端模块负责前端的数值优化和进一步的运动估计，回环模块负责通过计算大规模环境中的图像相似度来消除累积误差，建图模块负责重建周围环境（Gao等人，2017）。

2.1 相机传感器

根据传感器类型的不同，常见的视觉传感器主要可分为单目、双目、RGB-D和事件摄像机。摄像机传感器如图2所示。市场上流行的视觉传感器制造商和产品如下，但不限于：

· MYNTAI：S1030系列（带IMU的双目摄像头）、D1000系列（深度摄像头）、D1200系列（适用于智能手机）；

· Stereolabs ZED：Stereolab ZED相机（深度范围：1.5至20米）；

· Intel：200系列、300系列、Module D400系列、D415（主动红外双目、滚动快门）、D435（主动红外双目、全局快门）、D4 35i（集成IMU）；

· 微软：Azure Kinect（适用于带IMU的麦克风）、Kinectc-v1（结构光）、Kinect-v2（TOF）；

· Occipital Structure：Structure Camera （应用于ipad）；

· 三星：第2代和第3代动态摄像头和基于事件的视觉解决方案（Son等人，2017b）。

2.2 前端

视觉SLAM的前端被称为视觉里程计（VO）。它负责基于相邻帧的信息粗略地估计相机运动和特征方向。为了获得具有快速响应速度的精确姿态，需要有效的VO。目前，前端主要可分为两类：基于特征的方法和直接方法（包括半直接方法）（Zou等人，2020）。本节主要回顾VO的基于特征的方法。

关于半直接和直接方法在后文。基于特征点的VO系统运行更稳定，对光和动态目标相对不敏感。具有高尺度和良好旋转不变性的特征提取方法可以大大提高VO系统的可靠性和稳定性（Chen等人，2019）。1999年，Lowe（2004）提出了尺度不变特征变换（SIFT）算法，该算法在2004年得到了改进和发展。整个算法分为三个步骤来完成图像特征点的提取和描述。i）通过高斯差分金字塔方法构建尺度空间，并通过高斯微分函数识别感兴趣的点。ii）确定每个候选的位置和比例，然后找出关键点。iii）将指向特征指定给关键点以获得描述子。SIFT消耗大量计算。SURF（Herbert等人，2007）是SIFT的改进。它解决了SIFT运算量大、实时性差的缺点，保持了SIFT算子的优良性能。尽管如此，SURF算法在应用于实时SLAM系统时具有更大的局限性。在保证性能的基础上，提出了一种更加注重计算速度的特征提取算法。2011年，Viswanathan（2011）提出了一种基于模板和机器学习方法的局部角点检测方法，即FAST角点检测法。FAST算法将要检测的像素作为圆心，当具有固定半径的圆上的其他像素与圆心的像素之间的灰度差足够大时，该点被认为是角点。然而，FAST角点不具有方向和尺度信息，它们不具有旋转和尺度不变性。

2012年，Rublee等人（2012）提出了基于FAST角点和BRIEF描述符的定向FAST和旋转BRIEF（ORB）算法。该算法首先在图像上构建图像金字塔，然后检测FAST关键点并计算关键点的特征向量。ORB的描述符采用了二进制字符串特征BRIEF描述符的快速计算速度（Michael等人，2010），因此ORB计算速度比具有实时特征检测的fast算法更快。此外ORB受噪声影响较小，具有良好的旋转不变性和尺度不变性，可应用于实时SLAM系统。2016年，Chien等人（2016）比较并评估了用于VO应用的SIFT、SURF和ORB特征提取算法。通过对KITTI数据集的大量测试（Geiger等人，2013），可以得出结论，SIFT在提取特征方面最准确，而ORB的计算量较小。

因此，作为计算能力有限的嵌入式计算机，ORB方法被认为更适合自动驾驶车辆的应用。VO的其他图像特征描述子如下所列，但不限于DAISY（Tola等人，2010）、ASIFT（Morel和Yu，2009）、MROGH（Fan等人，2011a）、HARRIS（Wang等人，2008）、LDAHash（Fan等，2011b）、D-BRIEF（Trzcinski和Lepetit，2012）、Vlfeat（Vedali和Fulkerson，2010），FREAK（Alahi等人，2012），Shape Context（Belongie等人，2002）、PCA-SIFT（Ke和Sukthantar，2004）。

2.3 后端

后端接收前端估计的摄像机位姿，并优化初始位姿，以获得全局一致的运动轨迹和环境图（Sunderhauf和Protzel，2012）。与前端的多样化算法相比，当前后端算法的类型主要可分为两类：基于滤波器的方法（如扩展卡尔曼滤波器（EKF）Bailey等人，2006）和基于优化的方法（例如因子图Wrobel，2001）。它们的描述如下：基于滤波器的方法，该方法主要使用贝叶斯原理基于先前状态和当前观测数据来估计当前状态（Liu，2019）。

典型的基于滤波器的方法包括扩展卡尔曼滤波器（EKF）（Bailey等人，2006）、无迹卡尔曼滤波器（UKF）（Wan和Merwe，2000）和粒子滤波器（PF）（Arnaud等人，2000）。以典型的基于EKF的SLAM方法为例，它在小规模环境中的应用相对成功。然而，由于协方差矩阵是存储的，其存储容量随着状态量的平方而增加，因此在大型未知场景中的应用总是受到限制。基于优化的方法，基于非线性优化（图优化）方法的核心思想是将后端优化算法转换为图的形式，以不同时刻的主题位姿和环境特征为顶点，顶点之间的约束关系由边表示（Liang等人，2013）。构建图形后，使用基于优化的算法来求解目标的位姿，以便顶点上要优化的状态更好地满足相应边上的约束。在执行优化算法之后，对应的图是目标运动轨迹和环境图。目前，大多数主流的视觉SLAM系统使用非线性优化方法。

2.4 回环

回环的任务是允许系统基于传感器信息识别当前场景，并在返回原始位置时确定该区域已被访问，从而消除SLAM系统的累积误差（Newman和Ho，2005）。对于视觉SLAM，传统的回环检测方法主要使用单词包（BoW）模型（Galvez LoPez和Tardos，2012），实现步骤为：i）通过对从图像中提取的局部特征的K-means聚类，构建包含K个单词的单词列表。ii）根据每个单词的出现次数将图像表示为K维数值向量。iii）判断场景的差异，并识别自动驾驶车辆是否已到达所识别的场景。

2.5 建图

自动驾驶汽车的一个基本组成部分是建立环境地图并在地图上定位的能力。建图是视觉SLAM系统的两项任务之一（即定位和建图），它在自动驾驶的导航、避障和环境重建中发挥着重要作用。一般来说，地图的表示可以分为两类：度量地图和拓扑地图。度量地图描述了地图元素之间的相对位置关系，而拓扑地图强调了地图元素间的连接关系。对于经典的SLAM系统，度量地图可以进一步分为稀疏地图和密集地图，稀疏地图仅包含场景中的少量信息，这适合于定位，而密集地图包含更多信息，这有利于车辆根据地图执行导航任务。

03 SOTA研究

3.1 视觉SLAM

与前文描述的VO子系统类似，根据利用图像信息的方法，纯视觉SLAM系统可分为两类：基于特征的方法和直接方法。基于特征的方法是指通过提取和匹配特征点来估计相邻帧之间的相机运动和构建环境地图。这种方法的缺点是提取特征点和计算描述符需要很长时间。因此，一些研究人员建议放弃关键点和描述符的计算，然后产生直接方法（Zou等人，2020）。

此外，根据传感器的类型，视觉SLAM可以分为单目、双目、RGB-D和基于事件相机的方法。根据地图的密度，可分为稀疏、密集和半密集SLAM，介绍如下：

3.1.1 基于特征的方法

2007年，Davison等人（2007）提出了第一个实时单目视觉SLAM系统，Mono-SLAM。实时特征patch方向估计的结果如图3（a）所示。在后端使用EKF算法来跟踪从前端获取的稀疏特征点，并使用相机位姿和界标点方向作为状态量来更新其均值和协方差。同年，Klein和Murray（2007）提出了一种并行跟踪和建图系统PTAM。它实现了跟踪和建图工作的并行化。特征提取和建图的过程如图3（b）所示，首次通过非线性优化方法区分了前端和后端，并提出了关键帧机制。

关键图像串联连接以优化运动轨迹和特征定向。许多随后的视觉SLAM系统设计也采用了类似的方法。2015年，Mur Artal等人（2015）提出了ORB-SLAM，这是一种相对完整的基于关键帧的单目SLAM方法。与PTAM的双线程机制相比，该方法将整个系统分为三个线程：跟踪、建图和回环。需要注意的是，特征提取和匹配（左列）、地图构建和循环检测的过程都基于ORB特征（右列）。图3（c）是大学道路环境中单目相机的实时特征提取过程（左列）和轨迹跟踪和建图结果（右列）。

2017年，Mur Artal等人提出了ORB-SLAM2的后续版本（Murartal和Tardos，2017）。该版本支持回环检测和重定位，具有实时地图重用功能，此外，改进的框架还打开了双目相机和RGB-D相机之间的接口。图3（d）的左列显示了ORB-SLAM2的双目轨迹估计和特征提取。图3（d）的右栏显示了RGB-D相机在室内场景中的关键帧和密集点云建图效果。图片中连续的绿色小方块构成了关键帧的轨迹，RGB-D相机构建的密集3D场景地图围绕着关键帧。

3.1.2 基于直接的方法

2011年，Newcombe等人（2011b）提出了基于直接方法DTAM的单目SLAM框架。与基于特征的方法不同，DTAM采用基于逆深度的方法来估计特征的深度。通过直接图像匹配计算相机的位姿，并通过基于优化的方法构建密集地图（图4（a））。2014年，Jakob等人（2014）提出了LSD-SLAM（图4（b）），这是直接方法在单眼视觉SLAM框架中的成功应用。该方法将面向像素的方法应用于半密集单目SLAM系统。与基于特征的方法相比，LSD-SLAM的灵敏度较低，但当相机内参和照明变化时，系统很脆弱。2017年，Forster等人（2017）提出了SVO（半直接视觉里程计）。它使用稀疏直接法（也称为半直接法）来跟踪关键点（图4（c）的底部），并基于关键点周围的信息来估计位姿。图4（c）顶部显示了室内环境中稀疏地图的轨迹。由于半直接方法跟踪稀疏特征，既不计算描述符，也不处理密集信息，因此SVO具有较低的时间复杂度和较强的实时性。

2016年，Engel等人（2018）提出了DSO，该方法还使用半直接方法以确保在更快的操作速度下获得更高的精度。然而，它们只是视觉里程计。由于缺少后端优化模块和回环模块，系统的跟踪误差会随着时间累积。图4（d）显示了DSO（单目视觉里程计）的3D重建和跟踪效果。直接法具有计算速度快、对弱特征条件不敏感等优点。然而，它基于灰度级不变的强烈假设，因此它对照明的变化非常敏感。相反特征点方法具有良好的不变性。

2020年，Zubizarreta等人（2020）提出了一种直接稀疏映射方法DSM，这是一种基于光度学束调整（PBA）算法的全单目视觉SLAM系统。表1总结了最先进的视觉SLAM框架的主要特点及其优缺点。除上述典型框架外，还研究了其他相关工作，如（i）稀疏视觉SLAM；（ii）半密集视觉SLAM；（iii）密集视觉SLAM。正如你所看到的，视觉SLAM领域有很多成就，论文只是对流行的方法进行了回顾。即使视觉SLAM提供了良好的定位和建图结果，所有这些解决方案都有优点和缺点。在这项工作中，总结了“基于稀疏的方法”、“基于密集的方法”和“基于特征的方法”的优缺点，“基于直接的方法”，“单目方法”，”双目方法“，”RGB-D方法“和”事件相机方法“可在表2中找到。

3.2 视觉-惯性SLAM

IMU传感器可以提供一个很好的解决方案，以解决当相机移动到具有挑战性的环境中（较少的纹理和/或照明变化）时跟踪失败的问题，另一方面，视觉传感器可以弥补IMU的累积漂移。这种视觉和IMU的结合被称为黄金搭档。由于相机和IMU的互补功能，在无人驾驶等领域具有良好的发展前景（Sun和Tian，2019）。VI-SLAM的主要方法是将IMU信息结合到视觉SLAM系统的前端，该系统也称为视觉惯性里程计（VIO）系统。通常，VI-SLAM系统可分为两类：基于滤波器的方法和基于优化的方法：3.2.1 基于特征的方法2007年，Mourikis和Roumeliotis（2007）提出了多状态约束卡尔曼滤波器（MSCKF），这是最早的基于扩展卡尔曼滤波器（EKF）算法的视觉惯性SLAM系统。

与纯视觉里程计相比，MSCKF（图5（a））可以在一定时间内适应更剧烈的运动和纹理损失，具有更高的鲁棒性。2012年，Stephan（2012）提出了SSF（图5（b）），它是一种基于EKF和松耦合方法的时间延迟补偿单传感器和多传感器融合框架。2013年，Li和Mourikis（2013）指出了MSCKF在状态估计过程中的不一致性。2017年，Paul等人（2017）提出了MSCKF2.0，这大大提高了准确性、一致性和计算效率。此外，ROVIO（鲁棒视觉惯性里程表）（Bloesch等人，2015）（图5（c））和MSCKF-VIO（Ke等人）（图6（d））也是近年来基于过滤方法的优秀作品；

3.2.2 基于优化的方法

就基于优化的VI-SLAM系统而言，最经典的框架是OKVIS。2015年，Leutinegge等人提出了OKVIS，它使用IMU测量值来预测当前状态、空间点和二维图像特征，以构成重投影误差。预测的IMU状态量和优化的参数构成IMU误差项，然后再投影误差与IMU误差相结合以进行优化。2017年，Tong等人（2017）提出了VINS-Mono，它被视为一种优秀的单目VI-SLAM系统，前端采用光流方法，后端采用基于滑动窗口的非线性优化算法（Cheng等人，2021b）。此外，VINS-Mono的初始化方法值得注意，它采用了不相交方法（以及VI-ORBSLAM Mur Artal和Tards，2017），该方法首先初始化纯视觉子系统，然后估计IMU（加速度计和陀螺仪）的偏差、重力、比例和速度。

通过KITTI和EuRoC数据集的测试，VINS Mono已被证明具有与OKVIS相当的定位精度，在初始化和环路闭合阶段具有更完整和鲁棒性。2019年，VINS-Mono团队提出了双目版本，并整合了GPS信息，VINS-Fusion（Tong等人，2019）。如图6（c）所示，由于增加了GPS测量，它在户外环境中实现了良好的定位和建图效果，并且被认为是自动驾驶车辆领域的一个良好应用。2020年，Campos等人（2020）提出了一种基于特征的紧密集成视觉惯性SLAM系统ORB-SLAM3。这是通过最大后验（MAP）算法实现的更高效初始化过程的最新成果，并且它实现了多地图功能，该功能依赖于具有改进的召回率的新地点识别方法。此外，该系统能够使用单目、双目和RGB-D相机执行视觉、视觉-惯性和多地图SLAM。户外场景的实验结果如图6（d）所示。

ORB-SLAM3的管道与ORB-SLAM2类似，整个系统由三个线程组成：跟踪、局部建图和回环线程。此外，ORB-SLAM3可以在长时间的不良视觉信息中生存，当它丢失时，它会启动一个新的地图，当重新访问地图区域时，它将与以前的地图无缝合并。表3总结了近年来视觉惯性SLAM框架中的主要算法。目前，基于优化的VI-SLAM方法已成为主流。除上述方法外，还有其他最先进的工作可以总结如下，但不限于BASALT、Kimera、ICE-BA、Maplab、StructVIO。

3.3 测试和评估

为了直观地理解上述SLAM方法的定位效果，在配备Intel Core i7-9700 CPU、16 GB RAM和Ubuntu18.04+Melodic操作系统的同一机载计算机上测试了一些典型算法，并将其与我们之前的一项工作（Cheng等人，2021a）进行了比较。如Cheng等人（2021a）所述，基于传统的高斯-牛顿（G-N）线性迭代策略，提出了一种改进的信赖域迭代策略，然后将该策略集成到VI-ORBSLAM框架中（Mur-Artal和Tards，2017），以实现更快的初始化和更高的定位精度。信任区域迭代策略的模型如图7所示。它结合了最速下降算法和G-N算法，用信任模型逼近目标函数。当解被认为是当前点附近模型函数的最小值时，则在每个迭代步骤中求解最小化子问题。

需要估计的初始参数包括比例因子、速度、重力以及加速度计和陀螺仪的偏差。为了使所有变量都可观察到，纯ORB-SLAM系统需要执行几秒钟。该方法的具体步骤如下：首先，执行视觉初始化过程，包括ORB提取、地图初始化和初始位姿估计。其次，采用IMU预集成技术对IMU相机进行频率对准，生成关键帧。第三，提出了一种改进的基于信赖域的迭代策略，用于陀螺偏差估计，并对重力方向进行了细化。最后，在先前估计的基础上估计加速度计偏差和视觉尺度。论文之前工作的管道如图8所示。

EuRoC数据集V2_01_easy序列上算法的2D轨迹如图9所示。可以看到，与GT相比，每个算法的测试结果都有不同程度的偏差，论文算法的轨迹（红线）更接近GT（黑虚线），而VI-ORBSLAM（蓝线）的漂移最大。X、Y、Z方向的位置变化曲线如图10所示。欧拉角（即横摇、俯仰、偏航）的比较曲线如图11所示。表4显示了在整个11个序列中测试的同一CPU平台（i7-9700 CPU）中的定量均方根误差（RMSE）结果和帧速率，因为所有算法都采用多线程，所以表4的第三列报告了处理图像流时的帧速率。图12和图13分别提供了平移误差的RMSE和累积分布函数（CDF），图14和图15分别提供了定向误差的RMSE和累积分布功能（CDF）。

可以知道，论文之前的工作，一个快速单目视觉惯性系统，具有改进的迭代初始化策略方法，在几乎所有序列中实现了最佳的定位精度。实际上，由于出色的初始化过程，论文的方法在六个序列和七个序列上提供了最佳的定向性能，即使系统无法提取ORB特征，系统也可以快速重新启动工作。

3.4 视觉-LIDAR SLAM

视觉和激光雷达有各自的优点，例如视觉可以从环境中获得大量的纹理信息，并且具有很强的场景识别能力，而LADAR不依赖光，可靠性好，距离测量精度更高。因此，在自动驾驶领域，集成视觉和激光雷达的SLAM系统可以提供更智能、更可靠的环境感知和状态估计解决方案。它遵循具有三个主要步骤的经典SLAM架构：（i）数据处理步骤；（ii）估计；（iii）全局建图步骤。根据视觉和激光雷达在SLAM系统中的不同比例，视觉激光雷达SLAM方案可分为三类：视觉引导方法、激光雷达引导方法和视觉激光雷达相互校正方法。

3.4.1 视觉引导方法

视觉SLAM，特别是对于单目视觉SLAM而言，总是无法有效地提取特征点的深度信息，而LIDAR是这方面的专家。为了弥补视觉SLAM的缺点，研究人员试图将LIDAR数据融合到视觉SLAM系统中。视觉引导SLAM的代表作是LIMO（Graeter等人，2018）。该方法将激光雷达获得的空间点云投影到图像平面上，以估计视觉特征的尺度，然后将激光雷达恢复的视觉特征尺度和从相机位姿估计得到的特征尺度构造误差项作为后端优化的约束。

Shin等人（2018b）提出了一种使用LIDAR获取视觉SLAM的稀疏深度点云的方法，由于相机的分辨率远高于LIDAR，该方法存在大量像素没有深度信息的问题。为了解决这个问题，De Silva等人（2018）在计算两个传感器之间的几何变换后，采用了高斯回归模型来插值缺失的深度值。该方法使用激光雷达直接初始化图像中检测到的特征，其效果与使用RGB-D传感器的方法相同。还有一些研究将激光雷达集成到视觉SLAM中，以提高解决方案的应用价值，例如降低成本、提高性能和增强系统鲁棒性。

一些研究在建图阶段使用视觉SLAM的姿态估计进行点云标注。Zhang等人（2018b）提出了一种基于一维激光雷达测距仪的单目视觉SLAM方法，该方法在低成本硬件上实现了有效的漂移校正，并用于解决单目SLAM中经常出现的尺度漂移问题。Scherer等人（2012）采用无人机建图河流沿线的水道和植被，使用视觉里程测量和IMU相结合的融合框架来估计状态，并使用激光雷达检测障碍物并建图河流边界，但这种方法产生了包含遮挡点的点云，这在一定程度上降低了状态估计的准确性。Huang等人（2019）解决了这一问题，并提出了一种包括遮挡点检测和共面点检测机制的直接SLAM方法。

3.4.2 LIDAR引导方法

在LIDAR引导的方法方面，它采用视觉信息来提高回环检测的准确性，或者在姿态估计阶段构建LIDAR特征变换误差和视觉重投影误差的联合优化函数来提高位姿估计的鲁棒性，例如Bai等（Bai等人，2016）使用卷积神经网络提取特征以实现回环检测，并通过设置匹配范围有效避免环路闭合场景的失配，并通过特征压缩确保SLAM系统的实时性能。Liang等人（2016）使用扫描匹配和基于ORB特征的回环检测技术来改善基于LIDAR的SLAM的弱性能。Zhu等人（2018）提出了一种使用视觉回环检测的3D激光SLAM方法，该方法通过使用视觉词汇袋的关键帧技术来实现回路检测。此外，迭代最近点（ICP）方法（Arun等人，1987）也可以通过激光雷达和视觉融合进行优化。Pande等人（2011）使用视觉信息来估计刚体变换，然后提出了一个广义ICP框架。

3.4.3 视觉-激光雷达相互校正方法

上述研究方法大多使用单一SLAM方法，并使用另一个传感器作为辅助设备。也有一些研究试图将两种SLAM方法结合起来，以相互纠正。VLOAM（Zhang和Singh，2015）是视觉激光雷达相互校正的经典实时方法。该方法使用激光雷达扫描圆内的视觉里程计估计的相机位姿来校正激光点云。点云运动失真，使用在相邻扫描校正之后从LIDAR点云估计的相对位姿来校正视觉估计姿态，并将校正后的点云映射到局部地图以进行后续位姿优化。

Seo和Chou（2019）提出了一种并行SLAM方法，该方法同时使用激光雷达SLAM和视觉SLAM，其特征在于在后端使用两种模式的测量残差来优化后端。Jiang等人（2019）使用LIDAR约束和特征点约束来定义图优化的成本函数，并构建了2.5D地图以加快回环检测过程。目前，基于视觉LIDAR融合的SLAM方法的研究成果和实际应用比视觉惯性融合少，需要进一步探索和研究。

3.5 Visual-LIDAR-IMU SLAM

目前，多传感器融合方法（如视觉-LIDAR-IMU融合SLAM）被认为适用于L3级别的自动驾驶，并引起了许多学者的关注。基于激光雷达的SLAM系统可以获得广泛的环境细节，但在缺乏结构信息的场景（尤其是自动驾驶场景）中很容易失败。例如，长长的走廊或开阔的广场。基于视觉的方法在具有丰富纹理信息的场景中表现良好，并且很容易重新识别场景（Shin等人，2020）。但它对照明、快速移动和初始化过程的变化非常敏感。因此，激光雷达和视觉传感器经常与IMU融合，以提高系统的准确性和鲁棒性。IMU可以消除点云的运动失真，并在缺乏特征的环境中持续一段时间，同时可以帮助视觉系统恢复尺度信息。

目前，关于视觉-LIDAR-IMU融合SLAM的研究成果很少（Debeunne和Vivet，2020b）。一些学者尝试使用视觉-IMU融合系统（即视觉-惯性系统，VIS）和LIDAR-IMU融合系统（如LIDAR-惯性系统，LIS），因为这两个单独的模块进一步融合，以形成性能更好的视觉-LIDAR-IMU融合系统（LIDAR-视觉-惯性系统，LVIS）（Chen等人，2018）。本文还介绍了激光-IMU融合SLAM方法的研究情况。基于LIDAR-IMU融合的方案分为两类：松耦合和紧耦合方案。典型的松耦合方案是LOAM，（图16（a））和LeGO-LOMA（Shan和Englot，2018），其中IMU测量信息未用于优化步骤。与松耦合方案相比，紧耦合方案处于开发阶段，这通常大大提高了系统的准确性和鲁棒性。在当前公开的紧密耦合系统中，LIO-Mapping（Ye等人，2019）使用VINS-Mono中的优化过程来最小化IMU残差和LIDAR测量误差。由于LIO建图旨在优化所有测量值，因此系统的实时效果较差。Zou等人提出了LIC融合，如图16（b）所示。它融合了点云中提取的LiDAR特征和稀疏视觉特征，蓝色和红色的LiDARR点分别是平面和边缘特征，估计的轨迹用绿色标记。为了节省计算资源，LIO-SAM（图16（c））引入了滑动窗口优化算法，使用因子图方法联合优化IMU和LIDAR的测量约束。LINS（图16（e）），专门为地面车辆设计，使用基于误差状态的卡尔曼滤波器迭代修正待估计的状态量。

Zhang和Singh（2018）提出了一种紧密耦合的LVIO（激光雷达视觉惯性里程表）系统，该系统使用从粗到精的状态估计方法，从IMU预测开始进行粗略估计，然后由VIO和LIO进一步细化。目前，LVIO算法是KITTI数据集上测试精度最高的算法。Zoo等人（2019）基于MSCKF框架实现了时空多传感器的在线校准。不幸的是，Zhang和Singh（2018）和Zoo等人（2019）实施的代码目前不是开源的。Shan等人（2021）于2021发布了最新的可视化LIDAR-IMU紧耦合方案：LVI-SAM（图16（d））。为了提高系统的实时性能，它使用了平滑和建图算法。作者将视觉IMU和激光雷达IMU视为两个独立的子系统。当检测到足够多的特征点时，这两个子系统将链接在一起。当其中一个子系统检测不到时，这两个子系统可以独立分离，因为不会相互影响。表5总结了近年来视觉-惯性SLAM框架中的主要算法。

04 讨论

尽管如前所述，视觉SLAM在自动驾驶车辆的定位和地图绘制方面取得了巨大成功，但现有技术还不够成熟，无法完全解决当前的问题。当前基于视觉的定位和建图解决方案仍处于起步阶段。为了满足复杂城市环境中的自动驾驶要求，未来的研究人员面临许多挑战。这些技术的实际应用应被视为一个系统的研究问题。此外，SLAM系统只是自动驾驶车辆复杂系统的组成部分，自动驾驶系统不能完全依赖SLAM系统，还需要配备控制、目标检测、路径规划和决策等模块。本节讨论了自动驾驶车辆应用的视觉和基于视觉的SLAM的当前关键问题以及未来发展趋势的总体观察和推断。

4.1 实时性能

自动驾驶车辆的应用要求视觉SLAM系统尽可能快速地响应。在视觉算法的情况下，10 Hz的频率被认为是车辆在城市道路上维持自动驾驶所需的最小帧速率。一方面，已经提出了一些视觉算法来显式优化实时性能，另一方面，可以通过具有更高规格性能的硬件（如GPU）来进一步改进。此外，考虑到系统的准确性和鲁棒性，应考虑各种环境动态（例如场景变化、移动障碍物和照明不变量。目前，在特定场景下，如自动代客泊车（APV），摄像头最常用于实现自动驾驶的障碍物检测或避让和车道保持；

4.2 定位

城市道路场景的自动驾驶仍处于L2和L3之间的技术攻关阶段，其中一个关键问题是车辆的位置精度很粗糙。论文观察到，高质量的自动驾驶离不开精确的位置，即使在未建图的环境中，车辆也能在厘米级的位置上导航。仅依靠精度约为10米的传统GPS接收机无法实现这种精度，通常安装昂贵的差分GPS（DGPS）接收机来实现这一点，但它引入了冗余，而视觉SLAM算法本身可用于精确定位。如本文所述，研究了实现相对定位的其他独立于GPS的方法，如视觉-惯性融合方法、视觉-LIDAR融合方法和视觉-LIDAR-IMU融合方法，由IMU引入的漂移误差将指数地影响精度。在视觉LIDAR融合方法方面，由于缺乏自身的航位推算（DR）传感器（如编码和IMU传感器），自动驾驶车辆的定位鲁棒性无法保证。就视觉LIDAR-IMU融合方法而言，据论文所知，目前还没有成熟的基于视觉的融合SLAM算法成功应用于真实世界的自动驾驶车辆，但近年来正在研究许多优秀的融合方法。随着激光雷达传感器成本的降低，我们认为视觉激光雷达IMU融合方法是自动驾驶车辆高精度定位的最终方案；

4.3 测试

目前现实世界中的实施还不充分，这可以归因于当地立法和缺乏用于自动驾驶测试的开发车辆。在这里，论文观察到，几乎所有最近呈现的视觉SLAM作品都在公共数据集（例如KITTI、EuROC、TUM等）上进行了测试。诚然，它们是用于算法验证的绝佳数据集，但这些算法最终在真实世界环境中的表现仍有待验证。此外，对这些数据集的测试还将测试环境限制在捕获数据集的位置，这可能不是其他国家或城市的算法的有效指标。缺乏真实世界实现的另一个原因似乎是由于视觉SLAM算法的较高计算要求，这表明在线实现将需要具有足够和专用并行处理硬件的计算机。通常的移动计算机（如笔记本电脑）不具备桌面GPU的并行计算能力。Nvidia的DRIVE PX2（Nvidia Corporation，2017a）等商用自动驾驶计算机价格昂贵，通常无法在预算内进行开发。令人鼓舞的是，最近出现了具有改进的视觉算法的高性能和低成本嵌入式设备，例如，Nvidia Jetson和快速VO（即前端或部分视觉SLAM）方法的优化可以促进这些实现；

4.4 未来发展趋势

由于视觉SLAM的复杂模块（例如前端、后端、回环和建图等）增加了硬件平台的计算负担，高性能移动计算平台通常限制了上述视觉SLAM算法在自动驾驶中的应用。基于多代理的视觉SLAM技术似乎能够克服这个问题。目前，基于多智能体的可视化SLAM通常用于无人机，如果它安装在自动驾驶汽车上进行移动计算，移动计算机平台只负责处理前端数据，而后端优化和建图的过程则由远程服务器通过5G/6G通信网络来处理，我们相信，这将大大加快视觉SLAM在未来自动驾驶车辆中的应用；

05 结论

最近研究的可用性对解决视觉SLAM问题有很大贡献。这项工作回顾了各种类型的视觉SLAM和/或基于视觉的SLAM方法及其在自动驾驶中的应用。目前视觉SLAM在自动驾驶汽车中的应用被认为还不成熟，但这仍然引起了广泛的关注。由于自动驾驶公共数据集的易获取性，视觉SLAM算法总是易于验证，并鼓励对新算法的研究。然而，尽管数据集的可用性促进了新的视觉SLAM算法的提出，但目前城市道路环境中的真实世界视觉SLAM应用仍然存在不足。此外，数据集评估的结果往往与本地真实世界环境中的性能的完整指示不符，因此，自动驾驶车辆的应用有望出现实用的视觉SLAM。

通过回顾最先进的视觉SLAM算法，可以确认当前视觉SLAM系统的趋势是轻量化和多智能体协作，鼓励将其应用于低功耗硬件，如嵌入式设备，并且多传感器融合算法被认为是自动驾驶车辆中视觉SLAM应用的核心。综上所述，自动驾驶领域仍存在各种问题，特别是视觉SLAM和自动驾驶车辆的结合需要探索。尽管如此，公众对自动驾驶汽车和即将推出的高性能移动计算机的日益认可无疑将在不久的将来激发视觉SLAM的实际应用。

审核编辑：黄飞

阅读全文

移动机器人(33293) 移动机器人(33293)
SLAM(31569) SLAM(31569)
自动驾驶(162871) 自动驾驶(162871)
LIDAR(28964) LIDAR(28964)
相机传感器(4402) 相机传感器(4402)

探讨SLAM技术发展中还存在的问题

SLAM作为一种基础技术，从最早的军事用途（核潜艇海底定位就有了SLAM的雏形）到今天，已经逐步走入人们的视野，过去几年扫地机器人的盛行让它名声大噪，近期基于三维视觉的VSLAM又让它越来越显主流。

2018-08-08 10:07:28

9778

关于无人机的新型轻型高速视觉系统

在无人机视觉系统的常规研究中，用于基于视觉的导航的视觉同步定位和映射（Visual SLAM）和视觉里程计（VO）是主要课题。

2022-07-28 11:21:42

1108

基于多模态语义SLAM框架

本文提出了一个鲁棒且快速的多模态语义 SLAM 框架，旨在解决复杂和动态环境中的 SLAM 问题。具体来说，将仅几何聚类和视觉语义信息相结合，以减少由于小尺度对象、遮挡和运动模糊导致的分割误差的影响。

2022-08-31 09:39:14

1300

针对视觉SLAM的VO稳定的图像配准算法解析

本文针对视觉SLAM的VO广泛使用的特征点法以及光流法存在的问题，寻求建立一种更加简便且稳定的图像配准算法，该算法以图像一致性为理论基础，利用VO顺序采集图像的帧间特点，最后通过实验验证了所设计的基于边缘特征一致性的图像配准评价符合VO应用的视觉要求。

2022-09-15 10:22:59

687

解读多传感器融合SLAM技术的发展趋势

相较于激光雷达SLAM系统，视觉SLAM系统具有不主动发出信号的优点。此外，视觉是对环境的稠密感知，可以利用视觉特征构建出更符合人类感知的环境地图。

2022-12-21 16:18:09

2451

什么是SLAM？视觉SLAM怎么实现？

上周的组会上，我给研一的萌新们讲解什么是SLAM，为了能让他们在没有任何基础的情况下大致听懂，PPT只能多图少字没公式，这里我就把上周的组会汇报总结一下。这次汇报的题目我定为“视觉SLAM：一直在

2023-08-21 10:02:07

1570

探讨目前主流3D激光SLAM算法方案

　激光SLAM局部定位精度高但全局定位能力差且对环境特征不敏感，而视觉SLAM全局定位能力好但局部定位相对激光雷达较差，两者融合可以提高SLAM系统的精度和鲁棒性。

2023-10-23 11:01:14

650

动态环境中基于神经隐式表示的RGB-D SLAM

神经隐式表示已经被探索用于增强视觉SLAM掩码算法，特别是在提供高保真的密集地图方面。

2024-01-17 10:39:50

442

SLAM大法之回环检测

常有必要的。　　　　回环检测失败　　如何提升机器人回环检测能力？　　那么，怎么才能让机器人的回环检测能力得到一个质的提升呢？首先要有一个算法上的优化。　　1. 基于图优化的SLAM算法　　基于图优化

2019-03-06 15:38:04

SLAM技术的应用及发展现状

近年来，由于扫地机的出现使得SLAM技术名声大噪，如今，已在机器人、无人机、AVG等领域相继出现它的身影，今天就来跟大家聊一聊国内SLAM的发展现状。 SLAM的多领域应用SLAM应用领域广泛，按其

2018-12-06 10:25:32

SLAM技术目前主要应用在哪些领域

　　目前，SLAM（即时定位与地图构建）技术主要被运用于无人机、无人驾驶、机器人、AR、智能家居等领域，从各应用场景入手，促进消费升级。　　机器人　　激光+SLAM是目前机器人自主定位导航所

2020-12-01 14:26:37

SLAM的相关知识点分享

研究生期间进行了基于2D激光雷达的SLAM的研究，当时主要做了二维激光雷达的数据处理。小弟不才，没有入得了SLAM的坑，却一直谜之向往，如今得以机会，决定正式迈出第一步，彻底进入SLAM的坑！心中

2021-08-30 06:13:31

视觉SLAM特征点法与直接法对比分析

视觉SLAM——特征点法与直接法对比以及主流开源方案对比 ORB LSD SVO DSO

2020-06-02 16:56:49

视觉SLAM笔记总结

【总结】视觉SLAM笔记整理

2020-07-17 14:05:20

视觉伺服控制系统

视觉伺服控制系统，最近在学习相关知识，做个简要总结：背景介绍国内外研究现状算法介绍研究问题及实施方案总结展望背景介绍研究表明，人类获得的80%以上的感官信息来自于视觉器官。借鉴同样的原理，借助视觉

2021-07-12 06:03:45

视觉机器人的发展现状与趋势

***有关部门应组织力量进行充分地调查研究，在此基础上，制定切实可行的推广、应用机器人和促进机器人研究开发的倾斜政策。如在税收、投资和贷款方面对机器人产业实行扶持政策。日本***通过制定政策，采取一系列

2016-09-08 10:34:05

HOOFR-SLAM的系统框架及其特征提取

HOOFR SLAM System: An Embedded Vision SLAM Algorithm and Its Hardware-Software Mapping-Based

2021-12-21 06:35:49

LabVIEW 的Tripod 机器人视觉处理和定位研究

针对传统的物流分拣过程效率低、成本高的现状以及利用机器视觉进行分拣快速、可靠的优点对机器视觉、图像处理和Ｔｉｒｏｐｄ机器人进行了研究基于ＬａｂＶＩＥＷ设计了Ｔｒｉｐｏｄ机器人视觉系统将分拣过程简化

2019-06-01 06:00:00

【Toybrick RK3399Pro AI开发板试用申请】机器人激光与视觉融合的导航模块

项目名称：机器人激光与视觉融合的导航模块试用计划：申请理由本人在机器人SLAM领域有4年开发经验，从最开始激光SLAM到视觉SLAM，在物流机器人行业不断创新开发。SLAM技术将赋予为机器人和智能体

2019-07-03 10:50:01

中国人工智能的现状与未来

机器学习，计算机视觉等等，总的说来，人工智能研究的一个主要目标是使机器能够胜任通常需要人类智能才能完成的复杂工作。那人工智能知识体系有哪些内容呢？下面是新一代人工智能知识体系大全图谱:中国人工智能发展现状

2021-07-27 06:40:45

单片机自检技术的研究现状及进展情况？

单片机自检技术的研究现状及进展情况？？要弄开题报告，求大神帮助！！

2015-03-25 11:37:26

基于SLAM的移动机器人设计

题目：基于SLAM的移动机器人设计嵌入式PPT应具有的几个部分1、有哪些硬件　　1）小车　　2）STM32F429开发板　　3）树莓派3b+开发板　　4）4g通信模块　　5）GPS模块　　6

2021-11-08 06:17:14

基于视觉的slam自动驾驶

基于视觉的slam自动驾驶，这是我们测试的视频《基于slam算法的智能机器人》调研分析报告项目背景分析机器人曾经是科幻电影中的形象，可目前已经渐渐走入我们的生活。机器人技术以包含机械、电子、自动控制

2021-08-09 09:37:34

基于视觉的机器人SLAM入门实践

嵌入式系统开发与应用——基于视觉的机器人SLAM入门实践1一、OpenCV的安装与配置1. 下载OpenCV3.4.1并解压到ubuntu相应目录上2. 下载安装依赖库和编译工具cmake（1）更新

2021-12-16 08:16:12

基于LabVIEW的五子棋游戏开发开题报告中的研究现状和可行...

开题报告中的研究现状和可行性分析写了好几次都被打回来了，求好心人帮忙看看怎么写

2014-01-07 16:23:36

我想学习SLAM技术有老师愿意教我吗？

大家好，我想学习SLAM技术有资深的老师愿意教我吗？qq：496397940

2018-11-09 13:42:27

无线传感器网络技术及应用现状

无线传感器网络技术及应用现状摘　要:无线传感器网络是当前信息领域的一个研究热点。本文总结无线传感器网络的发展历史和研究现状,分析无线传感器网络的地位和作用,对当前国内外的最新研究现状进行概述,列举

2009-10-26 16:22:33

无线传感器网络的研究现状及发展趋势

2012-08-15 13:00:42

智能家居的应用研究现状精选资料分享

智能家居的应用研究现状摘要：随着关键技术发展和消费者增长的需求，智能家居成为近年来家电行业的关键词。智能家居是以住宅为平台，贯彻以人为本的设计理念，利用计算机、网络通信、综合布线等技术将家居设备

2021-07-19 09:08:19

有关虚拟仪器的计算机视觉系统有哪些研究？

请问有关虚拟仪器的计算机视觉系统有哪些研究？基于虚拟仪器的视觉系统对PC性能有什么要求？

2021-04-13 06:43:49

机器视觉测试系统具有哪些特性应用？

机器视觉测试系统构成、分类及工作原理是什么？机器视觉测试系统的典型应用领域及市场现状分析机器视觉测试系统在检测方面的应用有哪些

2021-05-14 06:22:31

汇总 |计算机视觉系统学习资料下载精选资料分享

计算机视觉干货资料，涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、姿态估计、多视图几何、多传感器融合等方向【计算...

2021-07-27 07:51:42

浅谈SLAM的回环检测技术

什么是回环检测？在讲解回环检测前，我们先来了解下回环的概念。在视觉SLAM问题中，位姿的估计往往是一个递推的过程，即由上一帧位姿解算当前帧位姿，因此其中的误差便这样一帧一帧的传递下去，也就是我们

2018-10-23 17:47:22

激光SLAM与视觉SLAM有什么区别？

机器人定位导航中，目前主要涉及到激光SLAM与视觉SLAM，激光SLAM在理论、技术和产品落地上都较为成熟，因而成为现下最为主流的定位导航方式，在家用扫地机器人及商用送餐机器人等服务机器人中普遍采用了...

2021-07-05 06:41:57

激光SLAM与VSLAM定位导航方法谁主沉浮？

SLAM（同步定位与地图构建），是指运动物体根据传感器的信息，一边计算自身位置，一边构建环境地图的过程，解决机器人等在未知环境下运动时的定位与地图构建问题。目前，SLAM 的主要应用于机器人、无人机、无人驾驶、AR、VR 等领域。其用途包括传感器自身的定位，以及后续的路径规划、运动性能、场景理解。

2020-05-20 08:19:40

激光SLAM和视觉VSLAM的分析比较

什么是激光SLAM？视觉VSLAM又是什么？激光SLAM和视觉VSLAM有哪些不同之处？

2021-11-10 07:16:02

激光SLAM技术在机器人运动控制系统中的应用是什么

什么是激光SLAM？激光SLAM技术在机器人运动控制系统中的应用是什么？

2021-07-30 06:37:25

行业研究：机器视觉产业2020年进入成熟期

2014、2015年情况来看，我国机器视觉产业已积累足够技术、市场、行业经验，已步入快速发展阶段。　　OFweek行业研究中心最新出版的《2016-2020年中国工业机器视觉市场研究及预测报告》指出

2016-01-20 10:54:41

让机器人完美建图的SLAM 3.0到底是何方神圣？

地图上看误差较大，SLAM 3.0也可灵活对已产生的地图进行调整。　　即：　　　　　　SLAM 3.0闭环修正　　| 支持多传感器融合　　· 除激光雷达外，SLAM 3.0软件技术同时支持深度视觉

2019-01-21 10:57:46

谁有关于密码登录系统国内外研究现状的资料啊，

谁有关于密码登录系统国内外研究现状的资料啊，手头资料没有这方面的介绍，谁能帮忙给点资料啊谢谢了

2014-03-11 15:34:44

车载雷达通信系统的研究现状

车载雷达通信系统的研究意义车载雷达通信系统的研究现状

2020-12-18 07:32:53

单目视觉SLAM仿真系统的设计与实现

实现单目视觉同时定位与建图(SLAM)仿真系统，描述其设计过程。该系统工作性能良好，其SLAM算法可扩展性强，可以精确逼近真实单目视觉SLAM过程。以方便SLAM算法的研究为目标，提

2009-04-15 08:50:37

软开关型逆变弧焊电源研究现状

软开关型逆变弧焊电源研究现状，下来看看。

2016-03-30 14:48:12

图像分割方法的研究现状与展望

立体视觉的应用越来越广泛，立体视觉需要用到图像分割方法，这个论文是有关图像分割的研究现状与展望

2016-05-20 16:50:06

基于视觉词典BOW的三维SLAM算法

针对传统滤波器方法解决机器人同时定位与地图创建（ SLAM）时的误差积累问题，提出了一种基于视觉词典（BOW）的三维SLAM算法，以有效解决机器人长时间运动下误差积累的问题。相比图优化SLAM中常

2017-12-22 14:58:13

视觉SLAM技术以及其应用详解

当我们谈论SLAM时，最先问到的就是传感器。SLAM的实现方式与难度和传感器的形式与安装方式密切相关。传感器分为激光和视觉两大类，视觉下面又分三小方向。下面就带你认识这个庞大家族中每个成员的特性。

2018-01-09 13:09:02

23852

机器人SLAM实现

针对复杂环境下机器人的同时定位与地图构建（ SLAM）存在实时性与鲁棒性下降等问题，将一种基于ORB特征点的关键帧闭环检测匹配算法应用到定位与地图构建巾。研究并分析了特征点提取与描述符建立

2018-03-26 10:57:32

未来的SLAM会是什么样？

随着技术工艺的进步，摩尔定律的瓶颈似乎开始出现，追求单核更大功率的处理器还是比较困难的，而在SLAM中，单指令，多线程GPU提供的并行性，也非常适合实时视觉的计算要求。

2018-04-09 11:06:32

5143

高仙SLAM具体的技术是什么？SLAM2.0有哪些优势？

高仙的SLAM2.0技术体系核心，是基于多传感器融合+深度学习的架构，即语义SLAM。高仙SLAM2.0技术方案以语义分析、机器学习为基础，结合云端实时信息处理以及专为多传感器融合而开发的专业算法体系，真正实现了SLAM在建图和导航两个环节的完整应用。

2018-05-15 16:48:30

8534

盘点视觉SLAM技术在各领域的应用

当今科技发展速度飞快，想让用户在AR/VR、机器人、无人机、无人驾驶领域体验加强，还是需要更多前沿技术做支持，SLAM就是其中之一。实际上，有人就曾打比方，若是手机离开了WIFI和数据网络，就像无人车和机器人，离开了SLAM一样。

2018-10-09 14:58:49

7240

游戏中视觉风格的历史和现状

Double Fine（残酷传奇，破碎时代）的Lee Petty介绍了游戏中视觉风格的历史和现状，并提供了如何使用视觉风格在您自己的游戏中产生最大影响的见解。

2018-11-08 06:19:00

2545

多维度对比激光SLAM与视觉SLAM

SLAM（同步定位与地图构建），是指运动物体根据传感器的信息，一边计算自身位置，一边构建环境地图的过程，解决机器人等在未知环境下运动时的定位与地图构建问题。

2018-11-14 08:54:01

7334

视觉SLAM的技术资料总结

随着传感器种类和安装方式的不同，SLAM的实现方式和难度会有很大差异。按传感器来分，SLAM主要分为激光、视觉两大类。其中，激光SLAM研究较早，理论和工程均比较成熟。视觉方案目前大部分实验室研究

2019-05-12 10:31:13

4896

视觉SLAM实现的关键方法有哪些详细资料总结

本文是调研视觉SLAM中的实现方法的总结，包括三方面内容：姿态计算、闭环检测、BA优化。

2019-05-18 11:49:01

4035

激光SLAM和视觉SLAM各擅胜场,融合使用、取长补短潜力巨大

近年来SLAM系统与其他传感器的融合成为了一大热点。

2019-05-24 09:45:06

12480

视觉SLAM技术浅谈

近年来，SLAM技术取得了惊人的发展，领先一步的激光SLAM已成熟的应用于各大场景中，视觉SLAM虽在落地应用上不及激光SLAM，但也是目前研究的一大热点，今天我们就来详细聊聊视觉SLAM的那些

2019-08-09 17:31:20

1430

视觉SLAM深度解读

2019-09-11 22:01:35

1759

激光SLAM与视觉SLAM必将融合移动机器人核心技术将不断升级

近年来，伴随移动机器人在各行各业的广泛应用，SLAM这个“名字”逐渐被更多的人所熟悉，但是SLAM具体是什么、SLAM有哪些应用领域、激光SLAM和视觉SLAM哪种方式更有优势等等这些问题却总是模糊不清。今天，小编就带大家来详细了解一下～

2020-01-18 17:43:00

3117

科普|视觉SLAM是什么——三种视觉SLAM方案

，就相当于人类失去了双眼一样。一、什么是视觉SLAM? SLAM的英文全称是Simultaneous Localization and Mapping，中文称作「即时定位与地图创建」，而视觉SLAM就是用摄像头来完成环境的感知工作。举个例子，当你第一天去上大学的时候，为了迅速熟悉校园环境并且找到

2020-04-17 09:21:41

53842

视觉SLAM与激光SLAM有什么区别？

在业内，视觉SLAM与激光SLAM谁更胜一筹，谁将成为未来主流趋势这一问题，成为大家关注的热点，不同的人也有不同的看法及见解，以下将从成本、应用场景、地图精度、易用性几个方面来进行详细阐述。

2020-08-28 14:53:30

16068

视觉SLAM技术在各领域的应用盘点

当我们谈论SLAM时，最先问到的就是传感器。SLAM的实现方式与难度和传感器的形式与安装方式密切相关。传感器分为激光和视觉两大类，视觉下面又分三小方向。

2020-12-26 00:25:30

2033

技术干货，带你了解SLAM技术的前世今生

SLAM这个“名字”逐渐被更多的人所熟悉，但是SLAM具体是什么、SLAM有哪些应用领域、激光SLAM和视觉SLAM哪种方式更有优势等等这些问题却总是模糊不清。

2020-12-26 09:39:32

2084

机器人主流定位技术：激光SLAM与视觉SLAM谁更胜一筹

定位技术是机器人实现自主定位导航的最基本环节，是机器人在二维工作环境中相对于全局坐标的位置及其本身的姿态。目前SLAM （Simultaneous Localization and Mapping即时定位与地图构建）是业内主流的定位技术，有激光SLAM和视觉SLAM之分。

2020-12-26 10:59:43

1285

SLAM导航技术的分类、典型应用及国内发展现状

SLAM是Simultaneous localization and mapping缩写，意为“同步定位与建图”，主要用于解决机器人在未知环境运动时的定位与地图构建问题。 SLAM的典型应用领域

2020-12-31 09:49:42

7086

VIL-SLAM系统可实现获得更好的回环约束

本文提出的立体视觉+惯导+激光雷达的SLAM系统，在比如隧道一些复杂场景下能够实现良好性能。VIL-SLAM通过将紧密耦合的立体视觉惯性里程计（VIO）与激光雷达建图和激光雷达增强视觉环路闭合相结合

2021-02-18 17:59:06

1949

视频采集方案的研究现状实验设计

主要阐述视频采集方案的研究现状实验设计。

2021-03-16 10:42:48

视觉SLAM方案和硬件选型调研的总结

SLAM 是 Simultaneous Localization and Mapping 的缩写，中文译作“同时定位与地图构建”。它是指搭载特定传感器的主体，在没有环境先验信息的情况下，于运动过程中建立环境的模型，同时估计自己的运动。如果这里的传感器主要为相机，那就称为“视觉 SLAM”。

2021-03-20 09:13:12

3814

基于三维激光数据的层级式SLAM方法

课题组已将该研究成果应用于智能驾驶即时定位与建图（SLAM）任务中，提出了基于三维激光数据的层级式SLAM方法，实现了无GNSS环境下智能无人系统的高精度自主定位定姿，在智能驾驶国际著名公开数据集KITTI上排名全球第7（纯激光SLAM算法中排名全球第4）。

2021-04-20 09:19:30

1806

机器视觉的现状及其应用

近年来，机器视觉已经发展成为光电子的一个应用分支，广泛应用于微电子、 PCB生产、自动驾驶、印刷、科学研究和军事等领域。机器视觉在中国的蓬勃发展，使从事机器视觉的公司和人员大量涌现。首先概述了机器

2021-04-28 11:32:56

基于概率运动统计特征匹配的单目视觉SLAM算法

在单目视觉同步定位与建图（SLAM）过程中，由于特征匹配阶段存在误匹配且耗时长，使得机器人初始化速度慢、定位精度不髙。针对此问题，基于概率运动统计特征匹配，提出一种单目视觉SLAM算法。通过设置

2021-05-27 14:25:54

教你们视觉SLAM如何去提高定位精度

ORB-SLAM）的定位精度不能达到论文中，或者你预想的精度，那么这个事情是可以根据实际场景讨论的。排名6， 11， 12， 14， 15的方案是基于视觉的，或者至少融合了视觉。其漂移误差大都低于1%。这是什么概念？我本科时参加的机器人竞赛里，经过仔细标定的轮式

2021-07-06 10:57:04

3582

《OTFS技术研究现状与展望》论文

2021-12-30 09:27:06

事件视觉传感器发展现状与趋势

据麦姆斯咨询报道，中国科学院长春光学精密机械与物理研究所徐伟研究员课题组在《液晶与显示》期刊上发表了以“事件视觉传感器发展现状与趋势”为主题的综述文章。徐伟研究员主要从事新型高分辨率空间有效载荷总体设计等方面的研究工作。

2022-04-28 14:48:08

3175

Snake-SLAM视觉惯性SLAM系统

./oschina_soft/Snake-SLAM.zip

2022-06-16 11:27:43

基于SupSLAM的视觉惯性SLAM方法

近年来，使用机器学习技术进行特征提取的基于调制解调器特征的SLAM越来越受到关注，并有望在几乎所有机器人工作环境中超越传统方法。

2022-10-17 16:39:46

600

基于SupSLAM视觉惯性SLAM方法在无人机中的应用研究

近年来，使用机器学习技术进行特征提取的基于调制解调器特征的SLAM越来越受到关注，并有望在几乎所有机器人工作环境中超越传统方法。

2022-10-19 17:35:08

676

基于视觉传感器的ORB-SLAM系统的学习

视觉SLAM是一种基于视觉传感器的 SLAM 系统，与激光传感器相比，视觉传感器具有成本低、保留环境语义信息的优点，能够与深度学习进行大量结合。

2022-11-02 15:02:32

746

一种快速的激光视觉惯导融合的slam系统

一个建立在两个基于直接法的紧耦合的完整的激光视觉惯导融合的slam框架；

2022-11-09 09:55:54

1147

移动机器人视觉SLAM回环检测原理、现状及趋势

目前视觉SLAM回环检测主要方式有传统的词袋模型以及基于概率和词袋模型的一些改进算法，但是传统方式依然存在过多的人工干预，对于场景中动态对象的处理不是十分理想，并且计算量较大，响应比较慢。而深度学习技术的出现及发展在回环检测问题的解决上提供了新的方向。

2022-11-09 12:38:21

1361

基于视觉传感器的SLAM系统学习

2022-11-29 21:38:37

626

关于视觉SLAM直接法的介绍

而关于SLAM，它是英文“同时定位与建图”的缩写。而有时候，我们还会听到VO，SfM等概念，而因此容易混淆。

2022-11-30 09:22:10

708

基于深度学习的视觉SLAM综述

SLAM本质上是一个状态估计问题，根据传感器做划分，主要是激光、视觉两大类。激光SLAM的研究在理论和工程上都比较成熟，现有的很多行业已经开始使用激光SLAM完成工业工作；而视觉SLAM

2022-12-02 15:00:28

1149

经典视觉SLAM框架开源方案

2022-12-05 10:16:31

1247

SLAM的原理手持SLAM的优缺点讲解

手持SLAM设备最大的特点肯定要放到手持这个动作上面，由于SLAM算法的优越性，手持可以做到走到哪里测到哪里。

2022-12-27 10:43:41

3280

ORB-SLAM3与ORB-SLAM2相比有哪些优势呢？

自主导航是机器人基础性和关键性技术，是机器人实现其他更高级任务的前提。视觉 SLAM (Simultaneous Localization And Mapping) 利用视觉传感器获取环境图像信息，基于多视图几何算法构建环境地图。

2023-01-16 10:58:29

2085

一种基于直接法的动态稠密SLAM方案

基于特征点法的视觉SLAM系统很难应用于稠密建图，且容易丢失动态对象。而基于直接法的SLAM系统会跟踪图像帧之间的所有像素，因此在动态稠密建图方面可以取得更完整、鲁棒和准确的结果。

2023-03-13 09:38:45

745

OV2SLAM(高速视觉slam)简析

视觉里程计最近几年越来越受到学术界以及工业界的认可，以ORB和VINS为代表的视觉SLAM已经可以满足绝大多数场景，而OV2SLAM在其他VSLAM中脱颖而出，其实时性以及具体的回环性能在测试中都得到了认可。

2023-03-21 17:16:31

765

视觉纹理导航,亦称Visual SLAM导航

视觉纹理导航,亦称Visual SLAM导航，通过自动导引车车载视觉传感器获取运行区域周的图像信息来实现导航的方法。视觉导航是以地面纹理为特征信息的视觉导航AGV 深圳市不止技术有限公司是激光雷达

2022-04-29 10:01:03

2613

SLAM技术在国内的发展现状

用在SLAM上的传感器主要可分为两大类，一种是激光雷达，而另一种是摄像头，为此，业内人士也将SLAM分为激光SLAM和视觉SLAM。激光SLAM比视觉SLAM起步早，在理论、技术和产品落地上都相对成熟。

2022-02-15 19:15:24

1849

slam技术研究现状 SLAM技术开发和应用挑战

融合。作为AR和计算机视觉领域的领先企业，谷东科技受邀参与本次技术了论坛，与业内专家和学者进行深入的交流和探讨，共同探索SLAM技术在现实世界中的发展和应用前景。我们分享了在SLAM技术方面的最新成果和经验，包括基于深度学习的实时地图构

2023-08-01 09:37:23

526

视觉SLAM开源方案汇总视觉SLAM设备选型

SLAM至今已历经三十多年的研究，这里给出经典视觉SLAM框架，这个框架本身及其包含的算法已经基本定型，并且已经在许多视觉程序库和机器人程序库中提供。

2023-08-10 14:15:53

410

什么是SLAM SLAM技术目前主要应用在哪些领域？

激光雷达是最古老，研究也最多的SLAM传感器。它们提供机器人本体与周围环境障碍物间的距离信息。常见的激光雷达，例如SICK、Velodyne还有我们国产的rplidar等，都可以拿来做SLAM。激光雷达能以很高精度测出机器人周围障碍点的角度和距离，从而很方便地实现SLAM、避障等功能。

2023-08-16 10:31:08

1895