MG-SLAM：融合结构化线特征优化高斯SLAM算法-电子发烧友网

0. 这篇文章干了啥？

同步定位与地图构建 (SLAM) 是计算机视觉中的一个基本问题，旨在在同时跟踪相机姿势的同时对环境进行地图构建。基于学习的密集 SLAM 方法，尤其是神经辐射场 (NeRF) 方法，在捕获密集光度信息和提供准确的全局重建方面表现出显著的进步，而传统系统则基于稀疏点云或体素。然而，NeRF 方法仍然存在过度平滑、场景表示受限和计算效率低下等缺点。最近，基于高斯的 SLAM已成为一种利用体积辐射场的有前途的方法。利用显式 3D 高斯表示，高斯 SLAM 可提供高保真渲染和细粒度场景重建，从而克服了基于 NeRF 的方法的局限性。

尽管高斯 SLAM 具有优势，但它在室内场景中仍面临显著挑战，因为室内场景通常以无纹理表面和复杂的空间布局为特征。这些环境由于缺乏相机姿势优化所必需的足够纹理细节而阻碍了稳健的跟踪。此外，由于遮挡或视野覆盖有限，室内场景的复杂几何形状通常会导致大量未观察到的区域。这些看不见的区域对高斯 SLAM 构成了关键但尚未探索的挑战，因为高斯表示很难在没有多视图优化的情况下插入未观察到的几何形状。因此，地图上看不见的区域留下了大量的漏洞和空白，这个问题在以前的高斯 SLAM 研究中基本上被忽视了。

为了克服这些挑战，我们利用著名的曼哈顿世界假设作为细化和完成场景几何图形的基础策略。该假设认为，构建的环境主要遵循网格状结构，表面和线条与三个正交方向对齐。这些线条和平面对高斯 SLAM 系统中的跟踪和映射过程施加了有意义的约束。具体来说，我们涵盖了跟踪、映射和场景完成方面的增强。在跟踪中，我们利用从结构化场景中得出的线特征作为无纹理区域中的稳健特征基础，对这些线段进行反向投影和重新投影以进行姿势优化和全束调整。在映射中，我们对重新投影的线特征应用光度损失来细化地图。这种方法确保重建的场景紧密遵循环境的真实结构，从而提高其几何精度和渲染质量。此外，曼哈顿世界假设有助于识别和插值结构化表面，例如地板和天花板。这些平面对于定义空间的整体几何形状至关重要，但在捕获的视图中通常会被部分遮挡或缺失。通过分割这些不完整的表面（通过提取的线作为边界进行细化），我们可以通过生成新的高斯函数来预测它们在直接观察到的部分之外的延续。这种策略使我们能够优化场景中大表面的表示，从而增强渲染地图的完整性。最后，我们通过泊松重构合并正则化项，将高斯表示压缩为网格表面。这种方法能够提取以前在高斯 SLAM 系统中无法获得的高质量网格，使其随时可用于下游任务。

下面一起来阅读一下这项工作~

1. 论文信息

标题：Structure Gaussian SLAM with Manhattan World Hypothesis

作者：Shuhong Liu, Heng Zhou, Liuzhuozheng Li, Yun Liu, Tianchen Deng, Yiming Zhou, Mingrui Li

机构：东京大学、哥伦比亚大学、国家信息学研究所、上海交通大学、萨尔州应用科学大学、大连理工大学

原文链接：https://arxiv.org/abs/2405.20031v1

2. 摘要

高斯 SLAM 系统在提高实时重建的效率和保真度方面取得了重大进展。然而，这些系统在复杂的室内环境中经常会遇到不完整的重建，其特点是由于障碍物或有限的视角导致未观察到的几何形状而产生大量空洞。为了应对这一挑战，我们提出了曼哈顿高斯 SLAM (MG-SLAM)，这是一个利用曼哈顿世界假设来提高几何准确性和完整性的 RGB-D 系统。通过无缝集成来自结构化场景的融合线段，MG-SLAM 可确保在无纹理的室内区域中进行稳健的跟踪。此外，提取的线和平面假设允许在缺失几何形状的区域中战略性地插入新的高斯函数，从而实现高效的场景完成。在合成场景和真实世界场景上进行的大量实验表明，这些进步使我们的方法能够实现最先进的性能，标志着高斯 SLAM 系统功能的显着提升。

3. 效果展示

MG-SLAM 利用线段在相机姿态估计和场景重建方面实现 SOTA 结果。此外，通过应用结构表面约束，我们通过对缺失的几何体进行新的高斯插值来增强和完善场景。

在Replica Apartment 数据集场景 frl_apartment_4 上的线段提取结果的消融实验。

4. 主要贡献

• 我们提出了 MG-SLAM，这是一种新颖的 RGB-D 高斯 SLAM 系统，它利用了曼哈顿世界假设 [5]。该假设引入了线和平面，用于神经密集型 SLAM 系统的稳健跟踪、地图细化和表面补全。

• 我们使用提取的代表平面边界的线段建立假设表面。这些表面指导我们有效地插入新的高斯函数来填补重建地图中的间隙和空洞，无缝解决当前高斯 SLAM 系统由于未观察到的几何形状而面临限制的区域。

• 在大型合成和真实世界数据集上进行的大量实验表明，我们的系统提供了最先进的 (SOTA) 跟踪和全面的地图重建，在真实世界场景中实现了 ATE 降低 50% 和 PSNR 增强 5dB，同时以极高的帧速率运行。这些进步明显优于以前的高斯 SLAM 系统。

5. 基本原理是啥？

所提出的 MG-SLAM 的两阶段流水线图示。上部可视化了跟踪和建图系统的并行过程。下部展示了场景完成和网格提取的后优化。在曼哈顿世界假设的约束下，MG-SLAM 引入了线段和结构化表面来增强相机姿态估计和地图重建。我们利用一种特定的策略来融合线段，以确保可靠地识别线特征。高斯表示，包括专用于线段重建的专用损失项。

6. 实验结果

使用表 1 中的 ScanNet 数据集和Replica-V1 数据集对重建质量进行了定量评估。我们的方法提供了 SOTA 结果，在两个数据集上的 PSNR 均显著优于其他基于高斯的方法 4dB。跟踪评估结果如表 2 所示。我们的方法显著降低了 ATE RMSE（cm）误差，比高斯基线提高了 50%。此外，得益于我们的线融合策略，MG-SLAM 还表现出优于传统 SLAM 系统的跟踪性能。

为了评估系统在大型室内环境中的稳健性，我们在 Replica Apartment 数据集上评估了 MG-SLAM。该数据集包含广泛的多房间场景、复杂的物体几何形状和跨房间的循环轨迹。表 3 展示了我们的方法与 SplaTAM和 MonoGS在五个选定场景中的渲染质量对比。MG-SLAM 在这些基线上显示出显着的改进，特别是在具有两层八室布局的广泛公寓 0 场景中实现了 7dB 的改进。这种最佳性能主要归功于融合线段的加入，这为环路闭合和姿势优化奠定了坚实的基础。图 5 展示了公寓场景的新视图渲染结果。我们的方法在几何精度和精细细节丰富度方面比高斯基线有显着的增强。

7. 总结

在本研究中，我们提出了 MG-SLAM，这是一种基于曼哈顿世界假设的高斯 SLAM 方法。MG-SLAM 采用线段进行稳健的姿态估计和地图细化。此外，通过利用线段和平面假设，我们可以在缺失几何的间隙上有效地插入新的高斯函数。大量实验表明，我们的方法提供了最先进的跟踪和映射性能。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

结构化

结构化

+关注

关注
0

文章
27

浏览量
10337
SLAM算法

SLAM算法

+关注

关注
0

文章
11

浏览量
2558

原文标题：GS SLAM最新SOTA！MG-SLAM：使用结构化线特征提升高斯SLAM

文章出处：【微信号：3D视觉工坊，微信公众号：3D视觉工坊】欢迎添加关注！文章转载请注明出处。

一种基于MASt3R的实时稠密SLAM系统

精心设计的集成式硬件与软件堆栈，实现稳健且精准的视觉SLAM已成为可能。然而，SLAM尚未能成为一种即插即用的算法，因其需要硬件方面的专业知识以及校准操作。即便对于仅配备单个摄像头且无诸如IMU等额外传感器的最简设置而言，也不存

发表于 12-27 15:25 •515次阅读

利用VLM和MLLMs实现SLAM语义增强

语义同步定位与建图（SLAM）系统在对邻近的语义相似物体进行建图时面临困境，特别是在复杂的室内环境中。本文提出了一种面向对象SLAM的语义增强（SEO-SLAM）的新型SLAM系统，借

发表于 12-05 10:00 •355次阅读

利用VLM和MLLMs实现<b class='flag-5'>SLAM</b>语义增强

探索 SLAM 技术赋能的 MR 混合现实应用场景 #可视化 #MR #混合现实 #SLAM

SLAM

阿梨是苹果

发布于 :2024年12月02日 14:18:29

激光雷达在SLAM算法中的应用综述

SLAM算法运行的重要传感器。基于激光雷达的SLAM算法，对激光雷达SLAM总体框架进行介绍，详细阐述前端里程计、后端

发表于 11-12 10:30 •1216次阅读

激光雷达在<b class='flag-5'>SLAM</b><b class='flag-5'>算法</b>中的应用综述

从算法角度看 SLAM（第 2 部分）

作者： Aswin S Babu 正如我们在[第 1 部分]中所讨论的，SLAM 是指在无地图区域中估计机器人车辆的位置，同时逐步绘制该区域地图的过程。根据使用的主要技术，SLAM 算法可分为三种

发表于 10-02 16:39 •425次阅读

从<b class='flag-5'>算法</b>角度看 <b class='flag-5'>SLAM</b>（第 2 部分）

Jetson Nano集成探索大象机器人myAGV上的 SLAM 算法！

引言大家好，最近新入手了一台myAGV JN这是elephant robotics在myAGV升级后的版本。最近有对SLAM相关知识感兴趣，想深入了解一些关于ROS中SLAM的一些算法和规划，跟据

发表于 06-03 14:13 •635次阅读

Jetson Nano集成探索大象机器人myAGV上的 <b class='flag-5'>SLAM</b> <b class='flag-5'>算法</b>！

深度解析深度学习下的语义SLAM

随着深度学习技术的兴起，计算机视觉的许多传统领域都取得了突破性进展，例如目标的检测、识别和分类等领域。近年来，研究人员开始在视觉SLAM算法中引入深度学习技术，使得深度学习SLAM系统获得了迅速发展，并且比传统

发表于 04-23 17:18 •1441次阅读

什么是结构化网络布线？结构化网络布线有哪些好处？

在电缆领域，结构化网络布线这个术语经常被提及。人们将其用作流行语，但它的真正含义是什么?结构化布线到底是什么? 为了了解真正的含义，让我们看它的一些相关定义。根据光纤协会的说法，结构化布线是由

发表于 04-11 11:54 •623次阅读

工程实践中VINS与ORB-SLAM的优劣分析

ORB-SLAM是一种基于特征的单目视觉SLAM系统，广泛用于实时三维地图构建和机器人定位。该系统使用ORB特征进行高效的视觉识别和地图重建，支持关键帧技术和回环检测来

发表于 04-08 10:17 •3230次阅读

工程实践中VINS与ORB-<b class='flag-5'>SLAM</b>的优劣分析

结构化布线的好处多吗

考虑将这种布线纳入网络基础设施中，以优化性能和生产力。 结构化布线的好处 • 增强的可靠性：结构化布线通过最大限度地减少错误和故障点来确保可靠的网络基础设施。正确安装和组织的布线可以降低信号干扰、数据丢失和性能

发表于 04-07 11:15 •509次阅读

什么是SLAM？SLAM算法涉及的4要素

SLAM技术可以应用在无人驾驶汽车、无人机、机器人、虚拟现实等领域中，为这些领域的发展提供了支持。SLAM技术的发展已经逐渐从单纯的定位和地图构建转向了基于场景理解的功能。

发表于 04-04 11:50 •2876次阅读

什么是SLAM？基于3D高斯辐射场的SLAM优势分析

基于NeRF的SLAM算法采用全局地图和图像重建损失函数，通过可微分渲染捕获稠密的光度信息，具有高保真度。

发表于 04-01 12:44 •886次阅读

从基本原理到应用的SLAM技术深度解析

LSD-SLAM 即 Large-Scale Direct SLAM，兼容单目相机和双目相机。LSD-SLAM是一种基于光流跟踪的直接法SLAM，但是实现了半稠密建图，建图规模大，可以

发表于 02-26 09:41 •9765次阅读

从基本原理到应用的<b class='flag-5'>SLAM</b>技术深度解析

深度解析：多传感器融合SLAM技术全景剖析

SLAM中，先验值通常从一系列传感器获得，比如惯性测量单元（IMU）和编码器，而观测值则是通过GPS、相机和激光雷达等其他传感器获取的，后验值是融合了先验信息与观测数据之后得到的结果，它代表了根据所有已知信息计算出的最优定位输出。

发表于 02-23 11:31 •3527次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

MG-SLAM：融合结构化线特征优化高斯SLAM算法

评论