0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

MG-SLAM:融合结构化线特征优化高斯SLAM算法

3D视觉工坊 来源:计算机视觉工坊 2024-11-11 16:17 次阅读

0. 这篇文章干了啥?

同步定位与地图构建 (SLAM) 是计算机视觉中的一个基本问题,旨在在同时跟踪相机姿势的同时对环境进行地图构建。基于学习的密集 SLAM 方法,尤其是神经辐射场 (NeRF) 方法,在捕获密集光度信息和提供准确的全局重建方面表现出显著的进步,而传统系统则基于稀疏点云或体素。然而,NeRF 方法仍然存在过度平滑、场景表示受限和计算效率低下等缺点。最近,基于高斯的 SLAM已成为一种利用体积辐射场的有前途的方法。利用显式 3D 高斯表示,高斯 SLAM 可提供高保真渲染和细粒度场景重建,从而克服了基于 NeRF 的方法的局限性。

尽管高斯 SLAM 具有优势,但它在室内场景中仍面临显著挑战,因为室内场景通常以无纹理表面和复杂的空间布局为特征。这些环境由于缺乏相机姿势优化所必需的足够纹理细节而阻碍了稳健的跟踪。此外,由于遮挡或视野覆盖有限,室内场景的复杂几何形状通常会导致大量未观察到的区域。这些看不见的区域对高斯 SLAM 构成了关键但尚未探索的挑战,因为高斯表示很难在没有多视图优化的情况下插入未观察到的几何形状。因此,地图上看不见的区域留下了大量的漏洞和空白,这个问题在以前的高斯 SLAM 研究中基本上被忽视了。

为了克服这些挑战,我们利用著名的曼哈顿世界假设作为细化和完成场景几何图形的基础策略。该假设认为,构建的环境主要遵循网格状结构,表面和线条与三个正交方向对齐。这些线条和平面对高斯 SLAM 系统中的跟踪和映射过程施加了有意义的约束。具体来说,我们涵盖了跟踪、映射和场景完成方面的增强。在跟踪中,我们利用从结构化场景中得出的线特征作为无纹理区域中的稳健特征基础,对这些线段进行反向投影和重新投影以进行姿势优化和全束调整。在映射中,我们对重新投影的线特征应用光度损失来细化地图。这种方法确保重建的场景紧密遵循环境的真实结构,从而提高其几何精度和渲染质量。此外,曼哈顿世界假设有助于识别和插值结构化表面,例如地板和天花板。这些平面对于定义空间的整体几何形状至关重要,但在捕获的视图中通常会被部分遮挡或缺失。通过分割这些不完整的表面(通过提取的线作为边界进行细化),我们可以通过生成新的高斯函数来预测它们在直接观察到的部分之外的延续。这种策略使我们能够优化场景中大表面的表示,从而增强渲染地图的完整性。最后,我们通过泊松重构合并正则化项,将高斯表示压缩为网格表面。这种方法能够提取以前在高斯 SLAM 系统中无法获得的高质量网格,使其随时可用于下游任务。

下面一起来阅读一下这项工作~

1. 论文信息

标题:Structure Gaussian SLAM with Manhattan World Hypothesis

作者:Shuhong Liu, Heng Zhou, Liuzhuozheng Li, Yun Liu, Tianchen Deng, Yiming Zhou, Mingrui Li

机构:东京大学、哥伦比亚大学、国家信息学研究所、上海交通大学、萨尔州应用科学大学、大连理工大学

原文链接:https://arxiv.org/abs/2405.20031v1

2. 摘要

高斯 SLAM 系统在提高实时重建的效率和保真度方面取得了重大进展。然而,这些系统在复杂的室内环境中经常会遇到不完整的重建,其特点是由于障碍物或有限的视角导致未观察到的几何形状而产生大量空洞。为了应对这一挑战,我们提出了曼哈顿高斯 SLAM (MG-SLAM),这是一个利用曼哈顿世界假设来提高几何准确性和完整性的 RGB-D 系统。通过无缝集成来自结构化场景的融合线段,MG-SLAM 可确保在无纹理的室内区域中进行稳健的跟踪。此外,提取的线和平面假设允许在缺失几何形状的区域中战略性地插入新的高斯函数,从而实现高效的场景完成。在合成场景和真实世界场景上进行的大量实验表明,这些进步使我们的方法能够实现最先进的性能,标志着高斯 SLAM 系统功能的显着提升。

3. 效果展示

MG-SLAM 利用线段在相机姿态估计和场景重建方面实现 SOTA 结果。此外,通过应用结构表面约束,我们通过对缺失的几何体进行新的高斯插值来增强和完善场景。

10f385ec-9053-11ef-a511-92fbcf53809c.png

在Replica Apartment 数据集场景 frl_apartment_4 上的线段提取结果的消融实验。

113851ea-9053-11ef-a511-92fbcf53809c.png

4. 主要贡献

• 我们提出了 MG-SLAM,这是一种新颖的 RGB-D 高斯 SLAM 系统,它利用了曼哈顿世界假设 [5]。该假设引入了线和平面,用于神经密集型 SLAM 系统的稳健跟踪、地图细化和表面补全。

• 我们使用提取的代表平面边界的线段建立假设表面。这些表面指导我们有效地插入新的高斯函数来填补重建地图中的间隙和空洞,无缝解决当前高斯 SLAM 系统由于未观察到的几何形状而面临限制的区域。

• 在大型合成和真实世界数据集上进行的大量实验表明,我们的系统提供了最先进的 (SOTA) 跟踪和全面的地图重建,在真实世界场景中实现了 ATE 降低 50% 和 PSNR 增强 5dB,同时以极高的帧速率运行。这些进步明显优于以前的高斯 SLAM 系统。

5. 基本原理是啥?

所提出的 MG-SLAM 的两阶段流水线图示。上部可视化了跟踪和建图系统的并行过程。下部展示了场景完成和网格提取的后优化。在曼哈顿世界假设的约束下,MG-SLAM 引入了线段和结构化表面来增强相机姿态估计和地图重建。我们利用一种特定的策略来融合线段,以确保可靠地识别线特征。高斯表示,包括专用于线段重建的专用损失项。

115f94f8-9053-11ef-a511-92fbcf53809c.png

6. 实验结果

使用表 1 中的 ScanNet 数据集和Replica-V1 数据集对重建质量进行了定量评估。我们的方法提供了 SOTA 结果,在两个数据集上的 PSNR 均显著优于其他基于高斯的方法 4dB。跟踪评估结果如表 2 所示。我们的方法显著降低了 ATE RMSE(cm)误差,比高斯基线提高了 50%。此外,得益于我们的线融合策略,MG-SLAM 还表现出优于传统 SLAM 系统的跟踪性能。

1190cc76-9053-11ef-a511-92fbcf53809c.png

11c6c948-9053-11ef-a511-92fbcf53809c.png

为了评估系统在大型室内环境中的稳健性,我们在 Replica Apartment 数据集上评估了 MG-SLAM。该数据集包含广泛的多房间场景、复杂的物体几何形状和跨房间的循环轨迹。表 3 展示了我们的方法与 SplaTAM和 MonoGS在五个选定场景中的渲染质量对比。MG-SLAM 在这些基线上显示出显着的改进,特别是在具有两层八室布局的广泛公寓 0 场景中实现了 7dB 的改进。这种最佳性能主要归功于融合线段的加入,这为环路闭合和姿势优化奠定了坚实的基础。图 5 展示了公寓场景的新视图渲染结果。我们的方法在几何精度和精细细节丰富度方面比高斯基线有显着的增强。

11fce0dc-9053-11ef-a511-92fbcf53809c.png

12294866-9053-11ef-a511-92fbcf53809c.png

7. 总结

在本研究中,我们提出了 MG-SLAM,这是一种基于曼哈顿世界假设的高斯 SLAM 方法。MG-SLAM 采用线段进行稳健的姿态估计和地图细化。此外,通过利用线段和平面假设,我们可以在缺失几何的间隙上有效地插入新的高斯函数。大量实验表明,我们的方法提供了最先进的跟踪和映射性能。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 结构化
    +关注

    关注

    0

    文章

    27

    浏览量

    10308
  • SLAM算法
    +关注

    关注

    0

    文章

    11

    浏览量

    2528

原文标题:GS SLAM最新SOTA!MG-SLAM:使用结构化线特征提升高斯SLAM

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    利用VLM和MLLMs实现SLAM语义增强

    语义同步定位与建图(SLAM)系统在对邻近的语义相似物体进行建图时面临困境,特别是在复杂的室内环境中。本文提出了一种面向对象SLAM的语义增强(SEO-SLAM)的新型SLAM系统,借
    的头像 发表于 12-05 10:00 120次阅读
    利用VLM和MLLMs实现<b class='flag-5'>SLAM</b>语义增强

    最新图优化框架,全面提升SLAM定位精度

    已经实现了准确的估计。然而,在大规模问题中更新协方差矩阵在计算上是昂贵的。基于图的方法最早由Lu和Milios在1997年引入,随着图的增长,计算成本较低。随着计算能力的提高,基于图的SLAM优化算法
    的头像 发表于 11-12 11:26 334次阅读
    最新图<b class='flag-5'>优化</b>框架,全面提升<b class='flag-5'>SLAM</b>定位精度

    激光雷达在SLAM算法中的应用综述

    SLAM算法运行的重要传感器。基于激光雷达的SLAM算法,对激光雷达SLAM总体框架进行介绍,详细阐述前端里程计、后端
    的头像 发表于 11-12 10:30 490次阅读
    激光雷达在<b class='flag-5'>SLAM</b><b class='flag-5'>算法</b>中的应用综述

    算法角度看 SLAM(第 2 部分)

    作者: Aswin S Babu 正如我们在[第 1 部分]中所讨论的,SLAM 是指在无地图区域中估计机器人车辆的位置,同时逐步绘制该区域地图的过程。根据使用的主要技术,SLAM 算法可分为三种
    的头像 发表于 10-02 16:39 309次阅读
    从<b class='flag-5'>算法</b>角度看 <b class='flag-5'>SLAM</b>(第 2 部分)

    Jetson Nano集成探索大象机器人myAGV上的 SLAM 算法

    引言 大家好,最近新入手了一台myAGV JN这是elephant robotics在myAGV升级后的版本。最近有对SLAM相关知识感兴趣,想深入了解一些关于ROS中SLAM的一些算法和规划,跟据
    的头像 发表于 06-03 14:13 488次阅读
    Jetson Nano集成探索大象机器人myAGV上的 <b class='flag-5'>SLAM</b> <b class='flag-5'>算法</b>!

    深度解析深度学习下的语义SLAM

    随着深度学习技术的兴起,计算机视觉的许多传统领域都取得了突破性进展,例如目标的检测、识别和分类等领域。近年来,研究人员开始在视觉SLAM算法中引入深度学习技术,使得深度学习SLAM系统获得了迅速发展,并且比传统
    发表于 04-23 17:18 1284次阅读
    深度解析深度学习下的语义<b class='flag-5'>SLAM</b>

    工程实践中VINS与ORB-SLAM的优劣分析

    ORB-SLAM是一种基于特征的单目视觉SLAM系统,广泛用于实时三维地图构建和机器人定位。该系统使用ORB特征进行高效的视觉识别和地图重建,支持关键帧技术和回环检测来
    的头像 发表于 04-08 10:17 2816次阅读
    工程实践中VINS与ORB-<b class='flag-5'>SLAM</b>的优劣分析

    结构化布线的好处多吗

    考虑将这种布线纳入网络基础设施中,以优化性能和生产力。 结构化布线的好处 • 增强的可靠性:结构化布线通过最大限度地减少错误和故障点来确保可靠的网络基础设施。正确安装和组织的布线可以降低信号干扰、数据丢失和性能
    的头像 发表于 04-07 11:15 427次阅读

    什么是SLAMSLAM算法涉及的4要素

    SLAM技术可以应用在无人驾驶汽车、无人机、机器人、虚拟现实等领域中,为这些领域的发展提供了支持。SLAM技术的发展已经逐渐从单纯的定位和地图构建转向了基于场景理解的功能。
    发表于 04-04 11:50 2342次阅读

    什么是SLAM?基于3D高斯辐射场的SLAM优势分析

    基于NeRF的SLAM算法采用全局地图和图像重建损失函数,通过可微分渲染捕获稠密的光度信息,具有高保真度。
    的头像 发表于 04-01 12:44 720次阅读

    从基本原理到应用的SLAM技术深度解析

    LSD-SLAM 即 Large-Scale Direct SLAM,兼容单目相机和双目相机。LSD-SLAM是一种基于光流跟踪的直接法SLAM,但是实现了半稠密建图,建图规模大,可以
    发表于 02-26 09:41 9189次阅读
    从基本原理到应用的<b class='flag-5'>SLAM</b>技术深度解析

    基于NeRF/Gaussian的全新SLAM算法

    基于NeRF的SLAM算法采用全局地图和图像重建损失函数,通过可微分渲染捕获稠密的光度信息,具有高保真度。
    的头像 发表于 01-26 10:48 650次阅读
    基于NeRF/Gaussian的全新<b class='flag-5'>SLAM</b><b class='flag-5'>算法</b>

    NeRF何去何从?GS SLAM到底哪家强?来看看最新的开源方案!

    Gaussian-SLAM提出了用于seeding和优化Gaussian splats的新策略,以将其从多视图离线场景扩展到RGBD序列。还扩展了Gaussian splats来编码几何图形并尝试
    的头像 发表于 12-26 16:38 1204次阅读
    NeRF何去何从?GS <b class='flag-5'>SLAM</b>到底哪家强?来看看最新的开源方案!

    CFD 设计利器:结构化和非结构化网格的组合使用

    在CFD的发展历史中,结构化网格出现最早,至今仍在使用。结构化网格有几个主要优点,如精度高、生成速度快、单元分布均匀。有些工具擅长绘制这类网格,例如CadenceFidelityAutomesh
    的头像 发表于 12-23 08:12 1882次阅读
    CFD 设计利器:<b class='flag-5'>结构化</b>和非<b class='flag-5'>结构化</b>网格的组合使用