0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

辐射场的实时密集单眼SLAM简析

3D视觉工坊 来源:泡泡机器人SLAM 2023-01-30 11:24 次阅读

摘要

我们提出了一个新的几何和光度3D映射管道,用于从单眼图像中准确和实时地重建场景。为了实现这一目标,我们利用了最近在密集单眼SLAM和实时分层容积神经辐射场方面的进展。我们的见解是,密集的单眼SLAM通过提供准确的姿势估计和具有相关不确定性的深度图,为实时适应场景的神经辐射场提供了正确的信息

通过我们提出的基于不确定性的深度损失,我们不仅实现了良好的光度测量精度,还实现了巨大的几何精度。事实上,我们提出的管道比竞争对手的方法实现了更好的几何和光度测量精度(PSNR提高了179%,L1深度提高了86%),同时实时工作并只使用单眼图像。

主要贡献

我们提出了第一个结合密集单眼SLAM和分层体积神经辐射场优点的场景重建管道。

我们的方法从图像流中建立精确的辐射场,不需要姿势或深度作为输入,并且可以实时运行。

我们在Replica数据集上实现了单眼方法的最先进性能。

主要方法

ecfcaede-9784-11ed-bfe3-dac502259ad0.png

我们管道的输入包括连续的单眼图像(这里表示为Img 1和Img 2)。从右上角开始,我们的架构使用Instant-NGP拟合一个NeRF,我们使用RGB图像I和深度D对其进行监督,其中深度由其边缘协方差ΣD加权。

Rosinol等人[23]的启发,我们从密集的单眼SLAM计算这些协方差。在我们的案例中,我们使用Droid-SLAM。我们在第3.1节提供了关于信息流的更多细节。蓝色显示的是Droid-SLAM的贡献和信息流,同样,粉红色是Rosinol的贡献,而红色是我们的贡献。

1. 追踪

密集SLAM与协方差 我们使用Droid-SLAM作为我们的跟踪模块,它为每个关键帧提供密集的深度图和姿势。从一连串的图像开始,Droid-SLAM首先计算出i和j两帧之间的密集光流pij,使用的架构与Raft相似。

Raft的核心是一个卷积GRU(图2中的ConvGRU),给定一对帧之间的相关性和对当前光流pij的猜测,计算一个新的流pij,以及每个光流测量的权重Σpij。

有了这些流量和权重作为测量值,DroidSLAM解决了一个密集束调整(BA)问题,其中三维几何被参数化为每个关键帧的一组反深度图。这种结构的参数化导致了解决密集BA问题的极其有效的方式,通过将方程组线性化为我们熟悉的相机/深度箭头状的块状稀疏Hessian H∈R (c+p)×(c+p) ,其中c和p是相机和点的维度,可以被表述为一个线性最小二乘法问题。

从图中可以看出,为了解决线性最小二乘问题,我们用Hessian的Schur补数来计算缩小的相机矩阵HT,它不依赖于深度,维度小得多,为R c×c。通过对HT=LLT的Cholesky因子化,其中L是下三角Cholesky因子,然后通过前置和后置求解姿势T,从而解决相机姿势的小问题。

此外,给定姿势T和深度D,Droid-SLAM建议计算诱导光流,并再次将其作为初始猜测送入ConvGRU网络,如图2左侧所示,其中Π和Π-1,是投影和背投函数。

图2中的蓝色箭头显示了跟踪循环,并对应于Droid-SLAM。然后,受Rosinol等人的启发,我们进一步计算密集深度图和Droid-SLAM的姿势的边际协方差(图2的紫色箭头)。

为此,我们需要利用Hessian的结构,我们对其进行块状分割如下:

ed23497c-9784-11ed-bfe3-dac502259ad0.png

其中H是Hessian矩阵,b是残差,C是块状相机矩阵,P是对应于每个像素每个关键帧的反深度的对角矩阵。我们用∆ξ表示SE(3)中相机姿态的谎言代数的delta更新,而∆d是每个像素反深度的delta更新。

E是相机/深度对角线Hessian的块矩阵,v和w对应于姿势和深度的残差。从这个Hessian的块分割中,我们可以有效地计算密集深度Σd和姿势ΣT的边际协方差:

ed2c4eaa-9784-11ed-bfe3-dac502259ad0.png

最后,鉴于跟踪模块计算出的所有信息--姿势、深度、它们各自的边际协方差以及输入的RGB图像--我们可以优化我们的辐射场参数,并同时完善相机的姿势。

ed3b0878-9784-11ed-bfe3-dac502259ad0.png

2. 建图

鉴于每个关键帧的密集深度图,有可能对我们的神经体积进行深度监督。不幸的是,由于其密度,深度图是非常嘈杂的,因为即使是无纹理的区域也被赋予了一个深度值。图3显示,密集的单眼SLAM所产生的点云是特别嘈杂的,并且包含大的离群值(图3的顶部图像)。

根据这些深度图监督我们的辐射度场会导致有偏见的重建。 Rosinol等人的研究表明,深度估计的不确定性是一个很好的信号,可以为经典的TSDF体积融合的深度值加权。受这些结果的启发,我们使用深度不确定性估计来加权深度损失,我们用它来监督我们的神经体积。

图1显示了输入的RGB图像,其相应的深度图的不确定性,所产生的点云(在用σd≤1.0对其不确定性进行阈值化以实现可视化),以及我们使用不确定性加权的深度损失时的结果。鉴于不确定性感知的损失,我们将我们的映射损失表述为:

ed8e320a-9784-11ed-bfe3-dac502259ad0.png

我们对姿势T和神经参数Θ进行最小化,给定超参数λD来平衡深度和颜色监督(我们将λD设置为1.0)。特别是,我们的深度损失是由以下公式给出的。

ed963086-9784-11ed-bfe3-dac502259ad0.png

其中,D*是渲染的深度,D、ΣD是由跟踪模块估计的密集深度和不确定性。我们将深度D*渲染为预期的射线终止距离。每个像素的深度都是通过沿着像素的射线取样的三维位置来计算的,在样本i处评估密度σi,并将得到的密度进行alpha合成,与标准的体积渲染类似:

ed9da7ee-9784-11ed-bfe3-dac502259ad0.png

颜色的渲染损失如下:

eda67cac-9784-11ed-bfe3-dac502259ad0.png

3. 架构

我们的管道由一个跟踪线程和一个映射线程组成,两者都是实时和并行运行的。追踪线程不断地将关键帧活动窗口的BA重投影误差降到最低。

映射线程总是优化从跟踪线程收到的所有关键帧,并且没有一个有效帧的滑动窗口。这些线程之间的唯一通信发生在追踪管道生成新关键帧时。

在每一个新的关键帧上,跟踪线程将当前关键帧的姿势与它们各自的图像和估计的深度图,以及深度的边际协方差,发送到映射线程。

只有跟踪线程的滑动优化窗口中当前可用的信息被发送到映射线程。跟踪线程的有效滑动窗口最多包括8个关键帧。

只要前一个关键帧和当前帧之间的平均光流高于一个阈值(在我们的例子中是2.5像素),跟踪线程就会生成一个新的关键帧。最后,映射线程还负责渲染,以实现重建的交互式可视化。

主要结果

edb16194-9784-11ed-bfe3-dac502259ad0.pngedbf6e42-9784-11ed-bfe3-dac502259ad0.png

edcba6ee-9784-11ed-bfe3-dac502259ad0.png







审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Gru
    Gru
    +关注

    关注

    0

    文章

    12

    浏览量

    7472
  • SLAM
    +关注

    关注

    23

    文章

    418

    浏览量

    31769
  • NGP
    NGP
    +关注

    关注

    0

    文章

    12

    浏览量

    6667

原文标题:NeRF-SLAM:实时密集单眼SLAM 辐射场的实时密集单眼SLAM

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    新能源电池产业链及投资机会-磷酸亚铁锂

    新能源电池产业链及投资机会-磷酸亚铁锂  一、前言
    发表于 12-25 09:34 976次阅读

    计算密集型的程序

    人工智能学习1. 人工智能应用场景网络安全、电子商务、计算模拟、社交网络 … …2. 人工智能必备三要素数据,算法,计算力计算力之CPU、GPU对比:CPU主要适合I\O密集型的任务GPU主要适合
    发表于 09-07 06:14

    辐射剂量实时成像测量系统的研究

    辐射剂量实时成像测量系统的研究 本文利用闪烁体的吸收发光特点,并结合计算机断层扫描技术,提出了对核辐射剂量分布进行
    发表于 10-21 08:38 826次阅读

    电动汽车用锂离子电池技术的国内外进展

    电动汽车用锂离子电池技术的国内外进展
    发表于 11-10 13:53 780次阅读

    PCB线路板电镀铜工艺

    PCB线路板电镀铜工艺   一.电镀工艺的分类:   酸性光亮铜电镀电镀镍/金电镀锡   二.工艺流程:
    发表于 11-17 14:01 3997次阅读

    EPON技术

    EPON技术 EPON是一个新技术,用于保证提供一个高品质与高带宽利用率的应用。   EPON在日本、韩国、中国大陆、中国台湾及其它以以太网络为基础的地区都
    发表于 01-22 10:43 853次阅读

    鼠标HID例程(中)

    鼠标 HID 例程 紧接《鼠标 HID 例程(上)》一文,继续向大家介绍鼠 标 HID 例程的未完的内容。
    发表于 07-26 15:18 0次下载

    5G AAU 功放控制和监测模块

    5G AAU 功放控制和监测模块
    发表于 10-28 12:00 2次下载
    5G AAU 功放控制和监测模块<b class='flag-5'>简</b><b class='flag-5'>析</b>

    用于SLAM的神经隐含可扩展编码

    我们提出了NICE-SLAM,一个密集的RGB-D SLAM系统,它具有实时性、可扩展性、预测性和对各种挑战性场景的鲁棒性。
    的头像 发表于 01-30 11:19 702次阅读

    密集单目SLAM的概率体积融合概述

    我们提出了一种利用深度密集单目 SLAM 和快速不确定性传播从图像重建 3D 场景的新方法。所提出的方法能够密集、准确、实时地 3D 重建场景,同时对来自
    的头像 发表于 01-30 11:34 645次阅读

    OV2SLAM(高速视觉slam)

    视觉里程计最近几年越来越受到学术界以及工业界的认可,以ORB和VINS为代表的视觉SLAM已经可以满足绝大多数场景,而OV2SLAM在其他VSLAM中脱颖而出,其实时性以及具体的回环性能在测试中都得到了认可。
    的头像 发表于 03-21 17:16 1527次阅读

    用于神经SLAM的矢量化对象建图

    vMAP 是一种基于神经的对象级密集 SLAM 系统,可根据 RGB-D 输入流实时自动构建对象级场景模型。
    的头像 发表于 06-15 09:29 742次阅读
    用于神经<b class='flag-5'>场</b><b class='flag-5'>SLAM</b>的矢量化对象建图

    AFE8092帧同步特性

    AFE8092帧同步特性
    的头像 发表于 08-24 13:37 623次阅读
    AFE8092帧同步特性<b class='flag-5'>简</b><b class='flag-5'>析</b>

    什么是SLAM?基于3D高斯辐射SLAM优势分析

    基于NeRF的SLAM算法采用全局地图和图像重建损失函数,通过可微分渲染捕获稠密的光度信息,具有高保真度。
    的头像 发表于 04-01 12:44 663次阅读

    MG-SLAM:融合结构化线特征优化高斯SLAM算法

    同步定位与地图构建 (SLAM) 是计算机视觉中的一个基本问题,旨在在同时跟踪相机姿势的同时对环境进行地图构建。基于学习的密集 SLAM 方法,尤其是神经辐射
    的头像 发表于 11-11 16:17 147次阅读
    MG-<b class='flag-5'>SLAM</b>:融合结构化线特征优化高斯<b class='flag-5'>SLAM</b>算法