0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种基于NeRF的六自由度姿态估计方法

3D视觉工坊 来源:计算机视觉工坊 作者:一杯红茶 2022-11-21 10:07 次阅读

主要内容: 提出了一种基于NeRF的六自由度姿态估计方法,即当给定单个RGB查询图像时通过最小化NeRF模型渲染的图像像素与查询图像中的像素之间的残差来估计相机的平移和旋转。

算法基于动量的相机外参优化算法集成到Instant Neural Graphics Primitives(一种最近非常快速的NeRF实现,也是NVIDIA提出的),通过在姿态估计任务中引入并行蒙特卡罗采样来克服问题总是收敛到局部极小值的问题,论文还研究了不同的基于像素的损失函数减少误差的程度,最终的实验也表明其方法可以在合成基准和真实基准上实现较好的泛化和鲁棒性

Nerf(Neural Radiance Fields):神经辐射场,它提供了一种仅从一个或几个RGB图像中捕获复杂3D和光学结构的机制,Nerf为在训练或测试期间在没有网格模型的情况下将合成-分析应用到更广泛的现实场景提供了机会,NeRF将场景的密度和颜色参数化为3D场景坐标的函数,该函数既可以从给定相机姿态的多视图图像中学习,也可以给定一个或几个输入图像通过生成模型直接预测。

Instant NGP:其提出是用来降低Nerf的训练和推理代价,采用由可训练的特征向量的多分辨率哈希表增强的小神经网络,允许网络消除哈希冲突的歧义,使其易于在GPU上并行化,实现了几个数量级的组合加速,允许在在线训练和推理等时间受限的环境中使用

出发点: 将Nerf用在姿态估计任务中的第一篇工作则是inerf,即反转Nerf,此论文基于inerf,进一步探索了Nerf在姿态估计任务中的应用,普遍认为NeRF的一个缺点是其计算开销很大,为了克服这一限制,本文利用了他们之前提出的快速NeRF,即即时神经图形原件(Instant NGP),Instant NGP的结构允许并行优化,这可以用来克服局部最小值问题,从而实现比iNeRF更大的鲁棒性。 Inerf:假设已经得到了权重θ参数化的NeRF模型,并且相机内参已知,iNeRF旨在恢复查询图像I的相机姿态T

d6316d28-6928-11ed-8abf-dac502259ad0.png

Contributions:

提出了一种基于NeRF模型的估计6-DoF姿态方法。

将并行蒙特卡罗采样引入到姿态估计任务中,展示了基于像素的损失函数选择对鲁棒性的重要性

通过合成和真实世界基准进行定量演示,证明所提出的方法改进了泛化和鲁棒性

Pipeline:

d641ca60-6928-11ed-8abf-dac502259ad0.png

三个输入:单个RGB图像、初始粗略姿态估计(通过向真值添加干扰得到)以及从目标的多个视图中训练的即时NGP模型。

基于动量的相机外参优化:

相对于标准Nerf,对相机姿态和梯度表示进行了修改,允许梯度更新的动态性结合基于动量的方法来增强优化。

首先,相机姿态由平移分量(位置)和旋转分量(方向)组成,通常由特殊欧式群建模,即SE(3),NeRF中外参优化的目标是找到那些通过梯度下降将图像空间损失最小化的相机姿态,梯度更新在特殊的欧式群上的李代数se(3)中计算,然后生成结合旋转和平移的相机姿态更新,作者认为使用SE(3)/se3表示有一个缺点,即相机姿势更新的旋转中心不在相机原点,而是在旋转轴上,这将相机位置和方向耦合起来,这种耦合导致某些情况下次优梯度更新,如下图所示,

d678081e-6928-11ed-8abf-dac502259ad0.png

为了解耦平移和旋转更新,作者将相机姿态建模为笛卡尔积SO(3)×T(3)(以及相应的李代数空间上so(3)×t(3)),其在T(3)上采用加法结构,在SO(3)上采用乘积结构,梯度更新将沿直线移动,从而实现更高效的优化。

其次,基于动量的优化在经验上证明了比基于标准梯度的方法更有效,尤其是当与自适应更新相结合时,在NeRF中每个像素对应于具有原点o和方向d的射线,沿着该射线,基于沿射线的移动距离ti得到pi=o+ti.d,损失的梯度与相机距离的叉积定义了每像素(光线)更新影响:

d69a3628-6928-11ed-8abf-dac502259ad0.png

基于刚体力学,对上式有一种物理解释,即由外力对相机产生的一个扭矩,该外力由基于图像的损失函数梯度产生,应用于光线导出点,就像它刚性地连接到相机一样。

因此将此分解应用于Adam优化器,将Adam的第一个moment转化为相机的物理动量,因为相机被用作力矩的梯度“推动”,尽管Adam的第二moment和指数衰减没有直接的物理类似物,由于物理系统遵循最小动作路径,可以推断相机在解耦参数化中遵循从其初始姿态到其优化姿态的有效路径。

并行蒙特卡洛采样: 由于优化的损失函数在6-DoF空间上是非凸的,单相机姿态假设很容易陷入局部极小值,由于Instant NGP的计算能力能够同时从多个假设开始优化,但是一个简单的多起点思想是低效的,特别是在一个大的搜索空间中,其中许多假设在优化过程中会偏离,因此它们无法对最终优化做出贡献,且占用了大量计算资源,从粒子滤波框架中获得灵感,提出了一种简单有效的姿势假设更新策略来处理这个问题。

将优化过程分为两个阶段,自由探索和重采样更新。 在第一阶段,围绕起始姿态生成相机姿态假设,平移和旋转偏移分别在欧式空间和SO(3)中均匀采样,相机姿态假设将进行独立优化,这样其中一些可以相对接近实际情况。 之后第二阶段,比较所有假设的损失,并将其作为采样权重的参考。

不同损失函数的影响: 通过合成视图进行姿态估计的方法最大挑战之一是与原视图相比,视图材质具有不同的视觉表面,包括许多干扰、环境噪声、照明条件变化和遮挡等都可能导致这个问题。

之前inerf使用L2损失,但作者研究了更多的损失选项以测量渲染像素和观察像素之间的差异,不同的损失具有不同的收敛特性,进而影响优化过程

研究了L1(平等的对待error)、L2(惩罚较大的error,宽容较小的error)、Log L1(是L1损耗的对数版本,它试图平滑收敛曲线,尤其是对于较大的误差)、Relative L2(它对高强度目标像素与低强度目标像素错位的情况更敏感)、MAPE(MAPE表示平均绝对百分比误差,作为基于误差相对百分比的精度度量,它也可以被视为相对L2损耗的L1等效值,它与规模无关,对负错误的惩罚更重)、sMAPE(是MAPE的对称版本,解决MAPE的不对称问题,但当预测和GT都具有低强度时,它可能是不稳定的)、Smooth L1(平滑L1损失被设计为对异常值不太敏感,并且可以防止梯度爆炸)

最终通过实验发现常用的L2损失未必是最好的,MAPE在其数据集测试上实现了最好的性能。

实验: 在Nerf合成数据集和真实数据集LLFF与inerf进行了比较

d6b84e60-6928-11ed-8abf-dac502259ad0.pngd6d94c1e-6928-11ed-8abf-dac502259ad0.png

不同损失函数对结果性能的比较:

d6ec3e5a-6928-11ed-8abf-dac502259ad0.png






审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4621

    浏览量

    99470
  • RGB
    RGB
    +关注

    关注

    4

    文章

    778

    浏览量

    57847
  • NGP
    NGP
    +关注

    关注

    0

    文章

    12

    浏览量

    6663

原文标题:并行Nerf逆过程解决姿态估计问题!(Arxiv 2022)

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基于PoseDiffusion相机姿态估计方法

    介绍 一般意义上,相机姿态估计通常依赖于如手工的特征检测匹配、RANSAC和束调整(BA)。在本文中,作者提出了PoseDiffusion,这是一种新颖的相机姿态
    的头像 发表于 07-23 15:22 939次阅读
    基于PoseDiffusion相机<b class='flag-5'>姿态</b><b class='flag-5'>估计</b><b class='flag-5'>方法</b>

    基于FPGA EtherCAT的自由度机器人视觉伺服控制设计

    和增强系统处理图像的实时性,本文提出了一种伊瑟特的自由度机器人视觉伺服控制系统,将摄像头集成到基于 Zynq的伊瑟特主站上,提高了视觉伺服的实时性.经测试,该平台能够对视觉检测目标的变化做出及时的反应
    发表于 05-29 16:17

    一种修正的近场声源定位时延估计方法

    【作者】:杜要锋;尹雪飞;陈克安;【来源】:《电声技术》2010年02期【摘要】:时延估计是近场声源定位领域中的项关键技术。相位转换广义互相关时延估计方法(PHAT-GCC)由于其低
    发表于 04-22 11:55

    啤酒生产线自由度机械手抓瓶控制系统设计

    的使用方法;3). 熟悉三菱自由度机械手的使用硬件介绍本啤酒生产线装箱分部所采用的是Q系列PLC的CPU为Q03UDCPU和Q172DRCPU。其中,Q03UDCPU为主CPU,Q172DRCPU为
    发表于 11-14 12:04

    基于STM32、以太网、Labview的自由度Stewart并联运动平台模型

    自由度Stewart并联运动平台模型-X,Y,Z平移、旋转测试自由度Stewart并联运动平台-Z向旋转正弦波复现
    发表于 04-16 23:25

    3自由度自动控制机械手

    3自由度自动控制机械手,试用好使!希望可以帮助到大家
    发表于 09-11 15:55

    怎么用LabVIEW定义个导弹的自由度弹道仿真界面

    怎么用LabVIEW自定义个导弹(飞行器)的自由度弹道仿真界面,使其能够和simulink进行联合仿真,并且能够在界面中显示导弹打击目标的三维运动曲线,有没有做过的或者这方面比较牛的人给
    发表于 12-20 21:40

    7自由度整车模型探讨

    本人建立个七自由度的整车模型,仿真时直报错,出现代数环的问题,欢迎小伙伴们来探讨!我qq:1139471346
    发表于 11-22 12:54

    关于自由度座椅的控制

    最近在参与自由度座椅控制的课题,需要查阅哪些方面的相关书籍,有什么推荐吗?谢谢各位
    发表于 01-13 14:46

    基于Matlab的开源自由度协作机器人实验平台

    前言针对机器人相关专业的教学需求,商飞信息科技开发出此开源自由度协作机器人实验平台。该平台有以下几大特色机器人本体采用自主设计的3Kg负载自由
    发表于 09-07 07:10

    ADIS16300四自由度IMU在姿态测量中的应用

    为了实现复杂的运动与导航控制,需获取控制对象的空间姿态信息,设计了基于四自由度(4DoF)IMU惯性测量传感器和C8051F330单片机的姿态测量系统。介绍了ADIS16300惯性测量传感器的
    发表于 07-21 15:25 23次下载

    自由度内模控制方法

    针对典型的工业过程控制对象,提出了一种自由度内模控制方法,此方法可以使系统同时具有良好的目标值跟踪特性、干扰抑制特性和鲁棒性,改进了常规内模控制的不足,而且控制算法简
    发表于 05-23 15:12 27次下载
    二<b class='flag-5'>自由度</b>内模控制<b class='flag-5'>方法</b>

    自由度转台的设计与实现

    基于MSP430F149单片机设计了一种自由度转台系统。在该系统中,利用旋转编码器的信息反馈,通过对电机的闭环控制,使三自由度转台能够模拟飞机的飞行姿态
    发表于 09-26 13:58 2401次阅读
    三<b class='flag-5'>自由度</b>转台的设计与实现

    一种基于六自由度IMU和动力学的车身姿态和侧向速度估计方法

    如前文所述,本文建立了三个估计器,在小侧向激励工况下,可通过基于动力学模型的估计估计出侧向车速,进一步使用该侧向车速估计出由于平动产生的侧向加速度,加速度传感器测量值剔除该平动加速度
    的头像 发表于 07-31 14:26 9554次阅读
    <b class='flag-5'>一种</b>基于六<b class='flag-5'>自由度</b>IMU和动力学的车身<b class='flag-5'>姿态</b>和侧向速度<b class='flag-5'>估计</b><b class='flag-5'>方法</b>

    基于深度学习的二维人体姿态估计方法

    基于深度学习的二维人体姿态估计方法通过构建特定的神经网络架构,将提取的特征信息根据相应的特征融合方法进行信息关联处理,最终获得人体姿态
    发表于 03-22 15:51 5次下载
    基于深度学习的二维人体<b class='flag-5'>姿态</b><b class='flag-5'>估计</b><b class='flag-5'>方法</b>