0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种基于NeRF的六自由度姿态估计方法

3D视觉工坊 来源:计算机视觉工坊 作者:一杯红茶 2022-11-21 10:07 次阅读

主要内容: 提出了一种基于NeRF的六自由度姿态估计方法,即当给定单个RGB查询图像时通过最小化NeRF模型渲染的图像像素与查询图像中的像素之间的残差来估计相机的平移和旋转。

算法基于动量的相机外参优化算法集成到Instant Neural Graphics Primitives(一种最近非常快速的NeRF实现,也是NVIDIA提出的),通过在姿态估计任务中引入并行蒙特卡罗采样来克服问题总是收敛到局部极小值的问题,论文还研究了不同的基于像素的损失函数减少误差的程度,最终的实验也表明其方法可以在合成基准和真实基准上实现较好的泛化和鲁棒性

Nerf(Neural Radiance Fields):神经辐射场,它提供了一种仅从一个或几个RGB图像中捕获复杂3D和光学结构的机制,Nerf为在训练或测试期间在没有网格模型的情况下将合成-分析应用到更广泛的现实场景提供了机会,NeRF将场景的密度和颜色参数化为3D场景坐标的函数,该函数既可以从给定相机姿态的多视图图像中学习,也可以给定一个或几个输入图像通过生成模型直接预测。

Instant NGP:其提出是用来降低Nerf的训练和推理代价,采用由可训练的特征向量的多分辨率哈希表增强的小神经网络,允许网络消除哈希冲突的歧义,使其易于在GPU上并行化,实现了几个数量级的组合加速,允许在在线训练和推理等时间受限的环境中使用

出发点: 将Nerf用在姿态估计任务中的第一篇工作则是inerf,即反转Nerf,此论文基于inerf,进一步探索了Nerf在姿态估计任务中的应用,普遍认为NeRF的一个缺点是其计算开销很大,为了克服这一限制,本文利用了他们之前提出的快速NeRF,即即时神经图形原件(Instant NGP),Instant NGP的结构允许并行优化,这可以用来克服局部最小值问题,从而实现比iNeRF更大的鲁棒性。 Inerf:假设已经得到了权重θ参数化的NeRF模型,并且相机内参已知,iNeRF旨在恢复查询图像I的相机姿态T

d6316d28-6928-11ed-8abf-dac502259ad0.png

Contributions:

提出了一种基于NeRF模型的估计6-DoF姿态方法。

将并行蒙特卡罗采样引入到姿态估计任务中,展示了基于像素的损失函数选择对鲁棒性的重要性

通过合成和真实世界基准进行定量演示,证明所提出的方法改进了泛化和鲁棒性

Pipeline:

d641ca60-6928-11ed-8abf-dac502259ad0.png

三个输入:单个RGB图像、初始粗略姿态估计(通过向真值添加干扰得到)以及从目标的多个视图中训练的即时NGP模型。

基于动量的相机外参优化:

相对于标准Nerf,对相机姿态和梯度表示进行了修改,允许梯度更新的动态性结合基于动量的方法来增强优化。

首先,相机姿态由平移分量(位置)和旋转分量(方向)组成,通常由特殊欧式群建模,即SE(3),NeRF中外参优化的目标是找到那些通过梯度下降将图像空间损失最小化的相机姿态,梯度更新在特殊的欧式群上的李代数se(3)中计算,然后生成结合旋转和平移的相机姿态更新,作者认为使用SE(3)/se3表示有一个缺点,即相机姿势更新的旋转中心不在相机原点,而是在旋转轴上,这将相机位置和方向耦合起来,这种耦合导致某些情况下次优梯度更新,如下图所示,

d678081e-6928-11ed-8abf-dac502259ad0.png

为了解耦平移和旋转更新,作者将相机姿态建模为笛卡尔积SO(3)×T(3)(以及相应的李代数空间上so(3)×t(3)),其在T(3)上采用加法结构,在SO(3)上采用乘积结构,梯度更新将沿直线移动,从而实现更高效的优化。

其次,基于动量的优化在经验上证明了比基于标准梯度的方法更有效,尤其是当与自适应更新相结合时,在NeRF中每个像素对应于具有原点o和方向d的射线,沿着该射线,基于沿射线的移动距离ti得到pi=o+ti.d,损失的梯度与相机距离的叉积定义了每像素(光线)更新影响:

d69a3628-6928-11ed-8abf-dac502259ad0.png

基于刚体力学,对上式有一种物理解释,即由外力对相机产生的一个扭矩,该外力由基于图像的损失函数梯度产生,应用于光线导出点,就像它刚性地连接到相机一样。

因此将此分解应用于Adam优化器,将Adam的第一个moment转化为相机的物理动量,因为相机被用作力矩的梯度“推动”,尽管Adam的第二moment和指数衰减没有直接的物理类似物,由于物理系统遵循最小动作路径,可以推断相机在解耦参数化中遵循从其初始姿态到其优化姿态的有效路径。

并行蒙特卡洛采样: 由于优化的损失函数在6-DoF空间上是非凸的,单相机姿态假设很容易陷入局部极小值,由于Instant NGP的计算能力能够同时从多个假设开始优化,但是一个简单的多起点思想是低效的,特别是在一个大的搜索空间中,其中许多假设在优化过程中会偏离,因此它们无法对最终优化做出贡献,且占用了大量计算资源,从粒子滤波框架中获得灵感,提出了一种简单有效的姿势假设更新策略来处理这个问题。

将优化过程分为两个阶段,自由探索和重采样更新。 在第一阶段,围绕起始姿态生成相机姿态假设,平移和旋转偏移分别在欧式空间和SO(3)中均匀采样,相机姿态假设将进行独立优化,这样其中一些可以相对接近实际情况。 之后第二阶段,比较所有假设的损失,并将其作为采样权重的参考。

不同损失函数的影响: 通过合成视图进行姿态估计的方法最大挑战之一是与原视图相比,视图材质具有不同的视觉表面,包括许多干扰、环境噪声、照明条件变化和遮挡等都可能导致这个问题。

之前inerf使用L2损失,但作者研究了更多的损失选项以测量渲染像素和观察像素之间的差异,不同的损失具有不同的收敛特性,进而影响优化过程

研究了L1(平等的对待error)、L2(惩罚较大的error,宽容较小的error)、Log L1(是L1损耗的对数版本,它试图平滑收敛曲线,尤其是对于较大的误差)、Relative L2(它对高强度目标像素与低强度目标像素错位的情况更敏感)、MAPE(MAPE表示平均绝对百分比误差,作为基于误差相对百分比的精度度量,它也可以被视为相对L2损耗的L1等效值,它与规模无关,对负错误的惩罚更重)、sMAPE(是MAPE的对称版本,解决MAPE的不对称问题,但当预测和GT都具有低强度时,它可能是不稳定的)、Smooth L1(平滑L1损失被设计为对异常值不太敏感,并且可以防止梯度爆炸)

最终通过实验发现常用的L2损失未必是最好的,MAPE在其数据集测试上实现了最好的性能。

实验: 在Nerf合成数据集和真实数据集LLFF与inerf进行了比较

d6b84e60-6928-11ed-8abf-dac502259ad0.pngd6d94c1e-6928-11ed-8abf-dac502259ad0.png

不同损失函数对结果性能的比较:

d6ec3e5a-6928-11ed-8abf-dac502259ad0.png






审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4773

    浏览量

    100890
  • RGB
    RGB
    +关注

    关注

    4

    文章

    799

    浏览量

    58569
  • NGP
    NGP
    +关注

    关注

    0

    文章

    12

    浏览量

    6694

原文标题:并行Nerf逆过程解决姿态估计问题!(Arxiv 2022)

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    DSP在自由度电磁跟踪系统中的应用

    自由度电磁跟踪系统根据电磁感应的原理来计算出目标的自由度参数,从而唯确定目标的位置和姿态
    发表于 01-25 00:11 1323次阅读
    DSP在<b class='flag-5'>六</b><b class='flag-5'>自由度</b>电磁跟踪系统中的应用

    基于FPGA EtherCAT的自由度机器人视觉伺服控制设计

    和增强系统处理图像的实时性,本文提出了一种伊瑟特的自由度机器人视觉伺服控制系统,将摄像头集成到基于 Zynq的伊瑟特主站上,提高了视觉伺服的实时性.经测试,该平台能够对视觉检测目标的变化做出及时的反应
    发表于 05-29 16:17

    基于STM32、以太网、Labview的自由度Stewart并联运动平台模型

    自由度Stewart并联运动平台模型-X,Y,Z平移、旋转测试自由度Stewart并联运动平台-Z向旋转正弦波复现
    发表于 04-16 23:25

    关于自由度座椅的控制

    最近在参与自由度座椅控制的课题,需要查阅哪些方面的相关书籍,有什么推荐吗?谢谢各位
    发表于 01-13 14:46

    一种改进的单神经元二自由度PID控制

    提出一种单神经元二自由度PID 控制方法,将前馈型二自由度PID 的五个参数分别对应于单神经元的五个权值,将二次型性能指标Pe2 (k) + QΔu 2 (k)作为控制算法中加权系数学
    发表于 08-27 08:35 11次下载

    基于单亲遗传算法二自由度PID控制器设计

    针对二自由度PID 控制器参数整定困难的问题,提出了一种基于单亲遗传算法的二自由度参数整定方法。运用该算法分别对单自由度PID 控制器和二
    发表于 12-26 13:56 23次下载

    自由度内模控制方法

    针对典型的工业过程控制对象,提出了一种自由度内模控制方法,此方法可以使系统同时具有良好的目标值跟踪特性、干扰抑制特性和鲁棒性,改进了常规内模控制的不足,而且控制算法简
    发表于 05-23 15:12 27次下载
    二<b class='flag-5'>自由度</b>内模控制<b class='flag-5'>方法</b>

    自由度转台的设计与实现

    基于MSP430F149单片机设计了一种自由度转台系统。在该系统中,利用旋转编码器的信息反馈,通过对电机的闭环控制,使三自由度转台能够模拟飞机的飞行姿态
    发表于 09-26 13:58 2573次阅读
    三<b class='flag-5'>自由度</b>转台的设计与实现

    一种新型7自由度冗余绳驱动机械臂

    针对传统机械臂负载白重比小、臂身惯量大、人机交互安全性弱等问题,对绳驱动机械臂的结构、绳驱关节耦合、冗余运动学等方面进行了研究,创新设计了一种新型7自由度冗余绳驱动机械臂。采用绳索间接驱动前端4个
    发表于 02-27 14:33 7次下载
    <b class='flag-5'>一种</b>新型7<b class='flag-5'>自由度</b>冗余绳驱动机械臂

    一种基于自由度IMU和动力学的车身姿态和侧向速度估计方法

    如前文所述,本文建立了三个估计器,在小侧向激励工况下,可通过基于动力学模型的估计估计出侧向车速,进步使用该侧向车速估计出由于平动产生的侧
    的头像 发表于 07-31 14:26 1w次阅读
    <b class='flag-5'>一种</b>基于<b class='flag-5'>六</b><b class='flag-5'>自由度</b>IMU和动力学的车身<b class='flag-5'>姿态</b>和侧向速度<b class='flag-5'>估计</b><b class='flag-5'>方法</b>

    磁致伸缩位移传感器在自由度运动平台上的应用解析

    自由度运动平台是典型的并联运动机构,由支作动筒,上、下各只万向铰链和上、下两个平台组成,下平台固定在基础上,借助支作动筒的伸缩运动,
    发表于 03-07 16:54 1524次阅读

    ADIS16495:战术级自由度惯性传感器数据表

    ADIS16495:战术级自由度惯性传感器数据表
    发表于 05-25 18:04 9次下载
    ADIS16495:战术级<b class='flag-5'>六</b><b class='flag-5'>自由度</b>惯性传感器数据表

    自由度视觉定位

    基于三维模型的视觉定位通过在查询图像和三维模型间建立 2D-3D 对应关系,估计相机自由度的位姿。传统的视觉定位方法通常采用人工设计的局部特征,如 SIFT,来实现 2D-3D 匹配
    的头像 发表于 04-20 10:07 1168次阅读

    自由度激光跟踪仪的特点

    GTS6000激光跟踪仪与空间姿态探头配合组成自由度激光跟踪仪,能够根据合作目标的精确空间姿态对被测工件的内部特征、隐藏特征或曲面等复杂特征进行快速、高精度的测量。
    的头像 发表于 07-21 10:58 729次阅读
    <b class='flag-5'>六</b><b class='flag-5'>自由度</b>激光跟踪仪的特点

    文读懂自由度激光跟踪仪

    激光跟踪仪与空间姿态探头(iProbe 6D姿态探头)配合使用,就组成自由度激光跟踪仪。它能够根据合作目标的精确空间姿态对被测工件的内部特
    的头像 发表于 12-12 09:39 777次阅读
    <b class='flag-5'>一</b>文读懂<b class='flag-5'>六</b><b class='flag-5'>自由度</b>激光跟踪仪