0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于反向传播PnP优化的端到端可学习几何视觉介绍

3D视觉工坊 来源:泡泡机器人SLAM 2023-02-06 16:46 次阅读

摘要

深度网络在从大量数据中学习模式方面表现出色。另一方面,许多几何视觉任务被指定为优化问题。

为了将深度学习和几何视觉无缝地结合起来,至关重要的是进行端到端的学习和几何优化。

为了实现这一目标,我们提出了BPnP,这是一个新颖的网络模块,通过Perspective-nPoints(PnP)求解器反向传播梯度,以指导神经网络参数更新。

基于隐式微分,我们表明一个 "独立的 "PnP求解器的梯度可以被准确有效地导出,就像优化器块是一个可微分的函数。

我们通过将BPnP纳入一个深度模型来验证它,该模型可以从训练数据集中学习相机的内在因素、相机的外在因素(姿势)和三维结构。

此外,我们开发了一个用于物体姿势估计的端到端可训练管道,该管道通过将基于特征的热图损失与二维-三维重投影误差相结合,实现了更高的准确性。

由于我们的方法可以扩展到其他优化问题,我们的工作有助于以一种原则性的方式实现可学习的几何视觉。

主要贡献

我们的主要贡献是一个名为BPnP的新型网络模块,它包含了一个PnP求解器。BPnP通过PnP "层 "反向传播梯度,以指导神经网络权重的更新,从而利用既定的目标函数(二维-三维重投影误差的平方和)和几何视觉问题的求解器实现端到端的学习。

尽管只结合了一个PnP求解器,我们展示了BPnP如何被用来学习有效的深度特征表征,用于多种几何视觉任务(姿势估计、运动结构、相机校准)。

我们还将我们的方法与最先进的几何视觉任务的方法进行比较。从根本上说,我们的方法是基于隐式微分的。

主要方法

反向传播的PnP算法: 让g表示一个 "函数 "形式的PnP求解器

7e1ebcc0-a402-11ed-bfe3-dac502259ad0.png

从n个2D-3D的对应关系中返回摄像机的6DOF姿态y和其内部参数K∈R3×3

7e4a7a40-a402-11ed-bfe3-dac502259ad0.png

其中(xi , zi)是第i个对应关系。让π(-|y, K)是三维点在图像平面上的投影变换,姿态为y,相机本征为K。

从本质上讲,g的 "评估 "需要解决优化问题如下:

7e66062a-a402-11ed-bfe3-dac502259ad0.png

7e926062-a402-11ed-bfe3-dac502259ad0.png

ri表示第i对对应关系的重投影误差。

7ea00474-a402-11ed-bfe3-dac502259ad0.png

πi是三维点zi在图像平面上的投影。

我们的最终目标是将g纳入一个可学习的模型中,其中x、z和K可以是一个深度网络的(中间)输出。此外,公式(4)的求解器应该被用来参与网络参数的学习。为此,我们需要把g当作一个可微调的函数,这样它的"梯度 "就可以反向传播到网络的其他部分。接下来我们将详细介绍如何对反向传播的梯度进行计算。

1. 隐式函数定理(IFT) 这里简单公式推导了IFT隐式函数定理。

7eaeabb4-a402-11ed-bfe3-dac502259ad0.png

7edbe502-a402-11ed-bfe3-dac502259ad0.png

7f04826e-a402-11ed-bfe3-dac502259ad0.png

IFT允许计算一个函数g相对于其输入a的导数,而不需要函数的明确形式,但有一个函数f约束a和g(a)。

2. 构造约束函数f

为了调用隐式微分的IFT,我们首先需要定义约束函数f(a, b)。对于我们的问题,我们使用所有四个变量x、y、z和K来构造f。

但我们将f视为一个双变量函数f(a, b),其中a在{x, z, K}中取值--取决于要得到的偏导--而b=y(即g的输出姿势)。

为了维护约束函数f(a,b),我们利用了优化过程的静止约束。

在这里,将PnP求解器的目标函数g表示为:

7f12e598-a402-11ed-bfe3-dac502259ad0.png

由于PnP求解器的输出姿态y是目标函数的局部最优,所以可以通过对目标的一阶导数与y的关系来建立一个静止约束,即:

7f384cde-a402-11ed-bfe3-dac502259ad0.png

给出一个PnP求解器的输出姿势y = [y1, ..., ym] T,我们构建f,可以写为:

7f641742-a402-11ed-bfe3-dac502259ad0.png

7f963ce0-a402-11ed-bfe3-dac502259ad0.png

3. 前向和反向传播

我们对g的PnP公式基本上是执行最小二乘法(LS)估计,这对离群值(x、z和K的恶劣误差)并不稳健。

另外,我们可以采用一个更稳健的目标,如加入M-估计器[56]或使离群值的数量最大化[15]。

然而,我们的结果表明,LS实际上更合适,因为它对输入测量中的误差的敏感性鼓励学习快速收敛到不产生x、z和K中的异常值的参数。

相反,一个稳健的目标会阻止异常值的误差信号,导致学习过程不稳定。

鉴于(4),解算器的选择仍然存在。

为了进行隐式微分,我们不需要精确地解决(4),因为cij只是(4)的静止条件,任何局部最小值都能满足。

为此,我们采用Levenberg-Marquardt(LM)算法,该算法保证了局部收敛。

作为一种迭代算法,LM在求解(4)时需要初始化y(0)。

我们通过将(1)重写为:"(1)"来明确这种依赖关系:

7fd1889a-a402-11ed-bfe3-dac502259ad0.png

在反向传播中,我们首先构建f,然后得到g相对于其每个输入的雅可比系数,即:

800098a6-a402-11ed-bfe3-dac502259ad0.png

给出输出梯度,BPnP返回输入梯度:

80179bd2-a402-11ed-bfe3-dac502259ad0.png

算法流程如下图所示:

802578b0-a402-11ed-bfe3-dac502259ad0.png

主要结果:

805896b4-a402-11ed-bfe3-dac502259ad0.png80e32fae-a402-11ed-bfe3-dac502259ad0.png812bd664-a402-11ed-bfe3-dac502259ad0.png








审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4765

    浏览量

    100561
  • 网络模块
    +关注

    关注

    0

    文章

    26

    浏览量

    9292
  • 求解器
    +关注

    关注

    0

    文章

    77

    浏览量

    4516

原文标题:BPnP:基于反向传播PnP优化的端到端可学习几何视觉

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基于WiMAX接入技术的网络架构

    基于WiMAX接入技术的网络架构 本文首先分析了WiMAX技术的市场驱动力和影响其成功部署的关键因素,随后介绍了一个基于WiMAX接入技术的
    发表于 10-20 21:03 731次阅读

    物联网解决方案

    英特尔打造核心技术物联网解决方案
    发表于 12-28 18:12 0次下载

    反向传播算法的工作原理

    反向传播算法(BP算法)是目前用来训练人工神经网络的最常用且最有效的算法。作为谷歌机器学习速成课程的配套材料,谷歌推出一个演示网站,直观地介绍
    的头像 发表于 07-02 16:01 1w次阅读
    <b class='flag-5'>反向</b><b class='flag-5'>传播</b>算法的工作原理

    深读解析反向传播算法在解决模型优化问题的方面应用

    反向传播算法隶属于深度学习,它在解决模型优化问题的方面有着重要的地位。
    的头像 发表于 11-01 15:48 5584次阅读
    深读解析<b class='flag-5'>反向</b><b class='flag-5'>传播</b>算法在解决模型<b class='flag-5'>优化</b>问题的方面应用

    的自动驾驶研发系统介绍

    Nvidia是比较早做控制车辆工作的公司,其方法训练CNN模型完成从单个前向摄像头的图像像素车辆控制的映射。 其系统自动学习一些处理
    的头像 发表于 07-13 09:30 4886次阅读
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>的自动驾驶研发系统<b class='flag-5'>介绍</b>

    基于深度神经网络的图像压缩方法

    人工设计的算法分别进行优化近年来,基于深度神经网络的图像压缩方法在图像压缩中取得了丰硕的成果,相比传统方法,
    发表于 04-08 09:30 16次下载
    基于深度神经网络的<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>图像压缩方法

    基于生成式对抗网络的图像去雾模型

    图像中雾的特征;其次,采用残差学习思想直接从退化图像中学习清晣图像的特征,实现的去雾;最
    发表于 04-12 15:03 20次下载
    基于生成式对抗网络的<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>图像去雾模型

    的IO链接解决方案

    的IO链接解决方案
    发表于 05-10 10:43 1次下载
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>的IO链接解决方案

    结合深度学习的自编码器物理层优化方案

    码器物理层优化方案。通过两阶段训练模式提髙神经网络的泛化性,同时利用自编码器压缩特性量化信道状态信息(CSI)并进行重建,降低CSI反馈导致的系统开销。仿真结果表明,该方案通过分
    发表于 05-24 15:18 7次下载

    BP(BackPropagation)反向传播神经网络介绍及公式推导

    BP(BackPropagation)反向传播神经网络介绍及公式推导(电源和地电气安全间距)-该文档为BP(BackPropagation)反向传播
    发表于 07-26 10:31 48次下载
    BP(BackPropagation)<b class='flag-5'>反向</b><b class='flag-5'>传播</b>神经网络<b class='flag-5'>介绍</b>及公式推导

    一种对红细胞和白细胞图像分类任务的主动学习工作流程

    细胞成像的分割和分类等技术是一个快速发展的领域研究。就像在其他机器学习领域一样,数据的标注是非常昂贵的,并且对于数据标注的质量要求也非常的高。针对这一问题,本篇文章介绍一种对红细胞和白细胞图像分类任务的主动学习
    的头像 发表于 08-13 10:27 1210次阅读

    构建的流程体系

    所谓流程的架构体系,就是一套有层次的流程管理体系。这种层次体现在由上至下、由整体
    的头像 发表于 06-01 15:09 1967次阅读
    构建<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>的流程体系

    神经网络反向传播算法的优缺点有哪些

    神经网络反向传播算法(Backpropagation Algorithm)是一种广泛应用于深度学习和机器学习领域的优化算法,用于训练多层前馈
    的头像 发表于 07-03 11:24 695次阅读

    测试用例怎么写

    编写测试用例是确保软件系统从头到尾能够正常工作的关键步骤。以下是一个详细的指南,介绍如何编写
    的头像 发表于 09-20 10:29 344次阅读

    连接视觉语言大模型与自动驾驶

    自动驾驶在大规模驾驶数据上训练,展现出很强的决策规划能力,但是面对复杂罕见的驾驶场景,依然存在局限性,这是因为
    的头像 发表于 11-07 15:15 153次阅读
    连接<b class='flag-5'>视觉</b>语言大模型与<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>自动驾驶