一种基于深度神经网络的迭代6D姿态匹配的新方法-电子发烧友网

基于图像信息对目标进行三维空间定位具有十分重要的作用。例如，在机器人操作中，抓握和运动规划等任务就需要对物体的6D姿态（3D位置和3D方向）信息进行准确的估计；在虚拟现实应用中，人与物体之间的友好流畅的虚拟交互需要对目标进行准确的6D姿态估计。

虽然最新的技术已经在使用深度相机进行物体姿态估计，但这种相机在帧速率、视场、分辨率和深度范围等方面还存在相当大的局限性，一些小的、薄的、透明的或快速移动的物体检测起来还非常困难。目前，基于RGB的6D目标姿态估计问题仍然具有挑战，因为图像中目标的表观会受到一系列因素的影响，如光照、姿态变化、遮挡等。此外，鲁棒的6D姿态估计方法还需要能处理有纹理和无纹理的目标。

传统方法往往通过将2D图像中提取的局部特征与待检测目标3D模型中的特征相匹配来求解6D姿态估计问题，也就是基于2D-3D对应关系求解PnP问题。但是，这种方法对局部特征依赖性太强，不能很好地处理无纹理目标。为了处理无纹理目标，目前的文献中有两类方法：一类是，学习估计输入图像中的目标关键点或像素的3D模型坐标；还有一类是，通过离散化姿态空间将6D姿态估计问题转化为姿态分类问题，或转化为姿态回归问题。

这些方法虽然能够处理无纹理目标，但是精度不够高。为了提高精度，往往还需要进一步的姿态优化：给定初始姿态估计，对合成RGB图像进行渲染来和目标输入图像进行匹配，然后再计算出新的更准的姿态估计。现有的姿态优化方法通常使用手工制作的图像特征或匹配得分函数。

在本文工作中，作者提出了DeepIM——一种基于深度神经网络的迭代6D姿态匹配的新方法。给定测试图像中目标的初始6D姿态估计，DeepIM能够给出相对SE(3)变换符合目标渲染视图与观测图像之间的匹配关系。提高精度后的姿态估计迭代地对目标重新渲染，使得网络的两个输入图像会变得越来越相似，从而网络能够输出越来越精确的姿势估计。上图展示了作者提出网络用于姿态优化的迭代匹配过程。

这项工作主要有以下贡献：

首先，将深度网络引入到基于图像的迭代姿态优化问题，而无需任何手工制作的图像特征，其能够自动学习内部优化机制；

其次，提出了一种旋转和平移解耦的SE(3)变换表示方法，能够实现精确的姿态估计，并且能使提出的方法适用于目标不在训练集时的姿态估计问题。

最后，作者在LINEMOD和Occlusion数据集上进行了大量实验，以评估DeepIM的准确性和各种性能。

两个数据集上的实验结果表明，作者提出的方法都比当前最先进的基于RGB的方法性能提高了很多。此外，初步的实验表明，DeepIM还能够在对一些训练集中未出现的物体的姿态进行准确估计。

下面让我们看看一些算法流程的细节。如上图所示，作者为了获得足够的信息进行姿态匹配，对观测图像进行放大，并在输入网络前进行渲染。要注意的是，在每次迭代过程中，都会根据上一次得到的姿态估计来重新渲染，这样才能够通过迭代来增加姿态估计的准确度。DeepIM的网络结构图如下图所示，输入观测图像、渲染图像以及对应的掩膜。使用FlowNetSimple网络第11个卷积层输出的特征图作为输入，然后连接两个全连接层FC256，最后旋转和平移的估计分别用两个全连接层FC3和FC4作为输入。

通常目标从初始位置到新位置的旋转与平移变换关系如上显示。

一般来说旋转变换会影响最后的平移变换，即两者是耦合在一起的。如果将旋转中心从相机坐标系的原点转移到目标中心，就能解耦旋转和平移。但这样就需要能够识别每个目标并单独存储对应的坐标系，这会使得训练变得复杂且不能对未知目标进行姿态匹配。

在本文的工作中，作者让坐标轴平行于当前相机坐标轴，这样可以算得相对旋转，后续实验证明这样效果更好。剩下的还要解决相对平移估计问题，一般的方法是直接在三维空间中计算原位置与新位置的xyz距离，但是这种方式既不利于网络训练，也不利于处理大小不一、表观相似的目标或未经训练的新目标。

本文作者采用在二维图像空间中进行回归估计平移变换，vx和vy分别是图像水平方向和垂直方向上像素移动的距离，vz表示目标尺度变化。其中，fx和fy是相机焦距，由于是常数，在实际训练中作者将其设为1。

这样一来，旋转和平移解耦了，这种表示方法不需要目标的任何先验知识，并且能处理一些特殊情况，比如两个外观相似的物体，唯一的区别就是大小不一样。

关于模型训练的损失函数，通常直接的方法是将旋转和平移分开计算，比如用角度距离表示旋转误差，L1距离表示平移误差，但这种分离的方法很容易让旋转和平移两种损失在训练时失衡。本文作者提出了一种同时计算旋转和平移的Point Matching Loss函数，来表达姿态真值和估计值之间的损失。其中，xj表示目标模型上的三维点，n是总共用来计算损失函数的点个数，本文中n=3000。

最后总的损失函数由L=αLpose +βLflow+γLmask组成，其中(α，β，γ)分别为(0.1,0.25,0.03)

实验部分，作者主要使用了LINEMOD和OCCLUSION数据集。如下表显示，在LINEMOD数据集上作者分别用PoseCNN和Faster R-CNN初始化DeepIM网络，发现即便两个网络性能差异很大，但是经过DeepIM之后仍能得到差不多的结果。

LINEMOD数据集上的方法对比结果如下表显示，作者提出的方法是最好的。

在目标有遮挡的数据集上的实验，本文提出的方法效果也相当不错哦。

除此之外，本文方法在ModelNet数据集上的表现也相当惊艳，要注意的是，这些物体都不曾出现在训练集中哦。

利用这种方法实现6D位姿估计是十分有效的，希望能为小伙伴们的研究应用带来启发和帮助~

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4777

浏览量
100995
图像

图像

+关注

关注
2

文章
1088

浏览量
40519
函数

函数

+关注

关注
3

文章
4344

浏览量
62847

原文标题：DeepIM：基于深度网络的6D位姿迭代新方法

文章出处：【微信号：thejiangmen，微信公众号：将门创投】欢迎添加关注！文章转载请注明出处。

基于LabVIEW8.2提取ECG特征点的新方法

阈值的方法[4]、差分阈值法[5]、模板匹配法[6]、小波变换法[7,8]、神经网络法[8]等。这些方法各有所长，但还没有

发表于 11-30 16:52

一种标定陀螺仪的新方法

一种标定陀螺仪的新方法

发表于 08-17 12:17

人工神经网络实现方法有哪些？

人工神经网络(Artificial Neural Network，ANN)是一种类似生物神经网络的信息处理结构，它的提出是为了解决一些非线性，非平稳，复杂的实际问题。那有哪些办法能实现

发表于 08-01 08:06

深度神经网络是什么

多层感知机深度神经网络in collaboration with Hsu Chung Chuan, Lin Min Htoo, and Quah Jia Yong. 与许忠传，林敏涛和华佳勇合作

发表于 07-12 06:35

如何构建神经网络？

原文链接：http://tecdat.cn/?p=5725 神经网络是一种基于现有数据创建预测的计算系统。如何构建神经网络？神经网络包括：输入层：根据现有数据获取输入的层隐藏层：使用反

发表于 07-12 08:02

传感器故障检测的Powell神经网络方法

大型热力控制系统必须能够检测传感器故障,并采取相应的措施,保证控制过程的顺利进行。提出了一种基于Powell 神经网络的故障检测新方法,为系统中每一个传感器构造

发表于 07-07 09:21 •6次下载

基于GA优化T_S模糊神经网络的小电流接地故障选线新方法_王磊

基于GA优化T_S模糊神经网络的小电流接地故障选线新方法_王磊

发表于 12-31 14:45 •0次下载

一种基于深度神经网络的基音检测算法

一种基于深度神经网络的基音检测算法_曹猛

发表于 01-07 19:08 •0次下载

一种改进的基于卷积神经网络的行人检测方法

为了在行人检测任务中使卷积神经网络（CNN）选择出更优模型并获得定位更准确的检测框，提出一种改进的基于卷积神经网络的行人检测方法。改进主要涉及两个方面：如何决定CNN样本

发表于 12-01 15:23 •0次下载

<b class='flag-5'>一种</b>改进的基于卷积<b class='flag-5'>神经网络</b>的行人检测<b class='flag-5'>方法</b>

DENSER是一种用进化算法自动设计人工神经网络（ANNs）的新方法

深度进化网络结构表示（DENSER）是一种用进化算法自动设计人工神经网络（ANNs）的新方法。该算法不仅能搜索最佳

发表于 01-10 15:49 •6771次阅读

DENSER是<b class='flag-5'>一种</b>用进化算法自动设计人工<b class='flag-5'>神经网络</b>（ANNs）的<b class='flag-5'>新方法</b>

一种改进的深度神经网络结构搜索方法

为提升网络结构的寻优能力，提岀一种改进的深度神经网络结构搜索方法。针对网络结构间距难以度量的问题

发表于 03-16 14:05 •3次下载

<b class='flag-5'>一种</b>改进的<b class='flag-5'>深度</b><b class='flag-5'>神经网络</b>结构搜索<b class='flag-5'>方法</b>

卷积神经网络和深度神经网络的优缺点卷积神经网络和深度神经网络的区别

深度神经网络是一种基于神经网络的机器学习算法，其主要特点是由多层神经元构成，可以根据数据自动调整神经

发表于 08-21 17:07 •4203次阅读

一种基于MCU的神经网络模型在线更新方案之数据处理篇

一种基于MCU的神经网络模型在线更新方案之数据处理篇

发表于 10-17 18:06 •573次阅读

一种基于MCU的神经网络模型灵活更新方案之先行篇

一种基于MCU的神经网络模型灵活更新方案之先行篇

发表于 10-17 17:48 •608次阅读

浅析深度神经网络压缩与加速技术

深度神经网络是深度学习的一种框架，它是一种具备至少一个隐层的

发表于 10-11 09:14 •773次阅读

搜索历史

一种基于深度神经网络的迭代6D姿态匹配的新方法

评论