一项将2D RGB图像的所有人类像素实时映射至3D模型的技术—

我们已经介绍过很多仅用RGB相机进行动作捕捉的研究了，其中大多数是模拟出骨骼进行追踪，少数则是通过模拟出的骨骼套上一个粗糙的模型，便可称为3D模型了。

近日，Facebook AI Reaserch（FAIR）开源了一项将2D RGB图像的所有人类像素实时映射至3D模型的技术——DensePose，而且采用的也不是我们经常介绍的骨骼追踪，而是一种十分密集的方案追踪来构建3D模型。

在户外和穿着宽松衣服的也表现良好。

还支持多人同时追踪。

那这个密集如何来理解呢？

对于一般的骨骼追踪，追踪的点大多在十到二十个之间，再多也没有多少实际的效果。而DensePose所追踪的点一共有336个，密密麻麻全身都是点。（密集恐惧症退避）

之所以要追踪这么多的点，是构建一个平滑流畅的3D模型所必须的数据。

辛苦的付出也是值得的，DensePose无论是在户外还是多人下都表现良好，还能实时更换场景中人的衣服。

那就来看看他们是怎么做到的吧。

为了让机器可以学习，研究人员手动标记了5万张照片中的336个点，光这个步骤就是一个巨大的工程了，如果按部就班的标记注释，不知道要到什么时候完成了。

研究人员将一个人拆分成了24个部分，分别为头、躯干上部、躯干下部、大臂、小臂、大腿、小腿、手、脚。每个部分标记14的点。

对于头部、手部、脚部都由人手动标记。同时还要求注释者在标记的时候标出被衣物掩盖住的部位，比如宽松的裙子。

这些工作做完后进入第二阶段，研究人员对每一个展开部位区域进行采样，会获得6个不同的标记图，提供二维坐标地图使标记者更直观的判断哪个标记是正确的。

最后再将平面重新组合成3D模型，进行最后一步校准。

这样两步下来，研究人员得以高效准确的获得了准确的标记。不过在躯干、背部还有臀部有较大的误差。

接下来就是深度学习的阶段了，这时一个好的方案就好比性能优越的催化剂。

研究人员采用与Mask-RCNN架构的DenseReg类似的方法，构成了'DensePose-RCNN'系统，还进一步开发使得训练的准确度提高。首先由外观粗略的估算像素所在的位置，然后将其与准确的坐标对齐。

DenseReg MaskRCNN的关键点分支中使用相同的体系结构，由8个交替的3×3完全卷积和512个通道的ReLU层组成。得益于Caffe2，所产生的架构实际上与Mask-RCNN一样快。

为了降低错误率，还训练了一个“教师”网络来重建地面，部署它完整的图像域，产生一个密集的监督信号。研究人员将人类监督者半自动监督和“教师网络”进行对比，结果是“教师”完胜。

研究人员还将其方法与SMPLify进行了对比，在模型的模拟方面，研究人员的自下而上的前馈方法在很大程度上胜过了迭代的模型拟合结果。

同时在多人处理时，FCN明显差于'DensePose-RCNN，再与其他方案比较时优势也十分突出。

最后，整体呈现的效果如开头所讲，能够处理大量遮挡物，成功的模拟出了衣服后面的人，但有一点需要注意，那就是所有人都是通过固定的曲率拟合的。而且在多人状况下表现十分良好。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

Facebook

Facebook

+关注

关注
3

文章
1429

浏览量
54719
3D模型

3D模型

+关注

关注
1

文章
72

浏览量
15696
深度学习

深度学习

+关注

关注
73

文章
5500

浏览量
121109

原文标题：Facebook最新开源，普通RGB相机即可实时映射3D模型

文章出处：【微信号：ARchan_TT，微信公众号：AR酱】欢迎添加关注！文章转载请注明出处。

3D LED液晶电视设计方案

2D信号等功能。图4 ECT223H信号处理框图　　信号模块的功能：　　60Hz的信号先经过2D检测分析将不同运动速度的信号进行特定的同静态算法分析处理；2D转换3D模块

发表于 07-11 18:05

如何同时获取2d图像序列和相应的3d点云？

如何同时获取2d图像序列和相应的3d点云？以上来自于谷歌翻译以下为原文How to obtain the sequence of 2d image and corresponding

发表于 11-13 11:25

为什么3D与2D模型不能相互转换？

AD17.1.5软件，3D与2D模型不能相互转换，按3可以进入3D模型，按

发表于 09-20 05:35

AD的3D模型绘制功能介绍

完成后，2D图如下：　　　　2D图　　我们按下键盘上的数字3，即可查看绘制的3D模型了，如图（4）。　　　　图（4）0805电阻

发表于 01-14 16:48

3D制图软件如何进行多CAD混合设计？

一体化。2D到3D数据的高效转化浩辰3D可以直接打开DWG和DXF图纸来进行编辑绘图，并且可以通过快速建模设计环境将DWG图纸直接转化为

发表于 02-24 17:22

使用DLP技术的3D打印

使用DLP技术的3D打印光固化成形法 (SLA)，一个常见的3D打印工艺，与传统打印很相似。与硒鼓将碳粉沉积在纸张上很类似，

发表于 11-18 07:32

如何把OpenGL中3D坐标转换成2D坐标

在OpenGL中，一切事物都在3D空间中，但我们的屏幕坐标确实2D像素数组，OpenGL大部分工作就是把3D坐标转换成适应屏幕的

发表于 07-09 10:40 •8584次阅读

基于DensePose的姿势转换系统，仅根据一张输入图像和目标姿势

DensePose 是 Facebook 研究员 Natalia Neverova、Iasonas Kokkinos 和法国 INRIA 的 Rıza Alp Guler 开发的一个令人惊叹的人体实时姿势识别系统，它在

发表于 09-24 09:21 •1.1w次阅读

微软新AI框架可在2D图像上生成3D图像

已经有不少机构在将 2D 图像转换为 3D 形式的方面进行了尝试，包括 Facebook、Nvidia 等公司的 AI 研究实验室，或是类似 Threedy.AI 这样的初创公司。

发表于 03-07 14:23 •3037次阅读

阿里研发全新3D AI算法，2D图片搜出3D模型

AI技术的研究正在从2D走向更高难度的3D。12月3日，记者获悉，阿里技术团队研发了全新3D A

发表于 12-04 15:49 •3524次阅读

谷歌发明的由2D图像生成3D图像技术解析

谷歌发明的由2D图像生成3D图像的技术，利用3D估计神经网络

发表于 12-24 12:55 •4759次阅读

3d人脸识别和2d人脸识别的区别

首先是3d人脸识别和2d人脸识别图像数据获取不同。3D人脸识别是以3D摄像头立体成像，而2D是以

发表于 02-05 16:00 •4.5w次阅读

如何直接建立2D图像中的像素和3D点云中的点之间的对应关系

准确描述和检测 2D 和 3D 关键点对于建立跨图像和点云的对应关系至关重要。尽管已经提出了大量基于学习的 2D 或 3D 局部特征描述符和

发表于 10-18 09:20 •8723次阅读

将2D/3D图表和图形添加到WindowsForms应用程序中

将2D/3D图表和图形添加到WindowsForms应用程序中包括您可能需要的所有功能，并以100%托管代码编写。很好地集成到仪表板和商业智能软件中。由响应迅速的支持团队提供支持

发表于 06-15 11:45 •2225次阅读

2D与3D视觉技术的比较

作为一个多年经验的机器视觉工程师，我将详细介绍2D和3D视觉技术的不同特点、应用场景以及它们能够解决的问题。在这个领域内，

发表于 12-21 09:19 •1117次阅读

搜索历史

一项将2D RGB图像的所有人类像素实时映射至3D模型的技术——DensePose

评论