0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

FAIR和INRIA的合作提出人体姿势估计新模型,适用于人体3D表面构建

DPVg_AI_era 2018-02-05 11:21 次阅读

FAIR和INRIA的合作研究提出一个在Mask-RCNN基础上改进的密集人体姿态评估模型DensePose-RCNN,适用于人体3D表面构建等,效果很赞。并且提出一个包含50K标注图像的人体姿态COCO数据集,即将开源。

密集人体姿势估计是指将一个RGB图像中的所有人体像素点映射到人体的3D表面。

我们介绍了DensePose-COCO数据集,这是一个大型ground-truth数据集,在50000张COCO的图像上手工标注了图像-人体表面(image-to-surface)的对应点。

我们提出了DensePose-RCNN架构,这是Mask-RCNN的一个变体,以每秒多帧的速度在每个人体区域内密集地回归特定部位的UV坐标。

DensePose-COCO数据集

我们利用人工标注建立从二维图像到人体表面表示的密集对应。如果用常规方法,需要通过旋转来操纵表明,导致效率低下。相反,我们构建了一个包含两个阶段的标注流程,从而高效地收集到图像-表面的对应关系的标注。

如下所示,在第一阶段,我们要求标注者划定与可见的、语义上定义的身体部位相对应的区域。我们指导标注者估计被衣服遮挡住的身体部分,因此,比如说穿着一条大裙子也不会使随后的对应标注复杂化。

在第二阶段,我们用一组大致等距的点对每个部位的区域进行采样,并要求注释者将这些点与表面相对应。为了简化这个任务,我们通过提供六个相同身体部分的预渲染视图来展开身体部位的表面,并允许用户在其中任何一个视图上放置标志。这允许注释者通过从在六个选项中选择一个,而不用手动旋转表面来选择最方便的视点。

我们在数据收集过程中使用了SMPL模型和SURREAL textures。

两个阶段的标注过程使我们能够非常有效地收集高度准确的对应数据。部位分割(part segmentation)和对应标注( correspondence annotation)这两个任务基本是是同时进行的,考虑到后一任务更具挑战性,这很令人惊讶。我们收集了50000人的注释,收集了超过500万个人工标注的对应信息。以下是在我们的验证集中图像注释的可视化:图像(左),U(中)和V(右)是收集的注释点的值。

DensePose-RCNN系统

与DenseReg类似,我们通过划分表面来查找密集对应。对于每个像素,需要确定:

它倾向于属于哪个表面部位;

它对应的部位的2D参数化的位置。

下图右边说明了对表面的划分和“与一个部位上的点的对应”。

FAIR和INRIA的合作提出人体姿势估计新模型,适用于人体3D表面构建

我们采用具有特征金字塔网络( FPN)的Mask-RCNN结构,以及ROI-Align池化以获得每个选定区域内的密集部位标签和坐标。

如下图所示,我们在ROI-pooling的基础上引入一个全卷积网络,目的是以下两个任务:

生成每像素的分类结果以选择表面部位

对每个部位回归局部坐标

在推理过程,我们的系统使用GTX1080 GPU在320x240的图像上以25fps的速度运行,在800x1100的图像上以4-5fps的速度运行。

DensePose-RCNN系统可以直接使用注释点作为监督。但是,我们通过在原本未标注的位置上“修补”监督信号的值进行取得了更好的结果。为了达到这个目的,我们采用一种基于学习的方法,首先训练一个“教师”网络:一个完全卷积神经网络(如下图),它重新构造了给定图像的ground-truth值和segmentation mask。

我们使用级联策略(cascading strategies)进一步提高了系统的性能。通过级联,我们利用来自相关任务的信息,例如已经被Mask-RCNN架构成功解决的关键点估计和实例分割。这使我们能够利用任务协同和不同监督来源的互补优势。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 3D
    3D
    +关注

    关注

    9

    文章

    2875

    浏览量

    107480
  • RGB
    RGB
    +关注

    关注

    4

    文章

    798

    浏览量

    58461
  • INRIA
    +关注

    关注

    0

    文章

    2

    浏览量

    6634

原文标题:效果惊艳!FAIR提出人体姿势估计新模型,升级版Mask-RCNN

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【爱芯派 Pro 开发板试用体验】人体姿态估计模型部署前期准备

    Bottom-up类型的。 3、Openpose/lightweight openpose模型 首先要用到的是Openpose模型,这应该是最有名的人体姿态
    发表于 01-01 01:04

    请问有适用于人体温度的红外温度传感器吗

    适用于人体温度?要求有足够的精度,最好有信号处理模块
    发表于 03-07 12:01

    基于局部姿态先验的深度图像3D人体运动捕获方法

    近邻并构建局部姿态先验模型通过迭代优化求解最大后验概率,实时地在线重建3D人体姿态序列,实验结果表明,该方法能够实时跟踪重建出稳定、准确的3D
    发表于 01-03 14:33 0次下载

    基于遗传优化的自适应凸松弛人体姿势估计

    针对凸松弛方法在解决三维人体姿势估计的问题时存在迭代次数较多、准确度不高的不足,提出一种基于遗传优化的自适应凸松弛人体
    发表于 01-16 16:41 1次下载

    特伦托大学与Inria合作:使用GAN生成人体的新姿势图像

    使用GAN(对抗生成网络)生成人体的新姿势图像。研究人员提出的可变形跳跃连接和最近邻损失函数,更好地捕捉了局部的纹理细节,缓解了之前研究生成图像模糊的问题,生成了更可信、质量更好的图像。
    的头像 发表于 01-29 16:34 9602次阅读
    特伦托大学与<b class='flag-5'>Inria</b><b class='flag-5'>合作</b>:使用GAN生成<b class='flag-5'>人体</b>的新<b class='flag-5'>姿势</b>图像

    3D感应技术TOF占用检测人体跟踪和人数统计

    3D time-of-flight 概览:3D TOF占用检测人体跟踪和人数统计
    的头像 发表于 08-10 00:02 7640次阅读

    基于DensePose的姿势转换系统,仅根据一张输入图像和目标姿势

    DensePose 是 Facebook 研究员 Natalia Neverova、Iasonas Kokkinos 和法国 INRIA 的 Rıza Alp Guler 开发的一个令人惊叹的人体实时姿势识别系统,它在 2
    的头像 发表于 09-24 09:21 1.1w次阅读

    3D打印技术未来有望打印出人体器官 以促进医学研究的发展

    据报道,俄医疗企业Invitro称,俄罗斯宇航员利用国际空间站上的3D生物打印机,设法在零重力下打印出了实验鼠的甲状腺。该公司表示,未来甚至有望打印出人体器官,以促进医学研究的发展。
    发表于 12-21 09:07 1812次阅读

    先临三维携手TechMed 3D出人体3D扫描一体化解决方案

    日前,先临三维与TechMed 3D达成合作,双方将基于彼此研发上的优势,共同推出人体3D扫描一体化解决方案。人体
    发表于 06-11 09:58 956次阅读
    先临三维携手TechMed <b class='flag-5'>3D</b>推<b class='flag-5'>出人体</b><b class='flag-5'>3D</b>扫描一体化解决方案

    适用于3D运动分析的模型

      对系统的运动进行精确建模可能是一件棘手的事情,但通过构建一个稳健的模型,我们可以更快地响应更广泛的问题。如果我们希望制作一个功能强大、平滑且优雅的稳定运动系统,那么我们必须决定哪种模型更合适。作为工程师,我们必须认识到常见
    发表于 06-29 11:12 1016次阅读
    <b class='flag-5'>适用于</b><b class='flag-5'>3D</b>运动分析的<b class='flag-5'>模型</b>

    Yoga AI从单个图像进行3D姿势估计

    电子发烧友网站提供《Yoga AI从单个图像进行3D姿势估计.zip》资料免费下载
    发表于 10-26 11:23 0次下载
    Yoga AI从单个图像进行<b class='flag-5'>3D</b><b class='flag-5'>姿势</b><b class='flag-5'>估计</b>

    CVPR2023:IDEA与清华提出首个一阶段3D全身人体网格重建算法

    三维全身人体网格重建(3D Whole-Body Mesh Recovery)是人类行为建模的一个重要环节,用于从单目图像中估计出人体姿态(
    的头像 发表于 04-07 09:56 1133次阅读

    AI深度相机-人体姿态估计应用

    构建一个可以检测、分析和响应人体运动的应用程序和系统。代码我们的演示视频如下,该视频展示了这项技术的实际功能。您可以看到使用虹科AI深度相机实现人体姿势
    的头像 发表于 07-31 17:42 1009次阅读
    AI深度相机-<b class='flag-5'>人体</b>姿态<b class='flag-5'>估计</b>应用

    3D人体生成模型HumanGaussian实现原理

    3D 生成领域,根据文本提示创建高质量的 3D 人体外观和几何形状对虚拟试穿、沉浸式远程呈现等应用有深远的意义。传统方法需要经历一系列人工制作的过程,如 3D
    的头像 发表于 12-20 16:37 1594次阅读
    <b class='flag-5'>3D</b><b class='flag-5'>人体</b>生成<b class='flag-5'>模型</b>HumanGaussian实现原理

    多尺度浸入式3D打印策略,用于人体组织和器官的精准制造

    生物3D打印技术被认为是实现复杂人体组织和器官构建的最有前景的技术方案之一。近年来,浸入式墨水书写技术作为生物3D打印的关键技术分支而备受瞩目。
    的头像 发表于 04-20 11:43 911次阅读