0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一款只通过单个普通的2D摄像头就能实时捕捉视频中的3D动作的系统

0wvm_ARchan_TT 来源:未知 作者:李倩 2018-05-14 09:53 次阅读

动作捕捉在各行各业都有着重要的作用,我们实现它的方法主要有两种。一是在电影和游戏当中经常使用的方式,通过在关节处贴上标志来记录运动轨迹;

二则是深度摄像头,通过红外来测量用户的身体,这个大家都十分熟悉了。前者根本无法普及,后者在强光下效率低下,但拥有一个共同的优良品质—昂贵。

而市场上充满的是普通智能手机,如果能够仅仅通过普通智能手机的摄像头实现身体追踪,那这将是一个巨大的进步。

除了便宜,普通摄像头较深度摄像头的另一大优势就是视野广,可以用于大场景的使用。同时基于红外的深度摄像头在户外阳光直射的条件下难以工作,2D摄像头却没有这个烦恼。

目前,马克思普朗克计算机科学研究所的科学家们研发出了一款只通过单个普通的2D摄像头(比如普通智能手机的摄像头),就能实时捕捉视频中的3D动作的系统。其效果可以媲美多个摄像头或者深度摄像头如Kinect的效果。

使用2D摄像头获得3D画面是科技前沿的开发者一直在做的事情,我们曾多次提到过,简单点说就是通过深度学习,也就是看得多了就能通过2D画面得出3D动作,例如通过照片就能的出一个人样貌的3D画面。

用2D摄像头捕捉3D动作也是科学家们一直在做的,其中骨骼姿势是其中的一大难题。前人的解决方案中,3D关节是十分不稳定的,会发生严重的偏离,重新投影时会不准确匹配2D位置。即使准确,也只是在极短的时间内,长时间下还是不稳定的。这导致他们大多数只能稳定捕获局部3D动作,而不是全身。

VNect解决了时间问题,可以在短时间内骨骼姿势稳定,同时还是全身动作捕捉。

VNect采用卷积神经网络(CNN),抛弃了以往的100层设计,因为运算时间过长,不适合实时运算,改为更浅的50层。同时了全新的公式,使得能以高精度输出,同时运行在30Hz以上。

在CNN的骨骼预测当中,最重要的骨盆的3D姿势,他们提出的姿态公式得出的结果,吻合度可与世界最先进的离线方法媲美。通过组合预测2D和3D关节位置来确保关节的稳定,同时应用滤波步骤来确保随着时间的推移还能够平滑的跟踪,提高了跟踪姿态的稳定性。

根据图片拓展出来了2D热图,再捕获关节的相对位置x、y、z,变为关节H。根据关节之间的长度计算骨骼的长度,这将成为预测动作的重要依据。采集了通常考虑的17个关节,还采取了脚尖的位置。

系统使用的是骨骼的平均数据,在刚开始的时候会有不稳定的现象,因为单个摄像头没有其他数据可以参考,所以需要被跟踪对象提供一次身高的数据,来实现稳定的追踪。

同时系统是完全卷积的,可以在目标周围缺少紧凑物的情况下运作,并能预测不同的场景,这无疑给准确的测量提供了坚实的基础。

在训练时,选择了八个项目,五个与胸同高,2个与头同高并向下倾斜,一个与膝盖同高并向上倾斜,来学习在不同角度下保持稳定。同时采用了多种组合,如背景、衣物(增多衣物)、障碍物(如椅子)等等。

结果是喜人的,在使用低端手机的相机条件下,在3D角色控制、姿态跟踪等方面,质量与深度摄像头相当,例如Xbox上的Kinect(也就是一代和二代,可不是最新的四代)。

在速度上,CNN计算需要18ms,骨架拟合需要7到10ms,预处理和过滤需要5ms,最多时间也只有33ms。

除去前文介绍的优势,该方案还具备深度摄像头不具备的功能,比如坐在凳子上或其他四肢靠近场景物体时,Kinect发生明显错乱,而2D解决方案却成功了。不过当双腿交叉时,就较为困难了,这将是一个挑战。

通过VNect,任何一个智能手机都能变成轻量级的全自动手持动作捕捉传感器,这将使许多应用变成可能,同时它还是开源的,可以使更多人参与到开发当中。

不过它也存在着许多不足,VNect脚踝追踪十分稳定,但头部准确性十分差。而且单个2D摄像头在深度捕捉上严重不足,任何一点细微的不准确都可能导致很大的不同。在时间上也不够长,长时间下追踪也会发生抖动。此外,遮挡还是一个十分严峻的挑战,十分快的运动也是。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 3D
    3D
    +关注

    关注

    9

    文章

    2861

    浏览量

    107314
  • 神经网络
    +关注

    关注

    42

    文章

    4762

    浏览量

    100533
  • 手机摄像头
    +关注

    关注

    11

    文章

    60

    浏览量

    34298

原文标题:开源项目VNect使用普通手机摄像头进行动作捕捉,媲美深度摄像头

文章出处:【微信号:ARchan_TT,微信公众号:AR酱】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    专题:3D ToF 技术大热,哪些方案值得关注?

    到的数据,我们能准确地知道图像每个点离摄像头的距离,这样加上该点在2D图像的(x,y)坐标,就能获取图像
    的头像 发表于 07-03 16:32 5110次阅读

    3D扫描的结构光

    光调制器和帧捕捉速率更高的摄像头,而亮度更高的图形照明也会对快速扫描有所帮助。在不同的3D测量系统,也许需要从每秒数次到最高每秒数百次的图
    发表于 08-30 14:51

    怎样去设计种基于OPT9221和OPT8241的3D ToF摄像头电路?

    3D ToF摄像头有哪些特性?3D ToF摄像头有哪些功能?怎样去设计种基于OPT9221和OPT8241的
    发表于 07-04 07:15

    全球首2D/3D视频转换实时处理芯片:DA8223

      Dialog半导体股份有限公司日前宣布推出全球首2D/3D影像转换实时处理芯片:DA8223.该芯片为包括智能手机和平板电脑等在内的各种便携式设备提供了
    发表于 12-14 09:17 5138次阅读

    Xilinx与Xylon联合发布2D/3D环视系统自动多摄像头图形拼接IP

    2015年3月6日,中国北京 - All Programmable 技术和器件的全球领先企业赛灵思公司(Xilinx, Inc. (NASDAQ:XLNX))携手Xylon公司今天共同宣布推出最新面向2D/3D环视
    发表于 03-06 09:18 3546次阅读

    HTC推出第一款拍摄3D影像双摄像头的手机

    2011 年,HTC 就推出了第一款拍摄 3D 影像双摄像头的手机 EVO 3D(G17),随后HTC 推出了记录景深数据,以实现「先拍照后对焦」功能双
    的头像 发表于 04-25 16:01 9046次阅读

    3D摄像头和vcesl产业做个超详细的专业科普

    电子终端加上了物体感知功能,从而引入多个“痛点型应用场景”,包括人机交互、人脸识别、三维建模、AR、安防和辅助驾驶等多个领域。站在当前时点,我们认为2D3D摄像头的转变将成为继黑白到彩色、低分辨率到
    的头像 发表于 02-05 09:35 2.6w次阅读
    对<b class='flag-5'>3D</b><b class='flag-5'>摄像头</b>和vcesl产业做<b class='flag-5'>一</b>个超详细的专业科普

    MWC2018:奥比光成功研发手机3D摄像头 安卓阵营进入3D人脸识别时代

    MWC2018正式拉开帷幕,在这次的展会上,联发科战略入股,奥比光成功研发手机前置3D摄像头,最新helio P系列芯片平台支持奥比3D
    发表于 03-02 14:49 1896次阅读

    2D3D视频自动转换系统

    完成系统界面的设置及控制、显示等功能,其DSP处理器实现图像分割和渲染等核心算法,实现了1个高效的2D3D视频视频转换
    发表于 03-06 14:20 1次下载
    <b class='flag-5'>2D</b>到<b class='flag-5'>3D</b><b class='flag-5'>视频</b>自动转换<b class='flag-5'>系统</b>

    适用于显示屏的2D多点触摸与3D手势模块

    视频将展示结合多点触摸与3D手势模块的Microchip显示解决方案。支持2D/3D功能的显示屏是Microchip基于GestIC®技术的最新解决方案。显示屏上结合了
    的头像 发表于 06-06 02:45 5107次阅读

    华为将推搭载索尼传感器的3D摄像头手机

    华为计划推出一款能够支持3D摄像头的新手机。
    的头像 发表于 12-11 17:15 4462次阅读

    手机的双摄像头有什么作用

    人的两眼睛看到的世界是不同的,人脑合成两眼睛看到的图像后,就产生了立体感,能判断出距离、看到缤纷的世界。我们日常所看到的照片、视频都是平面的、二维的,是单个
    的头像 发表于 02-01 10:14 1.9w次阅读

    什么是TOF3D立体摄像头技术

    不知道大家是否还记得游戏画面从2D进化到3D时代的那种感动?唯有更加趋近真实的3D立体“视界”,才能带给我们最为震撼和沉浸式的体验。如今,手机摄像头模块也正走在从
    的头像 发表于 05-20 10:30 2.8w次阅读

    3d人脸识别和2d人脸识别的区别

    首先是3d人脸识别和2d人脸识别图像数据获取不同。3D人脸识别是以3D摄像头立体成像,而2D是以
    发表于 02-05 16:00 4.2w次阅读

    aikit 2023 3D与机械臂结合!

    引言 今天我们主要了解3D摄像头是如何跟机械臂应用相结合的。我们最近准备推出一款新的机械臂套装AI Kit 2023 3D,熟悉我们的老用户应该知道,我们之前的AI Kit 2023套
    的头像 发表于 11-28 10:38 950次阅读
    aikit 2023 <b class='flag-5'>3D</b>与机械臂结合!