0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一个端到端的深度学习系统,可以将足球比赛的YouTube视频转换为运动的3D全息图

DPVg_AI_era 来源:未知 作者:李倩 2018-07-03 10:30 次阅读

你有没有想过让C罗、梅西或者内马尔在你家桌子上踢一场比赛会是什么样子?华盛顿大学、Facebook和Google的研究人员开发了第一个端到端的深度学习系统,可以将足球比赛的YouTube视频转换为运动的3D全息图,使用AR设备就可以观看到3D全息投影的足球比赛。这项研究将在 CVPR 2018 会议上首次亮相。

世界杯来了!央视名嘴白岩松调侃“俄罗斯世界杯,中国除了足球队没去,其他的都去了”,这届世界杯,中国球迷购买球票的数量在所有国家中排名第9,可见球迷对世界杯的热情。那么,除了准备好小龙虾在电视机前观看世界杯比赛,你有没有想过让C罗、梅西或者内马尔在你家桌子上踢一场比赛会是什么样子?

华盛顿大学、Facebook和Google的研究人员开发了第一个端到端的深度学习系统,该系统可以将足球比赛的YouTube视频转换为运动的3D全息图。

用CNN重建一场足球比赛

“对一场足球比赛进行单目重建有很多挑战。我们必须估计相对于场地的摄像机姿态,检测并跟踪每个球员,重新构建他们的身体形状和姿势,并对联合重建进行渲染,”研究人员在他们的研究论文中写道。

图1:以足球比赛的YouTube视频为输入,系统输出比赛的动态3D重建,可以使用增强现实设备在桌面上以交互式的方式观看。

这种方法的关键是卷积神经网络(CNN),研究人员通过训练CNN来估计每个球员与拍摄比赛的摄像机之间的距离。该网络分析了从足球视频游戏《FIFA》中提取的12000张2D球员图像,以及从游戏引擎提取的相应3D数据,以了解两者之间的相关性。

这样,网络就能从没见过的2D图像中预估球员的深度图(depth maps)。当被展示没见过的视频时,系统能准确地预测每个球员的深度图,并将其与颜色素材结合,以3D的方式重建每个球员。

图2:重建方法的概览

以YouTube视频的帧作为输入,我们使用field lines来恢复摄像机参数。然后,提取边界框、姿势和轨迹(跨多个帧)来分割球员。通过在视频游戏数据上训练好的深度网络,我们在游戏环境中重建了每个球员的深度图,这样就可以在3D查看器或AR设备上呈现出来。

然后,球员们被放在一个虚拟的足球场上。其结果令人惊叹,并且可以通过3D查看器或AR设备从任何角度观看比赛。

图3:训练数据:从《FIFA》游戏中提取图像和对应的深度,这里展示了几个可视化为深度图和网格的例子。

该团队使用NVIDIA GeForce GTX 1080 GPU和NVIDIA TITAN Xp GPU,以及cuDNN加速的PyTorch深度学习框架,在从世界杯比赛视频中提取的数小时的3D球员数据上对卷积神经网络进行训练。

基于这些比赛视频数据,神经网络能够重构球场上的每个球员的深度图,这些图可以在3D查看器或AR设备上呈现。

“事实证明,在玩EA的《FIFA》游戏并截取游戏引擎和GPU间的调用时,可以从视频游戏中提取深度图。具体来说,我们使用RenderDoc来截取游戏引擎和GPU之间的调用。”研究团队表示:“FIFA与大多数游戏类似,在游戏过程中使用延迟渲染。通过访问GPU调用,可以捕获每帧的深度和颜色缓冲区。一旦特定的帧被捕获了深度和颜色,就可以提取出球员。”

图4:合成数据集的结果以及与当前最优技术和ground truth的比较,可视化为depth maps和3D网格。我们的方法更准确,实现了更好的网格重构。

为了验证这个系统,研究团队用YouTube上找到的10个高分辨率的职业足球比赛视频测试他们的方法。值得注意的是,该系统只在合成视频素材上进行训练。但是,在真实的场景中,系统也有非常好的结果。

来自YouTube视频的实际图像的结果

从Youtube框架开始(顶行),我们网络重建的深度图可以添加到虚拟3D球场环境中,这里显示为仅网格和纹理渲染(第2-4行)。

研究人员用微软的HoloLensAR眼镜进行测试。HoloLens可以将3D重建叠加到真实的桌面上。最终的产品虽然不完美,它无法重建球,不能实时地工作,并且只允许从视频录制的球场侧面观看。但是,这项技术可能比当前3D重建运动的最先进方法更具可扩展性,因为当前的方法需要在每一个角度布置相机。研究人员称,这种方法也适用于预定义的其他事件,例如音乐会或剧场。

桌面实际的场景

用HoloLens看到的场景

研究人员承认他们的系统并不完美。他们的下一个项目将专注于训练系统以更好地检测球,并开发可从任何角度观察的系统。

这项研究将于6月18日至22日在犹他州盐湖城举行的年度计算机视觉和模式识别(CVPR)会议上首次亮相。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4765

    浏览量

    100608
  • 深度学习
    +关注

    关注

    73

    文章

    5495

    浏览量

    121042
  • 全息图
    +关注

    关注

    0

    文章

    8

    浏览量

    2540

原文标题:来看一场 AI 重建的 3D 全息世界杯比赛!

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    美远程裸眼3D全息图系统曝光[图文]

    :“这次进步使我们向最终的目标:实现拥有高清晰、彩色、人类大小的3D全息远程呈现更靠近步,这项技术能把视频刷新率从地球的
    发表于 03-29 14:47 1.6w次阅读

    3d全息声音技术解析

    ,然后可以感觉飘远的距离感。 随着3D技术在表演领域的广泛应用,音乐的创作必将因此受到影响,带来作曲方式上的改变。除了构思旋律之外,艺术家需要在前期创作中就考虑空间关系。
    发表于 04-16 10:39

    labview全息图

    怎么用labview生成修正离轴全息图,有没有大神
    发表于 04-30 18:28

    革命性创新测量技术——数字全息术带来实时3D形貌

    调焦扫描不同平面的图像,通过计算机分析和模拟,就能显示细胞样品的立体结构。数字全息技术由于其非扫描成像方式实现3D形貌显微,可以做到超高速实时3D显微。这
    发表于 11-07 10:30

    3d全息风扇灯条|3D全息风扇方案|3d全息风扇PCBA

    我公司专业从事3D全息风扇研发生产,主要生产供应3D全息风扇PCBA,也可出售整机,其他配件可免费提供供应商信息或者代购,欢迎咨询 刘先生:*** 微信同号
    发表于 08-02 09:50

    基于全维视觉的足球比赛机器人目标定位

    本文给出了robocup 中型组足球比赛机器人在全维视觉情况下,对足球比赛中目标定位的种方法。文中推导了种针对全向摄像机镜面投影的变换关系,该方法简单有效,为全维
    发表于 08-14 09:38 8次下载

    机器人足球比赛研究

    摘 要: 机器人足球比赛有趣且复杂的人工智能的新兴研究领域, 它试图利用各种理论、算
    发表于 04-29 10:54 153次下载

    足球比赛视频中的多运动员行为表示

    为提高足球比赛视频中的多运动员行为识别的准确率,提出种基于尺度自适应局部时空特征的足球比赛视频
    发表于 12-13 17:17 0次下载

    2D3D视频自动转换系统

    研究和实现了基于OMAP3530的2D3D视频自动转换
    发表于 03-06 14:20 1次下载
    2<b class='flag-5'>D</b><b class='flag-5'>到</b><b class='flag-5'>3D</b><b class='flag-5'>视频</b>自动<b class='flag-5'>转换系统</b>

    如何基于深度神经网络设计的自动驾驶模型?

    如何基于深度神经网络设计的自动驾驶模型?如何设计
    的头像 发表于 04-29 16:44 4862次阅读
    如何基于<b class='flag-5'>深度</b>神经网络设计<b class='flag-5'>一</b><b class='flag-5'>个</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>的自动驾驶模型?

    在智能手机上快速生成照片级真实感彩色3D全息图

    利用人工智能,科学家现在甚至可以在智能手机上快速生成照片级真实感彩色3D全息图。根据项新的研究显示,这项新技术可以在虚拟现实(VR)和增强
    的头像 发表于 04-06 16:19 2684次阅读

    平面全息图与体全息图的成像及白光原理

    运用物理光学相干与衍射的理论‚分析与阐述了平面全息图与体全息图的 成像及白光再现原理‚并对全息防伪印刷应用作了简要介绍。
    发表于 08-31 09:17 3次下载

    微美全息(NASDAQ:WIMI)开发基于深度学习3D计算机生成全息图技术

    物体时,会产生干涉条纹,并记录下这些条纹的信息,然后再通过光的反射和折射来呈现出物体的3D效果。全息图技术可以真实的3D物体以光学的方式呈
    的头像 发表于 05-11 11:03 792次阅读
    微美<b class='flag-5'>全息</b>(NASDAQ:WIMI)开发基于<b class='flag-5'>深度</b><b class='flag-5'>学习</b>的<b class='flag-5'>3D</b>计算机生成<b class='flag-5'>全息图</b>技术

    的立体深度感知系统的设计

        本文提出了种生产化的立体深度感知系统设计,
    的头像 发表于 05-26 16:12 721次阅读
    <b class='flag-5'>一</b>种<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>的立体<b class='flag-5'>深度</b>感知<b class='flag-5'>系统</b>的设计

    无监督深度学习实现单次非相干全息3D成像

    论文信息 背景引入 数字全息术因其能够从单视点对3D场景进行成像而备受关注。与直接成像相比,数字全息种间接的多步骤成像过程,包括光学记
    的头像 发表于 05-13 17:38 395次阅读
    无监督<b class='flag-5'>深度</b><b class='flag-5'>学习</b>实现单次非相干<b class='flag-5'>全息</b><b class='flag-5'>3D</b>成像