0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Facebook的研究人员提出了一个能从真实视频中抽取可控制主角的模型Vid2Game

nlfO_thejiangme 来源:lq 2019-04-26 09:58 次阅读

相信大家还记得曾经游戏中的主人公,可以随着按键旋转跳跃,通过三维/二维模型或者实现录制好的视频来响应不同指令的动作。而最近来自Facebook的研究人员提出了一个能从真实视频中抽取可控制主角的模型Vid2Game,这意味你可以将视频中喜欢的主人公变成可以在游戏中控制的主角。

让我们先来看看效果,从真实视频中抽取的主角被放置到了新背景中,随着按键的控制左右移动挥拍击球。

黑衣服的运动员被妥妥地安排到了不同的背景中,随着键盘的指令移动。这是怎么做到的呢?为了实现对主体的控制和生成需要解决一下几个问题:首先需要将主体从环境中分离出来以便在新的任意的背景中生成;由于渲染阴影、反射、运动效果等、这种分离不是二值化的;用户给出的控制信号任意的x,y位移、如何编码并将控制量馈入主体生成中;最后需要处理生成序列过程中积累误差的影响。

那么文章中具体是如何做到的呢?

下面让我们一起来看看背后的原理。Vid2Game包含了两个神经网络和三个主要步骤的工作流程,首先利用第一个神经网络将当前位姿和控制信号映射到下一时刻的新位姿;随后利用新位姿和给定的背景输出希望的帧,包括背景和主体以及主体的mask;最后将生成的主体以背景融合生成最终输出。这种通用的方法可以被广泛用于多种不同运动场景中。给定视频中的主角可以根据用户的控制,生成在目标背景中运动的视频。两个序列形式工作的模型分别是Pose2Pose和Pose2Frame。

Pose2Pose网络基于用户的控制序列信号以自回归的方式操作给定的位姿,实现在特定的域内基于2D控制信号引导人体位姿生成。

通过输入t-1时刻的位姿和对应物体、在用户控制序列的操作下生成t时刻的主角位姿和对应物体。上图中我们可以看到输入的运动员位姿图和对应的球拍、同时输入的还有控制量。我们还可以看到中间的n-2个条件残差模块是基于质心位移量进行处理的。在训练时,质心唯一来自于训练序列的编码、而推理时则来自于用户输入。

随后将生成的位姿及给定的背景输入Pose2Frame将生成高分辨率的真实视频序列。同样以运动员作为例子,将运动员位姿和网球拍的序列输入,模型将生成一个RGB图像和mask图像.RGB图像考虑了运动员在环境中需要包括了阴影、反射等渲染,而mask辅助融合运动员与给定背景。通过mask与生成的rgb相乘得到运动员部分的RGB图像、再通过背景抠出mask区域随后融合运动与与给定背景,即得到运动员在新环境中生成的受用户控制的帧。

对于判别器部分、模型主要关注多尺度情况下二进制阈值主体。其中o为基准图像f为生成图像,在放入多尺度判别器前需要进行均值pooling减采样,。放入VGG分类器中的图像则保持了原始分辨率用于给出感知损失。Pose2Pose和Pose2Frame的生成器和判别器都使用了pix2pixHD架构来作为基础网络,并进行了一系列改进。同时利用了基于DensePose的方法来对位姿进行表示,同时使用了语义分割的方法来对运动员手持物体进行抽取。

通过这样的方法,就可以在希望的场景中合成你可控制的主角了。这对于未来个性化游戏、虚拟显示等具有十分重要的意义。从各种视频中抽取主角、并可以通过键盘在游戏中控制真的很棒!

让我们来跳一支舞吧:

控制你的主角四处漫游:

到任何想去的地方打球:

与龙来一场战斗吧:

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4734

    浏览量

    100430
  • 图像
    +关注

    关注

    2

    文章

    1080

    浏览量

    40378
  • Facebook
    +关注

    关注

    3

    文章

    1429

    浏览量

    54612

原文标题:Facebook提出Vid2Game模型,帮助你来控制视频里的主人公动起来~

文章出处:【微信号:thejiangmen,微信公众号:将门创投】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    美国普渡大学和哈佛大学的研究人员出了项新发明 新...

    据物理学家组织网报道,美国普渡大学和哈佛大学的研究人员出了项极为应景的新发明:种外形如同颗圣诞树
    发表于 02-03 20:30

    研究人员提出了“Skim-RNN”的概念,用很少的时间进行快速阅读

    注意力模型和LSTM等方法提高计算效率或挑选重要任务,但它们的表现都不够好。在本篇论文中,研究人员提出了“Skim-RNN”的概念,用很少的时间进行快速阅读,不影响读者的主要目标。
    的头像 发表于 01-10 12:41 3566次阅读
    <b class='flag-5'>研究人员</b><b class='flag-5'>提出了</b>“Skim-RNN”的概念,用很少的时间进行快速阅读

    研究人员提出了种柔性可拉伸扩展的多功能集成传感器阵列

    研究人员提出了种柔性可拉伸扩展的多功能集成传感器阵列,成功将电子皮肤的探测能力扩展到7种,实现温度、湿度、紫外光、磁、应变、压力和接近等多种外界刺激的实时同步监测。
    的头像 发表于 01-24 15:15 7196次阅读
    <b class='flag-5'>研究人员</b><b class='flag-5'>提出了</b><b class='flag-5'>一</b>种柔性可拉伸扩展的多功能集成传感器阵列

    Facebook提出了种在虚拟现实环境中表征真实世界对象的解决方案

    )”的专利中指出,VR用户有时渴望与真实世界对象交互,但由于传统头显的设计,其无法或难以确定真实世界对象的位置。为了解决这个问题,Facebook提出了
    发表于 01-28 09:47 1086次阅读
    <b class='flag-5'>Facebook</b><b class='flag-5'>提出了</b><b class='flag-5'>一</b>种在虚拟现实环境中表征<b class='flag-5'>真实</b>世界对象的解决方案

    Facebook构建虚拟空间训练AI

    近日,Facebook推出开源的模拟数据集,希望帮助研究人员创建更加真实的AR/VR体验,最终目的是帮助 AI 了解物理世界的环境。
    的头像 发表于 06-18 17:07 3254次阅读

    研究人员提出了系列新的点云处理模块

    为了探索这些问题的解决办法、来自伦敦大学学院的研究人员提出了系列新的点云处理模块,从效率、信息共享和点云卷积操作等方面进行了研究,得到了更宽、更深、更快效率更高的点云处理网络,让更
    的头像 发表于 08-02 14:44 3030次阅读
    <b class='flag-5'>研究人员</b>们<b class='flag-5'>提出了</b><b class='flag-5'>一</b>系列新的点云处理模块

    JD和OPPO的研究人员提出了种姿势引导的时尚图像生成模型

    研究人员的主要目的在于训练生成模型,将模特在当前姿势上的图像迁移到其他的目标姿势上去,实现对于衣着等商品的全面展示。
    的头像 发表于 08-02 14:50 2512次阅读

    Facebook研究人员提出了Mesh R-CNN模型

    研究的目标是通过单张图像输入,对图像的物体进行检测、获取不同物体的类别、掩膜和对应的三维网格,并对真实世界的复杂
    的头像 发表于 08-02 15:51 3844次阅读
    <b class='flag-5'>Facebook</b>的<b class='flag-5'>研究人员</b><b class='flag-5'>提出了</b>Mesh R-CNN<b class='flag-5'>模型</b>

    研究人员出了种新的基于深度学习的策略

    苏黎世联邦理工学院的研究人员最近推出了种新的基于深度学习的策略,该策略可以在不需要大量真实数据的情况下在机器人中实现触觉传感。在arXiv上预先发表的
    的头像 发表于 03-26 15:47 2566次阅读

    研究人员开发出了种称为LB-WayPtNav-DH的机器人导航新框架

    加州大学伯克利分校的研究人员最近开发了种新的框架,该框架可以增强办公室,房屋或博物馆等室内环境中人类的机器人导航能力。他们的模型在arXiv上预先发表的篇论文中
    发表于 04-09 11:18 921次阅读

    研究人员提出了名为CommPlan的框架

    使用CommPlan,开发人员首先使用数据,领域专业知识和学习算法指定五模块-任务模型,通信功能,通信成本模型人员响应
    的头像 发表于 04-09 14:30 2147次阅读

    Facebook研究人员发布友谊数据

    Facebook篇博文中表示,卡耐基梅隆大学的研究人员“不会与Facebook分享个人调查反馈,Facebook也不会与
    的头像 发表于 04-22 10:58 3295次阅读

    华裔女博士提出Facebook提出用于超参数调整的自我监督学习框架

    【导读】Facebook研究人员近日提出了种用于超参数调整的自我监督学习框架。
    的头像 发表于 04-26 09:45 1736次阅读
    华裔女博士<b class='flag-5'>提出</b>:<b class='flag-5'>Facebook</b><b class='flag-5'>提出</b>用于超参数调整的自我监督学习框架

    研究人员制造出种可以挖洞的软体机器人

    的软体机器人。 研究人员提出了新的在颗粒介质挖掘的动力学理解,结合关键结果设计出款带有尖端延伸喷气装置的管状机器人,控制地下的相互作用力
    的头像 发表于 06-26 16:28 2140次阅读

    人工智能研究人员利用静止图像创建循环视频

      研究人员使用了 NVIDIA Pix2PixHD 用于运动估计网络训练的 GAN 模型,以及 FlowNet2 和 PWC-Net 。模型
    的头像 发表于 04-26 15:40 756次阅读