0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种框架把专业舞蹈演员的动作迁移到不会跳舞的人身上

zhKF_jqr_AI 来源:未知 作者:李倩 2018-08-27 09:30 次阅读

UC Berkeley近日发表了一篇论文,题目简洁明了:Everybody Dance Now,大家一起跳起来!没错,这个被网友称为“mad lab”的实验室提出了一种框架,把专业舞蹈演员的动作迁移到不会跳舞的人身上,不论是酷酷的街舞还是优雅的芭蕾,效果简直是神同步,流畅度和还原度都非常高。下面跟着论智一起看看这篇论文吧。

我们在这篇文章中提出了一个简单的方法进行动作迁移:首先选择一支单人跳舞视频作为源视频,几分钟后,在另一个目标视频上(完全不会跳舞的人)会呈现同样的动作。我们将这一问题看作是每一帧上图像到图像的转换,同时保证时间和空间的流畅。用动作探测器作为源视频和目标视频中间的表示,我们学习了一种从舞者动作画面到目标物体的映射,并且对这一设置进行调整,让它与视频完美融合,同时还加上了真实的人脸合成。

先放个视频感受一下这惊艳的效果,在后半部分的补充案例中,还展示了芭蕾舞的迁移。可以看到,原视频中芭蕾舞演员的大腿部分被裙子遮挡,但是映射到目标视频中,大腿动作也能正确呈现,效果满分!

简介

我们提出了一种方法,实现了动作在不同视频中的不同人物之间的转换。现在有两段视频,其中一段是我们希望进行合成的目标(不会跳舞的人),另一个是模仿的源视频(专业舞者)。我们通过基于像素的端到端通道实现了这一动作迁移。这一方法与过去二十年常见的最近邻搜索或3D中的重新制定目标动作不同。通过这一框架,我们让很多未经训练的人跳出了芭蕾和街舞。

为了实现两视频之间每帧的动作迁移,我们必须学习一种两个人物之间的映射。我们的目标是在源视频和目标视频之间进行图像到图像的转换。然而,我们没有两个目标物体做出同样动作的图片,也就无法直接对这一转换进行监督学习。即使视频中的两个人做出一系列同样的动作,还是很难提取每一帧的姿势,因为身体形状和风格完全不同。

我们发现,能体现身体各部分位置的关键点可以用作二者之间的表示。于是,我们设计了用来体现动作的“中间表示(火柴人)”,如图所示:

从目标视频中,我们用动作识别器为每一帧制作了(火柴人, 目标人物图像)的组合。有了这样相关的数据,我们就能用监督方法学习火柴人和目标人物之间图像到图像的转换模型了。于是,我们的模型通过训练,可以生成个性化的视频。之后,为了将源视频的动作迁移到目标视频中,我们把火柴人输入到经过训练的模型后,得到和源视频中人物相同的目标动作。另外,为了提高生成的质量,我们添加了两个元素。为了使生成的模型更流畅,我们都会根据上一帧对目前的帧进行预测。为了提高生成人脸的真实性,我们还加入了经过训练的GAN来生成目标人物的脸部。

具体方法

这一任务大致分为三步:动作检测、全局动作规范化和动作映射。训练和迁移过程如下图所示:

模型通过探测器P创造目标视频中人物所对应的火柴人。训练时,我们学习了映射G和一个对抗判别器D。D的作用是尝试判断火柴人和视频中的人是否符合。

下面一行是迁移过程。我们用动作探测器P:Y’→X’来获得源视频中的火柴人形象,这个火柴人形象通过归一化处理变成了为目标人物设计的火柴人。接着对其应用经过训练的映射G即可。

为了让效果更真实,我们还专门增加了生成对抗网络设置,让面部更真实,效果也显著提高。

网络架构

为了提取身体、面部和手部的动作关键点,我们使用了最先进的动作检测器OpenPose。在图像转换阶段,我们使用了Wang等人提出的pix2pixHD模型。对于面部图像的生成,我们没有使用完全的pix2pixHD生成器,而是利用pix2pixHD的全局生成器。

实验对比

由于我们没有标准答案,为了对比两个不同视频中的目标人物,我们分析了目标人物的重建过程(也就是将源视频人物当做目标人物)。另外,为了评估每一帧的生成质量,我们测量了结构相似度(SSIM)和学习认知图像补丁相似性(LPIPS)。

除此之外,我们还在每个系统的输出上应用了动作检测器P,比较这些重建之后的关键点和原始的动作有何不同。

迁移结果。最上方的是源目标人物,中间是对应的“火柴人”,最下面一行是输出的目标人物动作

我们对比了标准pix2pixHD、只含有流畅度设置的我们模型版本(T.S.)以及我们模型的最终版本(有流畅设置和人脸GAN)。首先,三种模式下相似度的对比如图:

而在脸部区域,三种生成图像的质量对比:

可以看到,我们的完整版模型的分数是最好的。

讨论

看过这篇论文后,许多人只有一个反应:“Amazing!!”的确,效果这么好的视频生成技术未来可应用的场景有很多,比如电影拍摄、VR动画等等。但也有人表示担心,会不会像之前的deepfakes换脸一样,再产生一堆虚假视频?

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像
    +关注

    关注

    2

    文章

    1087

    浏览量

    40507
  • 迁移
    +关注

    关注

    0

    文章

    33

    浏览量

    7943

原文标题:不如跳舞!伯克利的舞蹈动作迁移效果逆天

文章出处:【微信号:jqr_AI,微信公众号:论智】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    经典的QP框架原理

    状态机是嵌入式开发中常见的一种方法,但状态机的形式有很多,这里给大家分享下经典的QP框架原理。 状态机基本术语 现态:是指当前所处的状态。条件:又称为“事件”,当个条件被满足,将会
    的头像 发表于 07-21 09:04 1051次阅读
    经典的QP<b class='flag-5'>框架</b>原理

    怎么从Harmony 1.06迁移到1.07.01?

    你好!我的硬件是个PIC32 MZ2048 EFM与网络,USB,2×CAN,RS232,SPI。在框架1.06下工作,我试着这个项目从1.06迁移到1.07.01。问题之
    发表于 10-10 13:17

    EDK项目迁移到vivado的建议有哪些?

    大家好,我正在开发个目前处于planAhead ISE的项目。我正在将该EDK项目迁移到vivado。当我尝试迁移IP时,我能够成功迁移我的
    发表于 05-06 10:31

    请问下mysql怎么快速迁移到oceanBase啊?

    mysql怎么快速迁移到oceanBase啊
    发表于 05-30 17:04

    分享一种智能网卡对热迁移支持的新思路

    Guest访问的阶段。Pass-through物理设备的方式是可以达到跟HOST访问设备同等的性能,逐渐成为一种主流。但这给热迁移带来了问题,Pass-through的设备状态要想被获取,就需要硬件配合软件
    发表于 07-05 14:46

    如何使用Neon intrinsic的矢量处理代码迁移到氦intrinsic

    本指南旨在帮助任何将使用霓虹灯内部函数的现有矢量处理代码迁移到氦内部函数的人。我们将研究不同复杂度的霓虹灯代码示例,并研究如何将该霓虹灯代码迁移到氦。通过研究这些示例,您将了解些通用
    发表于 08-02 07:39

    从电源架构迁移到ARM的应用说明

    本文档的目的是强调那些参与将软件应用程序从Power架构迁移到ARM平台的人员感兴趣的领域。 本文并不试图将一种体系结构提升到另一种体系结构之上,只是为了清楚地解释将现有软件应用程序从
    发表于 08-22 06:09

    可穿戴在人身上的惊人科技设备

     最近介绍了可以穿戴在人身上的多种设备,些甚至可以植入人体。其中有些设备能充当“身体黑客”给医生提供病人至关重要的信息,让医生洞察先机,帮助人们克服病痛或者是永久性残疾。
    发表于 06-01 09:19 3101次阅读

    场探索人类与太阳关系的VR舞蹈体验

    作为款被称为“Celestial Moon(天体月亮)”的VR舞蹈体验,它结合了真人视频和计算机生成的图像。它的特点是几个舞蹈演员,在个探索人类与太阳关系的常规中表演于超现实的宇宙
    发表于 04-19 10:16 1735次阅读

    图像迁移最新成果:人体姿势和舞蹈动作迁移

    加州大学伯克利分校的研究人员,近日在著名预印本网站 arXive 上,发布了最新的图像迁移成果:人体姿势和舞蹈动作迁移
    的头像 发表于 09-03 16:19 6383次阅读

    谷歌与Wayne McGregor合作 研发出能预测特定风格舞蹈动作的人工智能

    近日,谷歌艺术与文化部的Damien Henry与英国舞蹈编导Wayne McGregor合作,共同研发了一种能够预测特定风格舞蹈动作的人
    发表于 12-27 16:01 1500次阅读

    一种能够预测特定风格舞蹈动作的人工智能

    当然,AI编舞也不是完全不具备创造力。该技术可以画出张它所识别的不同舞蹈动作的“地图”,并且推荐特定的动作序列。Henry解释说, 它在动作
    的头像 发表于 12-28 14:23 3678次阅读

    Hayden Barnes:微软不会将Windows迁移到Linux

    转自:开源中国 Canonical 桌面团队成员Hayden Barnes发表个人观点称,他认为微软不会将 Windows 迁移到 Linux。 近段时间以来,微软积极融合 Linux 的举措引发
    的头像 发表于 10-23 11:56 2016次阅读
    Hayden Barnes:微软<b class='flag-5'>不会</b>将Windows<b class='flag-5'>迁移到</b>Linux

    一种基于标签比例信息的迁移学习算法

    不充分的问题,于是如何利用历史数据(原任务数据)帮助新产生的数据(目标任务数据)进行分类显得异常重要。本文提出了一种基于标签比例信息的迁移学习算法,将知识从原任务迁移到目标任务,帮助目标任务更好构建分类
    发表于 03-30 15:46 523次阅读

    一种将CUDA代码迁移到SYCL和C++的开源工具

    英特尔发布了项开源工具,该工具可通过名为SYCLomatic的项目,将代码迁移至SYCL1,这有助于开发者更轻松地将CUDA代码迁移到SYCL和C++,从而加速面向异构架构的跨架构编程。这个开源
    的头像 发表于 06-10 11:17 1496次阅读