0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

facebook:如何以3D动画的形式将一段音频转化为演奏时的肢体动作

0wvm_ARchan_TT 来源:未知 作者:李倩 2018-07-17 09:26 次阅读

说到以VR演奏乐器,目前应用市场中已有的VR乐器应用并不罕见。VR乐器的诞生帮助很多对音乐向往却囿于乐器价格和摆放空间的爱好者过上了把手瘾、耳瘾。

就在上一周,小编提到的关于facebook对手部的精准追踪,更是助了VR演奏一臂之力,十八般乐器,样样不在话下。

这些应用都是以人为演奏者,根据人的动作发出对应的音调声响。可若是把这个过程反过来又会是怎么样的一种情形呢?

最近,facebook又又公布了一篇论文,名叫“音频到身体动力学”,讲的就是如何以3D动画的形式将一段音频转化为演奏时的肢体动作。依据人的动作,发出声音,我们已经见过许多,但根据声音,模拟出相应动作,这还是首次。

(可惜动图发不出声音ε=(´ο`*))))

想要进行这种转化,就需要知道每个音符所对应的演奏者可能会做出的动作。按照传统方法,自然是请几位演奏家到实验室内,在他们的手指和身体关节处贴上传感器,再让他们演奏上几个小时。但这种方法实施起来还是有些麻烦,怕麻烦的研究人员想出了一个更好的点子。

不知道大家还记不记得去年这个时候曾流传过一个用黑科技合成奥巴马说话的视频。华盛顿大学的研究人员分析了14个小时的奥巴马讲话的视频,判断奥巴马在讲话时其脸部是如何运动的,如嘴唇、牙齿、面部皱纹以及下巴的活动,再通过神经网络人工智能技术根据海量数据掌握了与不同声音相关联的嘴型,因此只要随意放出一段音频就可以制作奥巴马讲话的视频。

正是受到了“奥巴马”的启发,facebook的研究人员也采用了相似的视频学习方法。研究人员通过检测视频中每一帧中的上半身和手指来处理视频。每帧上取50个点,其中每只手占21个点,上半身占8个点。接着,分别通过OpenPose、MaskRCNN 和DeepFace三个库运行视频,其中OpenPose提供面部,身体和手部关键点,MaskRCNN 和DeepFace则为人脸识别算法

当然在采集过程中,也是成功与失败并存。为了采集的数据更精准,研究人员在每段视频中都选择一帧作为参考帧。倘若在参考帧附近的连续帧中有与参考帧参数相差较大的帧,例如面部、手部关键点不匹配,则自动消除掉那一帧。下图手部糊在一起的便是失败帧。

研究人员的目标是学习音频特征和身体动作之间的相关性,因此,完成了关键点采集,便要构建一个Long-Short-TermMemory(LSTM长短期记忆)网络开始学习音频特征和身体骨架标志之间的相关性了。

这也与“奥巴马”那个使用的是同款学习网络。研究人员选择使用具有时间延迟的单向单层LSTM。 xi是特定时间实例i的音频MFCC特征,yi是身体关键点的PCA系数,m是存储器(隐藏状态)。研究人员还添加了一个标记为'fc'的完全连接层,经过试验发现它可以提高系统学习效率。

最后动画的生成是基于ARkit实现的。研究人员使用ARkit构建了一个增强现实应用程序,该应用程序可以在手机上实时运行。使用带有骨骼的3D身体模型,通过将预测点与3D世界坐标对齐来初始化动画形象。研究人员通过所有帧平均下拉的左右肩点距离计算得出模型的刚性变换数据。然后再分别考虑身体,手臂和手指。对于身体,研发人员创建了一条IK链,其中根节点定义为左右臀部之间的平均值,并连接到左肩和右肩的平均值。然后,估计所有帧的平均脊柱长度,并据此相应地缩放动画模型的脊柱。对于手臂,以手腕为参考点,由前臂长度决定偏移量。对于手指,通过小指的根关节和指针的根关节确定手的旋转。最后,应用根旋转偏移来匹配琴与人的姿势角。

除了钢琴,还有小提琴的演奏

虽然目前这个应用还仅限于钢琴与小提琴演奏的转化,但是相信随着进一步的开发,将支持更多种乐器演奏的转化。甚至于将来还有可能发展出除乐器之外其他形式的转化,比如,放一段音乐,可以Freestyle出一段舞蹈;再比如,根据一段霹雳扒拉的拳打脚踢声,生成一段3D动画的打斗场面。总之,能够依声定形还是很有趣的。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 传感器
    +关注

    关注

    2552

    文章

    51325

    浏览量

    755364
  • Facebook
    +关注

    关注

    3

    文章

    1429

    浏览量

    54850
  • vr
    vr
    +关注

    关注

    34

    文章

    9641

    浏览量

    150554

原文标题:facebook:用音乐生成3D动画

文章出处:【微信号:ARchan_TT,微信公众号:AR酱】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    3D模型转化为实物过程中容易出现的五个问题

    所以作为3D设计师,如果您感到设计个好用的3D打印模型很困难,那简直是太正常不过了。在这里,为大家简单总结了
    发表于 11-05 22:31 4116次阅读

    3D 旗帜动画制作小软件

     3D 旗帜动画制作小软件可以 BMP 和 JPG 格式的图形文件制作成 3D 旗帜动画。程序本身提供了多种特效功能让使用者自行
    发表于 06-04 13:06

    [推荐]图片制成3D旗帜动画软件

        图片制成3D旗帜动画软件  可以 BMP 和 JPG 格式的图形文件制作成 3D 旗帜
    发表于 05-30 11:36

    3D游戏一段时间就花屏死机(带解决办法)

    3D游戏一段时间就花屏死机(带解决办法)  网友 snowfox2000:我用的显卡是华硕GeForce 7900GT,没有超频。最近突然发生异常,具体表现为玩3D游戏一段时间就花屏
    发表于 02-23 01:07

    基于8051的Proteus仿真-演奏一段音阶

    基于8051的Proteus仿真-演奏一段音阶
    发表于 09-01 23:37 33次下载

    3D光立方取字模动画软件下载

    3D光立方取字模动画,也可在线测试其光立方动画显示效果
    发表于 08-31 16:50 39次下载
    <b class='flag-5'>3D</b>光立方取字模<b class='flag-5'>动画</b>软件下载

    使用51单片机实现演奏一段音阶的仿真电路图免费下载

    本文档的主要内容详细介绍的是使用51单片机实现演奏一段音阶的仿真电路图免费下载。
    发表于 12-31 10:13 13次下载
    使用51单片机实现<b class='flag-5'>演奏</b><b class='flag-5'>一段</b>音阶的仿真电路图免费下载

    Facebook 3D照片使用范围扩大,不再局限于模式照片

    3D照片功能最早于2018年被引入,可以将带有丰富景深信息的人像模式照片,转化为3D效果的图像,照片主体与背景间会有相互运动。
    的头像 发表于 02-29 09:27 1804次阅读

    使用单片机实现演奏一段音阶的C语言程序和工程文件免费下载

    本文档的主要内容详细介绍的是使用单片机实现演奏一段音阶的C语言源代码和工程文件免费下载。
    发表于 06-10 17:14 13次下载
    使用单片机实现<b class='flag-5'>演奏</b><b class='flag-5'>一段</b>音阶的C语言程序和工程文件免费下载

    使用单片机演奏一段音阶的程序和工程文件免费下载

    本文档的主要内容详细介绍的是使用单片机演奏一段音阶的程序和工程文件免费下载。
    发表于 12-21 08:00 0次下载

    单片机工作原理—3D动画演示

    单片工作原理—3D动画演示
    发表于 11-10 18:35 40次下载
    单片机工作原理—<b class='flag-5'>3D</b><b class='flag-5'>动画</b>演示

    基于AT89C51单片机演奏一段音阶仿真及代码

    基于AT89C51单片机演奏一段音阶仿真及代码
    发表于 05-05 10:09 0次下载

    3D动画制作的应用优势有哪些

    3D动画技术作为种新颖高端的演示手段,在产品细节展示方面表现的尤为出色。因为其自身优势,3D动画技术被广泛应用到了越来越多的行业,机械领域
    的头像 发表于 01-13 16:04 1201次阅读
    <b class='flag-5'>3D</b><b class='flag-5'>动画</b>制作的应用优势有哪些

    电源是把什么能转化为什么能的装置

    电源是种将其它形式的能转化为电能的装置。 这些其它形式的能包括我们已知的所有能量形式,例如化学能、机械能、太阳能等。 电源通过
    的头像 发表于 09-14 16:10 3818次阅读

    奥比中光3D相机打造高质量、低成本的3D动作捕捉与3D动画内容生成方案

    高质量、低成本的3D动作捕捉与3D动画内容生成方案。 Moverse公司总部位于希腊塞萨洛尼基,是三维动画相关媒体和娱乐行业的
    的头像 发表于 06-25 16:37 1110次阅读