谷歌最新AI实验项目,根据用户指挥动作实时生成交响乐,圆你一个指挥家的梦!只需一个摄像头,浏览器内即可运行,快来试试吧!
如果你是一位古典乐发烧友,而且有做乐团指挥的梦想,听见古典乐就走不动道,就算没有乐队,也能自己对着空气手舞足蹈指挥一番,那么恭喜你,谷歌最新的人工智能实验项目简直就是为你量身定制的。而且,不用担心旁边有人对你指手画脚。
这个项目名为“半导体”,其中融合了谷歌过去一系列机器学习实验中的最新成果。包括AIDuet(邀请用户在浏览器中播放虚拟钢琴演奏,并提供虚拟伴奏),以及AutoDraw(可以解释用户绘制的粗糙涂鸦是什么,并将这些画作转变成为整洁的剪贴画)。
该项目可以跟踪用户的动作,就像用户在真正的管弦乐队前挥舞双手一样,并根据对用户动作的分析结果,实时生成一段交响乐。
想试试吗?只需在谷歌浏览器中启动“半导体”,允许其访问网络摄像头权限,然后面向摄像头后退一步,直到你的手臂位于屏幕内的框架中,就可以开始指挥自己的“乐队”了。不一定非要使用传统的指挥手势,本项目会提供建议提示,帮助你一路顺利完成指挥。
全程无需指挥棒随意放飞自我
本项目背后的核心技术是PoseNet,这是一种面向姿势估计的机器学习模型,可以在浏览器中对人的姿势和动作进行分析和估计。它无需任何专门的硬件或软件,即可检测到图像和视频中的人物形象。
最重要的是,因为所有处理都在浏览器中进行,所以无需向Google或其他任何人发送任何数据,因此你可以完全自娱自乐,无需担心由于数据泄露引发的一些不必要的尴尬。
这个项目可让用户通过浏览器管理自己的管弦乐队。你可以通过移动手臂,来改变交响乐的速度、音量和乐器种类。该项目使用PoseNet,这是一个可在浏览器中使用的机器学习库,通过网络摄像头捕捉动作。
PoseNet使用来自现场乐器演奏时录制的数百个微小音频文件,算法会根据捕捉到的动作信息播放这些音频。
关于PoseNet和姿势估计
姿势估计指的是检测图像和视频中的人物形象的计算机视觉技术,比如可以确定某人的肘部出现在图像中的位置。需要明确的是,这项技术无法识别图像中的人物身份。该算法仅仅是估计关键身体的关节在图像中的相对位置。
姿势估计有许多用途,比如用于基于身体反应的交互式装置,以及增强现实设备、动画制作、健身等用途。过去,虽然许多的姿势检测系统是开源的,但都需要专门的硬件或摄像头,以及相当繁复的系统设置。
由于TensorFlow.js上的PoseNet在可浏览器中运行,只要有网络摄像头,任何人都能在浏览器中体验这项技术。目前该模型已经开源,Javascript的开发人员只需几行代码即可使用。更重要的是,这实际上可以更好地保护用户的隐私。
-
谷歌
+关注
关注
27文章
6013浏览量
103609 -
人工智能
+关注
关注
1781文章
45025浏览量
232417 -
机器学习
+关注
关注
66文章
8199浏览量
131244
原文标题:谷歌最新AI实验:人人都是指挥家,实时生成交响乐
文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
荣耀新品将搭载谷歌AI功能,提升生成式AI体验
北斗短报文指挥机是什么,它的作用跟功能是什么?
生成式 AI 制作动画:周期短、成本低!
![<b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b> 制作动画:周期短、成本低!](https://file1.elecfans.com/web2/M00/C5/96/wKgaomX2_FiAdmqcAAOzMjM253o476.png)
谷歌计划重新推出改进后的Gemini AI模型人像生成功能
谷歌DeepMind推新AI模型Genie,能生成2D游戏平台
谷歌暂停Gemini人像生成服务
谷歌地图引入生成式AI功能
谷歌推出AI扩散模型Lumiere
鸿蒙千帆起】《开心消消乐》完成鸿蒙原生应用开发,创新多端联动用户体验
驾驭创造的力量: 生成式 AI 时代的 MLOps 演进
释放生成式AI的巨大潜力,德勤中国与亚马逊云科技共建生成式AI联合实验室
德勤中国与亚马逊云科技联合成立生成式AI联合实验室
利用 NVIDIA Jetson 实现生成式 AI
![利用 NVIDIA Jetson 实现<b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b>](https://file1.elecfans.com//web2/M00/AE/B6/wKgZomVKO9uARD1rAAEX6RZYLcQ926.jpg)
评论