0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌最新AI实验项目,根据用户指挥动作实时生成交响乐

DPVg_AI_era 来源:lq 2019-01-04 09:49 次阅读

谷歌最新AI实验项目,根据用户指挥动作实时生成交响乐,圆你一个指挥家的梦!只需一个摄像头,浏览器内即可运行,快来试试吧!

如果你是一位古典乐发烧友,而且有做乐团指挥的梦想,听见古典乐就走不动道,就算没有乐队,也能自己对着空气手舞足蹈指挥一番,那么恭喜你,谷歌最新的人工智能实验项目简直就是为你量身定制的。而且,不用担心旁边有人对你指手画脚。

这个项目名为“半导体”,其中融合了谷歌过去一系列机器学习实验中的最新成果。包括AIDuet(邀请用户在浏览器中播放虚拟钢琴演奏,并提供虚拟伴奏),以及AutoDraw(可以解释用户绘制的粗糙涂鸦是什么,并将这些画作转变成为整洁的剪贴画)。

该项目可以跟踪用户的动作,就像用户在真正的管弦乐队前挥舞双手一样,并根据对用户动作的分析结果,实时生成一段交响乐。

想试试吗?只需在谷歌浏览器中启动“半导体”,允许其访问网络摄像头权限,然后面向摄像头后退一步,直到你的手臂位于屏幕内的框架中,就可以开始指挥自己的“乐队”了。不一定非要使用传统的指挥手势,本项目会提供建议提示,帮助你一路顺利完成指挥。

全程无需指挥棒随意放飞自我

本项目背后的核心技术是PoseNet,这是一种面向姿势估计的机器学习模型,可以在浏览器中对人的姿势和动作进行分析和估计。它无需任何专门的硬件或软件,即可检测到图像和视频中的人物形象。

最重要的是,因为所有处理都在浏览器中进行,所以无需向Google或其他任何人发送任何数据,因此你可以完全自娱自乐,无需担心由于数据泄露引发的一些不必要的尴尬。

这个项目可让用户通过浏览器管理自己的管弦乐队。你可以通过移动手臂,来改变交响乐的速度、音量和乐器种类。该项目使用PoseNet,这是一个可在浏览器中使用的机器学习库,通过网络摄像头捕捉动作。

PoseNet使用来自现场乐器演奏时录制的数百个微小音频文件,算法会根据捕捉到的动作信息播放这些音频。

关于PoseNet和姿势估计

姿势估计指的是检测图像和视频中的人物形象的计算机视觉技术,比如可以确定某人的肘部出现在图像中的位置。需要明确的是,这项技术无法识别图像中的人物身份。该算法仅仅是估计关键身体的关节在图像中的相对位置。

姿势估计有许多用途,比如用于基于身体反应的交互式装置,以及增强现实设备、动画制作、健身等用途。过去,虽然许多的姿势检测系统是开源的,但都需要专门的硬件或摄像头,以及相当繁复的系统设置。

由于TensorFlow.js上的PoseNet在可浏览器中运行,只要有网络摄像头,任何人都能在浏览器中体验这项技术。目前该模型已经开源,Javascript的开发人员只需几行代码即可使用。更重要的是,这实际上可以更好地保护用户的隐私。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6211

    浏览量

    106438
  • 人工智能
    +关注

    关注

    1799

    文章

    48047

    浏览量

    241946
  • 机器学习
    +关注

    关注

    66

    文章

    8459

    浏览量

    133371

原文标题:谷歌最新AI实验:人人都是指挥家,实时生成交响乐

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    AI Agent 应用与项目实战》----- 学习如何开发视频应用

    再次感谢发烧友提供的阅读体验活动。本期跟随《AI Agent 应用与项目实战》这本书学习如何构建开发一个视频应用。AI Agent是一种智能应用,能够根据
    发表于 03-05 19:52

    AI Agent 应用与项目实战》阅读心得2——客服机器人、AutoGen框架 、生成式代理

    及时处理。 第5章的斯坦福AI小镇项目生成式代理技术做出了开创性的探索。该项目的核心是将LLM与计算交互代理相结合,构建了一个具有记忆、反思、规划能力的智能体系统。在技术实现层面,记
    发表于 02-25 21:59

    谷歌Gemini AI目标年底用户达5亿

    即将在AI市场掀起新的波澜。 据悉,谷歌的目标是在今年年底前,让全球有5亿人使用基于Gemini AI技术构建的聊天机器人。然而,目前谷歌尚未公布Gemini的具体
    的头像 发表于 01-18 11:30 601次阅读

    生成AI工具好用吗

    当下,生成AI工具正以其强大的内容生成能力,为用户带来了前所未有的便捷与创新。那么,生成AI
    的头像 发表于 01-17 09:54 160次阅读

    谷歌加速AI部门整合:AI Studio团队并入DeepMind

    旗下,此举旨在更好地整合人工智能部门,以提升各大项目的推进效率。 AI Studio团队在谷歌内部扮演着举足轻重的角色,主要负责打造谷歌旗下的AI
    的头像 发表于 01-13 14:40 317次阅读

    名单公布!【书籍评测活动NO.55】AI Agent应用与项目实战

    ,或协助制定营销策略。 医疗健康:AI Agent 已在医疗领域展现巨大潜力,如对常见的疾病进行预诊断,或基于患者的健康数据生成个性化的治疗方案。 教育领域:对用户进行个性化学习路径安排、智能辅导等通过
    发表于 01-13 11:04

    借助谷歌Gemini和Imagen模型生成高质量图像

    在快速发展的生成AI 领域,结合不同模型的优势可以带来显著的成果。通过利用谷歌的 Gemini 模型来制作详细且富有创意的提示,然后使用 Imagen 3 模型根据这些提示
    的头像 发表于 01-03 10:38 502次阅读
    借助<b class='flag-5'>谷歌</b>Gemini和Imagen模型<b class='flag-5'>生成</b>高质量图像

    谷歌Vertex AI助力企业生成AI应用

    过去的一段时间,我们看到了许多 Google Cloud 客户对生成AI 和 agent 的精彩应用,令我们拍案叫绝。为了让企业能够更快推出功能强大的 AI agent,Google
    的头像 发表于 09-09 15:59 631次阅读

    谷歌推出旗下AI智能体管理项目Project Oscar

    在近日于印度班加罗尔盛大举行的2024 I/O Connect开发者活动上,谷歌公司隆重推出了Project Oscar项目,这一创新举措标志着开源软件项目管理领域迎来了AI智能体的全
    的头像 发表于 07-19 16:07 715次阅读

    华太电子2024慕尼黑上海电子展精彩回顾

    2024年7月8日—10日,为期三天的慕尼黑上海电子展圆满落幕。这场翘首以盼的行业盛会根据实时热点融入了新的展示领域和展现形式,为电子行业合奏了一曲生机勃勃的产业交响乐。让我们一起回顾一下展会精彩瞬间吧!
    的头像 发表于 07-17 11:48 750次阅读

    高低温试验箱:科技与耐力的交响

    在现代工业的宏伟交响乐中,高低温试验箱以其独特的音符,奏响了产品质量与可靠性的序章。这一精密仪器,如同一位严谨的指挥家,引导着产品经历从冰点到沸点的严酷考验,以此验证其性能的坚韧与稳定。上海和晟HS
    的头像 发表于 06-12 10:54 424次阅读
    高低温试验箱:科技与耐力的<b class='flag-5'>交响</b>曲

    荣耀新品将搭载谷歌AI功能,提升生成AI体验

    荣耀于5月22日宣布,将在新款智能手机上集成谷歌AI功能,实现生成AI体验。此外,新机还将得到谷歌云服务的支持。
    的头像 发表于 05-23 08:51 581次阅读

    谷歌发布全新视频生成模型Veo与Imagen文生图模型

    谷歌近日宣布了两项重大技术进展,首先是视频生成模型Veo的正式推出。这款先进的模型能够支持生成质量更高的视频内容,让用户能够根据自己的需求设
    的头像 发表于 05-16 10:46 459次阅读

    谷歌推出能制作旅行攻略的AI工具

    谷歌近日发布了一项令人瞩目的新功能,它是一款能够借助自然语言对话帮助用户生成旅行行程和出游建议的AI工具。这款工具的推出,标志着谷歌在人工智
    的头像 发表于 03-29 11:08 798次阅读

    北斗短报文指挥机是什么,它的作用跟功能是什么?

    。同时,北斗指挥机还可以实时监视用户机的定位和通信信息,便于对它们进行实时指挥和调度。 顶坚北斗短报文
    的头像 发表于 03-21 11:13 1133次阅读