0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌AI新突破:为无声视频智能配音

CHANBAEK 来源:网络整理 2024-06-21 10:50 次阅读

近日,谷歌DeepMind团队公布了一项革命性的技术——利用AI为无声视频生成背景音乐的“video-to-audio”技术。这一技术的出现,不仅为视频创作领域带来了新的可能,也为观众带来了更加丰富的视听体验。

据悉,该模型的工作原理十分独特。首先,它会对用户输入的视频进行深度拆解,分析视频中的每一帧画面,提取出关键信息。然后,结合用户提供的文字提示,模型会利用扩散模型进行反复运算,以生成与视频画面相协调的背景声音。

值得注意的是,这一模型具有极高的灵活性和可扩展性。它可以为任何视频生成无限数量的音轨,无论是轻松愉悦的旋律,还是紧张刺激的音效,都能轻松应对。同时,通过调整提示词的内容,模型还能判断生成的音频是“正向性”还是“反向性”,从而令生成的声音更加贴近某些特定场景。

这项技术的应用前景十分广阔。对于视频创作者来说,他们无需再为寻找合适的背景音乐而烦恼,只需简单输入文字提示,AI就能为他们生成与视频内容完美契合的背景音乐。对于观众来说,他们也将享受到更加丰富多彩的视听盛宴,沉浸在更加真实、生动的视频世界中。

谷歌DeepMind团队的这一创新技术,无疑为人工智能领域带来了新的突破。它展示了AI在音视频创作领域的巨大潜力,也为未来的音视频创作带来了更多的可能性。我们有理由相信,在不久的将来,这一技术将在更广泛的领域得到应用,为人们的生活带来更多便利和乐趣。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6128

    浏览量

    105029
  • AI
    AI
    +关注

    关注

    87

    文章

    29928

    浏览量

    268241
  • 模型
    +关注

    关注

    1

    文章

    3140

    浏览量

    48673
收藏 人收藏

    评论

    相关推荐

    AI for Science:人工智能驱动科学创新》第二章AI for Science的技术支撑学习心得

    非常高兴本周末收到一本新书,也非常感谢平台提供阅读机会。 这是一本挺好的书,包装精美,内容详实,干活满满。 关于《AI for Science:人工智能驱动科学创新》第二章“AI
    发表于 10-14 09:16

    谷歌全球AI教育设立1.2亿美元基金

    在联合国未来峰会上,谷歌CEO桑达尔·皮查伊发表了一场激动人心的演讲,他将人工智能AI)誉为“迄今为止最具变革性的技术”,并承诺将这一力量用于推动全球教育进步。为此,谷歌宣布设立一项
    的头像 发表于 09-25 14:32 282次阅读

    谷歌任命原Character.AI首席执行官Gemini联合技术负责人

    近日,谷歌宣布了一项重要人事任命,原Character.AI的联合创始人兼首席执行官诺姆·沙泽尔(Noam Shazeer)已重返谷歌,并将担任其人工智能新项目“Gemini”的联合技
    的头像 发表于 08-26 11:06 464次阅读

    谷歌:聚焦AI与技术创新,携手中国开发者共筑未来

    2024年8月9日,备受瞩目的谷歌开发者大会——I/O Connect China圆满落幕。此次盛会,谷歌面向中国广大的开发者群体,全面展示了其在人工智能AI)、移动技术、云计算及W
    的头像 发表于 08-09 17:03 843次阅读

    谷歌推出旗下AI智能体管理项目Project Oscar

    在近日于印度班加罗尔盛大举行的2024 I/O Connect开发者活动上,谷歌公司隆重推出了Project Oscar项目,这一创新举措标志着开源软件项目管理领域迎来了AI智能体的全面赋能
    的头像 发表于 07-19 16:07 554次阅读

    ai智能视频监控系统 OpenCV

    ai智能视频监控系统选用数字图像处理、计算机视觉和机器视觉技术性,利用软件强劲的数据处理方法工作能力。ai智能
    的头像 发表于 07-08 08:46 329次阅读
    <b class='flag-5'>ai</b><b class='flag-5'>智能</b><b class='flag-5'>视频</b>监控系统 OpenCV

    荣耀新品将搭载谷歌AI功能,提升生成式AI体验

    荣耀于5月22日宣布,将在新款智能手机上集成谷歌AI功能,实现生成式AI体验。此外,新机还将得到谷歌云服务的支持。
    的头像 发表于 05-23 08:51 444次阅读

    微软发布视频编辑新功能:自动消除无声片段

    用户只需要在Clipchamp工具栏中启用人工智能建议,软件即可自动扫描视频并识别其中的静音片段。用户可以选择单独或批量删除这些无声音节。
    的头像 发表于 04-19 14:42 606次阅读

    谷歌推出能制作旅行攻略的AI工具

    谷歌近日发布了一项令人瞩目的新功能,它是一款能够借助自然语言对话帮助用户生成旅行行程和出游建议的AI工具。这款工具的推出,标志着谷歌在人工智能领域的又一重要
    的头像 发表于 03-29 11:08 614次阅读

    Nvidia利用人工智能将游戏角色变成聊天机器人

    英伟达正在展示开发者如何开始使用其人工智能“数字人”工具视频游戏角色配音、制作动画和生成对话。
    的头像 发表于 03-21 16:14 814次阅读

    谷歌DeepMind推出SIMI通用AI智能

    视频游戏中理解并遵循自然语言指令。这一突破性的技术成果标志着人工智能领域的一大步,使得机器能够更好地理解和适应人类的各种需求。
    的头像 发表于 03-18 11:39 877次阅读

    探索OpenAI Sora视频AI生成技术及其应用如何使用指南

    OpenAI的Sora现已扩展其能力范围,进入视频生成领域,标志着人工智能技术在多媒体内容创作上的一个重大突破。Sora的视频AI功能使得用
    的头像 发表于 02-20 12:01 1391次阅读

    谷歌发布AI新版本Gemini 1.5

    谷歌近日宣布推出其最新的人工智能AI)版本——Gemini 1.5,这一新版本在文本处理能力上实现了重大突破。据了解,Gemini 1.5 Pro的上下文窗口长度已经扩展到惊人的10
    的头像 发表于 02-19 11:05 1064次阅读

    谷歌推出AI扩散模型Lumiere

    近日,谷歌研究院重磅推出全新AI扩散模型Lumiere,这款模型基于谷歌自主研发的“Space-Time U-Net”基础架构,旨在实现视频生成的一次性完成,同时保证
    的头像 发表于 02-04 13:49 966次阅读

    人工智能的影响力正在蔓延

    2023人工智能/机器学习(AI/ML) 随着 Google Gemini AI 的发布而落下帷幕,它既是对 ChatGPT 的追赶,也是对多模式 AI
    发表于 12-27 18:16 265次阅读