0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌AI新突破:为无声视频智能配音

CHANBAEK 来源:网络整理 2024-06-21 10:50 次阅读

近日,谷歌DeepMind团队公布了一项革命性的技术——利用AI为无声视频生成背景音乐的“video-to-audio”技术。这一技术的出现,不仅为视频创作领域带来了新的可能,也为观众带来了更加丰富的视听体验。

据悉,该模型的工作原理十分独特。首先,它会对用户输入的视频进行深度拆解,分析视频中的每一帧画面,提取出关键信息。然后,结合用户提供的文字提示,模型会利用扩散模型进行反复运算,以生成与视频画面相协调的背景声音。

值得注意的是,这一模型具有极高的灵活性和可扩展性。它可以为任何视频生成无限数量的音轨,无论是轻松愉悦的旋律,还是紧张刺激的音效,都能轻松应对。同时,通过调整提示词的内容,模型还能判断生成的音频是“正向性”还是“反向性”,从而令生成的声音更加贴近某些特定场景。

这项技术的应用前景十分广阔。对于视频创作者来说,他们无需再为寻找合适的背景音乐而烦恼,只需简单输入文字提示,AI就能为他们生成与视频内容完美契合的背景音乐。对于观众来说,他们也将享受到更加丰富多彩的视听盛宴,沉浸在更加真实、生动的视频世界中。

谷歌DeepMind团队的这一创新技术,无疑为人工智能领域带来了新的突破。它展示了AI在音视频创作领域的巨大潜力,也为未来的音视频创作带来了更多的可能性。我们有理由相信,在不久的将来,这一技术将在更广泛的领域得到应用,为人们的生活带来更多便利和乐趣。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6009

    浏览量

    103597
  • AI
    AI
    +关注

    关注

    87

    文章

    27436

    浏览量

    265119
  • 模型
    +关注

    关注

    1

    文章

    2822

    浏览量

    48045
收藏 人收藏

    评论

    相关推荐

    谷歌I/O大会AI+AR眼镜原型揭幕,Meta/微美全息加速引领AR消费生态新篇章

    ”、生成式人工智能赋能谷歌搜索、以及一系列与图像、音乐、视频有关的生成式AI工具。   AI+AR眼镜原型机曝光   此外,本次发布会中,
    的头像 发表于 05-27 17:19 192次阅读
    <b class='flag-5'>谷歌</b>I/O大会<b class='flag-5'>AI</b>+AR眼镜原型揭幕,Meta/微美全息加速引领AR消费生态新篇章

    荣耀新品将搭载谷歌AI功能,提升生成式AI体验

    荣耀于5月22日宣布,将在新款智能手机上集成谷歌AI功能,实现生成式AI体验。此外,新机还将得到谷歌云服务的支持。
    的头像 发表于 05-23 08:51 176次阅读

    微软发布视频编辑新功能:自动消除无声片段

    用户只需要在Clipchamp工具栏中启用人工智能建议,软件即可自动扫描视频并识别其中的静音片段。用户可以选择单独或批量删除这些无声音节。
    的头像 发表于 04-19 14:42 274次阅读

    谷歌推出能制作旅行攻略的AI工具

    谷歌近日发布了一项令人瞩目的新功能,它是一款能够借助自然语言对话帮助用户生成旅行行程和出游建议的AI工具。这款工具的推出,标志着谷歌在人工智能领域的又一重要
    的头像 发表于 03-29 11:08 363次阅读

    迪思与百度智能云联手发布AI视频创作模型

    迪思传媒与百度智能云联手研发的AI视频创作模型D&S-AI Video于3月25日正式亮相,并成功集成至迪思AI智链平台。这一创新模型将传统
    的头像 发表于 03-26 11:46 498次阅读

    谷歌DeepMind推出SIMI通用AI智能

    视频游戏中理解并遵循自然语言指令。这一突破性的技术成果标志着人工智能领域的一大步,使得机器能够更好地理解和适应人类的各种需求。
    的头像 发表于 03-18 11:39 520次阅读

    谷歌发布新型AI模型Genie

    近日,谷歌推出了一款革命性的AI模型——Genie。这款模型能够将简单的文本提示、草图或初步想法迅速转化为一个可以互动和游戏的虚拟世界。这一突破性的技术无疑将改变人们创建和体验虚拟世界的方式。
    的头像 发表于 02-28 10:05 399次阅读

    探索OpenAI Sora视频AI生成技术及其应用如何使用指南

    OpenAI的Sora现已扩展其能力范围,进入视频生成领域,标志着人工智能技术在多媒体内容创作上的一个重大突破。Sora的视频AI功能使得用
    的头像 发表于 02-20 12:01 1088次阅读

    谷歌发布AI新版本Gemini 1.5

    谷歌近日宣布推出其最新的人工智能AI)版本——Gemini 1.5,这一新版本在文本处理能力上实现了重大突破。据了解,Gemini 1.5 Pro的上下文窗口长度已经扩展到惊人的10
    的头像 发表于 02-19 11:05 697次阅读

    谷歌推出AI扩散模型Lumiere

    近日,谷歌研究院重磅推出全新AI扩散模型Lumiere,这款模型基于谷歌自主研发的“Space-Time U-Net”基础架构,旨在实现视频生成的一次性完成,同时保证
    的头像 发表于 02-04 13:49 697次阅读

    云知声全新推出AIGC内容创作平台蓝藻AI

    近日,云知声基于智能语音技术和山海大模型技术,全新推出AIGC内容创作平台——蓝藻AI,为创作者提供AI声音克隆、AI文字配音
    的头像 发表于 01-10 13:38 463次阅读

    AI分布式无纸化交互系统:突破传统,引领AI智能会商新革命!

    随着AI人工智能技术的大规模应用于发展,传统的音视频会议系统迎来了又一次历史变革。虽然目前音视会议系统已经实现了数字化,并且具备了一定的智能化与交互能力,也实现了无纸化绿色办公,但是在
    的头像 发表于 12-29 15:13 360次阅读
    <b class='flag-5'>AI</b>分布式无纸化交互系统:<b class='flag-5'>突破</b>传统,引领<b class='flag-5'>AI</b><b class='flag-5'>智能</b>会商新革命!

    【KV260视觉入门套件试用体验】Vitis-AI加速的YOLOX视频目标检测示例体验和原理解析

    Vitis AI图像分类示例程序 - 智能硬件论坛 - 电子技术论坛 - 广受欢迎的专业电子论坛! (elecfans.com) 2.3 编译YOLOX视频目标检测示例程序 KV260使用DPU镜像的SD卡
    发表于 10-06 23:32

    AI智能呼叫中心

    对这些数据的深入分析,呼叫中心可以有效改进服务质量、优化流程并提升业绩,此外,AI智能呼叫中心还可以基于数据分析的结果,进行智能预测并制定更加科学的策略,企业的未来决策提供有力支持。
    发表于 09-20 17:53