0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Stability AI推出Stable audio的文本到音频生成人工智能平台

IEEE电气电子工程师 来源:IEEE电气电子工程师 2023-09-20 10:20 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Stability AI是一家主要以人工智能生成的视觉效果而闻名的公司,它推出了一个名为Stable audio的文本到音频生成人工智能平台。

Stable Audio使用扩散模型,与该公司更受欢迎的图像平台Stable diffusion的AI模型相同,但使用音频而非图像进行训练。用户可以使用它为任何项目生成歌曲或背景音频。

音频扩散模型倾向于生成固定长度的音频,这对音乐制作来说很糟糕,因为歌曲的长度可能不同。Stability AI的新平台允许用户发出不同长度的声音,要求公司对音乐进行训练,并在歌曲的开始和结束时间周围添加文本元数据。

同时,它可以实现实时的音频生成,无需等待长时间的渲染过程。Stability AI 宣称,Stable Audio 模型可以在一秒内渲染出 95 秒的立体声音频,并且只需要一个 NVIDIA A100 GPU

并且,Stable Audio是一个开源的项目,任何人都可以免费使用和修改。Stability AI 希望通过开源的方式促进 AI 领域的创新和发展,并让更多人享受到 AI 技术带来的便利和乐趣。

该公司在一份声明中表示:“Stable Audio代表了Stability AI生成音频研究实验室Harmonai的尖端音频生成研究。我们会继续改进我们的模型架构、数据集和训练程序,以提高输出质量、可控性、推理速度和输出长度。”

文本到音频的生成并不是什么新鲜事,因为生成人工智能领域的其他大牌一直在玩弄这个概念。Meta于8月发布了AudioCraft,这是一套生成的人工智能模型,有助于根据提示创建听起来自然的ERM、声音和音乐。到目前为止,它只提供给研究人员和一些音频专业人士。谷歌的MusicLM也可以让人们产生声音,但只对研究人员开放。

审核编辑:彭菁

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 音频
    +关注

    关注

    31

    文章

    3245

    浏览量

    86509
  • AI
    AI
    +关注

    关注

    91

    文章

    41885

    浏览量

    302993
  • 人工智能
    +关注

    关注

    1821

    文章

    50485

    浏览量

    267632
  • 模型
    +关注

    关注

    1

    文章

    3865

    浏览量

    52325
  • 数据集
    +关注

    关注

    4

    文章

    1242

    浏览量

    26286

原文标题:Stability AI发布AI音频平台Stable Audio

文章出处:【微信号:IEEE_China,微信公众号:IEEE电气电子工程师】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    嵌入式人工智能课程(华清远见)

    嵌入式 AI 编译器优化:华清远见课程,解锁极致端侧性能 随着人工智能从云端全面向边缘侧和终端侧下沉,“万物智联”的时代已经悄然到来。然而,在这股浪潮背后,隐藏着一个巨大的技术鸿沟:在算力受限
    发表于 04-16 18:47

    人工智能测试开发训练营2期

    霍格沃兹干货:AI 测试常见误区与避坑指南 在2026年的技术版图中,人工智能已不再是锦上添花的点缀,而是软件质量的基石。然而,随着大模型(LLM)和生成AI的深度应用,传统的测试方
    发表于 04-11 16:42

    NVIDIA和ComfyUI携手简化本地AI频生成工作流

    借助 ComfyUI 的应用视图、NVIDIA RTX Video 超分辨率和全新的 NVFP4 模型,AI 驱动的视频生成更加易用。
    的头像 发表于 03-14 16:37 2607次阅读
    NVIDIA和ComfyUI携手简化本地<b class='flag-5'>AI</b>视<b class='flag-5'>频生成</b>工作流

    LE Audio融合BLE双模重塑蓝牙音频生态的革命性技术

    在蓝牙技术诞生后的第28个年头,一场由LE Audio(Low Energy Audio,低功耗音频)引发的音频技术革命正在席卷全球。这项由蓝牙技术联盟(Bluetooth SIG)于
    的头像 发表于 03-11 15:11 387次阅读

    开发智能体配置-内容合规

    智能体上架前,需完成“人工智能生成合成内容标识”和“大模型备案信息”填写 ,以供平台审核;可在智能体【配置】-【内容合规】中填写。
    发表于 02-07 11:44

    生成人工智能会让自动驾驶更灵活吗?

    [首发于智驾最前沿微信公众号]每当提到“人工智能”(AI),很多人第一反应就是想到它能实现识别图片、听懂语音、做出判断、推荐内容等任务。但在AI领域,还有一个更细致的分类,那便是生成
    的头像 发表于 12-23 10:05 710次阅读
    <b class='flag-5'>生成</b>式<b class='flag-5'>人工智能</b>会让自动驾驶更灵活吗?

    全球首个动漫专属AI频生成平台Animon,国内版&quot;萌动AI&quot;正式发布

    平台Animon正式推出国内版产品——"萌动AI",为数亿创作者带来视觉革命。该平台由专业的动漫制作团队和顶尖的AI技术团队联合打造,并将专
    的头像 发表于 09-25 12:33 1461次阅读

    利用超微型 Neuton ML 模型解锁 SoC 边缘人工智能

    的框架小 10 倍,速度也快 10 倍,甚至可以在最先进的边缘设备上进行人工智能处理。在这篇博文中,我们将介绍这对开发人员意味着什么,以及使用 Neuton 模型如何改进您的开发和终端
    发表于 08-31 20:54

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    应用场景。从数据采集,模型推理,都能完整且自如地参与,轻松解锁人工智能全流程实训,让你深度体验AI技术的魅力 。 四、九门课程全覆盖,满足多元学习需求 对于高校教学或者技术学习来说,课程覆盖的广度
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    应用场景。从数据采集,模型推理,都能完整且自如地参与,轻松解锁人工智能全流程实训,让你深度体验AI技术的魅力 。 四、九门课程全覆盖,满足多元学习需求 对于高校教学或者技术学习来说,课程覆盖的广度
    发表于 08-07 14:23

    人工智能技术的现状与未来发展趋势

    人工智能技术的现状与未来发展趋势     近年来,人工智能AI)技术迅猛发展,深刻影响着各行各业。从计算机视觉自然语言处理,从自动驾驶
    的头像 发表于 07-16 15:01 2439次阅读

    迅为RK3588开发板Linux安卓麒麟瑞芯微国产工业AI人工智能

    迅为RK3588开发板Linux安卓麒麟瑞芯微国产工业AI人工智能
    发表于 07-14 11:23

    生成人工智能认证:重构AI时代的人才培养与职业跃迁路径

    ,恰似一座连接技术前沿与个体成长的桥梁,既承载着时代对人才的迫切需求,也指向着未来职场的核心竞争力。 一、技术革命的双重性:赋能与失衡并存 生成人工智能的突破性,在于其首次让机器具备了“无中生有”的创造力。从文本生成
    的头像 发表于 05-23 09:29 1053次阅读

    生成人工智能认证:重塑AI时代职业版图的钥匙

    在科技浪潮席卷全球的今天,人工智能AI)已从科幻概念进化为驱动社会变革的核心力量。其中,生成人工智能(Generative AI)作为技
    的头像 发表于 05-23 09:18 821次阅读

    生成人工智能认证:重塑AI职业生态的底层逻辑

    人工智能技术渗透至社会毛细血管的今天,生成人工智能(Generative AI)的崛起正在改写人类与技术的协作范式。从ChatGPT引爆的全球热潮,
    的头像 发表于 05-23 09:17 990次阅读