0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

比MP3小10倍,Meta公开全新音频压缩技术

OSC开源社区 来源:OSC开源社区 作者:OSC开源社区 2022-11-07 11:39 次阅读

Meta 近日在一篇题为 “High Fidelity Neural Audio Compression”(高保真神经音频压缩)的论文中公布了一项名为 "EnCodec" 的开源音频压缩技术,该技术由 AI 驱动,可以在音频质量没有损失的前提下,将音频压缩到比 MP3 格式还要小 10 倍的程度。

bc8c974c-5dd1-11ed-a3b6-dac502259ad0.jpg

Meta 将这项技术的实现方法分成了一个由三部分组成的系统,经过训练后的 AI 可以将音频压缩到所需的目标大小,其实现过程如下:

首先,编码器将未压缩的数据转换为较低帧率的 "latent space" 表示(representation);

然后,量化器将这个表示压缩到目标大小,同时跟踪最重要的信息,这些信息以后将被用于重建原始信号(这个压缩信号将通过网络发送或保存在磁盘上);

最后,解码器使用单个 CPU 上的神经网络将压缩的数据实时地转变回音频;

至于应用,Meta 表示这种由人工智能驱动的 "超压缩音频" 可以在恶劣的网络条件下获得更快、更优质的通话效果。作为一家 “梭哈” 元宇宙的公司,这项技术还可以提供更加丰富的元宇宙体验(视频会议、影音流媒体、VR 游戏等),而不需要提高带宽。 除了语音通话,这项技术同样可以应用于音乐领域,未来我们有望可以获得高品质、小体积的音频文件。 目前这项技术仍处于研究阶段,源代码和一些音频样本都已公开在 GitHub 上:https://github.com/facebookresearch/encodec

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1789

    文章

    46562

    浏览量

    236881
  • Meta
    +关注

    关注

    0

    文章

    256

    浏览量

    11325

原文标题:比MP3小10倍,Meta公开全新音频压缩技术

文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    请问如何把WAV,MP3格式的音频文件转化为16位的数据IIS格式?

    你好,请问如何把WAV,MP3格式的音频文件转化为16位的数据IIS格式?
    发表于 10-23 07:24

    嵌入式操作教程_数字信号处理_音频编解码:3-6 AAC音频解码实验

    压缩算法,如AC-3MP3等。并且其质量可以同未压缩的CD音质相媲美。 (2)同其他类似的音频编码算法一样,AAC也是采用了变换编码算法,
    发表于 04-11 09:22

    数字信号处理实验操作教程:3-3 mp3音频编码实验(AD7606采集)

    Audio Layer III),简称为MP3。它被设计用来大幅度地降低音频数据量。利用 MPEG Audio Layer 3技术,将音乐以1:
    发表于 04-03 16:41

    mp3或者电脑的音频输出接口3.5mm音频电路转换成mic 的电路信号

    假设我有一个电路现在是接一个电容式话筒麦克,我想把她改成 mp3或者电脑的音频接口3.5mm音频电路 来替换 mic 的输入, 我理解应该是一个音频变压器. 或者一个转换芯片,请问有成
    发表于 03-29 11:34

    WT2003Hx系列高品质语音芯片MP3音频解码IC的特征与应用优势

    在嵌入式语音领域,WT2003Hx系列高品质语音芯片以其卓越的音频解码性能脱颖而出。本文将深入研究该系列芯片的特色与应用优势,重点关注其支持wav、Mp3格式音频解码、高品质播放等方面。特色一:支持
    的头像 发表于 12-15 08:35 529次阅读
    WT2003Hx系列高品质语音芯片<b class='flag-5'>MP3</b><b class='flag-5'>音频</b>解码IC的特征与应用优势

    WAV to MP3Converter批量将WAV转换为MP3

    MPEG-1或MPEG-2音频层III,通常称为MP3,是一种用于数字音频音频编码格式,它使用有损数据压缩的形式。它是消费者
    的头像 发表于 12-13 16:22 982次阅读
    WAV to <b class='flag-5'>MP3</b>Converter批量将WAV转换为<b class='flag-5'>MP3</b>

    WT2003H0-16S语音芯片MP3音频播放在低频按摩仪中的应用介绍

    播放技术应用于低频按摩仪中,成为了新的创新趋势,进一步提升了按摩仪的使用体验。一、WT2003H0-16S语音芯片MP3音频播放技术简述WT2003H0-16S是一
    的头像 发表于 12-08 09:03 577次阅读
    WT2003H0-16S语音芯片<b class='flag-5'>MP3</b><b class='flag-5'>音频</b>播放在低频按摩仪中的应用介绍

    WT2003H MP3语音芯片方案:强大、灵活且易于集成的音频解决方案

    音频解决方案。1、强大的音频处理能力WT2003HMP3语音芯片方案支持MP3和WAV两种最常用的音频格式,这意味着它可以处理大量的
    的头像 发表于 12-02 09:39 426次阅读
    WT2003H <b class='flag-5'>MP3</b>语音芯片方案:强大、灵活且易于集成的<b class='flag-5'>音频</b>解决方案

    唯创知音高品质MP3音频解码语音芯片WT2003Hx的特征优势与应用场景

    WT2003Hx的特征优势以及其在各个领域的应用场景。一、特征优势1、高品质音频输出:WT2003Hx采用了先进的音频处理技术,能够提供高品质的MP3
    的头像 发表于 11-24 10:07 503次阅读
    唯创知音高品质<b class='flag-5'>MP3</b><b class='flag-5'>音频</b>解码语音芯片WT2003Hx的特征优势与应用场景

    芯知识 | MP3语音芯片IC的优势特征及其在现代科技应用中的价值

    的优势特征MP3语音芯片具有多种显著的优势特征,其中包括:(1)高品质音质:MP3语音芯片采用先进的音频编解码技术,能够实现高品质的音频输出
    的头像 发表于 11-23 14:41 551次阅读
    芯知识 | <b class='flag-5'>MP3</b>语音芯片IC的优势特征及其在现代科技应用中的价值

    芯知识 | MP3语音芯片IC的优势特征及其在现代科技应用中的价值

    的优势特征 MP3语音芯片具有多种显著的优势特征,其中包括: (1)高品质音质: MP3语音芯片采用先进的音频编解码技术,能够实现高品质的音频
    的头像 发表于 11-23 11:37 592次阅读

    MP3播放器详细设计方案

    简介:开发工具:keil7 主要IC:at89c51sdnd1(atmel) 说明:mp3播放器详细设计方案,包括电路原理图,物料,源码,开发文档,芯片datasheet等。 用途:单芯片mp3的设计实现。
    发表于 11-15 14:36 7次下载
    <b class='flag-5'>MP3</b>播放器详细设计方案

    硬盘MP3 player的原理图

    电子发烧友网站提供《硬盘MP3 player的原理图.rar》资料免费下载
    发表于 11-10 09:41 5次下载
    硬盘<b class='flag-5'>MP3</b> player的原理图

    MP3电路设计原理图

    简介:MP3电路原理图:Block Digram、Revision History、NANO、AUDIO、LCD、MEMORY、POWER&KEY。
    发表于 11-09 15:10 4次下载
    <b class='flag-5'>MP3</b>电路设计原理图

    国产嵌入式教学实验箱_创龙教仪_DSP教学实验箱:3-4 mp3音频解码实验

    Layer 3技术,将音乐以1:10 甚至 1:12 的压缩率,压缩成容量较小的文件,而对于大多数用户来说重放的音质与最初的不
    发表于 11-07 13:48