Meta 近日在一篇题为 “High Fidelity Neural Audio Compression”(高保真神经音频压缩)的论文中公布了一项名为 "EnCodec" 的开源音频压缩技术,该技术由 AI 驱动,可以在音频质量没有损失的前提下,将音频压缩到比 MP3 格式还要小 10 倍的程度。
Meta 将这项技术的实现方法分成了一个由三部分组成的系统,经过训练后的 AI 可以将音频压缩到所需的目标大小,其实现过程如下:
首先,编码器将未压缩的数据转换为较低帧率的 "latent space" 表示(representation);
然后,量化器将这个表示压缩到目标大小,同时跟踪最重要的信息,这些信息以后将被用于重建原始信号(这个压缩信号将通过网络发送或保存在磁盘上);
最后,解码器使用单个 CPU 上的神经网络将压缩的数据实时地转变回音频;
至于应用,Meta 表示这种由人工智能驱动的 "超压缩音频" 可以在恶劣的网络条件下获得更快、更优质的通话效果。作为一家 “梭哈” 元宇宙的公司,这项技术还可以提供更加丰富的元宇宙体验(视频会议、影音流媒体、VR 游戏等),而不需要提高带宽。 除了语音通话,这项技术同样可以应用于音乐领域,未来我们有望可以获得高品质、小体积的音频文件。 目前这项技术仍处于研究阶段,源代码和一些音频样本都已公开在 GitHub 上:https://github.com/facebookresearch/encodec
审核编辑 :李倩
-
人工智能
+关注
关注
1797文章
47888浏览量
240897 -
Meta
+关注
关注
0文章
293浏览量
11455
原文标题:比MP3小10倍,Meta公开全新音频压缩技术
文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
KT142C语音芯片支持的语音文件格式什么?Mp3还是wav呢?
![KT142C语音芯片支持的语音文件格式什么?<b class='flag-5'>Mp3</b>还是wav呢?](https://file1.elecfans.com/web3/M00/08/90/wKgZPGeyp6uAA53oAAOvEcwlW0w266.png)
学习机MP3语音芯片方案:WMV硬解码芯片,N9301-316
![学习机<b class='flag-5'>MP3</b>语音芯片方案:WMV硬解码芯片,N9301-316](https://file.elecfans.com/web2/M00/42/BC/pYYBAGJ6JAOAWhY7AAAjPnDlpp8975.jpg)
KT148A语音芯片一个mp3语音,有办法分成一段一段的吗
![KT148A语音芯片一个<b class='flag-5'>mp3</b>语音,有办法分成一段一段的吗](https://file1.elecfans.com/web3/M00/06/E3/wKgZPGeQp_WABTQNAADog_m0slw077.png)
N930X指定曲目播放MP3音乐芯片:提升睡眠仪体验
![N930X指定曲目播放<b class='flag-5'>MP3</b>音乐芯片:提升睡眠仪体验](https://file.elecfans.com/web2/M00/42/BC/pYYBAGJ6JAOAWhY7AAAjPnDlpp8975.jpg)
请问TLV320DAC3120可以用作MP3的解压芯片吗?
九芯电子电子琴语音芯片的无限可能——N930X-S16 MP3解码芯片
![九芯电子电子琴语音芯片的无限可能——N930X-S16 <b class='flag-5'>MP3</b>解码芯片](https://file.elecfans.com/web2/M00/42/BC/pYYBAGJ6JAOAWhY7AAAjPnDlpp8975.jpg)
ESP32-PICO-V3-02实现MP3播放遇到的几个疑问求解
N9300-S16音乐MP3芯片:电子琴的革命性突破
![N9300-S16音乐<b class='flag-5'>MP3</b>芯片:电子琴的革命性突破](https://file.elecfans.com/web2/M00/42/BC/pYYBAGJ6JAOAWhY7AAAjPnDlpp8975.jpg)
评论