比MP3小10倍，Meta公开全新音频压缩技术-电子发烧友网

Meta 近日在一篇题为 “High Fidelity Neural Audio Compression”（高保真神经音频压缩）的论文中公布了一项名为 "EnCodec" 的开源音频压缩技术，该技术由 AI 驱动，可以在音频质量没有损失的前提下，将音频压缩到比 MP3 格式还要小 10 倍的程度。

Meta 将这项技术的实现方法分成了一个由三部分组成的系统，经过训练后的 AI 可以将音频压缩到所需的目标大小，其实现过程如下：

首先，编码器将未压缩的数据转换为较低帧率的 "latent space" 表示（representation）；

然后，量化器将这个表示压缩到目标大小，同时跟踪最重要的信息，这些信息以后将被用于重建原始信号（这个压缩信号将通过网络发送或保存在磁盘上）；

最后，解码器使用单个 CPU 上的神经网络将压缩的数据实时地转变回音频；

至于应用，Meta 表示这种由人工智能驱动的 "超压缩音频" 可以在恶劣的网络条件下获得更快、更优质的通话效果。作为一家 “梭哈” 元宇宙的公司，这项技术还可以提供更加丰富的元宇宙体验（视频会议、影音流媒体、VR 游戏等），而不需要提高带宽。除了语音通话，这项技术同样可以应用于音乐领域，未来我们有望可以获得高品质、小体积的音频文件。目前这项技术仍处于研究阶段，源代码和一些音频样本都已公开在 GitHub 上：https://github.com/facebookresearch/encodec

审核编辑：李倩

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

人工智能

人工智能

+关注

关注
1797

文章
47888

浏览量
240897
Meta

Meta

+关注

关注
0

文章
293

浏览量
11455

原文标题：比MP3小10倍，Meta公开全新音频压缩技术

文章出处：【微信号：OSC开源社区，微信公众号：OSC开源社区】欢迎添加关注！文章转载请注明出处。

KT142C语音芯片支持的语音文件格式什么？Mp3还是wav呢？

真没有必要 2、如果客户强烈需要，我们也是可以添加的。但是KT142C内置的宝贵可用空间就变少了 3、因为同等音质、同等时长的mp3文件，比wav文件体积小很多很多。所以优先压缩

发表于 02-17 11:07 •53次阅读

学习机MP3语音芯片方案：WMV硬解码芯片，N9301-316

在当今数字化时代，学习机已不再仅仅是静态的物品。随着技术的快速发展和不断探索创新方法，人们将音乐与互动学习相融合，为儿童创造出更加富有创意和学习机产品。其中，九芯电子N9301系列MP3解码芯片

发表于 02-07 18:31 •55次阅读

KT148A语音芯片一个mp3语音，有办法分成一段一段的吗

第一步：生成语音素材：到这一步，就实现了语音素材的生成，下载下来就是一整个mp3文件详见KT148A资料包里面的文档说明第二步：将需要的语音素材剪裁使用的是Adobe

发表于 01-22 16:11 •124次阅读

N930X指定曲目播放MP3音乐芯片：提升睡眠仪体验

N930X MP3芯片集成硬解码，支持定制播放、智能定时、低功耗、自主更新，兼容多种控制及音频格式，提升睡眠仪体验，满足高质量睡眠追求。

发表于 12-11 14:29 •242次阅读

N930X指定曲目播放MP3音乐芯片：提升睡眠仪体验

和自然之声，帮助人们更好地入睡，提高睡眠质量。而N930X指定曲目播放MP3音乐芯片，就是这款睡眠仪的核心部件。芯片简介N930X是一个提供串口的MP3芯片，完美的集

发表于 12-11 14:25 •169次阅读

魅族E2 MP3使用手册（说明书）

魅族 E2 MP3 操作使用手册（说明书）

发表于 11-12 13:41 •0次下载

请问TLV320DAC3120可以用作MP3的解压芯片吗？

TLV320DAC3120项目要求用喇叭播MP3音频，我选用的方案是MCU+TLV320DAC3120，计划按以下步骤进行： 1. MCU通过I2C来配置TLV320DAC3120 2. MCU

发表于 11-06 06:26

请问如何把WAV,MP3格式的音频文件转化为16位的数据IIS格式？

你好，请问如何把WAV,MP3格式的音频文件转化为16位的数据IIS格式？

发表于 10-23 07:24

九芯电子电子琴语音芯片的无限可能——N930X-S16 MP3解码芯片

播放，是置入了音乐芯片，目前流行的高性价比语音芯片N930X音乐芯片；此款芯片是一个提供串口的MP3芯片，完美地集成了MP3、WMV的硬解码芯片，在音频压缩方面有着

发表于 10-13 08:01 •402次阅读

ESP32-PICO-V3-02实现MP3播放遇到的几个疑问求解

我之前做过一套Atmega328P+YX6300+W25Q128（PSRAM）+PAM8302实现MP3播放器。出于空间与接口的考虑，想利用ESP32实现该功能。由于想利用PICO内部的存储用于

发表于 06-28 06:47

N9300-S16音乐MP3芯片：电子琴的革命性突破

在数字音乐技术的浪潮中，N9300-S16音乐MP3芯片以其卓越的性能和广泛的应用领域，成为了电子琴领域的一次革命性突破。那么，N9300-S16究竟是何方神圣？它的优势又在哪里？它在电子琴上又能

发表于 05-09 08:06 •803次阅读

【RTC程序设计：实时音视频权威指南】音视频的编解码压缩技术

和技术可以实现不同的高效压缩和解压缩，常用的就是MP4文件。 MP4是一种容器格式，包含多种类型的媒体文件，如视频，

发表于 04-28 21:04

嵌入式操作教程_数字信号处理_音频编解码：3-6 AAC音频解码实验

压缩算法，如AC-3、MP3等。并且其质量可以同未压缩的CD音质相媲美。 (2)同其他类似的音频编码算法一样，AAC也是采用了变换编码算法，

发表于 04-11 09:22

数字信号处理实验操作教程：3-3 mp3音频编码实验（AD7606采集）

Audio Layer III），简称为MP3。它被设计用来大幅度地降低音频数据量。利用 MPEG Audio Layer 3 的技术，将音乐以1:

发表于 04-03 16:41

mp3或者电脑的音频输出接口3.5mm音频电路转换成mic 的电路信号

假设我有一个电路现在是接一个电容式话筒麦克,我想把她改成 mp3或者电脑的音频接口3.5mm音频电路来替换 mic 的输入, 我理解应该是一个音频变压器. 或者一个转换芯片,请问有成

发表于 03-29 11:34

搜索历史

比MP3小10倍，Meta公开全新音频压缩技术

评论

KT142C语音芯片支持的语音文件格式什么？Mp3还是wav呢？

学习机MP3语音芯片方案：WMV硬解码芯片，N9301-316

KT148A语音芯片一个mp3语音，有办法分成一段一段的吗

N930X指定曲目播放MP3音乐芯片：提升睡眠仪体验

N930X指定曲目播放MP3音乐芯片：提升睡眠仪体验

魅族E2 MP3使用手册（说明书）

请问TLV320DAC3120可以用作MP3的解压芯片吗？

请问如何把WAV,MP3格式的音频文件转化为16位的数据IIS格式？

九芯电子电子琴语音芯片的无限可能——N930X-S16 MP3解码芯片

ESP32-PICO-V3-02实现MP3播放遇到的几个疑问求解

N9300-S16音乐MP3芯片：电子琴的革命性突破

【RTC程序设计：实时音视频权威指南】音视频的编解码压缩技术

嵌入式操作教程_数字信号处理_音频编解码：3-6 AAC音频解码实验

数字信号处理实验操作教程：3-3 mp3音频编码实验（AD7606采集）

mp3或者电脑的音频输出接口3.5mm音频电路转换成mic 的电路信号