0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

比MP3小10倍,Meta公开全新音频压缩技术

OSC开源社区 来源:OSC开源社区 作者:OSC开源社区 2022-11-07 11:39 次阅读

Meta 近日在一篇题为 “High Fidelity Neural Audio Compression”(高保真神经音频压缩)的论文中公布了一项名为 "EnCodec" 的开源音频压缩技术,该技术由 AI 驱动,可以在音频质量没有损失的前提下,将音频压缩到比 MP3 格式还要小 10 倍的程度。

bc8c974c-5dd1-11ed-a3b6-dac502259ad0.jpg

Meta 将这项技术的实现方法分成了一个由三部分组成的系统,经过训练后的 AI 可以将音频压缩到所需的目标大小,其实现过程如下:

首先,编码器将未压缩的数据转换为较低帧率的 "latent space" 表示(representation);

然后,量化器将这个表示压缩到目标大小,同时跟踪最重要的信息,这些信息以后将被用于重建原始信号(这个压缩信号将通过网络发送或保存在磁盘上);

最后,解码器使用单个 CPU 上的神经网络将压缩的数据实时地转变回音频;

至于应用,Meta 表示这种由人工智能驱动的 "超压缩音频" 可以在恶劣的网络条件下获得更快、更优质的通话效果。作为一家 “梭哈” 元宇宙的公司,这项技术还可以提供更加丰富的元宇宙体验(视频会议、影音流媒体、VR 游戏等),而不需要提高带宽。 除了语音通话,这项技术同样可以应用于音乐领域,未来我们有望可以获得高品质、小体积的音频文件。 目前这项技术仍处于研究阶段,源代码和一些音频样本都已公开在 GitHub 上:https://github.com/facebookresearch/encodec

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1791

    文章

    47229

    浏览量

    238345
  • Meta
    +关注

    关注

    0

    文章

    270

    浏览量

    11385

原文标题:比MP3小10倍,Meta公开全新音频压缩技术

文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    N930X指定曲目播放MP3音乐芯片:提升睡眠仪体验

    N930X MP3芯片集成硬解码,支持定制播放、智能定时、低功耗、自主更新,兼容多种控制及音频格式,提升睡眠仪体验,满足高质量睡眠追求。
    的头像 发表于 12-11 14:29 145次阅读
    N930X指定曲目播放<b class='flag-5'>MP3</b>音乐芯片:提升睡眠仪体验

    N930X指定曲目播放MP3音乐芯片:提升睡眠仪体验

    和自然之声,帮助人们更好地入睡,提高睡眠质量。而N930X指定曲目播放MP3音乐芯片,就是这款睡眠仪的核心部件。芯片简介N930X是一个提供串口的MP3芯片,完美的集
    的头像 发表于 12-11 14:25 81次阅读
    N930X指定曲目播放<b class='flag-5'>MP3</b>音乐芯片:提升睡眠仪体验

    魅族E2 MP3使用手册(说明书)

    魅族 E2 MP3 操作使用手册(说明书)
    发表于 11-12 13:41 0次下载

    请问TLV320DAC3120可以用作MP3的解压芯片吗?

    TLV320DAC3120项目要求用喇叭播MP3音频,我选用的方案是MCU+TLV320DAC3120,计划按以下步骤进行: 1. MCU通过I2C来配置TLV320DAC3120 2. MCU
    发表于 11-06 06:26

    能在DSP的存储器上存MP3或其他格式的音频文件,由DSP读后控制TLV320AIC23转换成语音?

    我想用TLV320AIC23和DSP做一个音频系统。我想问一下能在DSP的存储器上存MP3或其他格式的音频文件,由DSP读后控制TLV320AIC23转换成语音?有没有好的方案推荐谢谢!
    发表于 11-01 06:45

    请问如何把WAV,MP3格式的音频文件转化为16位的数据IIS格式?

    你好,请问如何把WAV,MP3格式的音频文件转化为16位的数据IIS格式?
    发表于 10-23 07:24

    九芯电子电子琴语音芯片的无限可能——N930X-S16 MP3解码芯片

    播放,是置入了音乐芯片,目前流行的高性价比语音芯片N930X音乐芯片;此款芯片是一个提供串口的MP3芯片,完美地集成了MP3、WMV的硬解码芯片,在音频压缩方面有着
    的头像 发表于 10-13 08:01 273次阅读
    九芯电子电子琴语音芯片的无限可能——N930X-S16 <b class='flag-5'>MP3</b>解码芯片

    使用example中的pwm播放mp3,在mp3_music_read_cb中使用fread读取,会出现fread读取异常怎么解决?

    使用example中的pwm播放mp3,默认是没问题。然后想把mp3放到spiffs中,然后从spiffs中调用,碰到问题: 1:如果在mp3_music_read_cb中使用fread读取,最终
    发表于 06-28 07:37

    ESP32-PICO-V3-02实现MP3播放遇到的几个疑问求解

    我之前做过一套Atmega328P+YX6300+W25Q128(PSRAM)+PAM8302实现MP3播放器。出于空间与接口的考虑,想利用ESP32实现该功能。 由于想利用PICO内部的存储用于
    发表于 06-28 06:47

    SONY MP3不刷系统汉化界面

    SONY部分MP3播放器不用重新刷系统,目前试验过:X1050系列、A35等,香水瓶、鱼雷系列不能用的。附件中的文件用电脑操作一下,就可以汉化的,收音也可以改为国内频率的。具体操作见附件。
    发表于 06-19 14:14 12次下载

    N9300-S16音乐MP3芯片:电子琴的革命性突破

    在数字音乐技术的浪潮中,N9300-S16音乐MP3芯片以其卓越的性能和广泛的应用领域,成为了电子琴领域的一次革命性突破。那么,N9300-S16究竟是何方神圣?它的优势又在哪里?它在电子琴上又能
    的头像 发表于 05-09 08:06 669次阅读
    N9300-S16音乐<b class='flag-5'>MP3</b>芯片:电子琴的革命性突破

    【RTC程序设计:实时音视频权威指南】音视频的编解码压缩技术

    技术可以实现不同的高效压缩和解压缩,常用的就是MP4文件。 MP4是一种容器格式,包含多种类型的媒体文件,如视频,
    发表于 04-28 21:04

    嵌入式操作教程_数字信号处理_音频编解码:3-6 AAC音频解码实验

    压缩算法,如AC-3MP3等。并且其质量可以同未压缩的CD音质相媲美。 (2)同其他类似的音频编码算法一样,AAC也是采用了变换编码算法,
    发表于 04-11 09:22

    数字信号处理实验操作教程:3-3 mp3音频编码实验(AD7606采集)

    Audio Layer III),简称为MP3。它被设计用来大幅度地降低音频数据量。利用 MPEG Audio Layer 3技术,将音乐以1:
    发表于 04-03 16:41

    mp3或者电脑的音频输出接口3.5mm音频电路转换成mic 的电路信号

    假设我有一个电路现在是接一个电容式话筒麦克,我想把她改成 mp3或者电脑的音频接口3.5mm音频电路 来替换 mic 的输入, 我理解应该是一个音频变压器. 或者一个转换芯片,请问有成
    发表于 03-29 11:34