0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

比MP3小10倍,Meta公开全新音频压缩技术

OSC开源社区 来源:OSC开源社区 作者:OSC开源社区 2022-11-07 11:39 次阅读

Meta 近日在一篇题为 “High Fidelity Neural Audio Compression”(高保真神经音频压缩)的论文中公布了一项名为 "EnCodec" 的开源音频压缩技术,该技术由 AI 驱动,可以在音频质量没有损失的前提下,将音频压缩到比 MP3 格式还要小 10 倍的程度。

bc8c974c-5dd1-11ed-a3b6-dac502259ad0.jpg

Meta 将这项技术的实现方法分成了一个由三部分组成的系统,经过训练后的 AI 可以将音频压缩到所需的目标大小,其实现过程如下:

首先,编码器将未压缩的数据转换为较低帧率的 "latent space" 表示(representation);

然后,量化器将这个表示压缩到目标大小,同时跟踪最重要的信息,这些信息以后将被用于重建原始信号(这个压缩信号将通过网络发送或保存在磁盘上);

最后,解码器使用单个 CPU 上的神经网络将压缩的数据实时地转变回音频;

至于应用,Meta 表示这种由人工智能驱动的 "超压缩音频" 可以在恶劣的网络条件下获得更快、更优质的通话效果。作为一家 “梭哈” 元宇宙的公司,这项技术还可以提供更加丰富的元宇宙体验(视频会议、影音流媒体、VR 游戏等),而不需要提高带宽。 除了语音通话,这项技术同样可以应用于音乐领域,未来我们有望可以获得高品质、小体积的音频文件。 目前这项技术仍处于研究阶段,源代码和一些音频样本都已公开在 GitHub 上:https://github.com/facebookresearch/encodec

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1797

    文章

    47888

    浏览量

    240897
  • Meta
    +关注

    关注

    0

    文章

    293

    浏览量

    11455

原文标题:比MP3小10倍,Meta公开全新音频压缩技术

文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    KT142C语音芯片支持的语音文件格式什么?Mp3还是wav呢?

    真没有必要 2、如果客户强烈需要,我们也是可以添加的。但是KT142C内置的宝贵可用空间就变少了 3、因为同等音质、同等时长的mp3文件,wav文件体积小很多很多。 所以优先压缩
    的头像 发表于 02-17 11:07 53次阅读
    KT142C语音芯片支持的语音文件格式什么?<b class='flag-5'>Mp3</b>还是wav呢?

    学习机MP3语音芯片方案:WMV硬解码芯片,N9301-316

    在当今数字化时代,学习机已不再仅仅是静态的物品。随着技术的快速发展和不断探索创新方法,人们将音乐与互动学习相融合,为儿童创造出更加富有创意和学习机产品。其中,九芯电子N9301系列MP3解码芯片
    的头像 发表于 02-07 18:31 55次阅读
    学习机<b class='flag-5'>MP3</b>语音芯片方案:WMV硬解码芯片,N9301-316

    KT148A语音芯片一个mp3语音,有办法分成一段一段的吗

    第一步:生成语音素材:到这一步,就实现了语音素材的生成,下载下来就是一整个mp3文件 详见KT148A资料包里面的文档说明 第二步:将需要的语音素材剪裁 使用的是Adobe
    的头像 发表于 01-22 16:11 124次阅读
    KT148A语音芯片一个<b class='flag-5'>mp3</b>语音,有办法分成一段一段的吗

    N930X指定曲目播放MP3音乐芯片:提升睡眠仪体验

    N930X MP3芯片集成硬解码,支持定制播放、智能定时、低功耗、自主更新,兼容多种控制及音频格式,提升睡眠仪体验,满足高质量睡眠追求。
    的头像 发表于 12-11 14:29 242次阅读
    N930X指定曲目播放<b class='flag-5'>MP3</b>音乐芯片:提升睡眠仪体验

    N930X指定曲目播放MP3音乐芯片:提升睡眠仪体验

    和自然之声,帮助人们更好地入睡,提高睡眠质量。而N930X指定曲目播放MP3音乐芯片,就是这款睡眠仪的核心部件。芯片简介N930X是一个提供串口的MP3芯片,完美的集
    的头像 发表于 12-11 14:25 169次阅读
    N930X指定曲目播放<b class='flag-5'>MP3</b>音乐芯片:提升睡眠仪体验

    魅族E2 MP3使用手册(说明书)

    魅族 E2 MP3 操作使用手册(说明书)
    发表于 11-12 13:41 0次下载

    请问TLV320DAC3120可以用作MP3的解压芯片吗?

    TLV320DAC3120项目要求用喇叭播MP3音频,我选用的方案是MCU+TLV320DAC3120,计划按以下步骤进行: 1. MCU通过I2C来配置TLV320DAC3120 2. MCU
    发表于 11-06 06:26

    请问如何把WAV,MP3格式的音频文件转化为16位的数据IIS格式?

    你好,请问如何把WAV,MP3格式的音频文件转化为16位的数据IIS格式?
    发表于 10-23 07:24

    九芯电子电子琴语音芯片的无限可能——N930X-S16 MP3解码芯片

    播放,是置入了音乐芯片,目前流行的高性价比语音芯片N930X音乐芯片;此款芯片是一个提供串口的MP3芯片,完美地集成了MP3、WMV的硬解码芯片,在音频压缩方面有着
    的头像 发表于 10-13 08:01 402次阅读
    九芯电子电子琴语音芯片的无限可能——N930X-S16 <b class='flag-5'>MP3</b>解码芯片

    ESP32-PICO-V3-02实现MP3播放遇到的几个疑问求解

    我之前做过一套Atmega328P+YX6300+W25Q128(PSRAM)+PAM8302实现MP3播放器。出于空间与接口的考虑,想利用ESP32实现该功能。 由于想利用PICO内部的存储用于
    发表于 06-28 06:47

    N9300-S16音乐MP3芯片:电子琴的革命性突破

    在数字音乐技术的浪潮中,N9300-S16音乐MP3芯片以其卓越的性能和广泛的应用领域,成为了电子琴领域的一次革命性突破。那么,N9300-S16究竟是何方神圣?它的优势又在哪里?它在电子琴上又能
    的头像 发表于 05-09 08:06 803次阅读
    N9300-S16音乐<b class='flag-5'>MP3</b>芯片:电子琴的革命性突破

    【RTC程序设计:实时音视频权威指南】音视频的编解码压缩技术

    技术可以实现不同的高效压缩和解压缩,常用的就是MP4文件。 MP4是一种容器格式,包含多种类型的媒体文件,如视频,
    发表于 04-28 21:04

    嵌入式操作教程_数字信号处理_音频编解码:3-6 AAC音频解码实验

    压缩算法,如AC-3MP3等。并且其质量可以同未压缩的CD音质相媲美。 (2)同其他类似的音频编码算法一样,AAC也是采用了变换编码算法,
    发表于 04-11 09:22

    数字信号处理实验操作教程:3-3 mp3音频编码实验(AD7606采集)

    Audio Layer III),简称为MP3。它被设计用来大幅度地降低音频数据量。利用 MPEG Audio Layer 3技术,将音乐以1:
    发表于 04-03 16:41

    mp3或者电脑的音频输出接口3.5mm音频电路转换成mic 的电路信号

    假设我有一个电路现在是接一个电容式话筒麦克,我想把她改成 mp3或者电脑的音频接口3.5mm音频电路 来替换 mic 的输入, 我理解应该是一个音频变压器. 或者一个转换芯片,请问有成
    发表于 03-29 11:34