0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

从Satin到Lyra为什么微软、谷歌都盯向音频编解码器?

LiveVideoStack 来源:LiveVideoStack 作者:LiveVideoStack 2021-05-24 15:36 次阅读

回顾今年的2月份,可以说是音频编解码器最为热闹的一个月。先是微软宣布推出最新款由AI支持的音频编解码器——Satin。仅一周后,谷歌推出了用于语音压缩的新型超低比特率音频编解码器——Lyra,并且Android版本已开源。在此,也非常感谢来自国内音频领域的知名业内人士对本文发表评论及审校。

不难发现,硅谷大佬们对音频编解码器的深度研发进度已提上日程,对未来可应用的场景让人们充满期待。值得注意的是这两款音频编解码器都是基于AI的语音编码,但它们又有各自不同的特点。

Satin:用于实时通信的AI音频编解码器 作为一款由人工智能驱动的音频编解码器,Satin可以在网速6kbps时提供超宽频段的语音,17kbps时提供全频段的立体声音乐,网速越高,质量越高。

Satin旨在高丢包率下也提供良好的音频质量。此外,在冗余算法的改进下,可以应对突发丢包情况,提供更好的保护。以下是经过改进的弹性算法和Satin编解码器的最终效果: SILK@6kbps,突发数据包丢失(附加6kbps的冗余) Satin@6kbps,突发数据包丢失,改进的冗余算法(附加6kbps的冗余)

相对于Silk推出的超宽带语音,12kHz的频率,以24kHz的采样率(在人类声音超过12kHz的频率时,能量会迅速下降);Satin重新定义了超宽带,以覆盖16kHz的频率,采样率在32kHz,以提供更高的清晰度和稳定性,而其高效的压缩功能则可以实现6 kbps的超宽带语音。

4f0e8eb2-bc62-11eb-bf61-12bb97331649.png

/ t /一词在“ suit”一词中的频率分量。除了4 kHz的窄带截止甚至8 kHz的宽带截止以外,还有大量的能量。将能量保留在较高的频谱分量中会导致声音听起来更加自然。 以下分别为在6kbps下,Silk窄带和Satin超宽带的音频示例(建议使用耳机试听): 为了保证在6kbps超宽带下的语音质量,Satin使用对语音产生、建模和心理声学的深度理解来提取和编码信号的稀疏表达。

为了进一步降低所需的比特率,Satin只在较低的频带中编码和传输某些参数。在解码器上,Satin使用深层神经网络从接收到的低频带参数以及通过导线发送的最少量辅助信息中估计高频带参数。 虽然这种方法解决了在超低比特率下对使用超宽带语音的最大挑战,但也带来了计算复杂度的新挑战。对此,微软将重心放在对算法优化和循环向量化等技术上,使计算复杂度降低40%,并保障能够在所有用户的设备上运行。

4f31376e-bc62-11eb-bf61-12bb97331649.png

除此之外,微软还关注到了关于Satin的丢包数据恢复能力。对此,Satin对每个数据包进行独立编码,因此丢失一个数据包的效果不会影响后续数据包的质量。编解码器还被设计为有助于在内部参数域中隐藏高质量的丢包。这些功能可帮助Satin无缝处理随机丢失,一次丢失一个或两个数据包。

目前,Satin已被用于所有Teams和Skype两方通话,并将很快用于Teams会议。目前,它以6-36 kbps的比特率范围在宽带语音模式下运行,并且在不久的将来将扩展为以48 kHz的最大采样率支持全频带立体声音乐。

Lyra:一款用于语音压缩的新型超低比特率编解码器 Lyra是由谷歌团队研发并已开源了Android版本。它所拥有的能力在于能在3kbps网络带宽下为用户提供自然清晰的语音聊天,以及仅90ms延迟的情况下在从高端云服务器到中端智能手机的任何设备上运行。(有关Lyra的详细介绍请浏览:在3kbps的带宽下还能清晰地语音聊天?)

对比Satin & Lyra:虽然这两个音频编解码器都能够在低比特率下进行操作,并通过AI提供动力,但它们有很大的不同。Lyra仅专注于窄带,而Satin则致力于超宽带。 另外,国内音频领域的知名业内人士指出:“在AI Codec领域中,有两种方式。一种是 end to end 也就是全AI,所以Lyra属于全AI结构

。而另一种是hybird结构,就是只有部分模块才使用AI,因此Satin是hybird结构。那么之所以现在才使用AI与音频编解码器结合,是因为在相同码率下,使用AI能够大幅提升音频质量。”

相关链接: https://mp.weixin.qq.com/s/Y1wceNAuMO7X8Vq3NiJ_GQ https://techcommunity.microsoft.com/t5/microsoft-teams-blog/satin-microsoft-s-latest-ai-powered-audio-codec-for-real-time/ba-p/2141382 https://bloggeek.me/lyra-satin-webrtc-voice-codecs/

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 宽带
    +关注

    关注

    4

    文章

    988

    浏览量

    60309
  • 数据
    +关注

    关注

    8

    文章

    7010

    浏览量

    88978
  • AI
    AI
    +关注

    关注

    87

    文章

    30805

    浏览量

    268948
  • 音频编解码器

    关注

    4

    文章

    139

    浏览量

    55883

原文标题:从Satin到Lyra 为何微软、谷歌都盯向音频编解码器?

文章出处:【微信号:livevideostack,微信公众号:LiveVideoStack】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    TLV320AIC28音频编解码器评估模块

    电子发烧友网站提供《TLV320AIC28音频编解码器评估模块.pdf》资料免费下载
    发表于 12-20 16:02 0次下载
    TLV320AIC28<b class='flag-5'>音频</b><b class='flag-5'>编解码器</b>评估模块

    TAS25xx编解码器控制EVM手册

    电子发烧友网站提供《TAS25xx编解码器控制EVM手册.pdf》资料免费下载
    发表于 12-10 14:14 0次下载
    TAS25xx<b class='flag-5'>编解码器</b>控制EVM手册

    替换ES8311,音频编解码器SC2601在行车记录仪中的应用

    替换ES8311,音频编解码器SC2601在行车记录仪中的应用
    的头像 发表于 11-29 10:07 157次阅读
    替换ES8311,<b class='flag-5'>音频</b><b class='flag-5'>编解码器</b>SC2601在行车记录仪中的应用

    配置I2S以编解码器设备生成BCLK

    电子发烧友网站提供《配置I2S以编解码器设备生成BCLK.pdf》资料免费下载
    发表于 10-21 10:30 0次下载
    配置I2S以<b class='flag-5'>从</b><b class='flag-5'>编解码器</b>设备生成BCLK

    TMS320F2833x与AIC23B立体声音频编解码器的接口

    电子发烧友网站提供《TMS320F2833x与AIC23B立体声音频编解码器的接口.pdf》资料免费下载
    发表于 10-15 09:21 0次下载
    TMS320F2833x与AIC23B立体声<b class='flag-5'>音频</b><b class='flag-5'>编解码器</b>的接口

    Linux上的编解码器移植TMS320DM365预览版

    电子发烧友网站提供《Linux上的编解码器移植TMS320DM365预览版.pdf》资料免费下载
    发表于 10-14 10:53 0次下载
    Linux上的<b class='flag-5'>编解码器</b>移植TMS320DM365预览版

    TMS320DM365中的智能编解码器功能

    电子发烧友网站提供《TMS320DM365中的智能编解码器功能.pdf》资料免费下载
    发表于 10-14 10:24 0次下载
    TMS320DM365中的智能<b class='flag-5'>编解码器</b>功能

    音频编解码器和ADC中有哪些常见噪声问题,如何帮助避免这些问题?

    音频编解码器和 ADC 中有哪些常见噪声问题,如何帮助避免这些问题?
    发表于 10-10 08:09

    音频编解码器中的常见噪声问题

    电子发烧友网站提供《音频编解码器中的常见噪声问题.pdf》资料免费下载
    发表于 10-09 10:19 0次下载
    <b class='flag-5'>音频</b><b class='flag-5'>编解码器</b>中的常见噪声问题

    带你探索HiFi智能编解码器的奇妙世界

    HiFi智能编解码器就像是音频世界的魔法师,它让我们能听到最真实、最动人的声音。无论是家庭音响、智能音箱,还是无线耳机和专业设备,这个小小的设备都能带来巨大的音质提升。让我们一同期待,未来HiFi智能编解码器为我们带来的更多惊喜
    的头像 发表于 07-18 17:20 782次阅读
    带你探索HiFi智能<b class='flag-5'>编解码器</b>的奇妙世界

    音频编解码器AC'97电压转换收发数据表

    电子发烧友网站提供《音频编解码器AC'97电压转换收发数据表.pdf》资料免费下载
    发表于 05-28 10:52 0次下载
    <b class='flag-5'>音频</b><b class='flag-5'>编解码器</b>AC'97电压转换收发<b class='flag-5'>器</b>数据表

    国产可编程振荡在视频编解码器中的应用,兼容SiTime

    国产可编程振荡在视频编解码器中的应用,兼容SiTime
    的头像 发表于 04-17 09:39 1909次阅读
    国产可编程振荡<b class='flag-5'>器</b>在视频<b class='flag-5'>编解码器</b>中的应用,兼容SiTime

    集成电源管理和音频编解码器TPS65950数据表

    电子发烧友网站提供《集成电源管理和音频编解码器TPS65950数据表.pdf》资料免费下载
    发表于 03-06 11:15 0次下载
    集成电源管理和<b class='flag-5'>音频</b><b class='flag-5'>编解码器</b>TPS65950数据表

    TPS65920和TPS65930集成电源管理/音频编解码器数据表

    电子发烧友网站提供《TPS65920和TPS65930集成电源管理/音频编解码器数据表.pdf》资料免费下载
    发表于 03-06 10:55 0次下载
    TPS65920和TPS65930集成电源管理/<b class='flag-5'>音频</b><b class='flag-5'>编解码器</b>数据表

    高性能立体声编解码器DA7400 数据表

    电子发烧友网站提供《高性能立体声编解码器DA7400 数据表.pdf》资料免费下载
    发表于 02-20 10:11 1次下载
    高性能立体声<b class='flag-5'>编解码器</b>DA7400 数据表