0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Google最新推出的音频编解码器Lyra

LiveVideoStack 来源:LiveVideoStack 作者:LiveVideoStack 2021-03-11 16:37 次阅读

Google最新推出的音频编解码器Lyra,不仅实现了以每秒3kb网络宽带提供听起来自然清晰的语音聊天,还可以在仅90ms延迟的情况下在从高端云服务器到中端智能手机的任何设备上运行。

2月25日,Google AI blog发布了一篇文章详细的介绍了最新推出的Lyra——一种用于语音压缩的新型超低比特率编解码器。该编解码器使Google Duo,以及未来的其他应用程序能够以每秒3kb的网络宽带提供听起来很自然清晰的语音聊天。

众所周知,人们对实时音视频的需求不断增加。特别是去年由于受到疫情的影响,许多人不得不隔离在家,只能与亲朋好友通过视频通话的方式保持联系。例如,仅去年一年Google Duo和Meet就承载了超过1万亿分钟的视频。而这些情况无疑是给全球的互联网基础设施带来了巨大的挑战。除此之外,虽然有些人可以使用一致的高质量,高速网络,但这种连接并不普遍。比如在网络通信并不发达的农村地区。然而,尽管在连接良好的地区,人们有时也会遇到质量差、带宽低的问题。那么如何在有限的带宽下实现高质量的音频输出就成为了目前最重要的议题。

Lyra音频编解码器

6e8f3e5c-7e1a-11eb-8b86-12bb97331649.png

因此,Google推出了一种高质量、低比特率的新型音频编解码器——Lyra。尽管用户在网速很慢的情况下,也能进行语音聊天。Lyra编解码器的基本结构体系非常简单,如上图所示。而Lyra与其他音频编解码器的不同之处在于:它利用机器学习模型,开发了一种新的模型,能够使用最少的数据来重建语音。这种模型不仅能够区分信号,还能生成全新的信号。与之相比,传统的参数编解码器只从语音中提取关键参数,然后用于在接收端重建信号。虽然实现低比特率,但得到的音频通常听起来很机械,不自然。而Lyra利用这些新的自然声生成模型,即能够保持参数编解码器的低比特率,同时又能实现高质量的音频输出。这与目前大多流媒体平台中使用的波形编解码器几乎不相上下。更重要的是,Lyra的效率足够高,可以在仅90ms延迟的情况下在从高端云服务器到中端智能手机的任何设备上运行。

与现有编解码器对比

Lyra目前被设计运行在3kbps情况下,听力测试表明,Lyra的表现优于任何其他编解码器。并且优于在相同8kbps情况下的Opus,从而实现了超过60%的带宽减少。Lyra可以在带宽条件不适合高比特率和现有的低比特率编解码器不能提供足够质量的情况下使用,这是它的一大优势,也是解决现在低音频质量的方案。

以下是Lyra与现有编解码器的对比:

在安静的环境下:

Original原始音频

Opus@6kbps

Lyra@3kbps

Speex@3kbps

在嘈杂的环境下:

Original原始音频

Opus@6kbps

Lyra@3kbps

Speex@3kbps

上方是Google提供的Lyra与Opus、Speex分别以6kbps和3kbps,对同一音频的压缩质量对比。能够明显感受到即使Lyra在3kbps情况下,自然语音音频的清晰程度也远优于Opus在6kbps下的情况。

适用情况

Google已经利用开源音频库对Lyra使用超过70种语言的扬声器进行了数千小时的音频培训,然后与专家和来自广泛的听众一起验证音频质量。Lyra在一个广泛的数据集中训练,包括大量不同语言的使用者,以确保编解码器能够应对各种情况。另外,Lyra还可以在云环境中使用,以方便使用各种网络和设备的用户能够无缝对接聊天。不仅如此,Google还将Lyra与新的视频压缩技术(例如AV1)配对后,即使用户通过56kbps拨号调制调节器连接到Internet,也可以进行视频聊天。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Google
    +关注

    关注

    5

    文章

    1762

    浏览量

    57496
  • 音频编解码器

    关注

    4

    文章

    134

    浏览量

    55880
  • 应用程序
    +关注

    关注

    37

    文章

    3261

    浏览量

    57675

原文标题:在3kbps的带宽下还能清晰地语音聊天?

文章出处:【微信号:livevideostack,微信公众号:LiveVideoStack】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    TAS25xx编解码器控制EVM手册

    电子发烧友网站提供《TAS25xx编解码器控制EVM手册.pdf》资料免费下载
    发表于 12-10 14:14 0次下载
    TAS25xx<b class='flag-5'>编解码器</b>控制EVM手册

    替换ES8311,音频编解码器SC2601在行车记录仪中的应用

    替换ES8311,音频编解码器SC2601在行车记录仪中的应用
    的头像 发表于 11-29 10:07 147次阅读
    替换ES8311,<b class='flag-5'>音频</b><b class='flag-5'>编解码器</b>SC2601在行车记录仪中的应用

    配置I2S以从编解码器设备生成BCLK

    电子发烧友网站提供《配置I2S以从编解码器设备生成BCLK.pdf》资料免费下载
    发表于 10-21 10:30 0次下载
    配置I2S以从<b class='flag-5'>编解码器</b>设备生成BCLK

    TMS320F2833x与AIC23B立体声音频编解码器的接口

    电子发烧友网站提供《TMS320F2833x与AIC23B立体声音频编解码器的接口.pdf》资料免费下载
    发表于 10-15 09:21 0次下载
    TMS320F2833x与AIC23B立体声<b class='flag-5'>音频</b><b class='flag-5'>编解码器</b>的接口

    Linux上的编解码器移植TMS320DM365预览版

    电子发烧友网站提供《Linux上的编解码器移植TMS320DM365预览版.pdf》资料免费下载
    发表于 10-14 10:53 0次下载
    Linux上的<b class='flag-5'>编解码器</b>移植TMS320DM365预览版

    TMS320DM365中的智能编解码器功能

    电子发烧友网站提供《TMS320DM365中的智能编解码器功能.pdf》资料免费下载
    发表于 10-14 10:24 0次下载
    TMS320DM365中的智能<b class='flag-5'>编解码器</b>功能

    音频编解码器和ADC中有哪些常见噪声问题,如何帮助避免这些问题?

    音频编解码器和 ADC 中有哪些常见噪声问题,如何帮助避免这些问题?
    发表于 10-10 08:09

    音频编解码器中的常见噪声问题

    电子发烧友网站提供《音频编解码器中的常见噪声问题.pdf》资料免费下载
    发表于 10-09 10:19 0次下载
    <b class='flag-5'>音频</b><b class='flag-5'>编解码器</b>中的常见噪声问题

    带你探索HiFi智能编解码器的奇妙世界

    HiFi智能编解码器就像是音频世界的魔法师,它让我们能听到最真实、最动人的声音。无论是家庭音响、智能音箱,还是无线耳机和专业设备,这个小小的设备都能带来巨大的音质提升。让我们一同期待,未来HiFi智能编解码器为我们带来的更多惊喜
    的头像 发表于 07-18 17:20 763次阅读
    带你探索HiFi智能<b class='flag-5'>编解码器</b>的奇妙世界

    TP3094单芯片PCM编解码器和滤波数据表

    电子发烧友网站提供《TP3094单芯片PCM编解码器和滤波数据表.pdf》资料免费下载
    发表于 07-10 09:25 0次下载
    TP3094单芯片PCM<b class='flag-5'>编解码器</b>和滤波<b class='flag-5'>器</b>数据表

    音频编解码器AC'97电压转换收发数据表

    电子发烧友网站提供《音频编解码器AC'97电压转换收发数据表.pdf》资料免费下载
    发表于 05-28 10:52 0次下载
    <b class='flag-5'>音频</b><b class='flag-5'>编解码器</b>AC'97电压转换收发<b class='flag-5'>器</b>数据表

    国产可编程振荡在视频编解码器中的应用,兼容SiTime

    国产可编程振荡在视频编解码器中的应用,兼容SiTime
    的头像 发表于 04-17 09:39 1902次阅读
    国产可编程振荡<b class='flag-5'>器</b>在视频<b class='flag-5'>编解码器</b>中的应用,兼容SiTime

    集成电源管理和音频编解码器TPS65950数据表

    电子发烧友网站提供《集成电源管理和音频编解码器TPS65950数据表.pdf》资料免费下载
    发表于 03-06 11:15 0次下载
    集成电源管理和<b class='flag-5'>音频</b><b class='flag-5'>编解码器</b>TPS65950数据表

    TPS65920和TPS65930集成电源管理/音频编解码器数据表

    电子发烧友网站提供《TPS65920和TPS65930集成电源管理/音频编解码器数据表.pdf》资料免费下载
    发表于 03-06 10:55 0次下载
    TPS65920和TPS65930集成电源管理/<b class='flag-5'>音频</b><b class='flag-5'>编解码器</b>数据表

    高性能立体声编解码器DA7400 数据表

    电子发烧友网站提供《高性能立体声编解码器DA7400 数据表.pdf》资料免费下载
    发表于 02-20 10:11 1次下载
    高性能立体声<b class='flag-5'>编解码器</b>DA7400 数据表