0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

云知声2篇论文参展国际语音顶会INTERSPEECH 2022

云知声 来源:云知声 作者:云知声 2022-09-21 19:50 次阅读

2022年9月18日-22日,全球语音领域顶级会议INTERSPEECH 2022在韩国仁川举办。“云知声-上师大自然人机交互”联合实验室携提出的关于声音事件检测、单通道语音增强方向的2篇论文参会。这是继2022年6月亮相ICASSP2022(技术论文被收录)之后,云知声在2022年再一次获得国际语音顶会的认可。

b53e0852-399d-11ed-9e49-dac502259ad0.png

INTERSPEECH在国际上享有极高盛誉并具有广泛的学术影响力,是由国际语音通讯协会(ISCA)创办的旗舰级国际会议,也是全球最大的综合性语音领域的科技盛会,对参会企业和单位有着严苛的准入门槛,历届INTERSPEECH会议都倍受全球各地语音研究领域人士的广泛关注。

本届会议以“Human and humanizing speech technology”为主题,内容涵盖信号处理、语音识别、自然语言处理、神经机器翻译等领域,收到近万篇投稿论文。会议研究成果代表着语音相关领域的最新研究水平和未来的技术发展趋势。此次论文入选,代表云知声在语音交互领域持续的技术创新。

声音事件检测

b5534028-399d-11ed-9e49-dac502259ad0.png

在声音事件检测方向,研究团队提出了一个教师-学生(Teacher-Student)半监督学习框架,充分利用强标签数据、弱标签数据与大量无标签数据训练模型,有效解决标签数据匮乏的问题。为了提高模型的检测能力,研究团队提出通过两阶段的训练策略并聚焦于难以分类的事件,以及利用一种深度特征蒸馏方法,更详细地关注到时间轴上细致的声学信息。

同时,研究团队还提出语音分离技术辅助声音事件检测系统建模的方法,通过使用分离数据与混合数据联合调整训练模型的方式,有效解决事件重叠与背景噪声干扰对系统建模带来的影响。在DCASE2019 Task4 数据集上,研究团队所提出的方案在F1, PSDS1 and PSDS2得分上分别达到了46.5%, 44.5%以及75.4%,相比baseline提高了2.2%, 7.2%以及20.5%,充分体现了所提出方案的优势。

b57ba9fa-399d-11ed-9e49-dac502259ad0.png

单通道语音增强

b5a7977c-399d-11ed-9e49-dac502259ad0.png

在单通道实时语音增强方向,研究团队提出了一个基于PercepNet模型并感知语音相位与信噪比的实时语音增强方案(PercepNet+: A Phase and SNR Aware PercepNet for Real-Time Speech Enhancement),该方案提取多种声学特征,以获取语音包括幅度,相位,基音周期在内的多种声学属性。这些特征被进一步在模型中使用提取时间相关性和频率相关性的GRU网络层进行融合,以提升该语音增强系统的性能。

同时,研究团队还提出一种基于信噪比的后处理机制,旨在改善语音增强中的过度抑制问题。该机制利用网络估计得到的语音信噪比为阈值条件,决定基于MMSE-LSA的后处理方法是否被应用于当前输入语音。研究团队的模型在VCTK测试集上达到了2.65 (PESQ) 的得分,相比原PercepNet模型的得分相对提升了8%,充分验证了所提出方案的有效性。

b5d1d6e0-399d-11ed-9e49-dac502259ad0.png

人工智能成功的关键在于应用。为不断拓宽自身基础能力边界,云知声深入探究语音领域中的语音识别、语音增强、信号处理、声纹识别、声音事件检测等诸多方向,形成丰富技术积累,并将相关技术在多个领域以及行业进行应用,取得诸多成功案例。比如云知声的ASR技术被广泛应用于音视频翻译、会议系统、同声传译、三代共6款专用AI语音交互芯片等相关产品与场景。

其中,云知声输出的软硬一体的语音交互芯片产品,覆盖各种形态的多品类产品,市占率领先,出货量不断增长。为国内传统行业迅速实现智能化产品升级与改造,提供了技术保障。

本次在 INTERSPEECH 2022 大会上提出的原创技术,也将进一步夯实云知声全栈+硬核的人工智能技术“底座”,提高云知声在语音交互领域的技术领先性,推动人工智能系统以更人性化、高效的方式服务于千行百业,为用户带来更好的交互体验。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30095

    浏览量

    268363
  • 语音识别
    +关注

    关注

    38

    文章

    1721

    浏览量

    112535
  • 语音交互
    +关注

    关注

    3

    文章

    283

    浏览量

    27979
  • 云知声
    +关注

    关注

    0

    文章

    169

    浏览量

    8368
  • AI芯片
    +关注

    关注

    17

    文章

    1859

    浏览量

    34903

原文标题:云知声技术实力再获认可:2篇论文参展国际语音顶会INTERSPEECH 2022

文章出处:【微信号:云知声,微信公众号:云知声】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    中国科大携手斩获ACM MM 2024竞赛多项荣誉

    近日,第32届ACM国际多媒体会议在澳大利亚墨尔本圆满落幕。由中国科学技术大学自动化系於俊老师带队的中国科学技术大学与共同组建的USTC-IAT-United团队在不同挑战赛道上
    的头像 发表于 11-21 14:21 119次阅读

    学院荣登2024中国企培业模式创新TOP10榜单

    近日,第13届国际培训产品博览(简称“培博”)在江苏昆山举行,展会期间公布2024培博•培英奖评选结果,
    的头像 发表于 11-21 14:12 106次阅读

    与国信领英签署战略合作协议

    智能科技股份有限公司(以下简称“”)与苏州国信领英教育科技有限公司(以下简称“国信领
    的头像 发表于 10-12 14:16 289次阅读

    地平线科研论文入选国际计算机视觉ECCV 2024

    近日,地平线两论文入选国际计算机视觉ECCV 2024,自动驾驶算法技术再有新突破。
    的头像 发表于 07-27 11:10 855次阅读
    地平线科研<b class='flag-5'>论文</b>入选<b class='flag-5'>国际</b>计算机视觉<b class='flag-5'>顶</b><b class='flag-5'>会</b>ECCV 2024

    入选亿欧智库《2024北京国际车展展后洞察研究报告》

    解决方案,入选《报告》并成为智能座舱领域的代表厂商。 《2024北京国际车展展后洞察研究报告》重点关注技术进步、新车发布、创新营销、行业合作以及未来趋势等多个方面,通过报告模块化
    的头像 发表于 05-18 10:30 734次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b>入选亿欧智库《2024北京<b class='flag-5'>国际</b>车展展后洞察研究报告》

    携手耘途教育成立学院福建分院

    近日,与耘途教育携手,共同成立了学院福建分院,此举标志着双方在智慧教育领域展开了深度合作。根据合作协议,
    的头像 发表于 05-13 10:38 381次阅读

    携手耘途教育成立学院福建分院,探索智慧教育新思路

    近日,与耘途教育联合成立学院福建分院,深入探索智慧教育新模式、新思路。
    的头像 发表于 05-11 15:52 506次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b>携手耘途教育成立<b class='flag-5'>云</b><b class='flag-5'>知</b>学院福建分院,探索智慧教育新思路

    携山海大模型再赴港IPO

    智能科技股份有限公司(简称“”)于3月15日更新了招股书,继续其在港交所主板上市的步
    的头像 发表于 03-22 14:51 670次阅读

    推进港交所主板上市进程

    近日,智能科技股份有限公司(以下简称“”)再次更新招股书,继续其在港交所主板上市的征
    的头像 发表于 03-22 14:45 947次阅读

    再闯港股IPO

    近日,备受瞩目的智能科技股份有限公司(以下简称)再次更新了其招股书,继续稳步推进其在
    的头像 发表于 03-22 14:42 660次阅读

    推进港股IPO!AI解决方案收入排名中国第四,2023年营收破7亿

    于2012年,当时国内的AI产业刚刚萌芽,它率先开启AGI技术商业化。在成立仅三个月后,便发布了语音识别公有,在AI行业迅速崭露头角
    的头像 发表于 03-22 00:12 3416次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b>推进港股IPO!AI解决方案收入排名中国第四,2023年营收破7亿

    再闯港股IPO,深耕AI领域

    近日,智能科技股份有限公司(简称:)正式向港交所递交了招股书,计划主板IPO上市。这
    的头像 发表于 03-19 15:36 774次阅读

    人工智能企业再度递交招股书,拟登陆港交所主板

    近日,备受瞩目的“AI独角兽”智能科技股份有限公司(以下简称“”)再度递交了招股书,
    的头像 发表于 03-19 15:04 914次阅读

    再次冲刺港交所上市

    备受瞩目的“AI语音第一股”智能科技股份有限公司(简称“
    的头像 发表于 03-19 14:59 861次阅读

    山海大模型获得华为昇腾技术认证

    山海大模型近日取得了重大突破,顺利通过了华为Atlas 800训练服务器和华为AI框架昇思MindSpore的兼容性测试。这一成就标志着
    的头像 发表于 02-05 09:32 957次阅读