0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

声纹识别技术排名全球前三,快商通凭什么?

电子工程师 来源:lp 2019-03-15 14:57 次阅读

在由美国国家标准技术署(NIST)主办的说话人识别技术评测(Speaker Recognition Evaluation, SRE)公布的最新评测结果中,由快商通首席科学家李海洲教授及快商通声纹研究院领衔的I4U团队获得综合成绩第三名的好成绩,在大中华区参赛团队中排名第一。

lNIST SRE:国际最权威、标准最严、影响力最大的声纹识别技术评测

SRE 2018 是由NIST(National Institute of Standards and Technology,美国国家标准与技术研究院,直属美国商务部)承办的国际上规模最大、标准最严、最权威的声纹识别技术评测,为全球参赛研究机构提供了一个公平的统一测试平台,旨在关注声纹识别领域的核心技术问题。从1996年开始举办至今,参加 NIST SRE 评测的队伍逐年增加,今年有包括麻省理工、清华大学、声扬科技等在内的25个国家、78支队伍参赛。

近年来,NIST SRE 的重点任务是对于现阶段实用领域中,口语对话电话语音(CTS)的说话人检测

今年,除了在各种手机上录制的CTS 之外,SRE18中的开发和测试材料还加入了IP语音(VOIP)数据,以及视频音频(AfV)数据。数据库环境的复杂程度更高、干扰因素更多,已远远超过一般的实际应用场景,意味着对参评机构的算法性能和系统鲁棒性等提出更高的要求。

另外,由于现实应用中,系统往往要根据不同的需求来决定阈值的选取。今年,为综合考核参评系统的灵活度、实用度以及综合实力,NIST 将C_primary(或称为actDCF)作为首要核心指标,用于描述说话人识别系统的整体辨别能力,评判标准不再仅看在某个阈值点的FAR/FRR或DCF,进一步提升了竞赛的难度。

因此,NIST SRE 测评结果不仅为当前说话人识别的最新技术进步水平,也代表着该技术在目前实战场景应用中能够具备的最佳表现。

l 声纹识别技术排名全球前三,快商通凭什么?

在众多多场景测评中,快商通声纹识别系统在十万分之一的误报率下识别准确率超过99%。是国内声纹识别领域企业中在该指标下的最好水平,也体现了我国说话人识别技术已达到世界领先水平。

“NIST SRE 评测挑战最大的是单信道多说话人识别。”快商通AI事业部研究员叶志坚表示,“测试数据中,每段语音使用麦克风阵列录制用来混合测试,比如电话信道涵盖了移动电话,固定电话等。麦克风类型也几乎覆盖实际应用中所有类型。其次,环境噪声也更‘广义化’,包括环境噪声、人声非语言、彩铃炫铃等各种背景噪声情况。我们的系统采用了经典的DNN-ivector系统和基于端到端深度神经网络(DNN)的说话人特征提取系统,在不同语种中使用的结果都不错。”

今年,快商通声纹研究院在单信道多说话人识别方面取得了重大的进展,提出“单耳语音分离技术”,实现单音频定向人声分离,开创性解决声纹识别中“鸡尾酒会问题”难题。经实测、在嘈杂的环境中能够准确分辨多说话人声音。

这套强大声纹识别系统出色的完成了 NIST SRE 的说话人检测任务,特别是在降低环境“噪声”干扰,以及同一段语音中多声纹特征提取方面表现优异,系统将语音样本分割聚类成独立的片段,准确标注出“谁”从“什么时候”到“什么时候”在说话。

l 美国“最严技术封锁”,国产AI能力崛起

美国商务部工业安全署(BIS)根据出口行政规定(ExportAdministration Regulations, EAR)对军民两用和较为不敏感的军品出口进行监管,主要甄别涉及国家安全和高技术范畴的出口。根据美国商务部文件(15 CFR Part 744 [DocketNo. 180712626–8840–01] RIN 0694–AH61 Review of Controls for Certain Emerging Technologies),从美国公布的清单中甄别筛选出的代表性产业类别来看,可谓条条针对中国最新计划发展的高科技产业。

图:美国拟管制的14项技术出口

来源:据公开资料查找

近年来,中国人工智能高速发展。无人超市,无人物流,无人加油站,无人驾驶,无人酒店……再加上各种功能健全的机器人!在我们毫无察觉中,人工智能正在日夜不息地自我迭代进化,冲击着我们生活的方方面面。

在人脸识别技术的研发和应用上,中国在其上投入巨大,在各项国际人脸领域的评测中中国的企业稳拿第一,如依图科技,旷世科技,商汤科技(SenseTime)、云从科技、百度等企业。

在声纹领域,快商通已将自主研发的声纹识别技术落地应用在金融、安防、社保、智能家居物联网等领域,推出“金融信贷身份反欺诈”、“社保异地生存验证”等行业解决方案。 在丰富项目经验积累下,快商通在国内银行、保险等领域商业测试中均取得声纹技术排名第一,目前,快商通已为平安集团、上海华瑞银行,国家电网、常州司法局等用户落地声纹行业解决方案。

在推动人工智能落地应用的同时,快商通也在持续加大对前沿技术投入。在成立快商通新加坡研究院之后,还与福建本土高校厦门大学、华侨大学建立联合建立人工智能研究院,推进产学研用结合,为厦门市乃至福建省的人工智能产业规模化发展增光添彩,为提升我国科技创新实力、为我国高科技产业的核心技术发展做积极贡献。

2018年,快商通首席科学家李海洲教授带领的新加坡国立大学团队荣获2018年第二届国际大学生类脑计算大赛一等奖;

2017年,快商通声纹团队在Interspeech2017的ASVspoof2017自动说话人验证欺骗和对策挑战赛(AutomaticSpeaker Verification Spoofing and Countermeasures Challenge)中,获得全球第一。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据库
    +关注

    关注

    7

    文章

    3799

    浏览量

    64381
  • 人工智能
    +关注

    关注

    1791

    文章

    47269

    浏览量

    238442
  • 声纹识别
    +关注

    关注

    3

    文章

    140

    浏览量

    21523

原文标题:声纹识别最权威评测 NIST SRE18结果公布:快商通排名全球前三!

文章出处:【微信号:kuairobot,微信公众号:小快机器人】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    调试PCM3500E,DAC输出噪声纹波峰峰值居然高达600mV,为什么?

    你好!最近在调试PCM3500E,发现其DAC部分,输出噪声纹波峰峰值居然高达600mV,将芯片power down之后噪声就消除了。附图是DIN输入全零时,纹波的波形特征。
    发表于 11-08 07:25

     FP6601Q:兼容充协议控制器,智能识别充电设备,高效安全新体验

    and Dlines●支持苹果Apple设备●支持星设备●可以直接PIN对PINFP6601(QC2.0识别IC)●SOT23-6无铅封装 FP6601Q是QC3.0,QC2.0和华为海思
    发表于 10-28 17:22

    雷军称小米汽车目标全球

    在2024年巴黎奥运会召开之际,雷军正在欧洲展开深度调研工作。在法国,一位热心的粉丝向他提出了关于是否有机会在法国本地购买到小米SU7的问题,并询问是否有望在2030年实现这一目标。面对这样的咨询,雷军表示:“OK,我们的目标是全球
    的头像 发表于 07-31 16:54 310次阅读

    人脸识别技术的原理介绍

    人脸识别技术是一种基于人脸特征信息进行身份识别的生物识别技术。它通过分析人脸图像,提取人脸特征,然后与已知人脸特征进行匹配,从而实现身份识别
    的头像 发表于 07-04 09:22 1183次阅读

    梅赛德斯-奔驰携手通实现激光器全球数字化维护

    在智能工厂浪潮中,梅赛德斯-奔驰与通深化合作,通过云数据的监测技术,对其全球生产网络中的通激光器进行实时数字维护 通过MO360数字生态系统,通
    的头像 发表于 06-18 14:01 354次阅读
    梅赛德斯-奔驰携手通<b class='flag-5'>快</b>实现激光器<b class='flag-5'>全球</b>数字化维护

    重磅!中国企业跻身全球

    来源:半导体封测,谢谢 编辑:感知芯视界 Link 5月24日,最新研究报告显示,中芯国际在2024年第一季度成功跃升至全球大晶圆代工厂,仅次于台积电和星,市场份额达到6%。这一成绩标志着中芯
    的头像 发表于 05-27 11:10 666次阅读

    广汽埃安3月全球销量32530辆,环比增长95.1%,稳居主流纯电

    广汽埃安3月全球销量32530辆,环比增长95.1%,稳居主流纯电
    的头像 发表于 04-02 09:50 291次阅读
    广汽埃安3月<b class='flag-5'>全球</b>销量32530辆,环比增长95.1%,稳居主流纯电<b class='flag-5'>前</b><b class='flag-5'>三</b>

    平芯微FP6601Q:智能充芯片的新里程碑

    QC3.0识别芯片FP6601Q:平芯微技术引领充新时代
    的头像 发表于 03-04 14:40 640次阅读
    平芯微FP6601Q:智能<b class='flag-5'>快</b>充芯片的新里程碑

    智能声控灯具应用语音识别芯片AT6811

    AT6811是一款超低功耗的离线智能语音识别芯片,集成了先进的语音活动监测(VAD)、声纹识别、自动消噪神经网络,拥有高效的电源管理模块、数字和模拟语音信号输入接口以及ARMCortex-M0内核,并且搭配了GPIO、UART、SPI、I2C、I2S等片内外设。
    的头像 发表于 02-28 16:41 631次阅读
    智能声控灯具应用语音<b class='flag-5'>识别</b>芯片AT6811

    人脸识别技术的原理是什么 人脸识别技术的特点有哪些

    人脸识别技术的原理 人脸识别技术是一种通过计算机以图像或视频为输入,识别、检测、跟踪和分析人脸的技术
    的头像 发表于 02-18 13:52 1918次阅读

    图像识别技术原理 图像识别技术的应用领域

    图像识别技术是一种通过计算机对图像进行分析和理解的技术。它借助计算机视觉、模式识别、人工智能等相关技术,通过对图像进行特征提取和匹配,找出图
    的头像 发表于 02-02 11:01 2443次阅读

    测电源噪声纹波时为什么选无源探头

    在测量电源的噪声纹波时,采用无源探头是一种常见的选择。无源探头是指在测量过程中不需要额外的电源供电的探头。那么,为什么我们要选择无源探头呢?下面将详细解释这个问题。 首先,无源探头具有高频
    的头像 发表于 02-01 10:10 613次阅读
    测电源噪<b class='flag-5'>声纹</b>波时为什么选无源探头

    第四大运营,攻击大运营

    1&1称其委托Aetha Consulting开展的研究发现德国大移动运营相比欧洲其他有四家移动运营的国家的排名
    的头像 发表于 01-30 16:00 886次阅读

    简单认识射频识别技术

    技术无须识别系统与目标间建立机械或者光学连接,应用灵活、识别速度,相关设备具有使用简单、寿命长、安全性高的特点。RFID技术是构建物联网
    的头像 发表于 01-08 09:43 1162次阅读

    NAND芯片价格止跌回升,供应寻求更大利润

    全球储存型闪记忆体市场排名中,星以34.3%的市占率居于领先地位。为达到盈利目标,NAND芯片供应将持续拉抬报价。
    的头像 发表于 01-02 17:08 985次阅读