0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

快商通李稀敏:近场声纹识别将普及,本地化的AI能力是刚需

智能生物识别说 2019-11-01 18:11 次阅读

快商通公检法事业线总经理李稀敏博士就“人机语音交互是否必须要先唤醒和离线语音技术在本地端上的实现是否未来的趋势”为题进行分享:


01 人机交互必须要先唤醒吗?


语音交互流程被划分为五个环节 – 唤醒、响应、输入、理解、反馈。其中唤醒是每一次用户与语音产品交互的第一个接触点,唤醒环节的体验在整个语音交互流程中至关重要,它的体验好坏将直接影响用户对产品的“第一印象”。就目前市面上常见的语音交互产品来说,一个眼神或者一个动作还不能引起它的注意,因此需要定义一个将产品从待机状态切换到工作状态的词语,即所谓的“唤醒词”。比如“小度小度”“若琪”“叮咚叮咚”。那么,人机交互我们必须要先唤醒吗?李稀敏认为:随着技术场景越来越成熟,当机器具备足够的智能化,机器是可以不需要唤醒词,就像跟人对话一样自然。但距离无唤醒交互的实现,还有一段路要走。从声纹识别的角度来看有两种场景,第一种,用唤醒词作为命令词,设备在休眠或锁屏状态下也能检测到用户的声音(设定的语音指令,即唤醒词),让处于休眠状态下的设备直接进入到等待指令状态,开启语音交互第一步。第二种设置一个“唤醒词”,这时候我们可以将设备唤醒比作水龙头的开关,如果水龙头没有开关的话,摁都摁不住是吧?就像智能音响交互的时候,设备乱七八糟的识别了一大堆语音,这个东西出来摁都摁不住,所以人机交互还是要有“唤醒”步骤。但是否需要唤醒词,还需根据场景的需求来决定,没有所谓的通用答案。


02 声纹识别是否可以改进人机交互方式?


最近一段时间很火的苹果AirPods,华为荣耀FlyPods Pro都在主打身份识别。目前的唤醒大家都是在用这个特定的唤醒词,如果改用声纹识别,是否可以改变这种交互的方式?李稀敏认为:在不同的场景中,最佳的唤醒的方式可以不同,但在耳机等可穿戴设备的场景中,声纹识别因其高易用性、非接触、不需要前置设备等优点,相对其他生物识别技术,能够更好的解决该场景的实际身份认证的问题,进而改进人机交互体验。


03 实现本地端离线语音技术是未来趋势?


“在贴身的耳机,也就是本地端做声纹识别,其实避免了一个技术问题:远场识别”,李稀敏解释。远场的文本无关身份识别由于复杂的信号传播环境等原因,是目前的技术难点,还有很长的路要走。但相对来说,近场的身份识别,在本地端可以通过技术手段快速解决问题。所以,接下来本地端近场身份识别能够大面积普及,在今后很多场景,我们随身携带一个小设备都能够直接识别身份。


关于本地化是不是未来的趋势。从数据的角度来讲,很多人是不希望自己的声音信息,人脸信息,通过设备或各种隐私接口上传到云端且变为不可控。李稀敏认为,从这个角度来看,本地化的AI的能力是一个刚需。


04 大热的语音合成技术TTS,跟声纹识别PK,谁会更胜一筹?


对于使用录音、合成语音等攻击手段的识别,是声纹识别必须要解决的问题。快商通在为银行、保险等金融客户设计声纹身份识别系统,这个是第一个需要解决的问题。


目前,对声纹认证的攻击,大概分成几类,第一类是模仿,第二类是语音合成或者语音转换,第三类是录音重放。根据实际欺诈的手段来讲,目前主要是防录音重放。其中,录音重放是最难检测的。解决了录音重放问题,就相当于解决了语音拼接和语音合成问题。


快商通在这一点上做得比较领先,我们的首席科学家李海洲院士,团队在ASVspoof2017自动说话人验证欺骗和对策挑战赛中获得第一名。包括在许多银行客户的测试中,我们都是100%检测到录音重放。


另外分享个故事,除了算法和系统本身领先,解决方案还需要数据驱动,大量的录音样本、各种设备、各种采样率、各种时长、各种环境的训练。1年前,我们在北京几家银行做测试的时候,白天我们在地铁上,在最嘈杂的环境下,各种测试都攻不破。


但晚上,我住在清华大学里,在10:00、11:00左右夜深人静、一点声音都没有的时候,掏出了我们的APP进行测试,却被攻破了。说明当时我们的训练数据没有覆盖到无杂音、无噪音的情况,当然,现在已经覆盖到了(笑)。


关于快商通:


快商通是一家从事人工智能技术与应用研发的创新型科技企业,在声纹识别、自然语言处理、深度学习、大数据等方面拥有原创核心竞争力。


面向企业服务、金融、公检法、医疗、物联网等领域,为全球客户提供包含人工智能算法、应用软件、平台软件及内嵌人工智能功能的软硬件一体化解决方案。致力于持续为客户创造价值,让人工智能走进每个人的生活。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏

    相关推荐

    行芯完成DeepSeek-R1大模型本地化部署

    近日,行芯正式宣布完成 DeepSeek-R1 大模型本地化部署,实现在多场景、多产品中应用。解锁“芯”玩法,开启“芯”未来!
    的头像 发表于 02-24 15:17 264次阅读

    曙光顺利完成DeepSeek大模型本地化多点私有部署

    计算中心等政务云服务,依托本地政务云资源池,顺利完成DeepSeek大模型本地化多点私有部署,并打造出数字人“抚小智”。抚州市还计划将DeepSeek大模型成功落地到多个政务场景。这一成果的背后,曙光云凭借深耕政务领域的丰富经
    的头像 发表于 02-22 14:16 403次阅读

    芯海科技EC:构筑 AI PC安全基石

    随着AI技术从云端向终端设备、边缘设备延伸,具备本地化AI能力的计算设备正迎来爆发式增长,本地化AI
    的头像 发表于 02-17 18:50 130次阅读
    芯海科技EC:构筑 <b class='flag-5'>AI</b> PC安全基石

    AI赋能边缘网关:开启智能时代的新蓝海

    在数字转型的浪潮中,AI与边缘计算的结合正掀起一场深刻的产业变革。边缘网关作为连接物理世界与数字世界的桥梁,在AI技术的加持下,正从简单的数据采集传输节点,进化为具备智能决策能力的边
    发表于 02-15 11:41

    新品| Unit ASR,一体离线语音识别单元

    UnitASR是一款AI语音识别单元,内置AI智能离线语音模块CI-03T。它具有语音识别声纹识别、语音增强和语音检测等多项功能,同时支持
    的头像 发表于 02-14 18:34 114次阅读
    新品| Unit ASR,一体<b class='flag-5'>化</b>离线语音<b class='flag-5'>识别</b>单元

    正点原子ESP32S3系列开发板全面支持小智AI

    (WebSocket或UDP协议) 支持国语、粤语、英语、日语、韩语5种语言识别(SenseVoice) 声纹识别识别是谁在喊AI的名字(3D Speaker) 大模型TTS(火山引
    发表于 02-14 17:01

    意法半导体在中国的本地化战略

    提前谋划本地化供应链,解决中国客户后顾之忧,提高对汽车用MCU的重视,布局从高端到中低端的全线产品。ST带着这样的愿景开始了在中国市场的下一个40年!
    的头像 发表于 01-16 12:32 404次阅读
    意法半导体在中国的<b class='flag-5'>本地化</b>战略

    爱普生科技+本地化引领五大创新

    自八十年代进入中国以来,爱普生已在中国市场上深耕近四十年。从打印机到工业机器人,爱普生业务遍布多个领域,始终秉承“科技+本地化”的核心理念,与中国市场同频共振,不断深化与本土合作伙伴合作,推出“中国定制”产品及解决方案。
    的头像 发表于 12-12 16:31 432次阅读

    传音“融入”东南亚 本地化模式成功复制 ​

    近年来,中国手机品牌逐渐在海外占有一席之地,特别是深耕海外多年的传音控股在新兴市场呈现出勃勃生机。面对日益激烈的竞争态势,传音更坚持本地化运营与技术创新双驱动,积极开拓非洲之外的市场空间,最终成功
    的头像 发表于 12-11 11:14 459次阅读
    传音“融入”东南亚 <b class='flag-5'>本地化</b>模式成功复制 ​

    Visual Components数字化工厂仿真软件本地化服务:亿达四方的优势

    的行业经验和卓越的服务能力,为用户提供了全方位的本地化服务,助力企业在智能制造领域取得成功。本文将深入探讨亿达四方在提供本地化服务方面的几大优势。 ​1. 多语言支持与定制培训 对于
    的头像 发表于 12-03 18:07 648次阅读

    联想印度布局AI服务器生产,加速AI技术本地化进程

    联想集团近日宣布了一项重大战略举措,正式在印度南部启动人工智能服务器的本地化生产,并配套在班加罗尔科技中心设立专注于AI服务器的研发实验室。此举标志着联想在全球AI领域布局的进一步深化,尤其是在亚洲市场的重要一步。
    的头像 发表于 09-19 16:46 432次阅读

    极氪与Mobileye携手加速自动驾驶技术中国本地化

    近日,新能源汽车品牌极氪汽车与以色列领先的自动驾驶技术巨头Mobileye宣布了一项重要合作计划,旨在加速双方在中国市场的技术本地化进程。此次合作的核心是将Mobileye的SuperVision自动驾驶技术深度整合至极氪汽车的下一代车型中,共同推动驾驶安全与自动驾驶技术的全面升级。
    的头像 发表于 08-06 10:19 748次阅读

    涂鸦HEDV本地化部署方案,助你低成本实现定制化开发!

    在日新月异的信息科技领域,软件定制需求不断增长,尤其在智慧校园、智慧园区和智慧能源等多元业务场景中,许多企业和组织对本地化部署的需求日益强烈。然而,传统软件应用往往难以跟上企业智能
    的头像 发表于 07-06 08:15 1067次阅读
    涂鸦HEDV<b class='flag-5'>本地化</b>部署方案,助你低成本实现定制化开发!

    亚马逊云科技与四维图新深化合作,共推汽车行业本地化服务

    在近日举办的亚马逊云科技中国峰会2024上,亚马逊云科技与四维图新宣布了新一轮的战略合作。双方将携手合作,共同设计并推出面向汽车行业的本地化服务及专属解决方案。
    的头像 发表于 05-30 14:27 648次阅读

    开发者手机 AI - 目标识别 demo

    功能简介 该应用是在Openharmony 4.0系统上开发的一个目标识别AI应用,旨在从上到下打通Openharmony AI子系统,展示Openharmony系统的AI
    发表于 04-11 16:14