0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

语音唤醒技术的对比,语音唤醒技术哪家强

语音技术智能汇 来源:语音技术智能汇 作者:语音技术智能汇 2022-03-23 10:54 次阅读

编辑导语:

随着语音交互技术的日渐成熟,越来越多的智能硬件都选择增加语音能力作为产品卖点之一。但是,设备在进入语音交互工作状态的时候,需要先进行唤醒操作。

常见的唤醒语音交互的操作有按键或者触屏形式,但是,为了进一步降低学习成本和操作复杂度,也有不少的智能硬件选择通过语音唤醒的方式来激活交互功能。

本文将综合对比市面上各家提供的语音唤醒技术相关指标,可以帮助你快速掌握语音唤醒技术的情况。

一、语音唤醒技术的相关核心指标

1、唤醒率

语音唤醒的主要目的既然是激活设备进入交互工作状态,那么,唤醒率的高低就显得额外重要了。理论上,最好的状态就是我只要说一次唤醒词,设备就能立即响应。不过,受说话人与设备距离、发音标准、噪声等各种各样的因素,实际工作中比较难达到次次响应的完美工作状态。

一般来说,在近距离的安静场景下,市面上的技术都能够做到唤醒率在95%以上。

不过,消费者的实际使用场景是较复杂的,因此,需要模拟不同的应用场景进行实测,才能得到最后的唤醒率指标。

2、误唤醒率

指设备被非唤醒词唤醒的概率,误唤醒率越高,效果越不好。

大家在日常生活中可能会经常碰到,放在家里的智能音箱,大晚上莫名其妙答一句“我在”,把人吓个半死;还有如果家里用的智能电视,唤醒手机语音助手的时候,不是同一个唤醒词,电视也会蹦出一句“我在”。

这就是典型的误唤醒场景,一般用24小时被误唤醒多少次来衡量。

3、响应时长

主要是指用户说完唤醒词后,设备给出反馈的耗时,一般越短越好。

而反馈的形式则比较多样,可以通过语音应答响应、也可以通过亮屏或者指示灯闪烁响应。统计来看,如果是亮屏或者指示灯闪烁响应,控制在200ms以内用户体验较好;如果是语音应答响应,太快反而体验不好,一般控制在500ms左右更佳。

4、功耗

主要是针对电池供电设备,理论上越低越好,这样,设备的使用时长不会受到太大的影响。

因为唤醒的工作原理是会持续检测声音中是否包含唤醒词的特定片段,所以,会持续耗电。

为了进一步降低功耗,部分产品也会采取DSP来完成语音唤醒,再通过AP层兜底的模式,保证唤醒和功耗的均衡。

总结:语音唤醒的技术指标,除了与算法相关之外,还与智能硬件的结构设计、芯片算力、使用场景等息息相关。最后的实际效果,则应以实际测试效果为准,参考下图:

二、语音唤醒技术对比

该对比信息均从互联网公开渠道获取,相关信息来源于提供商官网公开信息,如其官网有更新,请以更新信息为准。(PS:百度搜索关键词“语音唤醒”)

poYBAGI6i66AIXdTAAn5A2rKJxY710.png

三、唤醒词的区别

唤醒词的定义实际是比较广泛,至少包含了四种使用场景:品牌唤醒词(如,小飞小飞)、离线命令词(如,我要听周杰伦的歌)、云端命令词(如,我要听周杰伦的歌)、免唤醒词(如,下一首、暂停)。这些使用场景,实际上都是使用了唤醒词的原理,只是唤醒后执行不同的动作。

四、语音唤醒项目实施要点

1、唤醒词评估

大部分服务商都提供了唤醒词评估服务,不过,有部分服务商对唤醒词有一定的限制。因此,在选择唤醒词的时候,需要充分考虑品牌、发音特点、词语等因素,综合确定最终的唤醒词。

2、确认测试环境和工具

以以往交付的唤醒项目来看,主要测试的环境包括:外噪场景测试、自噪场景测试、安静场景测试和误唤醒测试。

3、声音采集

根据产品主要面向的使用人群,采集真人发音音频。

示例:【某某投影仪音频采集需求】

  • 采集人数200人,总音频2000句
  • 男女比=1:1
  • 一人10句
  • 语速快:中:慢=1:3:1
  • 年龄儿童:青年:中年=1:3:1
  • 区域:北上广深
  • 普通话

4、测试音频处理

包括去除破音的音频、去除时长>1.7s的测试音频、音频幅度归一化。

5、数据记录表

根据实测结果,如实填写表格中对应测试结果,完成项目验收。

如果需要更深入地咨询了解,可添加笔者V:HolaAI,详细交流。

审核编辑:符乾江

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语音控制
    +关注

    关注

    5

    文章

    482

    浏览量

    28252
  • 语音交互
    +关注

    关注

    3

    文章

    286

    浏览量

    28018
收藏 人收藏

    评论

    相关推荐

    领先技术语音识别芯片,探索NRK3502芯片的技术特点

    九芯电子NRK3502芯片以卓越创新力和技术积累引领语音识别领域,低成本纯离线,高精度识别保障隐私,支持多唤醒词,低功耗高性能,推动智能家居、智慧办公等领域发展。
    的头像 发表于 12-25 13:06 71次阅读

    语音识别技术的应用与发展

    语音识别技术的发展可以追溯到20世纪50年代,但直到近年来,随着计算能力的提升和机器学习技术的进步,这项技术才真正成熟并广泛应用于各个领域。语音
    的头像 发表于 11-26 09:20 466次阅读

    ASR语音识别技术应用

    ASR(Automatic Speech Recognition)语音识别技术,是计算机科学与人工智能领域的重要突破,能将人类语音转换为文本,广泛应用于智能家居、医疗、交通等多个领域。以下是对ASR
    的头像 发表于 11-18 15:12 641次阅读

    语音灯控新体验,让传统开关实现智能化!

    —方案开发—LED灯语音控制方案LED灯语音控制方案是一种基于语音识别技术的智能家居解决方案,旨在通过语音指令实现对家中灯光的智能控制。该方
    的头像 发表于 10-19 08:08 226次阅读
    <b class='flag-5'>语音</b>灯控新体验,让传统开关实现智能化!

    【电磁兼容技术案例分享】因唤醒线导致的CE电压法测试超标整改分析案例

    【电磁兼容技术案例分享】因唤醒线导致的CE电压法测试超标整改分析案例
    的头像 发表于 09-28 08:03 377次阅读
    【电磁兼容<b class='flag-5'>技术</b>案例分享】因<b class='flag-5'>唤醒</b>线导致的CE电压法测试超标整改分析案例

    干货分享 | TSMaster—LIN 唤醒与休眠机制

    在汽车总线中常见的唤醒方式有硬线唤醒、网络唤醒和特定信号唤醒,而LIN总线则是通过休眠帧与唤醒电平来实现的,本文将介绍LIN的
    的头像 发表于 09-25 08:03 1726次阅读
    干货分享 | TSMaster—LIN <b class='flag-5'>唤醒</b>与休眠机制

    HLK-V20支持用户修改唤醒词和命令词 海凌科语音定制后台系统上线

    HLK-V20离线语音模块首发即爆款,在抖音上V20的单个视频播放量过100万。关于这款产品用户咨询量最多的便是语音命令词和唤醒词的自定义问题。在很多用户看来,作为一款离线语音模块,H
    的头像 发表于 07-28 08:38 650次阅读
    HLK-V20支持用户修改<b class='flag-5'>唤醒</b>词和命令词 海凌科<b class='flag-5'>语音</b>定制后台系统上线

    信息成功中标“语音智检项目”

    在智能语音技术领域深耕多年,成功中标澳门某银行“语音智检项目”,彰显了普在智能语音
    的头像 发表于 07-25 16:35 553次阅读

    使用\"hi 乐鑫\"语音唤醒,成功率比较低怎么解决?

    你好,我正在测试使用 esp-box,使用\"hi 乐鑫\"语音唤醒,成功率比较低。 已经设置为中文场景,但经常用\"hi 乐鑫\"唤醒无反应,这里面有什么设置要求吗? 另,乐这个字是个多音字,有什么方案可以在开发模式下更换
    发表于 07-19 06:33

    请问ESP32-EYE开发板例程支持修改语音唤醒命令吗?

    请问ESP32-EYE 开发板例程支持修改语音唤醒命令吗?该如何修改?
    发表于 06-28 16:23

    86box开发板在出厂测试固件下ui界面无法语音唤醒控制是什么情况?

    我在官方组织的开发者大会上看见86box开发板的出厂例程可以在UI界面语音唤醒并响应打开空调指令,界面会跳转到空调UI并打开,但是我的板子出厂例程进入ui后就对语音不响应,只能用哪个纯语音
    发表于 06-11 08:50

    蓝牙模块唤醒原理是怎样的?

    具有一项独特的功能——唤醒功能。本文将详细介绍蓝牙模块唤醒的工作原理。  一、蓝牙模块唤醒的基本原理  蓝牙模块唤醒的工作原理主要基于低功耗蓝牙(BLE)
    的头像 发表于 05-27 15:52 1501次阅读
    蓝牙模块<b class='flag-5'>唤醒</b>原理是怎样的?

    离线自然说,无需记固定唤醒词也能语音控制设备!

    电子发烧友网报道(文/李弯弯)离线语音识别是指不需要依赖网络,在本地设备实现语音识别的过程,通常以端侧AI语音芯片作为载体来进行数据的采集、计算和决策。 离线语音识别
    的头像 发表于 04-29 09:12 4541次阅读
    离线自然说,无需记固定<b class='flag-5'>唤醒</b>词也能<b class='flag-5'>语音</b>控制设备!

    成功中标某省电信“智能语音质检”项目

    在智能语音技术领域深耕多年的企业,继成功中标中移在线项目后,再度传来喜讯,成功中标某省电信的”智能语音质检“项目,充分彰显普在智能
    的头像 发表于 03-29 17:16 631次阅读

    DCM模块唤醒网络主动与被动唤醒机制探讨

    CanNm专题机从Prepare Bus-Sleep Mode切换到Nework Mode的Repeat Message State是如果是通过CanNm_PassiveStartUp()条件切换的就是被动唤醒,如果是通过CanNm_NetworkRequest()条件切换的就是主动
    发表于 03-15 11:20 1068次阅读
    DCM模块<b class='flag-5'>唤醒</b>网络主动与被动<b class='flag-5'>唤醒</b>机制探讨