0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

离线自然说,无需记固定唤醒词也能语音控制设备!

Carol Li 来源:电子发烧友 作者:李弯弯 2024-04-29 09:12 次阅读

电子发烧友网报道(文/李弯弯)离线语音识别是指不需要依赖网络,在本地设备实现语音识别的过程,通常以端侧AI语音芯片作为载体来进行数据的采集、计算和决策。

离线语音识别技术在诸多领域都具有广泛的应用前景,如用户可以通过语音控制智能家居设备,实现灯光、空调、电视等的自动化操作;在医疗设备领域,离线语音识别技术可以用于控制轮椅、病床等设备,为行动不便的患者提供便利;在车载系统中,离线语音识别技术可以实时识别驾驶者的语音指令,确保驾驶安全。

但是语音芯片的存储空间有限,通过传统的语音算法技术,最多也只能存储数百条词条,导致用户只能使用固定的词条来控制设备,大大降低了用户与设备之间的语音交互体验。

离线自然说,解决当前语音识别痛点

近日,在启英泰伦最新语音方案发布及技术交流会上,该公司技术支持总监孙振奎介绍了启英泰伦推出的一种轻量级NLP技术——离线自然说。

它的实现原理是,通过语义协议和语音识别构图结合,在进行语音识别同时对指令包含的意图和槽位进行解析(NLU),实现设备功能语音指令的理解和泛化。并且支持同时生成控制指令和反馈播报,完成识别、理解、播报的闭环。通过矩阵分解、权重共享等技术,保持低资源提高建模能力,支持说法突破万种。

据孙振奎介绍,离线自然说,可以很好地解决当前语音识别的诸多痛点,如需要联网、不会说、记不住词、反应慢、词条太少、普通话不标准、经常掉线等。离线自然说的价值在于,用户无需记忆固定词条,只需知道功能和唤醒词,即可语音控制设备,真正做到了自然、方便的人机交互。

59733f9a1f0549c1af9b402e7c29b478~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=20240429091209D914799B7E0B2D69E2BE&x-expires=2147483647&x-signature=7XZFUiUWMrX4sOJACwtFzmrDWlM%3D

具体来看,用户如果通过传统离线语音交互来打开空调,他只能说:“打开空调”。而如果通过离线自然说来打开空调,他可以说:“打开空调”、“帮我开空调”、“空调打开吧”、“开一下空调”、“我要开空调”、“空调开启”、“启动空调”、“吹空调”……

启英泰伦认为,相对于手机APP/小程序、红外遥控器、触摸按键等传统控制方式而言,自然化的语音交互更便捷、更高效、更人性化。

目前,启英泰伦离线自然说方案,已经在在风扇、吸顶灯、空调、茶吧机、油烟机、空调伴侣、窗帘电机、晾晒机、风扇灯等上完成应用,在风扇、取暖器上的应用已经非常成熟。另外,离线自然说方案在洗衣机、马桶、按摩椅、浴霸、微波炉等上的应用也在开发中。

不断迭代的语音芯片及全链条语音算法技术

启英泰伦是一家集语音芯片、语音算法、应用方案、开发平台于一体的语音解决方案供应商。其芯片产品已历经三次大迭代,四次小迭代,共计推出15款型号的智能语音芯片,涵盖AI语音芯片,AI语音Wi-Fi芯片,AI语音BLE芯片,形成系列化的芯片产品布局。

公司芯片产品现已广泛应用于智慧家居家电、智慧养老、智慧穿戴、智慧医疗、智慧酒店、智慧安防、智慧教育、智慧汽车和机器人等领域,服务客户超过5000家。

从发展历程来看,2016年,启英泰伦首度提出脑神经网络处理器(BNPU),发布全球首款AI语音芯片CI1006;2017年AI语音芯片进入家电巨头美的供应体系,支持英文语音识别;2018年发布1.5代AI语音芯片,性能不变,成本降低30%;2019年发布高性价比2代AI语音芯片(搭载BNPU V2),上线语音AI开发平台;2020年发布2.5代AI语音芯片,成本更低,支持日文等小语种语音识别;

2021年离线NLP算法取得突破,深度人声分离算法取得突破;2022年量产3代AI语音芯片、AI语音Wi-Fi Combo芯片(搭载BNPU V3),算法算力登上新台阶;2023年AIOT方案成熟,推出AI语音BLE芯片Cl231,预推出语音MCU芯片Cl132。

启英泰伦第三代CI13系列是一款极具性价比的离线AI语音芯片,包含CI1301、CI1302、CI1303、CI1306、CI1311、CI1312六款型号,据称其年装机达数千万台。

CI13系列基于启英泰伦自研BNPU 3.0,系统主频最高可达240MHz,内置高达640KByte SRAM,集成PMU电源管理单元和RC振荡器,集成双通道高性能低功耗Audio Codec和多路UART、IIC、IIS、PWM、GPIO、PDM等外围控制接口。芯片仅需少量电阻电容等外围器件就可以实现各类智能语音产品硬件方案,性价比极高。

e98fe0f9a3254f6e9e7fce530e7e9bad~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=20240429091209D914799B7E0B2D69E2BE&x-expires=2147483647&x-signature=ApbzjtogJXReJM4ZkHv4zWbIkBY%3D

CI13系列具有强大的自然语言交互能力,70dB噪声下,可以做到85%识别率及90%唤醒率(降噪模式),命令词数支持10001+词条,支持离线自然说。

在语音算法上,启英泰伦拥有完全自主知识产权的语音交互技术链条,包括语音识别、语音增强、深度降噪、回声消除、低功耗唤醒、本地语义理解、声纹识别、本地命令词自学习等语音算法。

此次交流会上,孙振奎还介绍了启英泰伦的多个语音算法。如,声纹识别,基于特定词条的声纹识别,可以通过注册声纹来区分讲话人,从而提供定制化的服务,如场景1:注册成人声纹,防止小孩不当操作导致危险;场景2:不同的人说“打开空调”,自动设置为不同人喜欢的模式,温度,档位等。

男女性别识别,基于声音特征,区分男女性别,进行不同的定制化功能开发,如识别到性别后,进行不同声音的播放;部分产品对性别有要求的,可以进行性别识别并进行个性化展示:例如智能马桶的洗洁方式。

特定声音检测,如鼾声识别:可用于智能床垫,智能枕头;婴儿哭声识别:婴儿监护产品,婴儿摇摇床等。

写在最后

用过语音控制产品的朋友们可能都知道,目前市面上大多数产品都需要精准通过唤醒词控制,然而如果一个设备一段时间没使用,或者其中一些唤醒词长时间没用过,当突然需要使用的时候,会忘记这个词,而无法顺利控制设备。而且对于一些功能较复杂的设备,需要记大量的唤醒词,稍有偏差都可能难以控制。而离线自然说算法技术,则打破了传统离线语音识别的这种局限性,只需要说出大意,设备就能听懂,互动更为高效。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    31493

    浏览量

    270103
  • 智能家居
    +关注

    关注

    1929

    文章

    9606

    浏览量

    186205
  • 语音控制
    +关注

    关注

    5

    文章

    484

    浏览量

    28290
  • nlp
    nlp
    +关注

    关注

    1

    文章

    489

    浏览量

    22089
收藏 人收藏

    评论

    相关推荐

    启英泰伦新推出多意图自然,重塑离线人机交互新标准!

    自然多意图自然说是启英泰伦新推出的一种离线NLP处理技术,该技术突破以往一次只能说一个命令的限制,可同时配置多个命令
    的头像 发表于 01-03 16:01 177次阅读
    启英泰伦新推出多意图<b class='flag-5'>自然</b><b class='flag-5'>说</b>,重塑<b class='flag-5'>离线</b>人机交互新标准!

    离线语音芯片让家电变得智能

    无需联网能进行语音控制,这对于家居类的某些设备来说,更为合适。今天主要来讲一讲九芯电子可三款离线
    的头像 发表于 11-27 01:00 218次阅读
    <b class='flag-5'>离线</b><b class='flag-5'>语音</b>芯片让家电变得智能

    离线语音芯片让家电变得智能

    九芯电子推出三款离线语音芯片NRK330X、NRK3502、NRK3603,具备无需联网、响应快等优势,适用于智能家居等领域,提供精准语音识别体验,助力物联网
    的头像 发表于 11-26 15:08 221次阅读
    <b class='flag-5'>离线</b><b class='flag-5'>语音</b>芯片让家电变得智能

    智能语音开关:离线控制,守护隐私的新选择

    智能家居依赖网络,智能音箱成入口。但隐私泄露成问题,离线智能产品应运而生。九芯电子采用NRK3502离线语音芯片,实现精准语音控制,守护用户
    的头像 发表于 11-22 13:37 292次阅读
    智能<b class='flag-5'>语音</b>开关:<b class='flag-5'>离线</b><b class='flag-5'>控制</b>,守护隐私的新选择

    离线语音控制模块,让生活更懂你!

    离线语音模块方案在智能家居、医疗设备等领域的开发正日益受到重视。这种方案无需网络连接,即可实现语音指令的识别与执行,为用户提供了更加便捷、高
    的头像 发表于 11-02 08:07 306次阅读
    <b class='flag-5'>离线</b><b class='flag-5'>语音</b><b class='flag-5'>控制</b>模块,让生活更懂你!

    离线语音控制芯片:提升家居生活便捷性,舒适度的智能原件

    离线语音控制芯片是一种集成了语音识别与处理功能的微型电子元件,它能够在不依赖网络连接的情况下,实现对特定语音指令的识别与执行, 
    的头像 发表于 10-31 15:42 202次阅读
    <b class='flag-5'>离线</b><b class='flag-5'>语音</b><b class='flag-5'>控制</b>芯片:提升家居生活便捷性,舒适度的智能原件

    用“”智能控制灯具开关语音识别芯片NRK3603

    用“”智能控制灯具开关是一种基于语音识别技术的智能家居设备,它通过内置的语音识别芯片,利用离线
    的头像 发表于 09-07 09:26 418次阅读
    用“<b class='flag-5'>说</b>”智能<b class='flag-5'>控制</b>灯具开关<b class='flag-5'>语音</b>识别芯片NRK3603

    HLK-V20支持用户修改唤醒和命令 海凌科语音定制后台系统上线

    离线语音模块物美价廉,单价低、开发简单且性能良好,但是其最大的遗憾在于其语音命令唤醒
    的头像 发表于 07-28 08:38 752次阅读
    HLK-V20支持用户修改<b class='flag-5'>唤醒</b><b class='flag-5'>词</b>和命令<b class='flag-5'>词</b> 海凌科<b class='flag-5'>语音</b>定制后台系统上线

    什么是离线语音识别芯片?与在线语音识别的区别

    离线语音识别芯片适用于智能家电等,特点为小词汇量、低成本、安全性高、响应快,无需联网。在线语音识别功能更广泛、识别准确率高,但依赖稳定网络。
    的头像 发表于 07-22 11:33 464次阅读

    离线语音控制技术特点

    离线语音控制通过结合高性能的音频前端处理算法和本地AI模型实现了高效的语音识别和控制能力,不依赖于互联网连接,同时具备灵活的应用扩展性。这种
    的头像 发表于 06-26 18:12 563次阅读
    <b class='flag-5'>离线</b><b class='flag-5'>语音</b><b class='flag-5'>控制</b>技术特点

    十万级口语识别,离线自然技术让智能照明更懂你

    在智能照明中,语音控制因其便捷性而备受青睐。然而,传统的离线语音控制方式存在诸多局限,如支持的词条数量有限、用户需要记忆
    的头像 发表于 04-30 08:15 425次阅读
    十万级口语识别,<b class='flag-5'>离线</b><b class='flag-5'>自然</b><b class='flag-5'>说</b>技术让智能照明更懂你

    **十万级口语识别,离线自然技术,让智能照明更懂你**

    固定词条等。针对这些问题,启英泰伦现已推出成熟的可应用于照明设备离线自然方案,该方案已在多家智能照明厂商最新产品上实现应用落地。 照明
    发表于 04-29 17:09

    澎湃微离线语音识别应用实例

    随着科技的飞速发展,人机交互的方式在不断演变。在键盘、触摸屏之后,语音识别技术正逐渐成为人机交互的新宠。从技术路线上来讲语音识别又分为在线语音
    发表于 03-15 14:11 477次阅读
    澎湃微<b class='flag-5'>离线</b><b class='flag-5'>语音</b>识别应用实例