0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

语音控制视为人机接口进步项 语音激活可嵌入到任何地方

CEVA 来源:lp 2019-02-27 17:26 次阅读

历史书可能会将语音控制视为人机接口中最重要的进步。我们不再打字,不再指点,只需说出想要什么就可以了。这个领域的初期进展十分缓慢,直到智能扬声器的出现,让我们开始意识到了解决方案。现在,随着在手机、耳机、可穿戴设备和智能家居中识别功能和应用的改进,这场竞争已然开始。如今,最广为人知的解决方案依赖于少数提供商控制的平台和服务,但这种情况正在发生改变。语音激活可嵌入到任何地方,不仅可以定制,还可提高抗噪性,降低功率,扩大范围,而且在语音识别方面与大型平台一样有效。

消费类语音产品市场的历史饶有趣味,而语音识别功能在其中起着重要作用。FutureSource 显示,从 2008 年到 2012 年,语音体验主要集中在智能手机上,整体市场价值下降。从 2012 年到 2014 年,市场基本持平。然后,从 2015 年到 2018 年,主要受语音激活驱动,它再次以 15% 的复合年增长率增长。展望未来,Yole Développement 预计到 2023 年,复合年增长率至少为 30%,这主要得益于语音识别。这一增长将主要集中在智能手机上,其次是耳机和可穿戴设备、个人助理和智能家居功能(电视、电器等)。同一份报告得出的结论是,我们现在正进入智能语音的第二阶段,随着消费者对这种控制方法越来越满意,语音控制将变得越来越普遍。

无论部署在哪里,他们的目标都是增强实别能力。在智能手机或任何其他电池供电的设备中,一个明显的优势是支持始终在线聆听;在发出命令之前无需按下按钮。这就需要超低功耗的触发命令词检测,众所周知,这意味着硬件与软件的契合,以尽量降低待机功耗。当然,用户都希望为自己的品牌定制个性化触发命令词或短语的功能,并且可以支持多种语言,以便在其所在地区甚至国际市场上获得强大的渗透力。您仍然将后续命令传递给某个主要的语音识别提供商来识别请求。或者,也许不必。如果您的设备只需要对有限的词汇表提供支持,并且您的语音识别引擎可以满足该目标,则可能无需第三方的帮助。

另一个关键需求是在嘈杂的环境中进行识别,也许还有身份验证。语音识别所面临的挑战与目标识别不同。例如,在起居室或汽车中,可能会有多个声源:人们说话、电视和独立的音乐/无线电、室内外的噪音、以及房间或汽车内部表面反射的回声。隔离命令源、消除回声和降低背景噪声需要一些复杂的技术,这取决于多麦克风、波束成形和回声消除,以及噪声抑制。

当然,鉴于这些需求,CEVA公司已备好满足这些需求的可用解决方案。最近推出的 CEVA Whispro™ 语音识别产品解决方案就采用了在 CEVA DSP 平台上运行的,基于神经网络的软件。Whispro 已经支持“Alexa”和“Ok Google”作为触发命令词,并且可以在培训中进行自定义,以支持任何客户要求的触发命令词。它支持多种语言,可以处理多种语音触发。该方案在多噪声背景下进行培训,因此,识别具有嵌入的抗扰性,识别率大于 95%,每小时错误接受率小于 1 次,且无需进行云识别。

通过添加专门的语音拾取解决方案 CEVA ClearVox™,开发人员可实现多麦克风支持和波束成形,以改进远场语音拾取、消除回声和进一步降低噪音。Whispro 与 ClearVox 的组合可以在更远的距离内(最远 7 米),尤其是在嘈杂的环境中,也能够提供具有竞争力的触发识别。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语音接口
    +关注

    关注

    0

    文章

    10

    浏览量

    9894
  • 语音控制
    +关注

    关注

    5

    文章

    481

    浏览量

    28217

原文标题:语音接口的大众化【中文版】

文章出处:【微信号:CEVA-IP,微信公众号:CEVA】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Transformer模型在语音识别和语音生成中的应用优势

    随着人工智能技术的飞速发展,语音识别和语音生成作为人机交互的重要组成部分,正逐渐渗透到我们生活的各个方面。而Transformer模型,自其诞生以来,凭借其独特的自注意力机制和并行计算能力,在
    的头像 发表于 07-03 18:24 932次阅读

    卷积神经网络在语音识别中的应用

    随着人工智能技术的飞速发展,语音识别技术作为人机交互的重要桥梁,受到了广泛的关注和研究。语音识别技术旨在将人类语音信号转换为文本信息,实现自然语言理解和
    的头像 发表于 07-01 16:01 675次阅读

    语音控制模块_雷龙发展

      1,串口   uart串口控制模式,即异步传送收发器,通过其完成语音控制。 []()   图中,GND表示单片机系统电源的参考地,TXD是串行发送引脚,RXD是串行接收引脚。发送uart将来
    发表于 06-14 17:18

    MCU配对简化了语音控制接口设计

    携手合作,为STM32微控制器的嵌入语音识别创建了一个完整的软件、硬件和许可包,并使添加语音接口变得简单。 它还将使设计工程师能够在没有编
    的头像 发表于 05-06 16:21 2070次阅读

    澎湃微离线语音识别应用实例

    随着科技的飞速发展,人机交互的方式也在不断演变。在键盘、触摸屏之后,语音识别技术正逐渐成为人机交互的新宠。从技术路线上来讲语音识别又分为在线语音
    发表于 03-15 14:11 356次阅读
    澎湃微离线<b class='flag-5'>语音</b>识别应用实例

    AI加速智能家居分布式语音技术发展

    中的任何地方通过语音命令来控制智能设备,实现更具有体验性的居家生活。   什么是分布式语音技术?   分布式语音技术,也称为DSR(Dist
    的头像 发表于 02-01 00:16 5739次阅读

    语音数据集:智能语音技术的燃料与推动力

    随着人工智能技术的不断进步语音技术作为人机交互的重要方式,正在逐渐渗透到我们的日常生活中。而语音数据集作为智能语音技术的“燃料”,对于推动
    的头像 发表于 12-29 11:11 370次阅读

    语音数据集:推动人工智能语音技术的关键要素

    随着人工智能技术的飞速发展,语音技术已成为人机交互领域的重要一环。语音数据集作为支撑语音技术研发与应用的基础资源,对于推动人工智能语音技术的
    的头像 发表于 12-29 11:00 556次阅读

    语音数据集:智能语音技术的基石与挑战

    随着人工智能技术的飞速发展,语音技术已成为人机交互领域的重要突破口。语音数据集作为支撑语音技术研发的核心资源,对于提高语音识别、合成及自然语
    的头像 发表于 12-28 11:28 672次阅读

    科大讯飞语音控制模块怎么用

    科大讯飞语音控制模块是一种人机交互技术,它利用语音识别和语音合成技术,使用户可以通过语音指令来
    的头像 发表于 12-25 13:58 1653次阅读

    OTP语音芯片与重复擦写(Flash型)语音芯片:特性比较与应用差异

    嵌入语音应用中,OTP(一次性可编程)语音芯片与重复擦写(Flash型)语音芯片是两种常见的存储解决方案,它们在特性和应用上存在明显差
    的头像 发表于 12-14 10:13 544次阅读
    OTP<b class='flag-5'>语音</b>芯片与<b class='flag-5'>可</b>重复擦写(Flash型)<b class='flag-5'>语音</b>芯片:特性比较与应用差异

    什么是重复擦写(Flash型)语音芯片?

    什么是重复擦写(Flash型)语音芯片?重复擦写(Flash型)语音芯片是一种嵌入语音存储
    的头像 发表于 12-14 10:08 568次阅读
    什么是<b class='flag-5'>可</b>重复擦写(Flash型)<b class='flag-5'>语音</b>芯片?

    语音数据集:推动AI语音技术的核心力量

    一、引言 随着人工智能的快速发展,语音技术作为人机交互的重要手段,正发挥着越来越重要的作用。而语音数据集则是推动AI语音技术的核心力量。本文将详细介绍
    的头像 发表于 12-12 11:32 661次阅读

    离线语音识别及控制是怎样的技术?

    引言:  随着人工智能的飞速发展,离线语音识别技术成为了一备受瞩目的创新。离线语音识别技术能够将人的语音转化为可理解的文本,无需依赖网络连接,极大地提升了
    发表于 11-24 17:41

    情感语音识别技术在人机交互中的应用与展望

    一、引言 随着人工智能技术的不断发展,人机交互已经渗透到日常生活的方方面面。情感语音识别作为人机交互中的关键技术之一,能够通过分析人类语音中的情感信息实现更加智能化和个性化的
    的头像 发表于 11-22 10:40 715次阅读