0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

百亿美元市场的语音识别为何如此受青睐?

高工智能汽车 来源:电子发烧友网 作者:工程师谭军 2018-07-12 10:35 次阅读

有数据显示,到2020年,全球语音市场规模预计将达到 191.7 亿美元。语音识别作为研究人工智能的方向之一,随着语音交互技术的发展,语音AI芯片也随之诞生。现在不论是互联网巨头,还是AI 初创公司,都陆续宣布进军芯片领域。

回头看国内车载语音市场,真正开始发展可以说是在2013年。在此之前,车内语音部分的运用最多也就是听音乐和广播,虽然车载语音已经出现,但系统还处于初级阶段,准确率还不够高,市场普及度很低。

2013年是一个转折点,行业开始变革,更多人开始关注车载语音市场的发展。2015年之后侧重云端方向,和智能汽车、车联网的发展方向相关,产品形态也越来越标准。

2016年,随着人工智能领域的发展,很多公司在智能语音部分加大了力度, 特别是对语音芯片的研发。今年更是语音芯片“爆发”的一年,并且在之后的一段时间,语音芯片还会持续作为热点。

多场景、低功耗

不同的语音技术公司研发语音芯片的考虑可能都不太一样,大体上来讲有几方面原因。

首先是快速集成和低功耗的需要。语音芯片能够更好地将本地功能进行集成,同时由于现在涉及深度学习的计算量巨大,终端设备对功耗的要求也很高,低功耗的芯片成为市场需求。

其次是IoT时代下多样化场景的需要。物联网场景下,设备形态是多样化的,需要一个硬件载体,成本低,算力强,同时能承载多样化终端设备的需求,芯片在这个过程中扮演着核心的角色。

此外还有盈利的目的。任何语音技术公司,推出产品或者技术、以及软硬件一体化的方案,最终都是为了盈利。研发语音芯片也不例外,现在正是物联网时代推动产品落地的时间点,增加硬件功能之后的产品会带来更高的市场效益。

语音芯片,从IOT到车载

不久前,云知声,思必驰、出门问问等语音技术公司相继发布了自己的AI芯片计划。

5月16日,云知声发布了首款面向物联网领域的AI芯片UniOne,同时,亿咖通和云知声签署了战略合作,将携手在UniOne芯片的基础上打造车规级AI芯片,这一芯片可以为用户与车之间提供更深层次的智能语音交互能力。

5月24日,出门问问发布了国内首款已经量产的AI语音芯片模组“问芯”Mobvoi A1,它可以帮助传统家电厂商获得远场语音交互的能力,之后会在创维电视和微鲸电视上实现合作落地。

6月26日,智能语音技术公司思必驰宣布已完成新一轮融资,并宣布已与某芯片巨头在AI芯片方面达成合作,双方将成立合资公司,并且适用于智能语音交互的AI芯片已在研发过程中。

虽然语音技术公司陆续宣布自己在研发语音芯片,但高工智能汽车咨询了多家语音技术公司以及主机厂,了解到现在还没有专门针对车载领域的语音芯片。

云知声芯片负责人李霄寒博士介绍,云知声5月16日发布的这款芯片是UniOne 系列芯片中的第一款,从语音AI切入,芯片命名“雨燕”,主要面向的是IoT领域,适合智能家电、智能车载等多个人机交互场景。目前在积极推进车规级芯片设计,预计明年推出符合车规要求的“雨燕”产品。

另一家语音公司思必驰宣布研发的AI芯片,也不是专门针对车载领域的语音芯片,预计下半年流片;出门问问推出“问芯”Mobvoi A1是语音芯片模组,即语音模组和芯片的结合,最先是在智能家居领域,也不是针对车载领域的语音芯片。

现在市场上推出的“语音芯片”可以称作是传统芯片的“智能化”,将芯片和语音技术融合在一起,相比传统的芯片和语音技术独立而言,语音和芯片一体化之后,二者相互结合,如果芯片能够和语音技术很好地匹配,不仅能够解决兼容性的问题,同时还能实现降低功耗需求。

车规级的语音芯片是市场需求

车载领域的语音芯片首先一定要满足车规的技术要求,通过温度、稳定性的测试才可以上车,研发出可以通过车规的语音芯片还存在难点。

技术上,开发芯片本身就有一定的难度。软件和芯片要结合在一起,其实就是把交互的东西放到硬件载体上,配比和兼容就是有难度的,还要做到识别速度快、适配不同的CPU、最后到实现量产,都需要强大的技术支撑。

虽然现在缺乏车载领域的语音芯片,随着汽车智能化以及车载语音交互的发展,未来车规级的语音芯片会成为市场需求。

吉利汽车负责HMI的相关人士表示,现在车载语音控制能力还远远不够,就目前已经上市的车型而言,语音的在线控制识别速度很慢,而本地词库又很少,自然语音状况下语音内容和词库无法匹配,就会出现无法识别或识别有误。

而目前市面上推出“云+端+芯片”或者“云端芯”一体化的芯片,优化了网络识别的能力,但本地识别的能力依旧比较差,识别速度慢,用户是比较难接受的。

语音芯片需要提高本地识别功能,但未来比较理想的是,随着网络传输速度的完善,研发出能够将本地识别和在线识别结合在一起的语音芯片。

亿咖通相关人士表示,随着车联网,人工智能的发展,车载芯片性能远远不能满足汽车娱乐和多样化交互功能需求。语音作为车载系统的刚需和亮点,更希望有强劲的硬件加速能力和适应力的平台,车规级智能语音芯片会是大势所趋。

响应速度和识别率如何提升

最近,首款搭载“祺云概念”智联系统的中期换代车型传祺GS4搭载的智能语音控制系统,用户发出语音指令,系统便能在1.2秒内快速反应。官方宣称,速度和灵敏度远超同级。

传祺智能语音控制系统能够在正常环境中实现95%识别正确率并具备多方言口音普通话的识别能力,离线语音识别能力、汽车训练的麦克阵列降噪能力、语音打断技术、可见即可说、自定义语音唤醒等多项核心技术能力。

针对传祺GS4智能语音控制系统这一大卖点,有业内人士表示:“在网速、使用环境、车机CPU、内存等各方面最佳工况时,达到1.2S响应、95%识别率并不难。”

而在实际应用中,车辆噪音、网速波动、车机后台多进程、硬件资源被占用、第三方执行器件延迟等等,都会造成语音控制系统延迟

科大讯飞相关人士表示:“影响语音识别响应时间有:音频后端检测、网络传输、引擎处理和应用处理四个方面。”

音频后端点检测是影响语音响应速度最重要的部分,也是不可减少和用时最长的部分。讲完一句语音指令,系统需要800ms-1000ms静音段来识别讲话是否结束,减少这个时间,则会带来体验下降。例如,用户说话停顿,系统误认为用户已经说完了,导致错误的识别结果。

引擎处理,车机硬件配置低或其它进程占用CPU、内存等硬件资源,导致语音处理进程没有足够的系统资源,引起处理延迟。

通过升级车机硬件和优化引擎算法两种方案可以有效解决问题,但升级硬件配置需要增加成本,所以主机厂更加倾向于,优化引擎算法,在低成本硬件平台上实现高效语音系统应用。

网络速度慢、不稳定也是会导致语音识别延迟的一大因素。通过提升网络传输速率,如未来的5G通讯,也可以有效减少延迟。

除此之外,优化信源(地图、音乐、电台等等)和第三方执行器件(开车内灯、开天窗、座椅加热等等),也能减少语音控制系统延迟,提升用户体验。

语音控制、触屏、机械按键等都属于控制层,最终做出执行反馈的是信源和第三方执行器件。如果信源和第三方执行器件运行缓慢,也会影响用户对语音控制系统的体验。

目前,车载领域已经量产的语音产品大多数响应时间在1.5s-3s之间,当响应时间达到2s以上时,用户能够感觉到明显的延迟。

低NVH可提高识别率

识别率对用户体验至关重要,识别率太低、不准确,用户好似对牛弹琴,不但不能体现语音控制系统的便利性,反而会成为鸡肋配置。

主机厂相关人士表示:“提升语音识别率除了技术方面,降低车辆NVH也是一个重要的途径。”

车辆行驶中,外界环境噪音、发动机震动噪音、胎噪、风噪、车身共振等等都会影响语音指令识别率,所以除了不断对语音系统优化之外,降低车辆NVH也是提升语音识别率和用户体验的方法之一。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    456

    文章

    50886

    浏览量

    424185
  • AI
    AI
    +关注

    关注

    87

    文章

    30996

    浏览量

    269293
  • 人工智能
    +关注

    关注

    1791

    文章

    47350

    浏览量

    238757
  • 车联网
    +关注

    关注

    76

    文章

    2586

    浏览量

    91611

原文标题:“语音AI芯片”持续发酵,车载语音去向何处?| GGAI深度

文章出处:【微信号:ilove-ev,微信公众号:高工智能汽车】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【「嵌入式系统设计与实现」阅读体验】+ 基于语音识别的智能杯垫

    语音命令Q 识别,适用于智能家居控制、玩具、人机交互等多个领域。该模块以其高识别率、低功耗和易于集成的特点受到广大开发者的青睐。 主要技术及功能有: 磁力搅拌、重量采集、
    发表于 01-02 18:15

    离线语音识别技术引领智能语音灯具市场——NRK3502

    智能语音灯具集高科技与人性化设计,内置NRK3502离线语音识别芯片,支持远场识别与自定义指令,提供便捷智能体验,推动智能家居行业发展。
    的头像 发表于 12-30 15:04 91次阅读
    离线<b class='flag-5'>语音</b><b class='flag-5'>识别</b>技术引领智能<b class='flag-5'>语音</b>灯具<b class='flag-5'>市场</b>——NRK3502

    语音识别与自然语言处理的关系

    在人工智能的快速发展中,语音识别和自然语言处理(NLP)成为了两个重要的技术支柱。语音识别技术使得机器能够理解人类的语音,而自然语言处理则让
    的头像 发表于 11-26 09:21 422次阅读

    语音识别技术的应用与发展

    语音识别技术的发展可以追溯到20世纪50年代,但直到近年来,随着计算能力的提升和机器学习技术的进步,这项技术才真正成熟并广泛应用于各个领域。语音识别技术的应用不仅提高了工作效率,也极大
    的头像 发表于 11-26 09:20 501次阅读

    ASR与传统语音识别的区别

    ASR(Automatic Speech Recognition,自动语音识别)与传统语音识别在多个方面存在显著的区别。以下是对这两者的对比: 一、技术基础 ASR : 基于深度学习算
    的头像 发表于 11-18 15:22 501次阅读

    ASR语音识别技术应用

    ASR(Automatic Speech Recognition)语音识别技术,是计算机科学与人工智能领域的重要突破,能将人类语音转换为文本,广泛应用于智能家居、医疗、交通等多个领域。以下是对ASR
    的头像 发表于 11-18 15:12 723次阅读

    物联网系统智能控制产品的语音识别方案_离线语音识别芯片分析

    01 物联网系统中为什么要使用离线语音识别芯片 物联网系统中使用离线语音识别芯片的原因主要基于以下几个方面: 1、实时性与可靠性 实时性好:离线语音
    的头像 发表于 09-26 17:56 632次阅读
    物联网系统智能控制产品的<b class='flag-5'>语音</b><b class='flag-5'>识别</b>方案_离线<b class='flag-5'>语音</b><b class='flag-5'>识别</b>芯片分析

    WTK6900FC语音识别模块

    语音识别
    WT-深圳唯创知音电子有限公司
    发布于 :2024年09月25日 17:35:07

    唯创知音WT2605C用在离在线语音识别方案# #语音芯片 #语音识别 #唯创知音

    语音识别
    WT-深圳唯创知音电子有限公司
    发布于 :2024年09月12日 17:24:28

    什么是离线语音识别芯片?与在线语音识别的区别

    离线语音识别芯片适用于智能家电等,特点为小词汇量、低成本、安全性高、响应快,无需联网。在线语音识别功能更广泛、识别准确率高,但依赖稳定网络。
    的头像 发表于 07-22 11:33 415次阅读

    网络延迟为何如此重要

    网络延迟是指数据在网络上从一点传输到另一点所需的时间。它是影响任何基于网络的系统(包括网站、应用程序和云服务)的关键因素。 以下是网络延迟很重要的一些原因: 体验 延迟会影响基于网络的系统的用户体验。例如,在浏览网站时,延迟可能会导致页面加载时间延迟,从而导致用户感到沮丧,甚至可能导致用户离开。 生产力 网络延迟会严重影响生产力。例如,网络速度慢会导致访问文件或应用延迟,从而浪费时间并降低效率。 收入 对于依赖
    的头像 发表于 05-28 10:39 464次阅读

    环保又高效:365nm固化灯为何如此受欢迎?

    在追求绿色发展和高效生产的当下,一款产品若能在满足性能需求的同时,还兼具环保与高效两大优势,无疑会受到市场的热烈追捧。而在工业固化领域,365nm固化灯便是这样一款备受瞩目的产品。那么,为何
    的头像 发表于 05-15 11:19 354次阅读
    环保又高效:365nm固化灯<b class='flag-5'>为何如此</b>受欢迎?

    RISC-V为何如此重要?

    本文由半导体产业纵横(ID:ICVIEWS)编译自xda-developersRISC-V正在缓慢而悄然地改变CPU市场。RISC-V在过去几年中一直是行业流行语,它正在慢慢改变半导体市场。但是
    的头像 发表于 04-29 08:28 399次阅读
    RISC-V<b class='flag-5'>为何如此</b>重要?

    什么是边缘计算?它为何如此重要?

    ,什么是边缘计算?它为何如此重要?本文将对其进行详细的解析。 边缘计算,简而言之,是指在靠近物或数据源头的一侧,采用网络、计算、存储、应用核心能力为一体的开放平台,就近提供最近端服务。它的核心思想是将计算任
    的头像 发表于 04-22 15:25 473次阅读

    语音识别的技术历程及工作原理

    语音识别的本质是一种基于语音特征参数的模式识别,即通过学习,系统能够把输入的语音按一定模式进行分类,进而依据判定准则找出最佳匹配结果。
    的头像 发表于 03-22 16:58 3274次阅读
    <b class='flag-5'>语音</b><b class='flag-5'>识别</b>的技术历程及工作原理