0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

车载语音交互市场的竞争也在从后装市场向前装蔓延

高工智能汽车 来源:lq 2019-01-25 13:28 次阅读

“比做语音的公司更懂车,比做车的公司更懂语音。”这或许是车载语音交互战场的杀手锏。

2017年4月,大众汽车集团(中国)与人工智能初创公司出门问问正式建立合作伙伴关系,双方确定将共同成立一家合资企业,在汽车领域展开合作。

这家名为问众智能的合资公司,基于出门问问领先的语音识别、自然语言处理、垂直搜索和主动式搜索技术,以及大众汽车集团在汽车和移动出行领域的地位,为未来的智能移动出行提供解决方案。

“公司成立之后比较低调,”1月15日下午,在2018高工智能汽车年会开幕式环节,来自问众智能的CEO张亚登台亮相,“大众汽车大家都比较熟悉,出门问问则是一家AI语音企业,也是在可穿戴式设备,比如手表、耳机以及智能音箱等领域有比较好积累的AI独角兽。”

这样的行业组合背后,是快速增长的车载语音市场需求。有数据显示,全球车载语音助理市场预计将在2017到2023年间以39.27%的年复合增长率增长,到2023年将达到78亿美元市场规模。而根据高工智能产业研究院(GGAI)发布报告称,到2020年中国前装车载语音年均市场规模将达到25亿元左右。

此外,车载语音交互市场的竞争也在从后装市场向前装蔓延。目前,各家汽车OEM厂商推出的2019年新车都将配置智能语音交互系统,前装车型的市场争夺战也在悄然打响。

一、技术公司没有商业边界

之所以过去一年多时间公司一直没有太多信息披露,张亚表示,做前装的车载项目需要花很多的精力,这是一个比较漫长的过程,它和互联网开发一个APP是不一样的。

问众智能从2017年初成立以来,其语音全栈式解决方案正在覆盖大众集团旗下多个乘用车品牌,包括一汽大众、上汽大众、江淮大众,奥迪等等。去年8月,问众智能成为南北大众五百万辆级车联网系统的语音方案提供商。

“按照正在进行中的项目装机覆盖率计算,到2020年问众智能在前装语音市场的占有率将位居市场NO.1。”张亚表示。

不过,问众智能并没有局限于内部客户。“我们以开放的心态,做技术的公司不太会介意自己的商业边界,只要我们的产品和技术是过硬的,一定会赢得更多客户的亲睐。”张亚对此信心满满。

二、从标准化到差异化

车载语音,这并不是新鲜的细分市场应用,语音和汽车的捆绑是在3、4年前就开始了。张亚表示,曾经问自己一个问题,车载语音这个行业是不是需要多一家像问众智能这样的公司?我们认为自己对这个问题有答案。

传统的语音供应商,接触那么多潜在客户之后,发现它只能提供标准化的语音服务方案,如果所有的客户都是用同一种语音方案,显然无法做到差异化的用户体验。

业内人士表示,虽然国内能够提供语音交互方案的公司众多,但真正应用到车载领域,获得规模化用户的企业并不多。通用的语音平台一般功能相对完善,但是对应到车企的定制化需求,用户的体验就千差万别了。

在张亚看来,问众智能愿意与客户做更多定制化的产品设计。像BAT互联网巨头进入到这个行业,很多OEM客户在考虑要不要跟BAT合作。BAT真正的问题是不太懂车厂,车厂的开发流程,质量要求,包括产品的体验。

往往对于BAT而言,则是希望把自己的一整套系统方案(不仅仅是语音)放在车上去用。而AI初创公司,对于车载上面的技术积累比较浅薄。

对于语音技术公司来说,产品效果,客户服务能力和方案的稳定性是决定成败的关键因素,尤其是客户服务能力。

对此,问众智能坚定认为作为一家全栈式智能网联解决方案提供商,在车载语音方面,能够获得最后胜利的企业定位就是要深耕整个车载语音市场。

三、语音智能也有自己的边界

“我们本身是做语音的,但是并不能自大的认为汽车加语音就能够让人机交互变得无所不能。”在张亚看来,语音智能也有自己的边界。

过去几年时间,语音识别成为功能日益复杂的汽车信息娱乐系统相结合的最安全的交互方式之一。但根据J.D. Power的数据,尽管汽车的语音识别系统的缺陷不断改善,但它已经成为车主对汽车新技术体验的最大抱怨之一。

张亚表示,现在行业里面有两个普遍现象,让他感到比较疑惑。

一方面是堆砌的低频功能,比如有些客户会提出来,能不能用语音来支持预定酒店,航班,或者查航班状态。作为车主、终端用户,这些服务一年里面能用到多少次?我们统称为堆砌低频功能,包括订西餐厅,买票等等。

还有化简为繁,违背初衷。比如说语音用在车控环节,车窗、雨刷,或者打开后备厢等等。在车内,通过按键操作就可以顺利完成的功能,未必一定需要用语音去做交互。

总结起来,整个行业在走向的方向,要么是纯粹用技术驱动思维、考虑车载人机交互,工程师认为这些事情我能干,我就干了。

二是忽略场景,直接把语音搬到车载场景当中。目前搭载在量产车上的语音交互系统存在不少用户差评,主要集中在识别准确度(方言),识别的速度,语音唤醒不灵敏,语音控制车辆功能较少,语音系统的升级更新速度慢等问题。

四、回归本质,回归到车

在张亚看来,问众智能的定位和立足之本还是要回归本质,回归到车。

一是,深耕在驾驶场景下的语音交互,有它的特殊性,比如把车窗打开的时候,有车外、车内噪音,车外风噪,胎噪,车内包括发动机的声音,如何在车载混杂环境下把噪音能够降低,并且在高噪状态下(85分贝)做到正常识别,顺利执行命令,需要工程优化。

这对车载语音的拾音和降噪能力提出了很高的要求,而这也正是车载语音当前比较难以攻克的问题。车载语音面临的技术难关远不止这些,比如,在拾音后要如何识别语义进行解析?包括对声纹、性别和场景的识别等等。

而问众智能在过去一年多时间里,就是一直在做这方面的技术与工程经验的积累,在张亚看来,这会是未来和竞争对手形成差异化的一个点。

二是,真正车载语音的核心指标,在实车环境下,强调唤醒,数据量、准确率,要考虑到无论是哪个指标都要在实车环境之下来测。

同时,要基于车内采集的大量语料,大量数据来训练模型。比如,在线ASR准确率还有响应时间,没有用户愿意等(响应)很长的时间,最后很重要的一环就是对于服务生态的连接。

此外,在车载语音交互上面,如何区别于像音箱这样的一些其他场景的智能语音应用。

在车载环境当中有一些是定制的,比如说司机一直处在和(语音)系统相对固定的距离,而且是长时间保持相对的位置。同时对于服务的唤醒,有些时候比较频繁,相当于音箱来讲。

这里面当然涉及到自然语音理解,多轮对话,自定义唤醒词,离线语音识别,这些都是最基础的语音交互体验。

同时,问众智能还在做一些其他技术研发,比如全场景打断,长时间的侦听,跨场景上下文交互,免唤醒热词或者句式。

这些都是在真正的降低用户交互成本。

五、做前装,非常不容易

经过这一年多时间的打磨之后,问众智能也看到了和传统互联网公司,或者技术公司之间的区别。

“从事车载市场并不容易,相比其他行业技术,质量,服务的要求都更为严格,而且要不断完善,经常会被OEM考核。”对此,张亚深有体会,比如说软件的质量,开发的周期,开发的复杂度要和各方沟通。

“我们从一个坑里爬出来再填另外一个坑,直到今天为止,很有信心的跟业界朋友说,我们已经成为一家真正能够懂得车的AI科技公司。”在张亚看来,这也是一件非常不容易的事情。

在语音公司争夺车厂前装市场订单的过程中,相关从业人员表示,车厂对于方案公司的服务达成率比较看重,也就是说,语音公司如果能够较快的响应车厂需求,更好的服务好车厂,那么在跟同行竞争的时候,会有一定的优势。

张亚表示,问众智能是一家拥有车载语音全栈技术的公司,从DSP模组,到HMI、TTS、NLU、DM、ASR、NLG、VAD等等,同时提供灵活、高效、标准化的解决方案。

经过这一年多时间与车厂项目的锤炼,问众智能对于语音SDS,DSP方案整合,适配到各个车载操作系统当中的量产经验,对于其他OEM潜在客户也是非常重要的。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1789

    文章

    46576

    浏览量

    236894
  • 智能语音
    +关注

    关注

    10

    文章

    773

    浏览量

    48677
  • 车载语音
    +关注

    关注

    0

    文章

    19

    浏览量

    10364

原文标题:做前装不易,这家公司却“喊出”到2020年成为前装语音市场No.1 | GGAI头条

文章出处:【微信号:ilove-ev,微信公众号:高工智能汽车】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    网线有铠的吗

    网线确实有铠类型的。铠网线,又称为金属护套网线,其结构在常规网线的基础上增加了一层铠层。以下是对铠网线的详细介绍: 一、结构特点 铠
    的头像 发表于 10-11 09:59 155次阅读

    如何在SOT-563封和SOT-236封之间实现共同布局

    电子发烧友网站提供《如何在SOT-563封和SOT-236封之间实现共同布局.pdf》资料免费下载
    发表于 09-04 10:32 0次下载
    如何在SOT-563封<b class='flag-5'>装</b>和SOT-236封<b class='flag-5'>装</b>之间实现共同布局

    光缆光缆VS非铠光缆区别在哪里

    光缆与非铠光缆在多个方面存在显著差异,这些差异主要体现在结构、性能、用途以及成本等方面。 一、结构差异 铠光缆:在光缆芯外包裹有一层保护性的铠层,该层可以是金属(如钢带、铝带
    的头像 发表于 08-22 09:56 677次阅读

    广和通出售车载无线通信模组业务

    近日,国内领先的通信模组制造商深圳市广和通无线股份有限公司(简称“广和通”)宣布了一项重大战略调整,其全资子公司深圳市锐凌无线技术有限公司(简称“深圳锐凌”)的车载无线通信模组业务及相关资产已顺利完成出售,标志着广和通在应对国际市场
    的头像 发表于 08-08 15:44 631次阅读

    广和通拟以1.5亿美元出售车载无线通信模组业务

    广和通近日宣布了一项重大战略调整,旨在灵活应对当前国际市场的复杂多变环境。公司计划将其旗下深圳市锐凌无线技术有限公司的车载无线通信模组业务,以及相关联的Rolling Wireless
    的头像 发表于 07-29 16:44 506次阅读

    详解表面贴技术和通孔插技术

    表面贴技术(SMT)和通孔插技术(THT)是电子元件安装在印刷电路板(PCB)上的两种主要方法。虽然它们都在电子制造中起着重要作用,但在技术和应用方面存在显著差异。
    的头像 发表于 07-19 09:46 448次阅读
    详解表面贴<b class='flag-5'>装</b>技术和通孔插<b class='flag-5'>装</b>技术

    光缆有铜丝吗

    光缆中可能有铜丝。但这里的铜丝并非直接用于传输信号,而是作为铠的一部分,提供额外的保护和强度。 铠光缆的构造通常包括内核光纤、填充物、金属铠和外护套等部分。其中,金属铠
    的头像 发表于 06-05 10:37 312次阅读

    专业:出整套TP图,抄板,调试,处理异常

    在触摸屏行业工作多年,熟悉GF/GFF/GG结构与市场常用IC,手机/车载/工控/手表/商显都做过 现承接所有关于触摸屏项目评估,出
    发表于 05-30 12:01

    WTK6900G语音识别芯片在车载语音交互氛围灯上的应用案例解析

    车载语音交互氛围灯系统显得尤为重要。WTK6900G语音识别芯片的推出,正好满足了这一市场需求,为车载
    的头像 发表于 05-17 13:57 332次阅读

    EMC测试整改:提升产品合规性和市场竞争力?|深圳比创达电子

    EMC测试整改:提升产品合规性和市场竞争力?|深圳比创达电子在当前的产品研发和制造领域,电磁兼容(EMC)测试是确保产品符合法规要求并能够在各种电磁环境下正常工作的重要环节。然而,很多企业在进行
    发表于 03-07 09:50

    车载中控_车载娱乐平板|车载方案定制厂家

    车载中控_车载娱乐平板|车载方案定制厂家。全新车载主机中控屏拥有出色的性能和功能,适合用于替
    的头像 发表于 03-04 19:13 344次阅读
    <b class='flag-5'>车载</b>中控_<b class='flag-5'>车载</b>娱乐平板|<b class='flag-5'>车载</b><b class='flag-5'>后</b><b class='flag-5'>装</b>方案定制厂家

    水晶光电车载AR-HUD综合实力位列前二

    近日,高工智能汽车研究院基于企业市场表现(合作车企的数量和交付规模)、AR-HUD技术及产品竞争力以及经营规模等指标,正式发布《2024年度前AR-HUD本土供应商竞争力TOP10》
    的头像 发表于 01-25 17:09 819次阅读
    水晶光电<b class='flag-5'>车载</b>前<b class='flag-5'>装</b>AR-HUD综合实力位列前二

    思必驰语音算法与芯片的完美结合 人机交互

    TH1520芯片解决方案AISpeech思必驰深圳羲顿科技有限公司TH1520是深聪智能(思必驰旗下的芯片设计企业)根据语音交互市场及算法的需求及发展方向,自主定义开发的“芯片+算法”的人
    的头像 发表于 12-29 11:43 874次阅读
    思必驰<b class='flag-5'>语音</b>算法与芯片的完美结合 人机<b class='flag-5'>交互</b>

    唯创知音WTN6170-8S语音芯片:SOP8封赋能,170秒时长播放引领行业新标杆

    语音芯片领域里,唯创知音一直以来都是技术的驱动者和创新的引领者。其最新的WTN6170-8S语音芯片再次证明了这一点,以SOP8封,支持长达170秒的语音内容播放,将
    的头像 发表于 11-27 10:09 557次阅读
    唯创知音WTN6170-8S<b class='flag-5'>语音</b>芯片:SOP8封<b class='flag-5'>装</b>赋能,170秒时长播放引领行业新标杆

    电子联技术解析

    电子联技术解析
    的头像 发表于 11-23 16:18 884次阅读
    电子<b class='flag-5'>装</b>联技术解析