0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

从蓝海杀成红海的语音科技,如何才能转化成智能家庭的入口

电子工程师 来源:未知 作者:李倩 2018-10-12 14:30 次阅读

从蓝海杀成红海的语音科技,如何才能转化成智能家庭的入口

各种调查数据显示,智能家居市场规模在未来几年,将会突破万亿,巨大蛋糕吸引了众多玩家参与,也涌现出众多创新企业,然而,要实现智慧的生活,这其中涉及到跨平台、跨品牌等互联互通是基础,处在产业链核心断的公司积极搭建生态建设,在这个智能家居市场整顿中,谁能聚拢更多第三方资源,谁就占住主导权,一个简单的语音人机交互对话场景中,机器稳中带皮的表现算是我们对于智能音箱最基本层面、最直观的认识了。而事实上,这并非智能音箱的最终形态。

智能音箱大混战从前年开始,已经在作为中国硅谷科技的前沿的巨头间打得焦头烂额。然而一直被全球认为是消费潜力巨大的中国市场,却在智能音箱领域陷入尴尬的境地。目前为止,国内还未出现单品销量突破1000万台的智能音箱产品

互联网巨头眼中,智能音箱被定义为是继PC电脑图形化系统+键鼠外设交互方式、智能手机+触屏操作交互方式之后的新形态交互方式,是后互联网时代的下一个超级入口。看整个互联网技术,就是数字技术颠覆性的变革和机会。我们最近在大力的推语音(智能音箱),其实都是一样的,智能音箱的工作原理:人发出指令——音箱对声音处理识别——传输服务器作出回应——传回智能音箱或者其他服务器——得出结果(其他设备开始运行)。

毫无疑问语音是未来一个互联网入口。有效的抢占了下一个互联网的超级入口就意味着在互联网的下一个时代里会拥有更多的主动权和话语权,因此被誉为下一个互联网超级入口的智能音箱产业早已形成巨头环伺的竞争形态。

目前,各品牌的智能音箱除了充当语音交互方式的闹钟设定、天气提醒查询、翻译、算数等基本生活小助手之外,同时还兼顾路况、百科查询,点外卖、叫专车等贴身小管家一职。技能的拓展性、应用场景的适应性在不断增强。

仅仅在深圳南山区一公里以内,就有112家公司做语音智能。”有如此之多的公司在做智能音箱,但真正成为了产品用户的公司却少之又少,对于智能硬件来说,没有销量,都是空谈。有人曾用这么一句话形容目前国内的智能音箱市场:行业爆款转身变成了鸡肋。

在智能音箱领域,用户体验是经常被强调的点,语音交互与服务内容则是竞争核心。而智能音箱行业发展的最大瓶颈则是AI技术的不成熟。目前AI技术虽愈加火爆,但仍处于弱人工智能阶段,其语音识别、语音合成、自然降噪等技术仅仅处于“可用”阶段,远未能满足人类的深度体验。

在智能音箱使用之前,需要加入局域网,而这一步需要在相应的手机app中操作才能实现。虽然这只是初始的一步,却反映出手机在智能家居体系中的重要地位。与小巧便携的手机相比,智能音箱显得臃肿了很多,尤其是对于许多经常出差的商务人士而言,智能音箱的使用率更是大打折扣。

在智能音箱背后,真正起作用的是语音助手,语音助手的背后则是基于大数据的人工智能。而人类是情感动物,智能音箱发展到今天之所以还没有成为人们生活中的常态,是由于AI技术还停留在机械化阶段,无法消解人类的孤独感。

尽管现在的AI音箱能够完成人类的一些指令,但想要进一步发展,需要完成从机械式执行到情感式对话的转变。要实现这一点,就需要AI技术更加成熟,需要AI朝着人性化的方向发展。

术硬伤难以突破:语义识别以及中文语言识别

智能音箱相关分析表示:在对话方式上,一些中国制造商生产的设备语音识别准确率低,中文自然语言的整体理解和反应依旧不够成熟,这是阻碍普及的一个关键原因。

语义识别是目前智能音箱的一个痛点,但也是AI技术的一大问题。AI可以下围棋战胜李世石,但它现在不一定能听明白每个人在讲什么。"

因为智能音箱的语音技术可以分为三个阶段:噪声抵消、语音识别,和语义识别。相对于国外,我国在于AI智能语音助理上的发展水平暂处于相对落后的状态。而对于智能家居这种产品来说,其技术核心是依赖语音声控,背后是人工智能的智能识别能力与深度学习能力。

虽然现在国内在相关技术上已经有一定的突破,比如科大讯飞,思必驰等公司都是具备语音识别能力的厂商。但当前,国内的智能音箱厂商还没有人工智能方面的平台优势,可以像亚马逊、谷歌那样跨越多个垂直领域进行资源整合的能力。

另外,除了在技术实力的原因以外,其语义识别的主要问题在于中国复杂的语言环境。

目前市面上的AI音箱只支持中文普通话交互,与中国的人文环境有所差异,实际情况却不如想象中那般简单:中国地域广袤,方言语系多样,据不完全统计,仅彼此不能相互沟通的方言就有80多种。

虽然普通话已经普及了几十年,但截至今日,仍有不少人不会说普通话;而夹杂方言的“伪普通话”更是多如牛毛。在语境方面,也不利于机器的语音学习和大数据手机。相比国外的智能产品,我国在本土智能音箱的发展过程中,仅在语言关方面,就需要多耗费数倍的研发精力。

因此,由于智能音箱在汉语的语音识别和语义交互等对话式交互技术还尚未成熟,都严重影响着用户体验。在目前的过渡阶段,提高音箱耳机产品本身的性能才是企业的重中之重。而只有当语言交互界面技术成型,并发展为标准服务时,智能音箱在有可能在中国市场真正普及起来实际上,国内对于人工智能的技术还没有使用习惯,智能音箱算是整个AI领域发展较为快速的。其实,我们也能从中看出一大问题,就是智能音箱的核心价值没有标准化,没有抓取到用户的核心需求,很多人都是在为智能而不是音质等需求买单,总的来说,不论关键在不在于技术,而是如何让技术符合你的生活需求,AI需要实实在在的应用。

尽管今年互联网巨头在智能音箱上价格战剧烈,但智能音箱发展仍呈现差异化的几个方向,这主要源于智能音箱品牌全品类布局与差异化布局。在十几家智能音箱品牌的二三十款音箱中呈现出4个特点:入门mini产品、大众产品、高端产品、儿童产品。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人机交互
    +关注

    关注

    12

    文章

    1200

    浏览量

    55321
  • 智能语音
    +关注

    关注

    10

    文章

    781

    浏览量

    48710

原文标题:从蓝海创新到红海突围:智能语音核实能飞入寻常百姓家

文章出处:【微信号:mojay_semi,微信公众号:茂捷半导体】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    智能语音开关:离线控制,守护隐私的新选择

    智能家居依赖网络,智能音箱入口。但隐私泄露成问题,离线智能产品应运而生。九芯电子采用NRK3502离线
    的头像 发表于 11-22 13:37 41次阅读
    <b class='flag-5'>智能</b><b class='flag-5'>语音</b>开关:离线控制,守护隐私的新选择

    AIC23B语音芯片的linein输入口和micin输入口能否同时使用?

    有一个问题想求助一下论坛的大佬们,AIC23B这个语音芯片的linein输入口和micin输入口能否同时使用,从而达到接收两路不同的声信号,将两路不同的信号输入开发板进行后面的算法运算呢?如果可以的话,需要什么条件呢?
    发表于 10-14 06:07

    输入文字转化语音

    一、介绍 基于鸿蒙Next模拟一个输入用户文字,转化成语音播报效果二、场景需求 辅助功能:为视障人士提供帮助:将文字内容转化语音,使视觉障碍用户能够获取信息。 教育与学习:语言学习:帮助学习者通过
    发表于 08-28 10:54

    如何将小电流信号转化成高压信号?

    因为是高速信号。脉宽在30ns。 电流小到26uA,想转化成电压信号再进行放大。有什么好的方法吗
    发表于 08-21 08:30

    OPA615把输出的信号接一个小电阻转化成电压信号直接送入STM32的ADC采集口是否可以?

    如果想把输出的信号接一个小电阻转化成电压信号直接送入STM32的ADC采集口是否可以?还是输出级要加入缓冲级?
    发表于 08-13 06:37

    车载语音识别系统语音数据采集标注案例

    车载语音识别系统是指利用机器学习算法实现的一种自然语言处理技术,载语音识别系统通过辨别声音的语调、语速和音量,将所听到的语音转化成可读取的语言数字,从而达到实现车辆控制、
    的头像 发表于 06-19 15:52 324次阅读
    车载<b class='flag-5'>语音</b>识别系统<b class='flag-5'>语音</b>数据采集标注案例

    车载语音识别系统语音数据采集标注案例

    车载语音识别系统是指利用机器学习算法实现的一种自然语言处理技术,载语音识别系统通过辨别声音的语调、语速和音量,将所听到的语音转化成可读取的语言数字,从而达到实现车辆控制、
    的头像 发表于 06-19 15:49 464次阅读

    用yolov5的best.pt导出onnx转化成fp32 bmodel后在Airbox上跑,报维度不匹配怎么处理?

    用官方的模型不出错,用自己的yolov5训练出来的best.pt导出onnx转化成fp32 bmodel后在Airbox上跑,出现报错: linaro@bm1684:~/yolov5/python
    发表于 05-31 08:10

    FPGA设计中 Verilog HDL实现基本的图像滤波处理仿真

    今天给大侠带来FPGA设计中用Verilog HDL实现基本的图像滤波处理仿真,话不多说,上货。 1、用matlab代码,准备好把图片转化成Vivado Simulator识别的格式,即每行一
    发表于 05-20 16:44

    华腾喜获“格客车2023年度合格供应商”奖!

    3月22日,2024苏州金龙供应商大会在苏州隆重召开,华腾受邀参加。会上,华腾荣获“格客车2023年度合格供应商”。
    的头像 发表于 04-02 10:26 412次阅读
    <b class='flag-5'>蓝</b><b class='flag-5'>海</b>华腾喜获“<b class='flag-5'>海</b>格客车2023年度合格供应商”奖!

    AI加速智能家居分布式语音技术发展

    电子发烧友网报道(文/黄山明)生成式AI的出现,让人与机器的交流将变得更加自然,也在不断推动分布式语音入口智能家居中的智能化水平升级,让家庭
    的头像 发表于 02-01 00:16 5764次阅读

    首次跻身全球智能机市场第四 传音手机在新兴市场“疯了”?

    增长68.6%,首次跃升全球第四。IDC分析称,传音在2023年下半年因新兴市场的快速增长实现了强劲增长。 事实上,在全球化的今天,拥有庞大消费潜力和巨大增长潜力的新兴市场已成功地海市场”发展
    的头像 发表于 01-31 10:44 646次阅读

    语音数据集在智能语音助手中的应用与挑战

    。本文将详细介绍语音数据集在智能语音助手中的应用、面临的挑战以及未来的发展趋势。 二、语音数据集在智能
    的头像 发表于 01-18 15:46 361次阅读

    ADUCM350可以同时处理生物阻抗信号、声音转化成的电流信号吗?

    请问,ADUCM350可以同时处理生物阻抗信号、声音转化成的电流信号吗? ADUCM350可以处理惯性传感器收集的运动信号吗? 同时收集和处理生物阻抗、声音、运动信号,除了评估套装(EVAL-ADUCM350EBZ)以外,还需要购买其他配套的评估板吗?
    发表于 01-11 07:10

    怎么用verdi将fsdb格式的波形转化成txt呢?

    和大家分享一个小技巧,你在debug问题的时候,是不是也曾经想过将波形中的某些信号转化成txt,然后用txt的值复现某些波形或者与理论值对比。
    的头像 发表于 01-10 09:19 2605次阅读
    怎么用verdi将fsdb格式的波形<b class='flag-5'>转化成</b>txt呢?