0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

语音交互领域亚马逊能否一直占到先机

454398 来源:网络整理 作者:工程师1 2018-05-24 14:50 次阅读

别调戏各路中文语音助手了,了解 Echo 和 Alexa 才是正经事。

语音时代核心硬件形态:Echo 定义

四年前,搭载语音助手 Alexa 的亚马逊智能音箱 Echo 问世,伴随其出现的,还有一个全新的概念,“Voice First”。当时亚马逊 Echo 的负责人 Mike George 认为,语音交互具有完全无门槛的易用性和高度直觉化的引导,所以人机交互的未来将围绕着“语音”展开。这套理论在当时并没有得到广泛的认可,毕竟彼时 Siri 问世已有 3 年,并没有做出什么实质性的成绩,人们对 Siri 的使用更多是停留在“调戏”的层面,很少有人会真的从实用的角度去讨论如何使用 Siri。

人们对语音交互有着天然的不信任,也很难从过去几十年的图形界面的舒适区中马上走出来。亚马逊却认为问题并不出在“语音交互”本身。它通过 Echo,大刀阔斧地砍掉了“图形界面”的存在,用音箱这种形式,“强迫”用户通过语音去和这样一个计算设备进行交互。

在屏幕消失之后,用户开始发现其实语音交互在一些场景下反而相当方便且高效。早上起来一边刷牙一边问问 Alexa 今天的天气,让 Alexa 播放自己喜欢的音乐。Echo 的诞生让人机之间的“有效交互距离”被显著延长了,你不需要将手放到键盘鼠标上,不需要将手指放到触摸屏上,就可以“隔空”和一个计算设备进行交互,这是智能音箱的核心产品优势。

后来的故事我们都知道了,谷歌、苹果反而成为了跟随者,Google Home、HomePod,是这两大巨头对“Voice First”理论的认可。苹果在 HomePod 的产品设计上主打音质而非“智能助手”,且在发售时间上姗姗来迟,紧随其后的消息就是其销量上的滑铁卢。三个月 60 万台的销量,使苹果在智能音箱这个新战场上仅仅占据了 6% 的市场份额。而同期 Echo 的销量却高达 400 万台。

Echo 在语音交互世界里,为亚马逊获得了产品形态的领先,最新的数据显示,Echo 已经占据了这个市场 73% 的份额。亚马逊也在过去的几年里尽自己所能,让 Alexa 进入越来越多的硬件。无论是智能家居还是车载智能系统,亚马逊希望 Alexa 无处不在。

谷歌也是这么想的,所以从去年到今年的 CES 上,亚马逊和谷歌围绕着第三方硬件支持展开了一场军备竞赛,越来越多的第三方硬件开始支持 Alexa 或 Google Assistant,正在渐渐形成一种“一呼百应”的态势。

从 Skills 到 Blueprints,Alexa 开始做得更多更好

但亚马逊深知,硬件层面的产品形态只是“Voice First”的第一步。更关键的深层次问题仍然在于软件的体验,如何让 Alexa 可以做的事情越来越多,最终围绕着语音交互搭建起一个丰富完备的平台,逐渐开始生态化,才是亚马逊完成这样一个“语音乌托邦”的关键。

所以亚马逊为 Alexa 打造了“Skills”(技能)。Skills 允许第三方开发者针对 Alexa 开发应用和功能,让用户可以借由 Alexa 使用第三方的服务。(类似于开发者为苹果生态开发的可在 App Store 下载的 App。)到去年,Alexa 上的 Skills 数量超过了 15000 个,远超谷歌的同类产品“Action”(动作)。更不必说苹果必须配合 App 才能工作的 SiriKit,在发布两年之后还处于一个几乎未起步的状态。

第三方开发生态的蓬勃发展,让 Alexa 在第三方服务接入的生态丰富性上一骑绝尘。但这并不代表 Alexa 的体验能够碾压 Google Assistant。Alexa 的平台上仍然存在着大量没什么人用的冷门 Skills,市场调研结果也显示,绝大多数情况下用户仍然只用亚马逊本身开发的那些简单的基础功能。而论基础功能,Alexa 和 Google Assistant 甚至 Siri,在体验上并没有很大的差别。

这可能是 Blueprints 诞生的源动力。

一个月前,亚马逊为 Alexa 带来了 Skill Blueprints 功能。直译过来的意思就是“技能蓝图”。Blueprints 有点像针对 Alexa 的 Workflow,用户不需要任何编程语言知识,就可以利用 Blueprints 中预设的模版,将你想要提供的信息以“答案”的形式写进已经准备好的“问题”里,打造属于用户自己的“技能”。

尽管目前 Blueprints 所支持的预设功能还非常有限,只能在预设的模版下,为特定问题预设答案。这使其在应用层面没有太多的灵活性,仅仅能用它来制作一些“问答游戏”。包括其中一个比较实用的功能是,让来到家里的访客可以问 Alexa 家里的 Wi-Fi 密码,以及如何使用电视这样的问题。目前制作好的“蓝图”也不能被发布或分享,严格与制作者的亚马逊账号绑定。

但 Blueprints 的产品逻辑使其完全有潜力成为亚马逊自己的 Workflow 或 IFTTT,通过设置一系列的条件和操作,其完全可以让 Alexa 平台上的众多功能更加有机地结合起来。

想象一下,你对 Alexa 喊出“我要去上班了”,Alexa 就可以自动关闭家里的灯、在关门后自动落锁,开启洗衣机,然后自动为你叫一辆 Uber。这在未来将成为 Alexa 上众多功能的粘合与催化剂,也会让目前的语音交互到达一个全新的次元,在定义上也将更加接近于“系统”的概念。

语音时代:将语音交互的边界推向更远的远方

在“培养用户的语音交互习惯”取得了初步成果之后,亚马逊推出了带屏幕但主要交互仍基于语音的 Echo Show。而在今年 Google I/O 的首场 KeyNote 上,谷歌也宣布其将在今年力推带屏幕的 Smart Display 产品。在消费者已经开始慢慢习惯与智能设备进行语音交互之后,带屏幕的 Smart Display 存在的产品意义很明显,就是要拓宽这样一个语音交互世界的版图,让智能助手有更强大的信息展示功能。当用户问接下来一周的天气时,与其将每一天的天气用语音播报出来,直接在屏幕上显示一张气温折线图,一定是更高效的。将语音交互和图形界面进行更深度的结合,有助于将智能语音助手进一步打造成一个完整的,拥有强势功能的“下一代操作系统”。

作为语音交互领域的领军者,亚马逊已经绘出了一副完整的蓝图,描绘了这样一个“语音乌托邦”。无论未来的世界是否将被语音交互所主导,它至少会成为一块谁都不可忽视的大蛋糕。今年的 CES,亚马逊和谷歌在智能硬件领域仍打得热火朝天,两边都想获得这样一个“语音乌托邦”的主导权。

有一种观点认为,亚马逊之所以要抢占语音交互领域的先机,其中的最关键原因在于,作为一家零售商,亚马逊想要占领一个“最简单、最直接的指令入口”。这种解释是很合理的,在语音交互的抽象世界里,“默认选项”的垄断力量只会比图形界面更强大。如果人们习惯了对着智能音箱喊一句指令就可以买东西的生活,将这些指令接入到亚马逊自身零售业务的重要性是不言而喻的。

无论是作为“下一代人机交互标准”,还是作为“零售行业的重要入口”,亚马逊成功地驱动了用户和计算机“说话”的欲望。人机交互的公式被图形界面定义了数十年之久,整个行业也几乎被巨头们笼罩得严严实实。亚马逊通过自己敏锐的产品洞察力,在其之上撕开了一个大裂口。而如何将新的交互方式与自身的业务线有机结合,将会是亚马逊未来 5 - 10 年的机遇与挑战。

刚刚过去的 Google I/O,谷歌在语音助手这一块展现出了空前的重视程度。而接下来的 WWDC 18,苹果也将在这个领域交出一份自己的答卷。无论是把握着互联网软件服务的谷歌,还是把握着硬件制造和销售主导地位的苹果,都不希望看到计算机交互的未来被把握在亚马逊的手上。而 Alexa 能否成为亚马逊走向美国科技界制高点的关键动力,会是未来几年内不可忽视的重要话题

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6142

    浏览量

    105100
  • 苹果
    +关注

    关注

    61

    文章

    24351

    浏览量

    196845
  • 亚马逊
    +关注

    关注

    8

    文章

    2625

    浏览量

    83192
收藏 人收藏

    评论

    相关推荐

    点烟器充电器可以一直插着吗

    关于点烟器充电器是否可以一直插着的问题,存在不同的观点和建议。以下是对这问题的分析: 支持一直插着的观点 安全无忧 :点烟器充电器在汽车熄火后会自动断电,静态电流很小(约1~2毫安),因此不存在
    的头像 发表于 10-14 15:42 510次阅读

    【实操文档】在智能硬件的大模型语音交互流程中接入RAG知识库

    本帖最后由 jf_40317719 于 2024-9-29 17:13 编辑 智能硬件的语音交互接入大模型后可以直接理解自然语言内容,但大模型作为个语言模型,对专业领域知识
    发表于 09-29 17:12

    乐鑫声学前端算法:打造智能语音交互新体验,ESP32-S3 SOC技术方案

    随着人工智能技术的不断进步,智能语音设备正逐渐成为我们生活中不可或缺的部分。然而,在嘈杂的现实环境中,如何实现清晰、准确的语音交互一直
    的头像 发表于 08-03 08:04 790次阅读
    乐鑫声学前端算法:打造智能<b class='flag-5'>语音</b><b class='flag-5'>交互</b>新体验,ESP32-S3 SOC技术方案

    在rtthreadstudio中安装platformio,一直报出platformio未安装怎么解决?

    我在rtthreadstudio中安装platformio,显示是成功的,但是创建基于platformio的应用工程时,一直报出platformio未安装。能否解决。电话:131**4391,可加微信。能否帮忙解决?
    发表于 07-25 06:12

    亚马逊语音助手的竞赛中上远远落后

    在AI浪潮席卷全球之际,科技巨头们无不争先恐后,力图抢占先机。然而,在语音助手的竞赛中,曾经的领先者亚马逊可能即将获得最后名。 继苹果在其WWDC 2024大会上发布了
    的头像 发表于 06-18 16:54 1286次阅读

    智能语音交互技术如何助力设备实现人机自然对话

    智能语音交互技术是指通过语音识别、语音合成和自然语言理解等技术,实现人与机器之间自然语言的交流和互动。随着现代人工智能在各行业的普及,智能语音
    的头像 发表于 05-23 15:14 357次阅读

    WTK6900G语音识别芯片在车载语音交互氛围灯上的应用案例解析

    随着智能汽车的快速发展,车载语音交互技术逐渐成为提升驾驶体验的关键技术之。传统的车载灯光控制系统往往依赖于手动操作,不仅操作繁琐,而且在驾驶过程中容易分散驾驶员的注意力。因此,开发
    的头像 发表于 05-17 13:57 368次阅读

    标贝语音识别技术在金融领域中的应用实例

    随着语音识别技术与文本挖掘、自然语言处理等技术的不断融合,智能语音交互技术在金融领域中爆发了出巨大的应用潜力。标贝科技根据自身与金融领域合作
    的头像 发表于 05-16 16:55 544次阅读
    标贝<b class='flag-5'>语音</b>识别技术在金融<b class='flag-5'>领域</b>中的应用实例

    求助蜂鸣器一直

    线路板功能正常,在蜂鸣器上接了个电磁牵引后,蜂鸣器一直响,本来是蜂鸣器是产量到达指定数值才响次。有懂的不
    发表于 04-23 12:42

    使用modustoolbox_v3.0 创建XMC7200_kit的工程,但是在github上获取一直失败的原因?

    我使用modustoolbox_v3.0 创建XMC7200_kit的工程,但是在github上获取一直失败。 能否提供个支持XMC7000的offline_packet_content文件。
    发表于 02-02 06:07

    Pod一直处于Pending状态?什么是Pod拓扑约束?

    起因: 今天在部署组件的时候,发现组件的pod一直处于Pending状态,报错显示的原因是:不满足Pod拓扑分布约束,看了代码发现是原来同事给组件新增了Pod拓扑约束。
    的头像 发表于 12-18 11:46 1162次阅读
    Pod<b class='flag-5'>一直</b>处于Pending状态?什么是Pod拓扑约束?

    SIMCom,一直在路上

    发展。 芯讯通从成立之初就开始了国际化征程,出海二十几年来一直与走向国际市场的无数“中国方案”和“中国故事”共同前进发展。值此之际,和大家聊聊在与“路”息息相关的数字基建、智慧
    的头像 发表于 12-16 16:05 496次阅读
    SIMCom,<b class='flag-5'>一直</b>在路上

    语音数据集:AI语音技术的灵魂

    、引言 在人工智能领域语音技术被誉为“未来人机交互的入口”,而语音数据集则是AI语音技术的灵
    的头像 发表于 12-14 14:33 979次阅读

    离线语音识别技术:掌控未来的语音交互

    离线语音识别技术的核心优势在于其独立性和实时性。在没有网络连接的情况下,设备依然能够迅速识别用户的语音指令,实现各种功能。这使得语音交互更加自然、流畅,让用户随时随地享受智能科技带来的
    的头像 发表于 12-13 11:12 551次阅读
    离线<b class='flag-5'>语音</b>识别技术:掌控未来的<b class='flag-5'>语音</b><b class='flag-5'>交互</b>

    能否通过SPI口对AD5676的8个通道进行连续操作,即同步信号(/SYNC)在写入8个通道寄存器时一直保持低?

    请教: 能否通过SPI口对AD5676 的8个通道进行连续操作,即同步信号(/SYNC)在写入8个通道寄存器时一直保持低,如: 还是次写入个通道,8个通道依次写入,如:
    发表于 12-13 06:17