0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

解读谷歌语音助手的全面进化

jmiy_worldofai 来源:fqj 2019-05-10 16:25 次阅读

想要了解谷歌智能语音助手Google Assistant的潜力,最好的方法之一就是看看其现在能多快地打开碧昂斯(Beyonce)的Instagram页面。谷歌项目经理梅吉·霍伦格(Meggie Hollenger)通过“Hey, Google”这个短语唤醒了其智能手机上的谷歌助手,然后开始了测试,连续快速地发出12个指令。

霍伦格的指令包括:“打开《纽约时报》、打开YouTube、打开Netflix、打开日历、设置5分钟的计时器、今天天气怎么样?明天呢?显示约翰·传奇(John Legend)的Twitter更新、显示碧昂斯的Instagram更新、打开手电筒、关掉手电筒、预定Uber网约车到我所在的酒店。”

伴随着霍伦格的每个指令,手机就会弹出相应新的信息,整个过程耗时41秒。她不需要在命令之间重复唤醒Google Assistant的短语。当她要求查看碧昂丝在做什么时,Google Assistant不仅会启动Instagram应用程序,还会自动把我们带到这位流行歌手的页面,这样你就能看到她与1.27亿粉丝分享的最新照片。同样地,当霍伦格要求使用Uber时,该软件已经知道她当前位置。

在谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)向世界推出其人工智能驱动的智能虚拟助理三年后,谷歌于美国当地时间周二的年度I/O开发者大会上预展了这款助理的“下一代升级”。GoogleAssistant现在可以比以前快10倍的速度提供答案。速度的大幅提升可能有助于扭转人们对语音助手过于迟缓和不准确的看法。如果像谷歌和亚马逊公司想让这些数字助手进一步成为主流,这将是一件大事。

对于这家全球最大,每年提供超过1万亿次搜索答案的搜索服务公司来说,让Google Assistant获得成功至关重要。许多人不再通过在电脑上打字来查询信息,而是通过智能手机和智能音箱来交谈。谷歌现在正与亚马逊及其Alexa、苹果及其Siri展开竞争,以给我们带来我们越来越希望从始终连网设备中得到的即时满足。

为此,在年度I/O开发者大会几天前,谷歌邀请资深科技记者理查德·内瓦(Richard Nieva)前往其加州山景城(Mountain View)全球总部,首先浏览下其迄今为止对Google Assistant进行的最大升级,此举堪称“成败在此一搏”。升级后的GoogleAssistant很吸引人,但也有点儿吓人。

下一代数字助手成为谷歌推出诸多新功能中的焦点,这些功能展示了谷歌世界级的人工智能和工程能力。Google Assistant不仅速度更快,而且更加智能化,谷歌继续依靠过去五年在神经网络研究和语音识别方面取得的突破,将自己与竞争对手区分开来。

此外,GoogleAssistant越来越个人化。你将能够将家庭成员添加到亲密联系人列表中。例如,当你向Google Assistant问路想去你妈妈家的时候,它知道你妈妈是谁,住在哪里。去年推出的语音礼宾服务Duplex也有一个新功能,可以让Google Assistant在你口头提出租车或购买电影票等要求后,自动在网上填写表格。

Google Assistant产品副总裁曼努埃尔·布朗斯坦(Manuel Bronstein)表示:“我们可能会看到这样的全新世界,即与系统实际通话的速度要比打电话快得多。如果这种情况成为现实,或当这种情况发生时,你会看到更多的人参与进来。”

Google Assistant产品副总裁曼努埃尔·布朗斯坦希望让语音搜索比打电话更快

但所有这些都凸显出这样的事实,即谷歌已经拥有了全球数十亿人的海量数据。该公司还强调称需要收集更多的个人信息,才能将Google Assistant的真正愿景变为现实。目前,Google Assistant已在10亿部设备上被使用,主要是因为它预装在运行全球最流行移动操作系统安卓(Android)的手机上。

此外,谷歌的许多其他服务,比如Gmail、YouTube、地图和Chrome浏览器,每月也为超过10亿人提供服务。所有这些服务都是有用的和创新的,但它们的命脉是你每天通过搜索历史、电子邮件收件箱、视频浏览习惯和驾驶方向向该公司提供的数据。

当然,这一切都需要以GoogleAssistant真正发挥作用为前提。谷歌不允许内瓦及其同事亲自体验其语音助手,也不允许他们录制演示视频。相反,谷歌为他们提供了预先拍摄的营销视频。霍伦格还根据预先编写的命令备忘单读取脚本。因此,在手机和智能家居设备上执行普通人漫不经心的请求时,目前还无法知道这款软件的灵活性有多强。

值得注意的是,演示过程中也出现了一些错误。虽然从一个应用程序跳转到另一个应用程序非常快,但霍伦格不得不重复一两次查询,因为Google Assistant在第一次尝试时没有处理她的请求。不过,在其他演示中,霍伦格使用Google Assistant以极高的准确度口述文本和电子邮件。该系统还能分辨出她想要在电子邮件中写什么,以及什么是通用命令。例如,当她说“发送它”时,GoogleAssistant就会发送电子邮件,而不是在电子邮件正文中键入“发送它”这样的字眼儿。

不过,GoogleAssistant肯定会成为讨论的主题,或许还会引发争议。阿斯彭科技政策中心(Aspen Tech Policy Hub)主任贝琪·库珀(Betsy Cooper)表示:“这其中有积极的一面,也有消极的一面,还有利弊权衡。有了Google Assistant,因为它总是处于倾听状态(捕捉唤醒短语),它有可能会滥用这种特权。”

打造个性化谷歌

谷歌首席科学家弗兰西斯科·比菲斯(Francoise Beaufays)表示,新的Google Assistant是他们五年辛勤工作的硕果,这比该软件问世的时间还长。在这五年中,谷歌研究人员在人工智能音频、语音、语言识别和语音控制方面取得了关键进展。比菲斯称:“我们所做的是彻底改造整个堆栈,使用一个神经网络来做所有的事情。”

这是一项重大的技术突破,将所需的空间从100GB降低到不足0.5GB。不过,这款升级版的数字助手需要智能手机具备强大的计算能力,因此只能在高端设备上使用。谷歌将在其旗舰手机Pixel的下一个高端版本上推出这款产品,预计Pixel将于今年秋季推出。

在2016年5月推出Google Assistant的几天前,内瓦和皮查伊在他那间玻璃墙的办公室里坐了下来,聆听后者的推介。这家搜索巨头在数字语音助手领域已经落后多年,现在终于准备好与Siri和Alexa展开竞争。对于谷歌来说,Google Assistant就是要突破公司标志性的白色主页,把它的工程学智慧渗透到你所拥有的每一项技术中——手机、汽车甚至洗衣机中。

皮查伊当时称:“这是谷歌在问用户:‘嗨。我能帮什么忙?’把它想象成建立你自己的谷歌。”现在,皮查伊为Google Assistant开启了一个新阶段,包括了解你家庭具体细节的功能,且比以往任何时候都更清楚地表明,当他说“打造个性化谷歌”时,他是认真的。谷歌不会让皮查伊接受采访。

时代变化

当然,现在的世界与三年前大不相同。

首先,谷歌与亚马逊的竞争如今已经是一场全面竞争。市场研究公司eMarketer的数据显示,在智能音箱方面,亚马逊的Alexa Echo设备占据了近67%的市场份额,而由Google Assistant驱动的Google Home占比近30%。谷歌今天发布了Nest Hub Max,这是一款内置Google Assistant的10英寸智能显示屏。

然后是关于隐私和安全的公开辩论。在社交网络巨头Facebook的剑桥分析公司(Cambridge Analytica)滥用数据丑闻发生之后,立法者和消费者对大型科技公司的政策更加关注,并将数据收集问题推到了风口浪尖上。就在上个月,谷歌还因为其Sensorvault数据库而受到批评,该数据库可以根据谷歌对你个人信息的了解,帮助衡量其利润丰厚的定向广告的有效性。

事实证明,全美各地的警察部门在试图破解犯罪调查时,都曾利用Sensorvault获取位置数据。作为回应,美国众议院下属的一个委员会致信皮查伊,要求就数据库问题给出答案。议员们要求在5月10日前举行一次现场简报会。

谷歌首席科学家弗兰西斯科·比菲斯表示,新一代Google Assistant背后的研究可以追溯到5年前

上周,谷歌被问及:如果执法部门要求谷歌提供家庭关系数据和Google Assistant收集的其他信息时,谷歌会怎么做?Google Assistant产品副总裁布朗斯坦表示,谷歌在为广告目的存储数据方面一直存在“非常好的争论”。他说,公司的理念是“不要为了存储信息而存储信息,而是要为能带来价值而存储。我们希望所有这些事情都能保持透明,这样你就能知道什么时候这些信息被用来做广告,或者永远不会被用于广告。”

但隐私专家表示,谷歌应该更好地向消费者传达其政策。斯坦福大学互联网与社会中心消费者隐私主管珍·金(Jen King)说:“我不知道人们实际上对此理解得有多透彻。”她补充说,谷歌应该给人们更多的选择,让他们选择是否参与数据收集,而不是把事情混为一谈。

谷歌在如何处理透明度方面已经受到挑战。去年,美联社报道称,谷歌甚至在人们关掉智能手机上的位置共享功能后,仍能追踪他们的位置。这些数据是通过名为“位置历史”的谷歌地图功能存储的,这与Sensorvault数据库中的功能相同。美国公民自由联盟(ACLU)等批评人士表示,谷歌披露的信息并不诚实。该公司后来在其网站上修改了此前的帮助页面,以澄清设置是如何工作的。上周,谷歌宣布了一项功能,允许人们自动删除位置、网页和应用程序历史。

布朗斯坦还表示,如果用户在设置中允许的话,来自Google Assistant的“一小部分”语音查询将与谷歌的一个团队共享,该团队致力于改进人工智能系统。他没有提供任何关于“被分享语音记录有多小”的细节。但他说,在这些情况下,个人信息被从语音音频中剥离。

Duplex的演化

除了GoogleAssistant带来速度上的震撼外,谷歌还在更新去年引发最大争议的项目——Duplex。该功能使用听起来令人不安的人工智能软件,代表Google Assistant用户打电话进行服务预订和预约。它的人工智能可以模仿人类的语言,使用像“uh”和“um”这样的口头语。它说话的节奏就像真人一样,在回答问题前停顿一下,拉长某些单词发音,好像是在争取时间思考。

去年的演示立即为人工智能伦理学家、行业观察人士和消费者敲响了警钟,他们担心这款机器人具有欺骗人类的能力。谷歌后来表示,它将增加信息披露,这样人们就会知道他们在与自动软件对话。这次新的迭代要温和得多。

谷歌Duplex获得升级,增加了许多新功能

谷歌周二更新了Duplex功能,以简化租车和购买电影票等更多类型预订的流程。但这一次没有说话听起来像人类的机器人,它基本上自动完成了你在移动网络上可以找到的表单填写过程。你可以这样说:“Hey Google,下次旅程为我从National租车公司租辆车。”然后,Google Assistant会在你的手机上打开National的网站,开始实时填写这些字段。

在整个过程中,你将看到一个进度条,就像下载文件时看到的那样。当Duplex需要更多信息时,比如价格或座位选择,进程会暂停并提示你进行选择。填好表格后,点击确认预订或付款即可。与其他Google Assistant功能一样,该系统使用从日历、Gmail收件箱和Chrome自动填充(包括信用卡信息)中挑选的数据来填写表单。今年晚些时候,这一更新将在安卓手机上推出。

Google Assistant工程主管斯科特·霍夫曼(Scott Huffman)今年早些时候曾说过,尽管这一版本可能会造成较少的反冲,但去年广泛的争议对谷歌来说是一个关键时刻。他说:“人们的反应强度让我吃惊,这让我们清楚地看到,这些社会问题未来会有多么重要。”

Google Assistant也有其他的事情要处理。谷歌周二还推出了一款新的安卓手机“驾驶模式”。当你激活它时,用户界面会将一些你可能在开车时使用的项目放在前面和中间位置。这些功能包括谷歌地图、Waze导航导航、音乐控制以及来电提醒等。当你启动导航功能后,音乐或电话控制就会出现在屏幕的底部,这样你就不用摆弄手机来找它们了。

道路规则

总的来说,谷歌的新智能助手公告可能会对我们如何使用科技产品和服务产生重大影响。让语音命令变得更简单、快捷,可能会改变我们与设备的互动方式,就像十多年前以苹果iPhone为首的智能手机成为主流,并引发触摸屏时代到来一样。也许我们可以把这看作是迈向人类不断与无生命物体对话世界的第一步。

Google Assistant的“驾驶模式”突出导航和音乐功能

谷歌下一代GoogleAssistant还可以为培养语音查询的新习惯打下基础。去年,谷歌宣布了语音命令的“继续对话”功能,它可以在用户提出问题后将麦克风打开8秒钟,这样用户就可以继续提问。下一代Google Assistant已经基于这一概念改进,最终可能为摆脱唤醒短语开辟一条道路。

这种开放式麦克风可能会引发对隐私的担忧。布朗斯坦说,把麦克风打开一段时间是有帮助的(公司还在调整这段时间的长短),但他希望人们在说话时“能保持相关意识”。他说:“你不一定想让这个东西把你说的话都抄录下来,因为你会觉得不舒服。”

谷歌还有许多其他方式可以提升GoogleAssistant。霍夫曼今年早些时候曾说,他有兴趣让这款软件记住你昨天和它进行的一次确切讨论,这样今天你就可以从你们上次讨论的地方继续。他甚至希望Google Assistant能够检测你的情绪和语调。

不管这是否令人恐惧,这就是谷歌如何考虑改进Google Assistant的方式。不过,布朗斯坦表示,目前他的重点是让用户体验变得更加无缝,并在添加这些面向未来的功能之前弄清楚哪些功能对用户更有价值。

与此同时,人们将不得不解决大规模数据收集和比以往任何时候都要聪明的技术所带来的各种问题,谷歌知道这一点。正如霍夫曼早些时候所说的那样:“有了人工智能,我们最终会让社会思考一些道路规则。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6141

    浏览量

    105068
  • 语音识别
    +关注

    关注

    38

    文章

    1721

    浏览量

    112534

原文标题:速度再涨10倍 解读谷歌语音助手的全面进化

文章出处:【微信号:worldofai,微信公众号:worldofai】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    三星Bixby语音助手即将进军家电产品,实现自然语言交互

     三星宣布,Bixby语音助手即将全面进驻BESPOKE AI系列家电,用户可通过自然语言对家电进行语音控制。Bixby作为三星智能手机、手表、平板及电视的核心功能,如今将拓展至更多家
    的头像 发表于 08-26 17:20 699次阅读

    SoundHound AI语音助手赋能欧洲汽车,引领智能驾驶新风尚

    近日,全球领先的AI语音技术独角兽企业SoundHound AI宣布了一项重要合作成果:其集成ChatGPT技术的先进语音助手SoundHound Chat AI,即将搭载于阿尔法罗密欧与雪铁龙等欧洲知名汽车品牌的多款车型中,标
    的头像 发表于 08-01 17:49 650次阅读

    OpenAI向部分用户推出ChatGPT语音助手

    据智通财经APP报道,OpenAI正在为其部分尊贵的用户们精心呈现备受瞩目的ChatGPT语音助手,尽管此款助手原定于今年6月底的发布因为可能存在的安全隐患问题而被暂时搁置。
    的头像 发表于 07-31 15:41 438次阅读

    亚马逊在语音助手的竞赛中上远远落后

    在AI浪潮席卷全球之际,科技巨头们无不争先恐后,力图抢占先机。然而,在语音助手的竞赛中,曾经的领先者亚马逊可能即将获得最后一名。 继苹果在其WWDC 2024大会上发布了一款新的“Apple
    的头像 发表于 06-18 16:54 1282次阅读

    截杀ChatGPT-4o,谷歌系AI产品迎来全面升级

    和应用。近日举办的谷歌I/O大会上,谷歌宣布全面进入Gemini时代,并发布了一系列与AI相关的更新。   对标 ChatGPT-4o , 谷歌发布 Project Astra   相
    的头像 发表于 05-16 01:58 2679次阅读
    截杀ChatGPT-4o,<b class='flag-5'>谷歌</b>系AI产品迎来<b class='flag-5'>全面</b>升级

    苹果宣布基于生成式AI系统的Siri语音助手

    苹果即将在下个月举行的年度全球开发者大会(WWDC)上揭晓人工智能领域的最新进展。这次盛会预计将成为科技界瞩目的焦点,因为苹果将发布全新改进的Siri语音助手
    的头像 发表于 05-14 11:46 575次阅读

    大众集团旗下MEB、MQB EVO平台使用语音助手的车型都将集成ChatGPT

    ChatGPT现已集成到汽车中。大众与其技术合作伙伴赛轮思通讯科技公司(Cerence)在国际消费类电子产品展览会(CES 2024)上公布了集成ChatGPT的更新版大众IDA车载语音助手,增强了IDA对车内语音命令的响应能力
    的头像 发表于 04-02 10:37 659次阅读

    华米发布智能手表操作系统 Zepp OS 3.5,搭载 AI 语音助手

    华米表示,Zepp Flow 不仅是语音助手,更注重平衡与和谐的理念,引导用户行为模式的变化。“Flow”名字表明了交互的流畅和直觉性,给用户带来了自然、持续的互动体验。
    的头像 发表于 02-26 11:39 1539次阅读

    智能语音助手在医疗行业的应用与挑战

    一、引言 随着人工智能技术的不断发展,智能语音助手在医疗行业的应用越来越广泛。语音数据集在医疗智能语音助手中发挥着重要作用,为系统提供了丰富
    的头像 发表于 01-19 17:37 615次阅读

    智能语音助手在旅游行业的应用与挑战

    一、引言 随着人工智能技术的不断发展和普及,智能语音助手在旅游行业的应用越来越广泛。语音数据集在旅游智能语音助手中发挥着重要作用,为系统提供
    的头像 发表于 01-19 17:30 731次阅读

    智能语音助手在教育行业的应用与挑战

    一、引言 随着人工智能技术的不断发展,智能语音助手在教育行业的应用越来越广泛。语音数据集在教育智能语音助手中发挥着重要作用,为系统提供了丰富
    的头像 发表于 01-19 17:21 768次阅读

    智能语音助手在医疗行业的应用与挑战

    一、引言 随着人工智能技术的不断发展,智能语音助手在医疗行业的应用越来越广泛。语音数据集在医疗智能语音助手中发挥着重要作用,为系统提供了丰富
    的头像 发表于 01-18 16:41 492次阅读

    语音数据集在智能语音助手中的应用与挑战

    一、引言 随着人工智能技术的不断发展,智能语音助手已经成为了人们日常生活中不可或缺的一部分。语音数据集在智能语音助手中发挥着重要作用,为系统
    的头像 发表于 01-18 15:46 359次阅读

    大众汽车推出AI语音助手ChatGPT

    在2024年的CES展会上,大众汽车公司向全球观众展示了其最新的人工智能(AI)相关技术。此次展示的一大亮点是,大众将把ChatGPT集成到车载语音助手中,为用户提供更加智能的交互体验。
    的头像 发表于 01-11 14:28 856次阅读

    语音数据集在智能语音助手中的应用与挑战

    一、引言 随着智能设备的普及和人工智能技术的不断发展,智能语音助手已经成为人们日常生活中不可或缺的一部分。语音数据集在智能语音助手中发挥着重
    的头像 发表于 12-14 15:07 724次阅读