0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

腾讯数字生态大会上AI语音助手+X的无限可能 人机交互的下一站

脑极体 来源:脑极体 作者:脑极体 2020-09-14 17:31 次阅读

日本声优(配音演员)花泽香菜官宣结婚的那一天,不少宅男都直呼“爷青结”(爷的青春结束了)。互联网上被奉为“大众情人”的男神/女神,哪个不是声形并茂的存在?

“颜控”如人类的情感就是如此不讲道理。所以尽管科技厂商们都努力将AI助手的声音“打扮”得亲切可人,但距离真正进入用户心扉还远远不够。尤其是对于智能家居、养老照护等重要语音落地场景来说,情感色彩的缺位就更加显现出不足了。

而近期,许多能说会道的AI人物,也逐步进入我们的视野。比如《时代周刊》刊发了一张马丁·路德·金的“肖像照片”,“他”还会在沉浸式展览《游行》中,重现马丁·路德·金的经典演讲《我有一个梦想》。

在许多岗位上,AI语音助手也开始被赋予真人一样的外貌,能够通过眼神、表情、动作进行自然流畅的表达。比如疫情期间许多办公楼里,都引入了数字人来执行测温任务,让这一行为更具温情,不再是机器语音例行公事一般冷冰冰的提醒。

腾讯全球数字生态大会上,一位来自《镜双城》动画番剧里的女主角那笙,就跟现场观众打起了招呼——“原本我只能出现在动漫世界里,现在的我能够读懂你、听懂你,还有自己的小个性、小脾气哦~”

一副娇俏少女的模样,让这样的“女神”成为自己的导游、助理、客服、老师等等,听起来就十分令人神往,是腾讯云小微和AI lab共同打造的数字虚拟人,也成为腾讯云小微“数字助手”解决方案的“颜值担当”。

当然,让人类与数字助理自然相处,其中既受限于理性的技术发展周期因素,也会受到人类虚无缥缈的情感左右。那么作为一种另辟蹊径的实现方式,腾讯云小微所打造的形象化AI助手,其想象空间到底来自哪里?又将把AI语音技术引向怎样的下一站?

“颜控”企业的出现,折射出哪些现实需求

智能语音助手早已在许多商业场景中落地,比如拨打客服电话时的语音服务,亦或是会为儿童朗读绘本的智能音箱。那为什么大家突然又开始“看脸”了呢?

其实,从智能语音助手中广泛存在的手机/音箱等产品的交互尴尬,就可以解开这个问题。

首先是打开频率。许多主打智能语音功能的硬件(比如音箱),只有在刚拿到手的新鲜劲里,或者是网络上又出现了“调戏”语音助手的段子,才会想起来跟它们对话。背后的关键原因是语音助理所能承载的工具性需求,大部分都已经被智能手机等设备完成的很好了,只能作为“备胎”被偶尔提起。

二是情感联系。语音交互是即忘形式的,这就决定了它无法承载更具私密性、情感性的交互活动。我们会让语音助手帮我们打开电视、启动扫地机器人,但跟它进行充满情绪色彩、大段大段地闲聊?估计大部分用户都会产生抵触心理。就算自己不介意,被其他人撞到抱着一个音箱喃喃自语也很难不引起误会不是……

三是技术瓶颈。伴随着NLP技术的进步,语音助手已经能很不错地完成声纹识别、多轮对话、语义理解等复杂任务了,但距离自然交流显然还有一定的差距。动不动就“我听不懂”“难倒我了”,娱乐消费产品会被弃之高阁,万一企业不小心聘用了这种“智障型”AI助理为消费者提供服务,难以达到普通用户期盼的准确无误、近似真人的交互效果,带来的就可能是订单的损失和品牌口碑的下跌。

针对这些AI语音助手在产业端、市场端的落地尴尬,存不存在可能的解决之道呢?从“工具人”转变为“数字人”,让用户从“声控”转变为“颜控”,就是腾讯数字生态大会上给出的一个十分吸睛的解题思路。

让用户跟AI多聊两句,数字助理需要具备哪些超能力?

“如果那笙哪里做的不对,主人不要嫌弃我我有在努力呢”——试问听到这种对话,你还会吐槽语音助手偶尔出现的小失误,甚至还有点想反思自己是不是过于吹毛求疵了呢?

沿着这个思路,我们可以看到形象化之后,腾讯云小微在数字助手领域都打造出了哪些超能力:

1.语音+视觉交互,借助腾讯系海量IP打造出各种形象、生动、贴近现实需求的形象,提升交互频率,从而真正有效地减轻人类工作负担。比如疫情期间,就有老师表示希望有分身到每个学生身边指导他们,而数字助理的拟人化交互恰好可以完成这一任务;

2.丰富的知识体系,利用知识图谱与深度学习技术,数字助手可以快速调用海量信息,完成问答、资讯等服务,再通过拟人化的形象输出给用户,人们会在服务过程中对技术产生一定的包容和理解。为故宫打造的清朝内阁大学士“福大人”,就担任起了知识渊博的游览助手;

3.个性化情感关系:智能语音助手等新鲜事物的核心受众群以年轻人为主,而随着国漫崛起,年轻人对标新立异的虚拟形象更感兴趣。而对于渴求增长与变化的企业来说,与其按部就班地在声音世界里打转, 尤其是在线上化业务增多,用户的交互频率和方式增长的情况下,年轻市场也需要新的服务形态来被重新激活;

此外,伴随着产业数字化程度的推进,企业想要在数据洪潮中传达出具象的品牌形象,新的视觉载体是不可或缺的。消费者的行为和决策链路也在数字世界中变得更加隐蔽、复杂,如何保持黏性,建立用户与品牌的情感连接也成为应有之义……

上述种种,或许都可以通过一个人格化、陪伴式的“数字助理”,来触发全新的可能性。

AI语音的下一站,开启人机交互的“宁静时代”

技术领域有个名词叫“宁静技术”,简单来说就是通过对用户的情景感知能力,最小化用户的注意力,让人机交互变得隐匿和不可见(invisible)。

就像进入电梯间之后按下楼层键一样,已经成为现代人潜移默化的惯性动作,谁还记得曾经按电梯也是一种职业,甚至需要考证呢。

而人机之间的语音交互,也正在从“好像有点尴尬”进入到自然而然地唤起阶段。接下来,就是要让这种已经在一些场景(比如客厅)成为习惯的事,隐匿到更大的社会空间之中,让AI助手能够在更广阔的商业世界里与人们自然顺畅地进行交流。

这既是技术发展的必然趋势,也离不开科技企业们的不断努力。以腾讯云小微AI语音助手为例,就已经在出行、文旅、教育等等领域开始落地。

之所以能达成这一成就,首先来自于腾讯在语音技术上核心技术链的深耕。

通过ASR、NLP、TTS等技术,对声音进行降噪、文本转化、语义理解,这一才能让AI助手能够在复杂环境中依然能够识别不同的方言或者口音。

想要达成和真人一样的交流,机器还需要听得懂,才能避免“所答非所问”的情况,来真正帮助用户解决问题,成为一个业务能力强大的“数字员工”。因此腾讯除了在语义技术方面发力之外,还十分重视知识图谱的建构。等于为AI搭建了一个先验的知识库,让它能够及时调动庞大的知识储备,更好地理解用户言语的意图,来显示出“智商很高”的样子。

除此之外,数字员工的“情商”也很重要。利用利用个性化、沉浸式的TTS语音合成技术,再结合虚拟人技术,将对话内容以多模态、多层次的形式表达出来,就能很好地通过表情、动作传达出语言的情绪,让用户更加可感、可知。

而这一整个技术体系要真正落地,一方面需要打通数据闭环,从而训练出更可靠、精准的对话模型。因此腾讯云小微团队也建构了一套系统工程。从没有数据怎么办开始,系统地钻研数据如何打通,推动数据共享,到缺失数据的采集,系统化地为客户规划了基于数据智能化目标的数据采集和信息化建设方案。

另外,数字助理的最终目标不是“卖萌”,而是帮助企业提质增效,推动数字生产力变革,达成体验/服务到业绩/留存的真实转化。因此要具备统筹全局、贯穿业务周期的能力。所以也需要对企业的全业务场景进行覆盖,来保证无论是简单的问题咨询,还是复杂的业务流程办理,抑或只是想跟数字员工闲聊谈心,背后的语音技术解决方案都能够通过正确响应来满足用户所需、企业所想。在这一点上,腾讯云小微也通过流式语义+语义VAD技术,让AI在极低时延的情况下也能边听边思考。

也正是“数据+业务”的双重闭环,形成了数字助理进入产业规模化的能力谱系,得以为企业智能化转型全程护航。

AI语音助手+X=无限可能

毫无疑问,数字化、智能化潮流的全面喷发,未来会有更多的数字助理、AI助手被纳入到人类的工作环境当中。对于广大普通人来说,数字助理的能力蝶变真的有现实意义吗?

答案是肯定的。可以预期的是,至少有几种社会生活会被革新:

一是文旅导游。一场疫情让旅游行业元气大伤,而防疫的“持久战”也决定了限人限流会成为一段时期依赖的常态,如何在这样的情况下依然保持甚至超越原有的服务质量,将基础讲解工作交给数字员工,就是一个不错的选择。未来走进景区,打开手机,也许就是一个数字导游引领我们游览,实时讲解,互动答疑;

二是家居场景。你的家里有多少智能音箱在等着落灰?年迈的父母呼唤语音助手的名字时是否还是会感到一丝尴尬?而一旦语音助手有了数字形象,被赋予拟人化色彩之后,一切可能都会变得不同。从原本的一问一答,到有情感、更自然的交流,大概率会有不少人开始发帖“我觉得家里的AI助理才是我爸妈亲生的”。

三是教育产业。一进九月临近教师节,家长群们总少不了“送礼物担心老师不收,不送礼物担心孩子得不到关照”的年度讨论,而现实中,确实存在老师无法针对学生进行一对一特定辅导、难以记住所有学生的学情状况、教学压力大等情况。能化身虚拟老师的“数字助手”,无疑就是妥妥的多赢,老师们得以从机械工作中解放出来,学生们也能得到实时、个性化的辅导,而家长们也不用发愁怎样才能在AI眼里刷存在感了。

三是智能营销。对于企业来说,数字助手不仅仅是一位德智体美劳全面发展的优秀员工,还可以是辅助商业营销决策的“超级智囊”。举个例子,一些汽车小白用户,通过互联网的消费行为偏好分析,进而设计出一些“傻瓜式”产品功能,比如一键询问维修、一键呼叫客户、智能导航、辅助驾驶等等,而这些用户洞察,基于腾讯云小微所处的数字生态都可以转化为车机企业争取潜在用户好感度的关键武器。

一个能听会说、知识全面,又善于表达、喜怒形于色的数字员工,拥有的可能性还有很多。不难发现,不仅企业需要重新认知数字助理所带来的价值红利,想要扩大数字助理的商业价值与应用边界,还需要一套体系化的平台性技术解决方案,来降低各行各业引入数字员工的门槛及成本。

从这一点来看,数字生态大会上所展示的人机交互技术前景与商业宏图,不是一种偶然,而是腾讯云小微从长期实战与技术研发中生长出来的确定性。

腾讯云小微扳动了一下技术齿轮,人与机器如同精密仪器适配一样,在某个瞬间发出“咔”的一声,于是我们知道,一个全新的产业世界大门,开启了……

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人机交互
    +关注

    关注

    12

    文章

    1199

    浏览量

    55266
  • AI
    AI
    +关注

    关注

    87

    文章

    29780

    浏览量

    268066
  • 腾讯
    +关注

    关注

    7

    文章

    1637

    浏览量

    49380
  • 腾讯云
    +关注

    关注

    0

    文章

    207

    浏览量

    16744
  • 语音助手
    +关注

    关注

    7

    文章

    235

    浏览量

    26785
收藏 人收藏

    评论

    相关推荐

    雷诺下一代车载语音助手Reno将引入生成式AI技术

    11月1日,赛轮思软件技术公司与雷诺公司宣布深化合作,旨在将生成式AI技术和类人交互功能融入雷诺下一代多模态虚拟车载助手Reno中。   雷诺推出的虚拟
    的头像 发表于 11-01 16:39 912次阅读

    具身智能对人机交互的影响

    在人工智能的发展历程中,人机交互直是研究的核心领域之。随着技术的进步,人机交互的方式也在不断演变。从最初的命令行界面,到图形用户界面,再到现在的自然语言处理和
    的头像 发表于 10-27 09:58 213次阅读

    英特尔与腾讯携手共绘AI与云计算新蓝图

    在召开的2024腾讯全球数字生态大会上,英特尔与腾讯的深度合作成果成为全场瞩目的焦点。双方不仅在AI
    的头像 发表于 09-06 16:31 850次阅读

    基于传感器的人机交互技术

    基于传感器的人机交互技术是现代科技发展的重要领域之,它极大地推动了人机交互的便捷性、自然性和智能性。本文将详细探讨基于传感器的人机交互技术,包括其基本原理、关键技术、应用领域以及未来
    的头像 发表于 07-17 16:52 597次阅读

    比尔·盖茨展望AI:耳机与智能眼镜引领人机交互新纪元

    我们描绘了幅人工智能(AI)技术普及后,生活与工作方式的全新图景。他特别指出,耳机与智能眼镜将成为AI硬件领域的两大焦点,引领人机交互进入前所未有的新纪元。
    的头像 发表于 07-04 16:34 832次阅读

    人机交互界面是什么_人机交互界面的功能

    人机交互界面(Human-Computer Interaction Interface,简称HCI或HMI),也被称为人机界面(MMI)、操作员界面终端(OIT)、本地操作员界面(LOI)或操作员
    的头像 发表于 06-22 11:03 1985次阅读

    亚马逊在语音助手的竞赛中上远远落后

    AI浪潮席卷全球之际,科技巨头们无不争先恐后,力图抢占先机。然而,在语音助手的竞赛中,曾经的领先者亚马逊可能即将获得最后名。 继苹果在其
    的头像 发表于 06-18 16:54 1255次阅读

    工业平板电脑在人机交互中的应用

    工业平板电脑在人机交互(Human-Machine Interaction,HMI)中扮演着至关重要的角色,它们通过直观的界面和强大的计算能力,极大地提升了工业环境下的操作效率和用户体验。以下是工业平板电脑在人机交互中的具体应用:
    的头像 发表于 06-18 12:00 242次阅读

    人机交互与人机界面的区别与联系

    随着信息技术的飞速发展,人机交互(Human-Computer Interaction,HCI)已成为现代社会不可或缺的部分。人机交互技术,作为实现人与计算机之间有效通信的桥梁,不仅改变了我们
    的头像 发表于 06-07 15:29 761次阅读

    人机交互的三个阶段 人机交互的常用方式

    交互经历的三个阶段:命令行界面交互阶段、图形用户界面交互阶段、自然和谐的人机交互阶段。
    的头像 发表于 03-13 17:25 2658次阅读

    人机交互技术有哪几种 人机交互技术的发展趋势

    人机交互技术是指人与计算机之间通过各种交互方式进行信息传递、操作和控制的技术。随着科技的进步,人机交互技术也在不断发展创新。以下将介绍人机交互技术的几种常见形式以及当前的发展趋势。
    的头像 发表于 01-22 17:47 3298次阅读

    大众汽车推出AI语音助手ChatGPT

    在2024年的CES展会上,大众汽车公司向全球观众展示了其最新的人工智能(AI)相关技术。此次展示的大亮点是,大众将把ChatGPT集成到车载语音
    的头像 发表于 01-11 14:28 839次阅读

    语音数据集:AI语音技术的灵魂

    、引言 在人工智能领域,语音技术被誉为“未来人机交互的入口”,而语音数据集则是AI语音技术的灵
    的头像 发表于 12-14 14:33 939次阅读

    情感语音识别技术在人机交互中的应用与展望

    、引言 随着人工智能技术的不断发展,人机交互已经渗透到日常生活的方方面面。情感语音识别作为人机交互中的关键技术之,能够通过分析人类
    的头像 发表于 11-22 10:40 712次阅读

    情感语音识别在人机交互中的应用与挑战

    、引言 情感语音识别是近年来人工智能领域的研究热点之,它能够通过分析人类语音中的情感信息实现更加智能化和个性化的人机交互。本文将探讨情感
    的头像 发表于 11-15 15:42 516次阅读