第一次使用手机语音助手的时候,这个令我新奇不已的玩意儿,总是会在我兴冲冲地问一个问题之后,令人失望地回答一句:“我好想听不懂你在说什么……”
后来技术演进,它终于能够通过我的一些关键词,听懂我说什么了。但一板一眼,一字一句,程式化十足。
慢慢地,简单的对话已经难不倒它。语音助手开始不局限于仅仅是对“文本”的理解,而是加入视觉、听觉等分析技术,通过“察言观色”来捕捉人的“话语”背后蕴藏的情感。它们开始试图获取人类的情绪。
就像亚马逊近日所透露的,基于Alexa语音识别情绪的技术能力,他们有计划打造一款类似手表的可穿戴设备,通过捕捉用户的情绪,而去提供更多的服务。
万事不离“视听”:
AI探知情绪的主要途径
对人类的情绪进行研究和总结,是一个已经开展了将近一个半世纪的课题。最初研究者们往返于不同的种族人群,进行比对、分析,得出了人类的几大基本情绪类别,然后可以应用在人际交往、医疗护理等行业。
而在人机交互越来越深入的今天,机器能否对人的情绪进行充分的理解,将会直接影响到交互体验。由此而来,诸多人工智能公司开始对机器识别情绪展开了攻关。得益于图像识别和语音识别技术的不断取得突破,目前AI识别情绪主要有两种途径。
第一种是视觉情绪识别。这是一种最基本的情绪识别方式,因为人的情绪往往会以面部肌肉运动的形式来直接呈现,这也是美国心理学家保罗·艾克曼和福里森证明人类有六大基本情绪的直接原因。
而面部识别如今已经是一项非常成熟的技术,通过“喂给”AI大量的面部表情数据,然后进行学习,从而就可以对现实中人脸所呈现的情绪进行判断。国内就有专门做面部情绪识别的人工智能公司,比如旷视、太古等。
第二种是语音情绪识别。人的情绪出了能“看”出来,也能“听”出来。与之直接相关的就是不同情绪下人说话的语调:深沉之于悲伤、高昂之于愉悦等。
相较于视觉识别,语音识别的难度要高了不少。因为情绪与表情的对应度要远高于语调与情绪,比如你很难将哭丧脸与开心联系到一起,但一个人如果说话声音低沉的话可以表示他心情沉重,也可能是因为他的音色本就如此。正因如此,对声音信号的分析才会要求更加精细。百度、谷歌、亚马逊等对此均有一定的技术积累。
除了这两种情绪识别途径之外,通过文本识别和生理信号(脑电波、呼吸、皮肤阻力等)也是AI进行情绪识别的方法,但由于文本涉及的场景狭窄和生理信号的准确率低的短板,其尚不能成为主流的情绪识别方法。
显然,Alexa所擅长的就是第二种途径。在语音情绪识别方面,去年10月Alexa就已经取得了相关专利,其可以通过声音的模式来确定用户的幸福、快乐、愤怒、悲伤、恐惧、厌恶、无聊、压力和其他一些情绪的状态。而如今,这项专利终于要派上用场了。
从买止咳糖浆到在线购物:
Alexa听懂情绪后怎样
Alexa是亚马逊专门研究智能语音技术的团队,它的技术要进行应用转化,往往和亚马逊的另一个团队Lab 126(曾经开发过kindle和echo等产品)有关。这一次,两个团队再次携手,准备把语音情绪识别的最新成果搭载到一个类似智能手表的可穿戴设备上。通过与手机APP的连接,来为用户提供个性化服务。
根据亚马逊的内部文件,这款手表的功能定位很简单,就是健康辅助。而在此之外,它还可以通过识别用户的语音特征来进行情绪判断,然后为其提供与他人交流的最佳方式。
根据描述,如果一个女生一边擤鼻涕一边咳嗽一边又跟Alexa说自己有点饿了,那么Alexa就会通过对女生说话的的音调(虚弱、低沉)和背景音(咳嗽、擤鼻涕)分析出她很可能得病了,然后发出来自机器的贴心关怀:要不要来碗鸡汤,或者叫个外卖?甚至直接线上订购一瓶止咳糖浆一小时内送货上门?
说真的,妹子要真有这么一个贴心助理,还要什么男朋友?
从这个角度来说,Alexa作为个人生活助理的角色会得到进一步的加强。比如将其和手机音乐、电商APP等业务进行连接,在感知到你比较悲伤的时候为你唱一支快乐的歌,或者为你购买一盒甜品来让你通过食物获取愉悦感等。
由此而往,Alexa很可能将开启一种全新的语音购物推荐方式。与传统的通过捕捉用户的浏览记录、搜索记录或者通过“窃取”其他用户在手机其他APP上留下的隐私足迹,然后进行毫无目标的泛化、低效的推荐不同,通过感知情绪和问询来为用户进行购物推荐,能够获得更高的成交效率。这无疑将对电商形成巨大的吸引,也是可能成为Alexa获利的一种新的商业模式。
当然,现在这种可穿戴设备尚且处于研究的早期阶段。亚马逊并未完全确定是否执行此项计划。如果技术可行的话,才会进一步地去进行设计。我们这样长篇大论似乎有“过度解读”之嫌。
但在这个时代,最不可小看也最无法预测的,就是技术的走势。如果它真的走入了现实,或许还真有一些东西需要认真对待并妥善解决。
谨防“服务”变成“买卖”
首当其冲需要被关注的,就是我们不厌其烦地再三提及但也不得不提的隐私问题。
隐私数据是互联网时代不可回避的,用户提供自己的数据以获取服务这种交换每天都在发生。在各种APP中,为了改进产品的使用体验,服务商一般都会明确告知会搜集用户的部分隐私数据,并且仅用于改进产品之用。但这种话向来被认为是鬼话,尤其是Alexa还是有前科的——echo就不止一次被用户曝出偷听用户和私自收集隐私的劣行。
但如果是做成监测健康和识别情绪的穿戴设备的话情况又不一样了。智能音箱正常情况下是需要唤醒才能工作的(我们假如非正常情况不存在……),而智能手表等可穿戴设备需要全天候地开启,也就是说它随时随地都在感知着你的变化……想一想,有个东西默默地掌握着你情绪的一切,然后很有可能在背着你做着一些不知情的事情,是不是有点害pia?
获取隐私的边界在哪儿,是需要解决的第一个问题。
其次,需要警惕它由一种私人服务“异化”为不合理的商业用途。上文我们分析过的,它可以和电商达成一种合作,形成一种新的购物模式。但是,如果它所推荐的商品或者商家都是“充值”过的呢?你以为被推荐的商品是最合适的,没想到却是给钱最合适的……利用用户的情绪进行商业分发,显然会给用户添不少堵。
从这个角度来说,如何划分服务和商业的界限,也是需要重点关注的。
最后,每次觉察到人的情绪变化,都会及时做出反应,很可能对人产生两个截然相反的影响。
一是过分地依赖。情绪不好有它安抚,情绪愉悦有它“锦上添花”,将会让人顺着天性而行,缺乏自主的情绪调节能力。成年人还好,如果是儿童的话将很可能对其性格的形成产生不良影响。如何限制儿童使用此类产品,就会成为一个新问题。
二则是引起反感。人与人性格不同,有的人可能会喜欢被安抚,但有的人如果事无巨细都要被“嘘寒问暖”,反而会引起精神的烦躁。这点很好理解,就跟你嫌爸妈唠唠叨叨是一个道理。那么,如何掌握好既能通过察觉情绪提供贴心的服务、又不至于引起反感的节奏,也是个技术活儿。
从总体上来说,Alexa如果能基于情绪识别提供正向的服务的话,还是很值得肯定的。毕竟人机交互到最后阶段,是不可避免的要进行情绪上的碰撞;而基于此提供一些商业化的服务也无可厚非。但由于情绪的私密性和个人化色彩,无论是Alexa还是其他提供类似语音技术服务的公司,都必须要在符合伦理常识和保证体验的前提下,提供有分寸、有边界的服务。
否则的话,被用户抛弃将会是注定之事。
-
机器视觉
+关注
关注
161文章
4336浏览量
120049 -
AI
+关注
关注
87文章
29961浏览量
268256 -
语音识别
+关注
关注
38文章
1719浏览量
112520
原文标题:AI能听懂你的情绪了,人机交互会变得更好吗?
文章出处:【微信号:smartman163,微信公众号:网易智能】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论