2012年5月苹果发布SIRI,带来了一种全新的交互方式——人机自然语言交互。SIRI带来了截然不同的用户体验,加上苹果公司的夸大宣传,很多人惊呼人工智能时代要来了。
然而很多年过去了,人机自然语言交互依然不是主流的交互方式。
2016年3月谷歌机器人阿尔法狗战胜人类围棋大师李世石,又一次让人们对人工智能充满了希望。2016年国内很多人工智能和机器人企业拿到了投资。
我们看到机器学习技术的广泛应用确实为我们带来了很多改变。比如语音识别和图像识别的准确率更高了。
尽管投资人、用户以及政府都对人工智能充满了期望,应该看到目前的进步都还只是量变,并没有达到质变。
于是我们看到很多拿到投资的企业很快就变得平庸了,不再能让我们眼前一亮。
人工智能时代,终究还没有到来。
我以前在我的朋友圈讨论过这个话题:什么是人工智能时代的正确打开方式?
我认为唯有人机交互方式的变革才能带来行业的质变,唯有键盘和触摸屏的交互变成全自然语言的交互,人工智能时代才会到来。
最初的电脑没有操作系统,各家的软硬件不兼容。有了操作系统,才形成了软硬件相互协作的格局,让更多企业参与到IT行业中来了。
但最初的操作系统是命令化操作,只有专业人士才能记住那些复杂的命令,于是电脑成了“奢侈品”,普及困难。
后来有了视窗操作系统,电脑成了办公工具,很快进入了各个企业、政府、学校,成了办公室必不可少的装备。后来互联网普及后,电脑开始进入家庭,成了游戏工具。
最初的手机是按键操作的。后来有厂商造出来可以替代计算机办公和打游戏的智能手机。当时的诺基亚和黑莓手机都非常棒,能支持移动办公,带来了很多便利。
但直到触摸屏手机出现,移动互联网时代才到来了,才达到了质变。
那么有没有什么能替代移动互联网的东西呢?我认为只有新的交互方式产生了,新的互联网时代才会来临。这种新的交互方式就是人机自然语言交互。
触摸屏交互和鼠标键盘交互存在的问题主要有以下几点:
第一、菜单式操作,能容纳的功能有限。大多数人在手机上安装的APP不会多于100个,大多数人即便在电脑上安装的软件数量也不会多于100个。因为太多了查找起来就很困难。我们大多数人手机里的电话号码不会多于1000个,微信里的好友很多人连5000个都没有加满。这都是受限于操作系统需要通过菜单展示信息。
第二、需要人理解机器。过去计算机要输入汉字是件很困难的事情。我们上学时最流行的是五笔字型输入。需要参加培训才能学会这种输入法。现在也需要通过各种输入法去解决汉字输入的问题。这就需要我们理解输入法的规则。过去很多软件操作都很复杂,需要经过培训成为专业人士用户才能使用。现在尽管软件都智能了很多,但一些软件还是需要人们去学习才能掌握它的使用方法。
第三、需要近距离操作,占用手和眼。无论键盘鼠标还是触摸屏,都需要近距离操作,需要手眼配合。因此在用计算机和电脑的时候,我们就不能干别的事情。另外,也因为近距离操作,限制了人们的使用场景。例如,必须有电源,有办工桌安放电脑等等。
SIRI让我们看到了一个新的机会,就是人机交互方式变革的机会。如果可以语音和机器交互,那键盘鼠标触摸屏就都不需要了。我们可以通过语音交互让机器为我们服务。手和眼被解放了出来,而且我们不再需要理解机器的规则。机器有成千上万的功能,它根据我们说的话去理解我门的意图,提供令我们满意的服务。我们可以语音告诉机器人我们要买的东西,它帮我们完成购买和支付。我们可以语音告诉机器人出差的时间和目的地,机器人帮我们订票和订酒店,然后反馈结果给我们。我们可以告诉机器人我们要吃什么东西,机器人自动帮忙叫外卖并完成付款。我们可以语音驾驶汽车,只要告诉汽车我要去哪里就可以了。我们不需要知道机器有哪些功能,我们只需要按自己的习惯表达,机器人会自动去匹配它的功能。这样,即便机器有千千万万的功能,也不会让我们使用上感到困难。
为什么SIRI不能实现以上功能呢?很多时候,那些SIRI一类机器人更像个智障。
其实人机自然语言交互需要的不仅仅是自然语言处理,而是一个系统,一个大脑。语言处理的过程就是思辨的过程。我说“吃”,你不知道我说的啥意思,但我说话的对象就能听得懂。因为他从我这里获得的信息比你多,他能综合各个信息通过思辨来理解我的意图。语言本身是模糊的,甚至矛盾的。说“是”也许表达的是否定,说“快乐”也许表达的是伤心。只有通过思辨才能理解一句话。机器要理解人就需要机器具备思辨能力,思辨能力就是智慧。如果像写普通程序那样写人工智能程序,不会让机器拥有思辨能力。
其次,只有机器拥有了相应的知识才能解决相应问题。但人类的知识是个无限集,是非常非常庞大的。只有通过UGC的模式,让每个参与者都为机器人提供知识,才能保证机器人拥有无限多的知识。如果需要通过训练来让机器人拥有知识,那普通用户是无法参与的。
另外,语言是流动的是模糊的。一个词在现代包含的意思和在古代不一定完全相同。一句话在不同的场合含义都不一样。要理解语言,不是理解字面,而应当去理解文字背后的语义。如果把语言当成处理对象,那就错了。
最后,很多人用菜单式的系统结构做人机自然语言交互的系统,这就错了。人机自然语言交互的系统是平行结构的。如果有菜单,用户就要去理解菜单,那就不是智能了。应该是机器人理解人,根据人的意图去平行调用各种功能模块。对于平行结构,我们的定义是所有功能都在第一级别。想进入一个功能就进入,不想进入不能进入,想退出就退出,不想退出就不能退出。
我们氖星智能经过很多年的研究,我们的DSA-nlp算法已经相对成熟了,我们能让机器在最大程度上理解用户意图,能理解上下文,能让对话变得自然流畅。
我们的目标是成为新的流量入口,人机自然语言交互时代的流量入口。各家大厂都在推智能音箱,都是在争这个入口。但能取胜的,一定是交互最流畅的。我们拥护先进的人机自然语言交互技术,一定能在这个市场拥有自己的地位。
因为我们研究了十多年的NLP技术,我们能处理上下文,我们的系统结构是平行结构,我们提出了人机自然语言交互的四个标准:差异性、同一性、模糊性、一致性。差异性就是机器人能理解语言之间的细微差异,比如“你干嘛”和“你干嘛的”。同一性就是能理解两句话语义是相同的,比如“你公司在哪里”和“贵司地址是什么地方”。模糊性是指当语音识别把“甲硝唑是什么”识别成了“早上做是什么”的时候也能正确处理。一致性是指机器真正理解了语义,前后说的话不矛盾。我们严格按照这四个标准在建设我们的系统。我们可以保证我们的机器人对用户输入理解的准确率可以很高,保证人机对话可以自然流畅。
我们推出了氖星智能平台www.neonstar.cn,能让每个用户建立自己的机器人。比如,你是个医院,你建个机器人回答健康问题。你是个律师事务所,你建个机器人回答用户法律问题。你是个驾校,你建个机器人回答关于汽车驾驶问题。我们平台已经有不少机器人了。他们一起为用户解答各种各样的问题。我们开发了氖星知道APP(以下是氖星知道下载地址:http://www.naistar.com/download/zhidao-release-signed.apk),用户提问,机器人抢答。未来几年我们氖星知道的用户数会突破1亿。
快来我们平台建立自己的机器人,在人工智能时代提前布局吧!这里才是通往人工智能时代的真正入口。
-
机器人
+关注
关注
210文章
28068浏览量
205765 -
触摸屏
+关注
关注
42文章
2282浏览量
115721 -
人工智能
+关注
关注
1789文章
46576浏览量
236896
原文标题:快来看!这里才是通往人工智能时代的真正入口!
文章出处:【微信号:robot-1hjqr,微信公众号:1号机器人网】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论