极客公园在上海科技馆举办“2016奇点创新者峰会”,下午举办的内部高峰论坛中,思必驰CEO高始兴也给大家带来了非常精彩的分享。
高始兴表示从工业革命、信息革命,现在人工智能的革命,进入人工智能时代确实对众多的创业公司,特别是技术驱动的,有技术积累的创业公司带来非常大的机会。
以下为演讲实录:
思必驰创立8年左右,在8年时间,基本上或多或少已经成功见证人工智能,特别是语音行业越来越往后加速发展的阶段,我们最早是做教育方面的语音技术,后来专注智能硬件垂直行业做语音技术和产品服务。
早期语音更多是在传统的非常窄的市场去应用,包括呼叫中心。后来Siri发布,引爆整个语音在互联网的市场,吸引了很多眼球,吸引了很多资本,吸引巨头发展,推动整个市场,推动技术的进步。再到智能硬件物联网行业,语音成为刚性痛点的需求,在各个行业,各个垂直产品进行落地,整个行业确实爆发力很强。技术早期还是单点的技术,后来技术的提升,包括语音识别、合成、智能识别等等,包括现在从感知走向认知,对话技术。
以前这个题目有可能有点大,现在人工智能加速渗透到商业、生活的方方面面,语音在各个终端连接了各种各样的服务。早期的时候,还是一个简单的模拟,简单的算法,虽然期望特别大,但是落地特别少。真正再一次掀起一个小浪潮是80年代,在欧洲、日本商业的企业,包括声音网络,遗传算法。但是真正大的技术变革,真正在行业上掀起爆发式应用,还是在近10多年互联网时代,摩尔定律处理能力,大数据、云计算,让能力循环成为可能。现在确实在各个产业上,我们看到更多的应用场景。
语音技术是人工智能的关键
AI从互联网到移动互联网到物联网,现在到智联网,现在它的渗透率,推动率越来越大。早期在互联网、移动互联网,更多还是产品驱动,是一个商业模式驱动。现在在智能硬件物联网,泛人工智能行业,我们看到AI,人工智能驱动,让各种新型商业、新型商业产品成为一种可能。包括现在人工智能创业公司价值体现也越来越多。
从工业革命、信息革命,现在人工智能的革命,进入人工智能时代确实对众多的创业公司,特别是技术驱动的,有技术积累的创业公司带来非常大的机会。我们现在看移动互联网,不说互联网,移动互联网更多还是抢夺存量市场,一片红海甚至血海,现在这个市场行业不是A的就是T的,或者是B的,当然B最近口碑不是太好,但是他们确实在人工智能布局还挺早,挺大。现在在整个巨头占据足够的市场,影响力的时候,我相信在若干个场景能成就很多独角兽,包括技术公司,包括结合行业的一些公司。
如果简单分的话,人工智能行业,语音智能应用在应用层、技术层和技术设施层,应用层,像一些产品类的公司,像暴风和小米,小米用我们思必驰语音技术,包括像人脸商汤,包括现在思必驰语音公司。在技术设施层,包括庆科等一些优秀公司,当然还有巨头公司,在这里面,技术还是核心的驱动力,这里面有一个趋势,我们看到一个是技术层和技术设施层,产品落地,产品服务的整合,我们确实做得还不错,整个大语音在诸多行业,传统行业科大讯飞也在做设施层。再一个,应用层和底层设施技术层融合和整合,像乐视自己在做语音,现在估计有五六十人,服务于它的大生态。还有一个技术层、应用层向后端技术设施层去整合,去联合。比如说一起去做相关的芯片摸索,像京东、小米他们都在做。
现在各个模态人工技术发展特别快,刚才讲的人工识别,体感识别,包括像我们语音识别等等这些,VR、AR进展特别快。我觉得应该在很多场景下,我们在手机端,我们基本上特别是服务场景是打通的,我们通过触摸交互订票、订餐、购物等等这些行为,如果说我们在智能硬件物联网几个场景里面,比如说在开车的时候,我们在家里面对音响和机器人的时候,我们去订张票,语音可能是唯一的入口。第一的,它是很自然,很便捷,还有一个它是唯一能传递复杂信息的。未来,多模态整个人机交互两个趋势非常关键。一个是多模态融合和整合,融合是一个必然。现在人机交互还是被动式,未来在场景数据积累,用户行为数据等等这些,形成能力循环,未来人机交互会变成更多是主动式。未来的机器,从一个简单的秘书,真正成为一个助理。
如果从语音上,实现人对机器的控制,我们喊一嗓子,把空调调高一点,控制电视,调整音量,简单的查询,搜一些歌,未来场景力量,一个生态一定让用户能够enjoy更多的服务,一定需要对话交互,像手机端触摸交互一样,能获取更多的服务。再一个随着情感识别,情绪识别,包括各种的人脸识别等等一些人工智能交互模态的进步整合,未来情绪识别富裕这个机器形态,现在机器人很吓人,未来情感世界会大大解决这个问题。再往后思想交互,我们机器能够自学习,自适应,未来我们进行人机交互的时候,如果你不看到它,不知道对面是一个机器。像去年6、7月份,剑桥和苏黎士理工做实验,母机器人孵化子机器人,而且自己检测这个完备性。
现在在智能硬件物联网上,未来我们让智能设备向我们手机一样,我们随地随时可以去获取很多的服务,订餐、订票,玩游戏等等这些,一定是对话交互, 对话交互分成三类,一类是问答式,有明确的确定和否。第二类是闲聊式,像现在Siri,基本属于闲聊式,一般没有明确的确定和否,没有聊天的本体,再就是任务式对话,任务式像现在估计在座大家都知道,做得非常棒的亚马逊echo,echo基于场景用户去完成一个任务,假设在人机交互里面,说一句我饿了怎么办?如果是问答式,他会回答你你要一天三餐,保证健康。聊天式有可能有很多答案,比如说它会回答,主人你饿了吗?你随便吃一点,陪我聊天呀。如果任务式,结合你的历史信息,甚至结合你的位置,结合你其他历史行为,给你推荐周边的餐厅,有可能你愿意吃辣的,周边推荐湘菜馆,火锅店推荐几家,进而形成对话交互,规划交互一定是近几年的发展趋势。
我们思必驰基于自然语言理解和处理,再一个是我们整合了我们对话逻辑,一软一硬两个产品,我们提供给三个垂直行业,车载、家居、机器人,让每个设备成为智能助理,帮助用户完成任务。
语音是产品创新的关键技术
语音交互一切,语音改变更多,它除了连接一切,交互一切,未来会在产品创新,行业的一些变化,甚至变革上起到很大的推动作用。
几个观点,这个就是当前的一些语音在智能电视上的应用。这个是当时给小米电视,小米电视整个语音交互是用思必驰,这里面用的语音唤醒,我们找的是林志玲模拟她的声音。目前还比较简单,唤醒跟简单的查询。下一步,一定会走向从感知走向认知,不仅仅让人机的交互能够实现控制和简单查询,一定在各个场景里面,整合更多的服务。
再一个,现在移动互联网很多的行业生态,商业模式,在智能硬件物联网领域不一定完全能迁移,会发生一定的变化,甚至是颠覆。比如说搜索,现在PC互联网,移动互联网,我们端是手机,在智能硬件物联网是各个端,不单是端,交互界面都发生变化。再一个用户行为,在PC互联网,移动互联网,人机搜索更多是信息的查询,在智能硬件互联网上,更多还是服务的获取。再一个,就是传统的一些商业模式,像CBC,在新的智能硬件物联网上,新的语音搜索有可能也是CBC,再就是智能语音发展促进产品创新,甚至产品形态的变化,包括其他人工智能的发展。现在说智能终端,智能硬件,硬件的智能化,我觉得大概两类,一类是真正通过人工智能,语音智能提升它的效率,提升它的体验,向一些消费电子,比如说我举的例子,空调,我们跟一些大的消费电子合作,像海尔、美的等等合作,不改变它的产品的属性,但是提升它的体验,我在房间任何一个角度,我在晚上起来以后,或者遥控器找起来不方便,喊一嗓子“我冷了,调一下温”。这个不改变产品整体功能和形态。再就是通过人工智能,语音智能,改变了它的产品的核心功能,甚至拓展了服务,成为一个中心态势,比如说echo,未来像echo设备越来越多。未来像翻译耳机,好像日本公司做的,未来耳机不是打电话,我们出国,甚至假设有方言的话,特别是南方隔一个县,甚至隔一个村就是一个方言,我们戴着耳机就可以自由对话。包括未来的会议,我们现在会议电话还是开会,未来的会议电话加上身份识别,语音识别,它其实就是一个秘书。因为电话只要加了一个通信模块,任何东西都可能成为电话。所以未来有很多产品创新和融合,包括未来我们有可能灯泡,我们插排、插座,有可能我们就是的speaker。
再一个,现在我们看到的智能硬件交互,还是很难完成闭环,未来在智能音响、电视,机器人等上面,加上身份识别或者其他的生物识别,身份能够通过身份密码完成支付,形成一个交易的闭环,这样整个大的生态才能起来。包括一些行业的融合和创新。比如说未来我们在家里,我们通过电视,通过音响,我们在车里,通过车载智能终端学习英语,在家里可以做一些远程医疗等等,包括还有一些创新点子,包括前段时间有人提出来,监测儿童呼声,做一些相应的看护,刚才阿里朋友讲,鉴黄,通过图像识别去鉴黄。在今年年初的时候,有人提出来用声音去鉴黄,就是她的叫声,当然没有做,我觉得都是创新点。包括未来传统的数据结构,未来更多的在智能硬件物联网上,大量、大规模的数据,语音数据,视频数据等等,人脸数据,新型的数据结构,包括一些新型用户画像,包括借助我们设备识别,老人可能Push脑黄金广告,年轻人可能Push一些年轻的产品,可能小孩子Push一些玩具的广告。
还有整个市场出现几百上千的语音助手,包括有一些获得投资的,基本上也都销声匿迹了,在几年前整个语音在通用环境下能做好,这么几年从感知智能走向认知智能,通过对话交流可以打通一个一个信息通道,未来手机可以看成一个端,类似于像智能音响一样,智能电视一样,因此我个人觉得,未来智能手机上,成为新型语音助手。
思必驰还是专注于在智能硬件,物联网,车载、家居、机器人,我们提供人机对话交互的方案、产品和服务。
-
智能语音
+关注
关注
10文章
782浏览量
48764 -
信息革命
+关注
关注
0文章
3浏览量
5816 -
工业革命
+关注
关注
0文章
107浏览量
15812
发布评论请先 登录
相关推荐
评论