近几年,关于人工智能的讨论很多,许多人对人工智能一知半解,媒体的报道也未必全面,那么什么是人工智能?人工智能的本质是什么?未来可能的应用场景?本文将带你一一熟悉这些。
什么是人工智能?
什么是人工智能?简单讲就是用计算机实现人的头脑功能,即通过计算机实现人的头脑思维所产生的效果。人工智能算法所要处理的问题,以及处理后的结果具有不可预测性。
目前,社会上把普通的模式识别、机器人技术混同于人工智能,其根本原因是对人工智能的概念不清楚,因而把一切先进的技术统统归属于人工智能。从另一个角度来说,这反而会影响人工智能的发展。
长期以来,人们习惯把导入计算机处理的系统统称为智能系统,所以,人们看到“人工智能”这个词时马上就联想到智能系统,其实这是完全不同的两个概念。
智能系统是依据确定性的算法所实现的系统,是按照一种算法实现某种目标函数的处理,其处理结果是确定性的。例如自动控制系统,通过闭环的PID调节,使机械位置能够尽快达到所定位置,使温度尽快达到所定指标等等,这种算法往往是经典的理论;再者,在模式识别的智能系统中有很多经典的分类的算法,例如利用欧几里得距离,可以计算出一个特征向量数据同若干个向量数据中的哪个向量数据最接近,这些都是模式识别的基本算法,导入这些算法的模式识别系统就是一个智能的系统。
在机器人系统中,机器人的行走以及手臂的动作需要人为地事先通过程序输入到机器人系统中,机器人才可以按照人为输入的程序进行行走以及做各种手臂动作。外行人可能以为机器人同人一样可以随心所欲地做出各种动作,其实不然。例如,机器人在行走过程中,如果路上出现一个不可预知的障碍物,这时机器人肯定会被绊倒;然而,如果在机器人系统中搭载了人工智能的算法,机器人就可以依据自己的判断,自主地绕过障碍物。
所以,普通的智能系统与人工智能的区别是:普通智能系统是经典的算法,是仅以满足目标函数的算法,是解决其结果是可预测性问题的算法,人工智能是模仿人类大脑处理问题的方法,或能客观上实现人脑所能实现的处理过程,人工智能所要解决的问题以及处理的结果往往是不确定性的,或者说是事先不可预知的。
常用的人工智能的算法
1 基于知识库技术的专家系统
客观地讲,人工智能最成功的应用应该是知识库技术的专家系统,早在20多年前,笔者研究室里就针对手写文字如何看起来美观为题开发了手写文字的专家系统,把美观的手写文字的规则输入到知识库中,运用这个系统可解决苦于手写字不流畅的企业负责人手写书信问题,通过专家系统的处理既保留了企业负责人书写文字的个性化,同时看起来又具有一定的美观效果。
同20多年前落后的硬件环境相比,今天的科研环境先进了许多。人们可以借助大型网络服务器构筑社会性的大知识库系统,可以得到意想不到的应用效果。例如,最近日本在网络服务器上建立了10万人的语音知识库,该库可以实现完全无障碍的自动语音交流,目前用于外国游客坐出租时的自动翻译系统中。
基于知识库技术的专家系统是把人的经过头脑加工的知识通过标准的知识库的形式归纳起来,使专家系统能够达到人脑所能实现的处理功能,因此可以解决传统算法所解决不了的难题。
2 基于模糊数学的空间映射理论*
空间映射理论的倡导者至今才发现这个理论是属于人工智能范畴的理论。空间映射理论的原理可以用来解决类似人脸识别、图像识别或文字识别等复杂系的模式识别问题。由于复杂系的问题往往很难找到可以直接解决的算法,因此不能像传统的智能系统一样,直接通过传统的算法进行处理;基于模糊数学的空间映射理论是把一个复杂系空间的问题映射到若干个简单系空间的问题,虽然在每一个简单系的空间中只能解决有限的问题,但是根据组合理论,若干个简单系空间的组合却能解决复杂系空间的问题;这里最重要的地方是由复杂系空间问题映射到简单系空间,是基于人的大脑的处理,学术上称为人为介入的方法;由于传统的数学方法非常死板,不易进行人为介入,模糊数学则给我们提供了便利,可以根据人对处理对象的理解,从若干个角度通过模糊数学的Membership函数进行定式,从而实现对复杂系问题的解决。由于这样的算法是按照人头脑处理的方式,再通过模糊数学的定式达到解决复杂系问题的效果,因此应当属于人工智能的理论范畴。
20多年前,日本利用这个理论在手写体数字的自动识别上得到了非常高水平的应用效果。比如,在区别数字“9”和数字“4”的自动识别方面。那个时候,普遍使用的扫描仪的解像度只有100dpi,扫描后的数字“9”和数字“4”很容易混淆:如果数字“4”竖线下面的笔画较长,很容易被识别成数字“9”,反过来手写的“9” 下半部分笔画较短时,可能会被识别成数字“4”。于是,研究人员利用空间映射理论中的Membership函数定式,把数字“9”和数字“4”的模糊值进行量化,从而可以得到非常高精度的识别结果。该技术主要用于超市传票的自动高速读取系统中,成为当时日本颇具代表性的手写文字识别方法。
该理论也可以用于其他应用。例如,利用这个理论,日本电气化轨道交通的无人驾驶系统可以通过模糊推论,成功地按照驾驶员的经验自动地处理在自动驾驶过程中可能遇到的随机问题,从而可以平稳地自动驾驶列车在各种条件下运行。
神经网络的深度学习理论是基于直接模仿人脑的神经元的信息处理的机理,因此当仁不让地属于人工智能范畴。人们曾经对这个算法寄予了很大希望,相信能够在模式识别这类复杂系的问题上得到令人意想不到的应用效果。遗憾的是,神经网络算法从一开始就遇到计算复杂度高、迭代收敛慢等难题,很难得到实际的应用。2000年以后,神经网络技术升华为深度学习技术,人们再次掀起对神经网络技术高度的期望。但是,能够大规模地应用所必需的具有突破性的技术进步目前还未看到。
4 概率尺度自组织理论*
早在20多年前,为了能同神经网络技术相对抗,有发明者提出了概率尺度自组织理论,至今,人们才意识到这个理论也属于机器学习理论。这个理论的出发点是出于人为思想,如果能找到一个最大概率值的尺度就可以通过自组织的方法,针对随机分布的数据得到一个超越传统算法的最大概率值的解。由此,产生了概率尺度自组织的算法。
传统算法的程序设计是程序的开始、中间乃至结果的整个处理过程都是程序员事先设计出来的,是具有预知性的,而概率尺度自组织算法的一个显著特点就是程序员对处理的过程以及结果都具有不可预知性。
截至到这一理论出现之前,一切与统计学有关的算法的处理结果都停留在这一算法的处理之前,反过来讲,该算法处理之后的结果可以让一切与统计学有关的算法的处理结果产生突破,而且这种算法出现之后,目前被人们视为不可逾越的统计学的各种常数已经不是最佳的常数了。
同深度学习的算法相比,概率尺度自组织算法的自组织的目标清晰,效率极高,每一次迭代必有作用,计算复杂度为线性,普通手机App就可实现,极具应用前景。
由于这种算法在理论上有大的突破,且计算复杂度低,因此使得它在出现以后一直显示出特殊的应用效果。例如,在文字识别OCR系统上、在计算机打印出的文档文件上。在没有基准线的情况下,当文件在扫描仪上放偏时,利用这个算法,仅通过文字的排列,系统就可以很快地计算出文件放偏的角度。
在人脸识别的应用中,例如在给定的一个图像中找到人脸的部位,传统的方法是先给出人脸的颜色数据,程序按照顺滕摸瓜的方法找到属于人脸颜色的所有像素。然而,同一个人在不同的光线下拍摄出的图像的颜色差别很大,再者,世界上有不同肤色的人,同一种肤色所含的具体颜色也是千差万别的,因此,传统的定义一种颜色进行搜寻的算法肯定不能满足实际应用的需要。导入概率尺度自组织算法可以直接地仅通过若干次的自组织就可精确地找到人脸部位,因为不论是那种肤色,不管由于拍摄光线的不同所拍摄图像的颜色如何失真,在整个图像中的人脸部位的颜色的分布密度值最大,也就是说人脸部位的肤色的概率值最大。通过概率尺度自组织的算法很简单地解决了这一难题,而且无需采用顺滕摸瓜的方法,在初始时可以通过图像的任何部位,在概率尺度自组织的过程中自动地迁移到人脸部位,并最终给出整个人脸部位的轮廓。这是在传统的模式识别的算法里不可想像的识别效果,而且这样一个胜似深度学习的算法仅仅通过手机终端就可在瞬间实现。
严格来说,概率尺度自组织理论应该属于机器学习理论。这个理论并不鲜为人知,其原因是20多年来一直作为技术诀窍并没有公开,2014年才在美国、欧洲、日本以及中国申报了专利,目前已在美国和日本获得了专利权。
5 基于模糊事件概率的最佳组合理论*
组合理论是人工智能的基础理论,因此人工智能理论的突破必然依赖于组合理论的突破。
组合理论通过图论解决最佳组合问题,最初是由美国佛罗里达大学***籍刘教授发明的,上世纪80年代初留美访问学者中国籍王教授提出了利用“熵”的最佳组合理论,从理论上证明能够获得最佳的组合结果,因此引起世界学术界的高度重视。然而,利用“熵”的最佳组合理论也存在计算复杂度大、收敛慢的问题,其应用受到局限。
如何高效率地实现最佳的组合结果,例如大规模集成电路需要实现面积最小、配线长最短、甚至还要考虑电气特性等多目的的组合,这是传统的组合理论所无法解决的难题。上世纪90年代,出现了一个被称为具有代表性的组合理论,即模糊事件概率的最佳组合理论。这个理论把复杂的集成电路的各个模块之间的连接关系通过模糊事件概率的测度进行定量化,通过考虑各个单元间的连接关系——越密切越要尽可能地排列在一起的模糊关系,同时还要考虑针对一个单元同有可能在这个单元附近排列的各个单元的概率关系,将不明显的微小的概率信息,以及不明显的微小的模糊信息积分起来,得到稳定的、明显的以及有价值的信息。这就是模糊事件概率理论的突破点,因此可以高效率的、针对多目的的集成电路的优化需求,直接计算出最佳的组合结果。这个理论的基础是出于人为主观地对单元之间的连接关系的模糊值的定义,因此也属于人工智能理论的范畴。
谷歌公司在英国投资6亿美元的一个创业公司利用人工智能的深度学习算法研制出的下棋程序战胜了韩国棋手,这一消息轰动了世界。当听到这一消息的时候,笔者立即猜测该程序的制作者一定是下棋高手。果不其然,当日本NHK派记者去英国采访程序的制作者后,证实了程序制作者在下棋方面是出类拔萃的。那么,这从侧面证明了,这个程序恐怕不主要是利用的深度学习的算法。作为组合理论的研究者都会知道,属于40个以上的组合要素都属于图灵机不可解的NP问题,对于下棋问题当然是属于NP问题,但是,如果加入人为的经验,NP问题就可以解决,英国创业公司的程序制作者把下棋的经验做到了程序中,因此可以实现战胜棋手的效果,从这一点看这个结果并不稀奇。
人工智能在未来的应用亮点
1 三维立体移动目标识别
20多年前,在笔者的研究室里有一个三维移动物体识别课题组,当时从事这个研究的所有人都知道,三维移动物体识别技术是应用于军事方面的。1991年海湾战争爆发后,曾经有媒体曝光,美国载有导弹的战机曾经对准一列民用火车发射导弹,但是很万幸没有击中火车。2003年第二次海湾战争中,有媒体再一次报道出美国载有导弹的战机对准一列民用火车发射导弹,准确地将这列火车击毁造成大量伤亡。面对手无寸铁乘客的火车,美国接连两次发射导弹目的何在?从事三维移动物体识别的研究者深知,这是美国在展示其三维移动物体识别的技术,因为使用GPS定位技术只能对固定目标进行跟踪,对于移动目标必须依靠三维移动物体识别技术。
在1991年第一次海湾战争中,美国使用的三维移动物体识别技术是通过将三维物体的三个方向上的图像轮廓的特征向量值进行登录,在识别三维移动物体时,把摄取到的三维物体的任何角度的图像的轮廓的特征向量值与登录的特征向量值进行比对,求出近似值。这种算法在正常情况下会得到比较好的识别结果。但是,在真正的战争环境下,周围炮火浓浓,硝烟弥漫,这对所摄取的移动物体的图像干扰很大。特别是通过轮廓识别图像本身违背了信息学的原理,用一维的方法识别二维图像,信息量本来就不够,如果图像的轮廓部分再有一点干扰,就会出现截然不同的识别结果。因此,在第一次海湾战争中,美国试验打击移动目标的结果没有达到预期的效果。
在2003年第二次海湾战争中,美国在移动物体识别技术中导入了人工智能算法,特别针对由于恶劣环境造成图像严重干扰的情况,可以非常准确地打击移动目标。
当前,通过无人驾驶飞机对地形地貌的测绘、自动搜索遇难人员等都需要具有人工智能的三维移动物体的识别产品,这样的高端技术产业具有很高的商业价值。
2 自动股票交易基金对冲以及金融预测*
在社会上最具有价值的技术是预测技术,如果人们能够正确预测股市就会获得巨额财富,然而目前预估股市结果的算法并不能满足人们的要求。例如,美国有一些号称军事机密的预测算法,当公开后笔者发现,这些算法在保密期也并没有想象之中的那种高水平的技术进步。因此,在预测方法上哪怕有一点技术进步都将是非常重要的。
进入人工智能的时代,预测技术将展现突出的颠覆性的效果。首先,在最佳预测的概念上显示其进步性。以往人们渴望得到一个最佳的预测值,然而,根据数学上的最优化理论,最优化解一定是建立在给出的某一边界条件上的最优化。人工智能的最优化预测值就是建立在预测者对社会诸因素的了解、对预测目标的认识程度、个人的智力情况等等诸因素以及诸条件的影响为边界条件所得到的最优化值,而且这个最优化的值一定是超越人的本身所能得到的解,这将把预测理论推向最高阶段。
其次,人工智能之所以能在最优化预测上具有突破性,其一是运用了概率自组织理论,颠覆了传统的统计学的预测;其二是运用了模糊数学的空间映射理论,可以把预测者对社会诸因素与预测对象的关系的认识通过Membership函数定式构建成社会模型,把对预测效果产生影响的有关社会学、哲学、历史学甚至易学中所提炼出的经验在人工智能的最优化预测系统中都可以定式,都可以起到对最优化预测的作用;其三是可以建立社会性的专家系统,针对预测对象建立大型的社会性的大专家库;其四是利用机器学习的相关分析、回归分析等算法。一句话,人工智能的最优化预测系统是将所有与预测有关的算法、知识以及信息全部利用起来。
人工智能最优化系统不是将这些算法分离地进行计算,而是构建成一个最优化决策平台,各种不同的算法的计算结果是融合在一起的,相互验证,信息彼此共享,并通过机器学习算法最终进行自组织运算,去伪存真,从而获得超越统计学的计算结果,得出最大概率的预测值。导入了人工智能的决策平台,将上述所有可以对预测起作用的因素通过新型的可对数据直接进行无监督学习的超深度学习的算法进行如同人的神经元系统那样的对各种数据的整合,以及如同人的大脑那样对预测结果的判断,对已经发生的数据同该系统的各个算法所得出的结果进行自动评价,自动修正系统的各种参数,平衡各种因素的影响的实际效果,实现自动的知识更新以及知识积累。上述这些都是在自动的基础上瞬间实现的,在这个平台上预测结果包括股票交易、基金对冲都是自动地进行的。
另一方面,这个系统尚需人为处理的功能是,系统在运行时可以不断地根据操作者对预测因素认识的提高,人为地修正各种因素的数值,或增加信息、增加预测要素,或重新调整预测战略的框架等,使预测水平不断提高。这样的系统之所以能正确预测是来源于人的头脑的智慧,但是在高速处理、果断决策方面人类是望尘莫及的,这样的系统一定会在自动股票交易、基金对冲以及金融预测上发挥不可估量的作用。
3 汽车自动驾驶
导入人工智能理论的汽车自动驾驶系统是当前产业界最为关注的应用课题。在这个应用领域中,其一是导入人工智能的机器学习理论的模式识别系统,可以在线地将路况信息自动识别出来,供自动驾驶系统作为汽车运行的依据;其二是导入人工智能的汽车自动运行系统。
汽车自动驾驶为什么需要人工智能?以刹车控制为例。首先,汽车不可能以一个速度运行,当需要停止在某位置上时有好多种情况:熟练的驾驶员有时会不睬刹车直接停在需要的位置,有时会轻轻地踩一下刹车,也可能会使劲踩一下刹车等等。这样的控制问题是目前所有的传统自动控制理论不可解决的,导入人工智能的模糊推论技术就可以把熟练的驾驶员的经验通过Membership函数定式,再按照模糊推论的算法实现同熟练驾驶员接近的自动驾驶控制。
这里举出的仅仅是刹车控制,在实际道路上的自动驾驶还有更复杂的控制问题,因此导入人工智能算法势在必行。
3.4 ITC图像变换代码*
随着代码技术的进化,当今技术已发展到无需事先设计出代码符号、构成代码图形以求得到稳定的识别结果。在人工智能的算法下,自然的纸纹、声纹、自然的图像甚至身体信息都可以直接变换成代码。
近年社会上流行的AR技术,可以通过手机拍摄的某一个印刷图像的信息,就能够上网连接到某一网站。由于这种技术可以从网络上下载开源程序,所以迅速普及。但是,AR技术是通过图像识别的算法,识别结果是一个占用十几兆内存的文件,不利于网络操作以及大量图像的应用。
从另一个角度看,谷歌眼镜、图像检索都需要通过拍摄一个图像,然后通过这个图像直接上网,或进行网络检索。这样,另一个技术——ITC(Image To Code)技术应运而生。ITC运用空间映射的算法,可以把图像的某些特征构造成图像的特征向量,再通过概率尺度自组织的算法组织成一个1036的代码,实现了将任何一个图像经过移动终端的拍摄就可成为一个代码,也就是说可以把任何图像直接作为二维码使用。这一成果可以让任何商品标识在无需任何处理的情况下成为一个二维码,可以使世界上的所有产品在一夜之间都可以连接到网上去,而且不破坏商品标识的美观,也可以实现谷歌眼镜看到任何图像都可以连接网络的设想,可以实现通过手机拍摄任何商品图像就可直接在网上检索该商品,促进网络销售的发展,同时对VR产品的发展起到重要作用等等。与传统的AR相比,ITC代码容量仅有其10万分之一,便于手机终端识别,具有占用服务器容量小、检索速度快的特点,适于国际性的大范围、大容量的应用。
未来的人工智能应用展望:
人工智能技术正在带动一些产业变革。比如无人驾驶技术已成为未来汽车行业发展的重要趋势和战略制高点,除谷歌、优步、特斯拉等科技公司在这一领域发力,奔驰、奥迪、丰田等传统汽车厂商也在竞相投入巨资研发。
谷歌母公司“字母表”旗下的“出行新方式”(Waymo)公司今年表示,基于谷歌自动驾驶技术的汽车已从公路测试转向公共试乘,还宣布下一阶段的目标是向公众提供无人驾驶出租车服务。如果无人驾驶汽车真的大规模商业应用,将给相关行业带来巨变。
在金融行业,全球首只完全由人工智能自主选定投资标的、以美国股票为投资组合的ETF类型基金今年10月在美国纽约证券交易所问世。该基金由位于硅谷的EquBot公司提供技术支持,使用了IBM公司的“沃森”人工智能平台。
EquBot公司首席执行官希达·卡图阿接受新华社记者采访时介绍,他们使用的人工智能程序每天自动扫描分析6000多只股票的相关信息,自主选出具有上涨潜力的股票,并对投资组合进行主动管理。这标志着人工智能取代人脑的革命在金融业拉开序幕,今后可能对此类知识密集型行业产生强大冲击。
人工智能还深入到了社会生活之中。在医疗领域,位于硅谷的斯坦福大学研究人员今年初公布了一项诊断皮肤癌的算法,经过训练,算法的表现已经可以媲美专业皮肤科医生。
人们身边的一些数码设备中也都有人工智能。比如苹果公司最新发布的iPhoneX手机重点宣传了快速人脸识别功能,相关芯片就使用了生物神经网络等人工智能技术。还有亚马逊公司推出的Alexa智能语音助手,背后也有强大的人工智能技术支持。
社交媒体网站“脸书”最近还开始利用人工智能技术来发现有自杀倾向的用户,并主动介入,鼓励他们与朋友沟通,走出阴影。
最后,人工智能在各个领域的迅猛发展,引发了人们对未来前景的讨论。虽然现在的人工智能技术还只是限定在各自领域中,尚不具备通用性,但有观点认为人工智能迟早会发展到那一步,应未雨绸缪。特斯拉公司首席执行官马斯克认为,将来可能出现超级人工智能,有可能威胁人类自身生存,人类需要应对挑战。
-
谷歌
+关注
关注
27文章
6171浏览量
105464 -
人工智能
+关注
关注
1791文章
47341浏览量
238726 -
机器学习
+关注
关注
66文章
8421浏览量
132710 -
自动驾驶
+关注
关注
784文章
13836浏览量
166520 -
深度学习
+关注
关注
73文章
5504浏览量
121217
发布评论请先 登录
相关推荐
评论