2010年,一个特殊的年份,也许注定是人类从工业革命时代悄然迈入智能革命时代的转折点。这个新时代的初期表象是人们对人工智能技术掺杂着疑惑、追求(甚至是盲目追求)、惊讶、躁动、追概念,甚至也有些许的追星现象。这个时代将会孕育着新科学的产生和发展(学习科学(人工智能、机器学习、生物学习)、数据科学、数据驱动的数学、数据驱动的信息科学、数据驱动的统计学等),并且随着科学的发展逐步回归理性和系统性,但也会发展得更快、更稳,产生更深远广泛的影响。能否跟上智能革命(不仅是人工智能)的前进步伐将关系到一个国家和企业的生存能力。虽然目前还处于智能革命的前夜,但是人工智能、机器学习、生物学习和智能材料的合力将加速智能革命的到来。
人工智能和机器学习的再定位
人工智能、机器学习等技术和概念的内涵不是一成不变的,它随着历史的发展而演化。
机器学习未必就是人工智能
也许把机器学习当作人工智能是个“美丽”的时代错误。人工智能强调的是“人工”创造的“智能”,机器学习是“机器”自主从数据中找出“知识”。当数据少、应用相对简单、人能推导以及控制时,“人工”的特性比较明显,人们会认为机器学习是人工智能的一部分。这种智能“人工”的创造特性从1950年代到本世纪初尤其明显。没有数据,机器很难学习到充分的知识,人的知识便在智能的实现中起到关键和主导作用。因而许多情况下机器学习是实现人工智能的重要辅助工具。 在当初人们认为机器智能永远附属于人类和人工智能,不会超越或挑战人类智能时,机器学习无疑是人工智能的一部分。
然而随着数据量、数据复杂度和应用复杂度指数式增长,机器学习有望独立于人工智能。各种应用和各种数据有其自我特征和规律,机器学习科学的建立将有助于更加科学地实现机器学习,也帮助(以人工神经网络技术为主的)机器学习和人工智能跳出“15年魔幻周期”。虽然其中也有人工参与和应用这种科学和技术,但并不能因此就把另外一个机器学习“世界”归为人工智能。就像物理世界有其规律,当人类社会发现物理定律,了解物理世界,进而利用物理定律改变世界,我们并不能因此说物理世界是人工创造的。
尤其在最终实现无监督学习和机器学习能力能自我进化的情况下,人工赋予的智能可能在整个机器学习世界中显得几乎微不足道。 随着时间的推移,人工智能和机器学习的区别就会越来越明显,二者又相互促进。机器学习的发展很大程度上来自数据科学和相关应用的驱动,直接的表现又好像是人工智能的发展和成就,人工智能和数据科学的发展也使机器学习变得更科学有效。 从长远来说,人类也许要为一个可控的“人工智能”和最终充满不确定性的“机器学习”时代的到来提前做好准备。
智能依赖于数据、算法和运算能力(速度、空间)的动态关系人工智能离不开高效的计算环境、大数据和好的学习算法,这些条件从2010年开始同时得到满足。即使面对简单的应用,目前大部分实现还是基于复杂的计算能力和大量的数据。这种实现其实是不可持续的。也许不久的将来,面对较为复杂的应用,许多实现也不必依赖于超算环境和大数据。数据是不可或缺的,但数据太多也会产生过拟合,算法是解决学习问题的关键,高效的算法使得人工智能和机器学习对大数据和超算环境的依赖度有所下降。数据、算法和运算能力(运算速度、空间)在人工智能的实现中保持一个动态的三角关系。目前许多应用、实现和产业资金都高度集中于数据和运算能力,使得这个三角关系显得相对不平衡,存在不稳定因素和系统风险。一旦智能算法有进展,也许会在某些人工智能细分领域造成塌方效应。
深度学习和人工神经网络
深度学习的意思其实不是不变的,它的本意是动态发展的。最初的深度学习基本意思是聚焦于区别于误差反向传递算法(Backpropogation)那种打包式的黑箱(black-box)学习方法,使用多层网络的“庖丁解牛”的“深层次”的白箱(white-box)学习(比如用卷积神经网络和自编码)组成多层结构。再后来发展到几个主要神经网络学习的组合也归纳为深度学习。可以说早期的深度学习是人工神经网络技术体系下的一个特例。现在出现一种趋势:深度学习已不再局限于神经网络范畴,多种学习算法的组合即是深度学习。
这样反而有让深度学习失去聚焦点的可能,不禁让人有疑问:5年后还有没有深度学习的必。早期当数据少、应用简单时,人们通常只用单一学习方法或加一个预处理。在现实应用中,多种机器学习算法的组合本是机器学习解决现实问题的基本思路和策略。
深度学习和“类脑”学习机制
深度学习是不是“类脑”学习机制?从网络结构的敏感性、人工的干预、并行和硬件的实现、实时性、对大数据的要求、对精度的追求以及在学习机制中出现的“鸡”和“蛋”议题看,答案应该都是否定的。 另一方面,可以从理论上证明在许多方面,深度学习和生物学习机制其实是矛盾的,比如深度学习依赖于神经元和链接的精确耗时调整,而这使得深度学习不利于多任务同步、记忆迁移和进化。 然而这不能否定深度学习是个好的人工智能技术。(智能)机器和人运行的是两个(智能)函数和,两者不必一样,即使两者在某些应用中的智力收敛到一点。
生物学习和生物智能潜能的探索
人工智能和生物智能
历史有时是惊人的巧合,当人们惊叹于人工智能和机器智能的巨大潜力、为人工智能和机器智能许多超越人类能力所震撼时,人类对生物学习机制的探索也在加速进行。 总体而言,研究和探索机器智能和生物智能在历史巧合中同步进行,二者又互相支持,这在过去的近70年间,甚至几年前还只是一个梦想,如今机器智能和生物智能的关联性竟然如此紧密。 一方面对生物学习机制的了解有助于机器学习和人工智能的发展(比如最典型的是日本人Fukushima根据猫的视觉系统提出的Neocognition网络结构及其特例卷积神经网络),机器学习和人工智能的发展也有助于对生物学习机制的了解。
同时根据超限学习机理论,也许有类似的学习算法存在于生命体智能和非生命体智能,只是生命体智能和非生命体智能二者的组成材料不同而已。智能不一定受限于其载体(材料)。
生物学习系统和自然界的相似性
根据超限学习机理论,学习(包括生物学习和机器学习)可以不依靠调整神经元来实现。(生物的或人工的)神经元与具体的训练数据无关。这一学习理论后来在2013年和2015年分别在老鼠和猴子的大脑中被发现。这一发现彻底颠覆了传统生物学习对于神经元调整可能是学习关键的认知。 随机神经元和随机连接可能是实现不依靠调整隐藏神经元来学习这一学习机制的两种特殊方式。神经元也可以从它们的祖先那里遗传或从其它系统迁移继承而来。 整体来说,整个活跃的大脑都是结构化的、有序的,但它们在某一特定的层或者大脑神经元薄片上或许是随机的、非结构化的。令人感到惊奇的是,大脑作为宇宙中最复杂的物体之一,竟然和整体结构化但是局部满是随机布朗运动的物理世界如此相似,二者之间竟然有如此强的相似性!生物学习正是因为其全局的结构化构造与局部的随机性的共存才能如此地完美。
智能革命的前夜
人工智能真空填补期
机器学习和人工智能目前基本还是处于发展初期,只能通过大数据和超高效运算环境带来的产业机会,实现以前由于数据匮乏和运算资源有限而不能实现的应用,基本属于快速的“真空填补期”。新产品新创意层出不穷。这就有点像饿极了的狼(产业界)突然面前有成群结队的羔羊(数据)出现一样,几乎是逮到羔羊便是机遇。
黎明前的黑暗
同时从历史发展看,机器学习和人工智能又处于黎明前的黑暗期,虽然表面看上去华丽多彩,背后却是大量资源的消耗和“血拼”,暗示着这种研发的局限性和不可持续性。现有流行的人工智能方法在许多看似简单的应用上也要用上几十块GPU(几万到几十万核)训练几天甚至几十天,许多公司和学校能承担这种高昂的资源成本。25年前,面对误差反向传递算法(Backpropogation)普天下调参,15年前,面对支持向量机(SVM)普天下调参,基本都是10年一个“波澜壮阔”的调参周期,最近几年面对深度学习普天下又开始了新的调参周期。
人工智能大爆发
每次“痛苦”经历也许预示着新的技术呼之欲出。综观过去60多年的历史,机器学习和人工智能本身就遵循一个螺旋式上升的发展过程,在2020前后可能新的一波机器学习技术要兴起,突出表现为:
●机器学习从云端走向各类本地智能终端、传感器、设备,云端机器学习和本地机器自主学习有机融合;
●机器学习算法本身不再只依赖于GPU的支撑,但GPU等却可以实现众多智能系统在云端的同步协同,GPU等在人工智能和机器学习中继续扮演重要的角色;
●基于神经形态,FPGA和光技术的芯片开始在普适学习、普适智能中显现魅力;
●机器学习也许不需要特别“深度”,理论上讲5~8层神经网络具有普适学习能力;
●无监督学习理论和应用可能有突破性发展;
●机器学习不必依赖于大数据,小样本学习技术的吸引力不可小觑,但数据始终是个重要的资源。
智能革命
一万年前新石器革命预示着农业时代的到来,250年前的瓦特改良蒸汽机推进了工业革命,6年前(2010年)苹果公司创办人Steve Jobs(史蒂夫·乔布斯)推出的iPhone4则撬动了“智能革命”,人类和其它非生命体从此迈向漫长的合二为一的“智能社会”。 iPhone 4之所以掀开了“智能革命”时代,原因之一是人类还在探索如何实现普适智能和如何实现智能传感器时,它已经首先把人类变成了超级智能传感器,从此人类、机器、虚拟世界、实体世界通过网络无缝衔接,促进了大数据的产生和对大数据分析的需求,大数据的产生和分析需求进而推动了人工智能和机器学习的爆发。
智能革命的10大影响
如果说农业革命起源于人类有意识的栽种,工业革命起源于人类了解自然规律进而制造和运用机器取代人力,智能革命也许起源于人类探索和使用非生命体智能。人类学会了栽种催生了农业革命,制造和运用机器取代人力催生了工业革命,创造和使用智能则迎来了智能革命。
1)数据驱动的科学和工程学(数学、信号处理等)
以前经典的物理学、数学、统计学、信号处理、天文学等大都建基于对事物本身的了解、相互关系和逻辑推理。有许多事物的本质也许未知,但可能它们的表象已经或以后可能反映在不同的数据中,通过数据分析事物的本质和规律也会变得越来越重要。由此需要数据驱动的相关科学和工程学支撑。
2)人工智能和机器学习的分化
人工智能强调更多的是根据人的经验规则衍生的智能,机器学习应该更注重于机器本身找寻数据背后的规律和模型。 随着人工智能和机器学习的飞速发展,机器(广义的讲包括包括各种传感器/感知器)也会自我学习、复制、推理、决策、有感情和认知,人类的经验规则在机器智能中的重要性,长期看(10年,50年……)有下行的可能。因而随着人工智能和机器学习的发展,深度学习这种依赖于大量人力和人类先验知识(调参等)技术的人工智能性质会逐步强于它的机器学习性质。
3)智能从云端走向世界
早期的人工智能由于缺少算法和智能芯片技术的支持,大部分人工智能实现只能依赖于超算环境、大数据在云端实现。 随着高效算法的出现和智能芯片技术的提高,低功耗微智能芯片将成为可能,智能正在从云端走向世界的各个角落、各个事物,智能成为可能。智能实现将不再是“富人”的专属。
4)智能材料
蛋白质和碳水化合物将不再是智能的唯一载体。 其它的智能材料也逐步呈现和被挖掘,这些智能材料有的已经出现,以后也许还会有新的智能材料陆续被发现。
5)机器智能和进化论(机器的进化、人的减少、人的工作时间缩短)
人工智能和达尔文的进化论有没有关联?也许许多人认为二者没有本质联系、没有太多的关联。 在机器学习迈向无监督学习、自主学习,在机器智能将来形成自主智能时,机器智能本身也可以适应达尔文的进化论,具有进化能力,逐步适应环境、适者生存。 也许将来人类也会由于适应机器智能带来的互补和竞争呈现人口减少的趋势,毕竟许多人类活动会逐步由机器取代。
6)智能物联网和新经济模式
相对于农业革命和工业革命,智能革命的影响也许更加深远。历史上每一次重大技术革命都会推动新经济模式的诞生。现在的经济模式大都需要人的参与,是以人为核心的经济模式。以后也许会迎来智能物联网推动的智能物社会经济模式。比如一个新的电商模式也许是:机器人助理根据主人的口味订某类牛扒,食品仓库中的机器人在收到订单后就会把预约的牛扒送到运货车上,自动驾驶运货车就会把牛扒送到客户家,客户家的家庭保姆机器人会把预订的牛扒取下送到厨房,厨房机器人会根据主人的爱好烹饪好牛扒,主人的保姆机器人也就可以给主人呈上美味的牛扒。再过20年,许多人类工作也许会被机器取代。 因此,从长远说,能否在人工智能技术上占有先机和领先优势也许会决定一个国家和企业的生存能力。
7)衔接机器学习和生物学习(催生新医疗方案、新药等)
机器学习和生物学习看似不相关。随着人类对生物学习机制的了解深入和机器学习的发展,二者在某种程度上存在相关性和收敛性。这种相关性和收敛性也会帮助人类发明新医疗方案、研制新药等。
8) 智能拐点
根据达尔文进化论,人类个体的智能也许到达历史的峰值附近,还有部分增加的空间。另一方面,机器智能只是刚刚被启动,机器智能的爆发期还没有到来,将来也许非生命体智能的总指数会超过生命体智能。 善用机器智能,无疑会使加富于人类在机器智能的辅助下变得更加富于智慧。
9)智慧星际旅行、时光倒转
随着技术的发展,智能可以存在于非生命体载体,最后首先实现星际旅行的也许是“智能”(进而是“智慧”)而不是人。最终也许是“智能”而不是人穿越时光隧道,甚至时光倒转。
10) 伦理、“智控”
人类的“智慧”就是这么矛盾:当机器学习还是以有监督为主,机器的智能多少比较容易“受控”。人类在追求无监督学习。 当机器真能全面走向无监督学习,人类就很难指望机器会自动学习对人类有用的东西,照着人类的梦想前进,机器就极有可能自我学出对人类有害的东西和行为。 虽然机器智能可以帮助人类,但是机器智能和人类智能的交融也可能产生负面的结果,甚至引起伦理、道德问题。 “智控”已经是个严肃的事情,同时伦理问题也不再遥远。
编辑:黄飞
评论
查看更多