0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器学习举一反三

jf_cVC5iyAO 来源:易心Microbit编程 作者:易心Microbit编程 2022-11-29 16:07 次阅读

▲计算机更像人的两种策略:五岁孩童能轻易解决的问题,却可以考倒效能最强大的计算机。 近年来,藉由研究人类的学习方法来教导计算机,以致AI热潮再起。目前,计算机可从两种方式来辨识字母A, 一种是根据原始信息,也就是由下而上的方法;另一种则运用既有知识去猜测,是由上而下的方法。

如果你常常跟孩童在一起,一定会好奇他们怎么能既快又广泛学习新事物。历代哲学家(一路回溯至柏拉图)也想知道缘由,但一直没有找到满意的答案。我的五岁孙子奥吉已经学习不少关于植物、动物和时钟的知识,更不用提恐龙和宇宙飞船。他也能理解其他人的需求、想法,以及有何感觉。他可以依据这些知识,把看到和听到的事分类,并做出新的猜测。举例来说,他最近认为美国纽约市自然史博物馆展出的新发现物种泰坦巨龙(titanosaur)只吃植物,换句话说,牠其实没有那么吓人。

奥吉从环境中感受到的是一连串撞击他视网膜的光子,以及振动他耳膜的空气分子。但在他蓝色眼珠后方的神经计算机,能设法从他感官获取的有限信息,做出关于草食性泰坦巨龙的猜测。我们不断在思考一个问题:计算机能否像孩童那般既快又广泛学习新事物?

15年来,信息科学家和心理学家努力想找到答案。孩童仅凭着教师或父母灌输有限的信息就能获得大量的知识。尽管智能机器已突飞猛进,但效能最强大的计算机的学习效率还是无法媲美五岁孩童。

了解孩童大脑实际上如何运作,然后创造出同样有效率的智能机器,是信息科学家在未来几十年要面对的挑战。但此刻,他们正在发展的人工智能(AI),已经纳入一些我们对于人类学习方式的认知。

复兴人工智能

1950~60年代AI爆发第一波热潮后,发展停滞了几十年。不过近几年AI展现惊人突破,特别是机器学习,而AI也成为科技界最热门的领域。关于这些进展所代表的意义,人们衍生了很多乌托邦或末日论的预测。说穿了,这些预言不是提到永生,就是世界毁灭,很多则是同时提到这两种可能性。

我猜AI的发展会引起如此强烈的情绪,是因为我们由衷恐惧机器变得太像人。从中世纪的泥人传说到科幻小说《科学怪人》,乃至电影「人造意识」性感的女机器人艾娃,人类有一天或许会创造出跟自己没有什么差别的人造物的这种想法,总教人深感不安。

但计算机真的可以像人类那样学习新事物吗?这些情绪强烈的预测,有多少指出革命性的改变,又有多少只是夸大之词?计算机如何学会辨认猫、语音或日文字,其中的细节可能难以理解,但进一步观察机器学习背后的基本概念,就会发现其实不像一开始那样令人费解。

解决上述问题的方法之一,是从奥吉或我们任何一人接收到的一连串光子与空气分子着手,不过传送给计算机的是数字影像的像素以及录制的声音样本。计算机会从数字数据中找出一连串模式,以侦测或辨认周遭世界里完整的物体。这种所谓由下而上(bottom-up)的方法源自许多人的想法,例如哲学家休姆(David Hume)、弥尔(John Stuart Mill)和心理学家巴佛洛夫(Ivan Pavlov)、史金纳(B. F. Skinner)。

1980年代,科学家想到强而有力且巧妙应用由下而上的策略,让计算机从数据中寻找有意义的模式。联结论(connectionism)或人工神经网络系统的研究人员从神经元的运作机制汲取灵感,神经元会把视网膜上的光转换成周遭世界的影像。人工神经网络采取类似做法,使用相互链接的处理组件(模仿神经元),在逐层分析数据时,把某一层的像素转换成越来越复杂的影像,例如鼻子或整张脸。

深度学习(deep learning)这项新技术之赐,人工神经网络的概念在最近有复兴之势。如今,Google、脸书与其他科技巨擘已经把深度学习运用到商业行为中。一如摩尔定律的预测,计算机的运算能力不断呈指数增加,也促成了这些新系统,而庞大数据集的发展也有贡献。在联结论系统具备更好的处理能力和更多可分析的数据后,学习效率比我们以前认为的还要高。

多年来,对于机器学习应该采取这种由下而上的方式,还是另一种由上而下的方法,AI社群一直摇摆不定。采取由上而下的方法,计算机就能依据既有的信息来学习新事物。柏拉图以及所谓的理性主义哲学家例如笛卡儿(Rene? Descartes),相信人类是采取由上而下的方法来学习,而这种方法在早期AI的发展中也扮演重要角色。2000年代,这类方法也以机率或贝氏(Bayesian)模型的型式重生。

就像科学家一样,采取由上而下方法的计算机,一开始会先对世界建构抽象又广泛的假设。如果假设正确,计算机会预测数据的模式。然后计算机也像科学家一样,会根据预测结果修正假设。

由下而上

由下而上的方法或许是最容易理解的,所以先说明这种方法。假设你想要计算机区分电子邮件信箱里的邮件和诈骗信,你可能会注意到诈骗信有一些容易辨别的特征:一长串收件人地址、尼日利亚或保加利亚的发信地址、信里会提到百万美元奖金或威而钢。但非常重要的邮件可能看起来也一模一样,你一定不想错过自己获得晋升或学术奖项的通知。

一旦你比较了够多的诈骗信和其他类型的邮件,你可能会注意到只有诈骗信显露某些特征。例如,尼日利亚配上百万美元奖金的邮件,就代表是诈骗信。事实上,要区分诈骗信和重要邮件,或许有一些更细微、高阶的模式,例如拼错字和IP地址,但两者一点也不明显。如果你找到这些特征,就能正确过滤出垃圾邮件,而不用担心错过「你的威而钢已寄出」的通知邮件。

采取由下而上方法的机器学习可以找出相关线索,解决这类任务。为了做到这点,人工神经网络必须进行学习过程。把庞大数据库里几百万笔例子输入计算机,每笔例子都标示一般邮件或是诈骗信,然后计算机会撷取出一组可分离出垃圾邮件的辨识特征。

同样地,人工神经网络也能检视网络上标示猫、狗或剑龙的影像,在每组影像中撷取共同特征,得以把猫和其他影像区隔开来。之后人工神经网络就能辨识猫的影像,即使那是从未见过的新影像。

其中一种由下而上的方法,称为「无监督学习」(unsupervised learning),虽然还在相对初期的发展阶段,但可以从毫无标示的数据中找出模式。计算机会寻找影像中可辨识物体的整组特征,举例来说,一张脸总是有鼻子和眼睛,而且与背景中的树和山不同。这些先进的深度学习网络透过逐层分析来辨识物体,而辨识任务在不同层中会转换输入。

2015年,发表在《自然》期刊的一篇论文,阐释由下而上方法的进展。深度心智(DeepMind)是Google创立的一家公司,研究人员结合了两种由下而上的技术:深度学习与「增强学习」(reinforcement learning),让计算机精通一款名为雅达利(Atari)2600的电玩游戏。计算机一开始对游戏的运作方式一无所知,采取的策略是随机猜测最佳玩法,同时不断接收玩法结果的回馈。深度学习帮助计算机辨识屏幕上的特征,增强学习则因计算机获得高分而奖励它。计算机在好几款游戏上都达到熟练程度,在某些游戏中的表现还赢过人类专业玩家。不过,对于人类轻易就能够精通的一些游戏,计算机则完全没辄。

我们让AI透过庞大数据集学习,例如数以百万的Instagram影像、电子邮件讯息或语音档案,在过去几度让人气馁的问题上获得解决方案,例如影像或语音的辨识。然而,我的孙子奥吉没有接收那么多的数据并进行训练,却轻易就能认出动物或回应别人的发问。五岁孩童能够轻易解决的某些问题,对计算机来说依旧十分费解,难度也远超过下棋。

计算机通常要接收几百万个范例,才能辨识满是络腮胡的脸孔影像,而人类只需要一些例子就能办到。计算机经过密集训练后,或许能辨识从未见过的猫的影像,但是辨识方法和人类的类化(generalization)很不一样。因为计算机软件采用不同的推论方式,有时会发生失误。有些包含猫的影像却没标记猫,计算机也可能误指某个影像是猫,不过那其实只是杂乱的模糊影像,人类则不会出这种洋相。

由上而下

另一种机器学习的方法,在近几年改变了AI的发展,运作方式刚好相反:由上而下。我们假设人类可以从实际数据里获得抽象知识,因为人类已经知道很多事,更是因为大脑已经了解基本的抽象概念。就像科学家一样,我们可以藉由这些概念建构关于这个世界的假设,如果假设正确,就能预测数据(事件)的样貌;相较之下,实行由下而上方法的AI会设法从原始数据中撷取出模式,做法南辕北辙。

要说明这个概念,可讨论上述泛滥成灾的诈骗信,这回谈一件跟我有关的真实案例。我先前收到某期刊编辑寄来的电子邮件,那份期刊名称奇怪。编辑明确提到我的一篇论文,并提议我写篇论文发表在这本期刊。这封电子邮件中没有提到尼日利亚、威而钢和百万美元奖金,没有诈骗信共同的特征。但我依据已经知道的信息,并且抽象思考诈骗信的产生方式,可以判定这封电子邮件很可疑。

首先,我知道诈骗信发送者骗取他人钱财的手法是基于人类的贪婪;学术圈人士对发表论文的渴望,可能跟一般人对百万美元奖金或性能力的渴求一样强烈。其次,我知道「开放取用」期刊已经开始向作者收费来分担成本,而非向订阅者收费。另外,我的工作跟期刊名称完全不相干。综合以上因素,我提出合理假设:这类电子邮件想让学术圈人士误以为只要付费给「假」期刊就能「发表」论文。我从单一例子就得出这项结论,而且还能进一步测试自己的假设:透过搜索引擎查询这位编辑是否真有其人。

信息科学家会说我的推论过程是「生成模型」(generativemodel),生成模型能描绘抽象概念,例如贪婪与欺骗。同样的模型也可以描述提出假设的过程,这个推论过程得出这封邮件可能是诈骗信的结论。运用这个模型,我能假想这种类型的诈骗信如何运作,也能揣测其他类型,即使是我从未看过或听过。当我收到这个期刊寄来的电子邮件,便能反向运用这个模型,一步步追查这封邮件的真伪。

1950~60年代第一波AI和认知科学的发展中,生成模型至关重要,但也有局限。首先,原则上我们可以用各种不同的假设来解释大多数证据模式;就我的例子而言,即使那封邮件看似诈骗信,但也可能不是。于是,生成模型必须纳入机率概念,而机率是这些方法近来最重大的进展之一。其次,我们通常不知道那些构成生成模型的基本概念出自何处。笛卡儿与乔姆斯基(Noam Chomsky)这类学者指出,你天生就拥有这些概念,但你一诞生在世上时就知道他人如何凭借贪婪和谎言来诈骗?

贝氏模型是近来由上而下方法的绝佳范例,试图处理这两个问题。贝氏模型是以18世纪统计学家兼哲学家贝兹(Thomas Bayes)为名,利用一种称为贝氏推论(Bayesian inference)的方法,结合生成模型与机率论。机率生成模型可以告诉你,如果某个假设为真,你看到特定模式数据的机率有多高。如果某封电子邮件是场骗局,可能就是基于收件者的贪婪。不过,基于贪婪的电子邮件不一定是诈骗信。贝氏模型结合你提出假设所依据的知识以及你手上的数据,让你精准计算某封电子邮件是诈骗信的机率。

比起由下而上的方式,这种由上而下的方式更符合我们对孩童学习方式的认知,这就是为什么过去15年我和同事一直采用贝氏模型来研究他们的学习方式。我们与其他实验室都使用这些技术来了解孩童学习的因果关系,预测他们如何与何时会萌生出关于这个世界的新想法,以及何时会改变既有的想法。

贝氏方法也是教导机器像人一样学习的绝妙方式。2015年,美国麻省理工学院(MIT)的特南鲍姆(Joshua B. Tenenbaum)和纽约大学的雷克(Breden M. Lake)等人在《科学》期刊发表研究,设计了一套可以辨识手写字的AI系统;人类可以轻易办到这件事,对机器来说却非常棘手。

试想你的辨识能力,即使你从未看过日文滚动条上的字,大概也能分辨不同滚动条上的文字是否相同。搞不好你还可以写出日文字,甚至设计出假的单字,并且知道日文与韩文或俄文大相径庭。这正是特南鲍姆的团队要让AI做到的事。

如果采用由下而上的方法,计算机要接收成千上万的范例,从这些范例中找到模式,藉由模式辨识新的字。相较之下,贝氏方法则给计算机一个如何写字的通用模式,举例来说,一画可能是往左或往右。计算机在处理完一个字后,会接续下个字。

当计算机看到一个字,会推论这个字的笔画顺序,接着产生一套类似的笔画,这就像我推论那封疑似期刊诈骗的电子邮件所采取的一连串步骤。特南鲍姆的方式不是推论那封电子邮件是否可能来自诈骗管道,而是猜测特定的笔画顺序是否可能写出相符的字。在同样的数据上,采用由上而下方式的计算机会表现得比深度学习更好,也更接近人类表现。

巧妙结合两种方法

这两种主要的机器学习方法:由下而上与由上而下,优缺点恰能彼此互补。利用由下而上的方法,计算机一开始不需要对猫有任何了解,但它需要大量的数据。

采用贝氏模型的计算机可以从少数范例中学习,而且能更广泛推论。不过实行这种由上而下的方法,事先需要做很多功课,才能提出一套正确的假设。两种系统的设计者可能会遇到类似的障碍:只能处理范围相对较小、定义明确的问题,例如辨识手写字、猫或玩雅达利的电玩游戏。

孩童面临同样的限制,却游刃有余。发展心理学家已经发现,不知为何,孩童会结合各种方法的最佳特色,并发展出新的方法。奥吉可以仅靠一两个例子就学到知识,由上而下的系统也是如此。但不知为何,奥吉也会从数据本身撷取新的概念,就像由下而上的系统一样,即使那些概念一开始并不存在。

事实上,奥吉不只能办到这些事。他很快就认得猫与区别字母,但他也能做出有创意又令人惊喜的新推论,这些推论已经超出他的经验或背景知识。他最近就解释,如果大人想要再次变成小孩,应该不要吃任何有益健康的蔬菜,因为蔬菜会让小孩长成大人。这种创意推理是从哪里冒出来的,我们几乎毫无头绪。

当我们听到有人主张AI是一种「存在威胁」时,我们应该想起人类大脑依然神秘的力量。AI和机器学习听起来很吓人,就某些方面来说确实如此。军方正在研究使用这些系统来控制武器的方法;人类的愚蠢相较AI可能造成更多破坏,我们必须比以前更有智慧,才能适当管理这些新科技。

摩尔定律是一大影响力:即使信息科技的进步是基于数据量和计算机处理能力的大幅增加,而不是我们对心智的了解有观念上的突破,但这些进展日后依然会有重大成果。尽管如此,我们也不应该认为新的科技泥人会有如脱缰野马在世上横冲直撞。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1797

    文章

    47909

    浏览量

    240937
  • 机器学习
    +关注

    关注

    66

    文章

    8455

    浏览量

    133186

原文标题:机器学习举一反三

文章出处:【微信号:易心Microbit编程,微信公众号:易心Microbit编程】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    传统机器学习方法和应用指导

    在上篇文章中,我们介绍了机器学习的关键概念术语。在本文中,我们会介绍传统机器学习的基础知识和多种算法特征,供各位老师选择。 01 传统
    的头像 发表于 12-30 09:16 439次阅读
    传统<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法和应用指导

    如何选择云原生机器学习平台

    当今,云原生机器学习平台因其弹性扩展、高效部署、低成本运营等优势,逐渐成为企业构建和部署机器学习应用的首选。然而,市场上的云原生机器
    的头像 发表于 12-25 11:54 184次阅读

    什么是机器学习?通过机器学习方法能解决哪些问题?

    计算机系统自身的性能”。事实上,由于“经验”在计算机系统中主要以数据的形式存在,因此机器学习需要设法对数据进行分析学习,这就使得它逐渐成为智能数据分析技术的创新源之
    的头像 发表于 11-16 01:07 551次阅读
    什么是<b class='flag-5'>机器</b><b class='flag-5'>学习</b>?通过<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法能解决哪些问题?

    NPU与机器学习算法的关系

    在人工智能领域,机器学习算法是实现智能系统的核心。随着数据量的激增和算法复杂度的提升,对计算资源的需求也在不断增长。NPU作为种专门为深度学习
    的头像 发表于 11-15 09:19 662次阅读

    人工智能、机器学习和深度学习存在什么区别

    人工智能指的是在某种程度上显示出类似人类智能的设备。AI有很多技术,但其中个很大的子集是机器学习——让算法从数据中学习
    发表于 10-24 17:22 2561次阅读
    人工智能、<b class='flag-5'>机器</b><b class='flag-5'>学习</b>和深度<b class='flag-5'>学习</b>存在什么区别

    【「时间序列与机器学习」阅读体验】+ 简单建议

    这本书以其系统性的框架和深入浅出的讲解,为读者绘制了幅时间序列分析与机器学习融合应用的宏伟蓝图。作者不仅扎实地构建了时间序列分析的基础知识,更巧妙地展示了机器
    发表于 08-12 11:21

    【《时间序列与机器学习》阅读体验】+ 了解时间序列

    收到《时间序列与机器学习书,彩色印刷,公式代码清晰,非常精美。感谢作者,感谢电子发烧友提供了个让我学习时间序列及应用的机会! 前言第
    发表于 08-11 17:55

    深度学习卷积的原理和应用

    在深度学习的广阔领域中,卷积(Deconvolution,也称作Transposed Convolution)作为种重要的图像上采样技术,扮演着至关重要的角色。特别是在计算机视觉任务中,如图
    的头像 发表于 07-14 10:22 2557次阅读

    如何理解机器学习中的训练集、验证集和测试集

    理解机器学习中的训练集、验证集和测试集,是掌握机器学习核心概念和流程的重要步。这者不仅构成了
    的头像 发表于 07-10 15:45 4790次阅读

    人工智能、机器学习和深度学习是什么

    在科技日新月异的今天,人工智能(Artificial Intelligence, AI)、机器学习(Machine Learning, ML)和深度学习(Deep Learning, DL)已成为
    的头像 发表于 07-03 18:22 1503次阅读

    机器学习算法原理详解

    机器学习作为人工智能的个重要分支,其目标是通过让计算机自动从数据中学习并改进其性能,而无需进行明确的编程。本文将深入解读几种常见的机器
    的头像 发表于 07-02 11:25 1447次阅读

    深度学习与传统机器学习的对比

    在人工智能的浪潮中,机器学习和深度学习无疑是两大核心驱动力。它们各自以其独特的方式推动着技术的进步,为众多领域带来了革命性的变化。然而,尽管它们都属于机器
    的头像 发表于 07-01 11:40 1586次阅读

    机器学习的经典算法与应用

    关于数据机器学习就是喂入算法和数据,让算法从数据中寻找种相应的关系。Iris鸢尾花数据集是个经典数据集,在统计学习
    的头像 发表于 06-27 08:27 1744次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>的经典算法与应用

    请问PSoC™ Creator IDE可以支持IMAGIMOB机器学习吗?

    。 我发现IMAGIMOB 是个很好的解决方案来满足我的需求,但现在的问题是, PSoC™ Creator 不支持 IMAGIMOB! PSoC™ Creator 可以支持机器学习或 IMAGIMOB 吗?
    发表于 05-20 08:06

    机器学习8大调参技巧

    今天给大家篇关于机器学习调参技巧的文章。超参数调优是机器学习例程中的基本步骤之。该方法也称为
    的头像 发表于 03-23 08:26 749次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>8大调参技巧