0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一听说是黑盒系统就敬而远之是否是最好的做法?

jmiy_worldofai 来源:lp 2019-04-16 10:30 次阅读

一直以来大家都对深度学习这样的黑盒系统多有诟病,即便深度学习的可解释性方面已经有所建树,怀疑和抵制之声仍然很多。但CMU材料科学与工程系教授ElizabethA.Holm近期在《科学》杂志发表了一篇短评文章,少见地为黑盒系统给予一些肯定。这篇文章的视角也提醒我们重新考虑一下,一听说是黑盒系统就敬而远之是否是最好的做法。

曾经,科幻小说作家DouglasAdams假想人类建造出了有史以来最厉害的计算机,它的名字叫DeepThought,它上面运行的程序可以解答人类能够提出的最深刻的问题「生命的意义是什么」、「宇宙为什么存在」,以及其它所有问题。在计算了750万年以后,DeepThought给出了一个回答:数字「42」。随着人工智能系统已经开始进入所有人类努力探索的领域,包括科学、工程以及医疗保健,如今人类也必须面对DouglasAdams在这个故事里巧妙地隐含的问题:当我们不理解为什么会出现这个答案的时候,我们还有没有必要知道这个答案?一个黑盒系统到底好还是不好?

在我们学校大多数的物理科学和工学的教授同事们眼中,不使用深度学习这样的AI方法的最大原因就是他们不知道如何解释AI给出的答案是如何产生的。这个反对意见非常有力,其中隐含的顾虑可以包括实践、可以包括道德、甚至还可以包括法律。科学家们的使命、以及工程师们的职责都要求不仅仅能够预测会发生什么,还要理解它为什么会发生。一个工程师能够学会预测一座桥是否会倒塌,AI系统其实也可以学会做同样的事情,但只有工程师才能通过物理模型解释清楚他的决定是如何做出的,然后和别人沟通交流、让他们评价他的思路。假设有两座桥,人类工程师认为一座桥不会塌,AI认为另一座桥不会塌,那你会对哪一座桥更放心呢?

黑箱系统给出的答案无法完全令人信服的事情并不只发生在科学家和工程师身上。2018年提出的「欧盟一般数据保护条例」GDPR中就要求基于个人数据的自动决策系统能够为决策对象提供「对于涉及的决策逻辑的有意义的解释」。目前人们仍然在讨论这条要求如何在司法实践中落实,但是我们已经可以看到司法系统对于无法解释的系统的不信任。

在这种整个社会的怀疑氛围下,AI研究人员们的行动很好理解,他们不再公开宣扬黑盒决策系统,但他们展开更多研究,尝试更好地理解黑盒系统是如何做出决策的——这也就是我们常说的「可解释性」问题。实际上,这也是计算机科学领域当今最大的挑战之一。

不过,一刀切地拒绝所有的黑盒系统也许鲁莽了一点。在现实中,科学家和工程师们,作为人类、也和所有其他人一样地,根据自己已有的判断和经验做出决策,就好像是来自他们自己大脑中的「深度学习系统」。所以,脑神经科学也遇到了和计算机科学一样的可解释性挑战。然而,对于人类做出的决策、给出的结论,我们常常不加防备地直接接受,也不去试着完全了解它们的来源过程。这样说来,AI系统给出的答案也许值得考虑一下,它们也许也能发挥类似的益处;如果能确认的话,那我们还应该使用它们。

首当其中可以说的,也是最明显的,就是当错误答案带来的代价比正确答案带来的价值低很多的时候。定向广告投放就是一个典型的例子。从广告商的角度讲,投放了广告但是目标群体不想看的成本是很小的,但是成功的广告却能带来可观的收益。以我自己的研究领域,材料科学来说,图像分割任务通常都需要人类把材料图像中感兴趣的部分的复杂内部结构的边界手动勾画出来。这个过程成本很高,以至于不论是博士论文还是工业级的质量控制系统中一旦有需要图像分割的部分,都要让这部分所需的图像尽可能地少。如果换成AI系统,它就能很快完成大批量的图像分割任务,同时还具有很高的保真度(虽然并不完美)。在这里,完美的图像分割结果对于这些系统并不是必需的,因为出现那么一些误分类的像素的代价要比没有AI系统时研究生们付出的时间精力低太多了。

第二个可以使用黑盒系统的例子也很明显,不过要更有活力一些。如果一个黑盒系统能产生最佳的结果,那我们就应当使用它。比如,在评估标准的平面医学影像时,经过训练的AI系统可以帮助人类影像科医生得到更准确的癌症评估结果。虽然这种情况下出现一个错误答案(不论是假正例还是假负例)的代价并不低,但在黑盒系统的帮助下我们可以达到其它任何方案都无法达到的高准确率,这就成为了当前最佳的解决方案。当然了,有人会说让AI看X光片本来就可以接受,部分原因是因为总会有人类医生检查AI给出的结果;让AI开车就会让人有更多顾虑,因为这个黑盒系统做出的决策能影响人的生死,但同时它却没有给人类留出干预的机会。即便这样,自动驾驶汽车也总有一天会比人类驾驶的汽车更安全,它们将会在事故率和死亡率上都做得比人类司机更好。如果取一些合理的指标来衡量,那么那一天一旦到来我们马上就会知道,但是是否让人类司机让位给AI司机会是整个社会的决定,需要考虑到人类道德观念、公平性、非人类实体的追责等许多方面。

但是需要说明的是,我们能列出这些情况并不代表黑盒模型在这些场景中就直接得到许可了。在上面两种情况中我们都假设了一个理想的黑盒子,有人对它的运行负责,而且能够它的代价,或者能够明确无误地定义什么是最好的结果。这两个假设都有落入误区的可能。AI系统可能会有一系列的缺点,包括偏倚、在训练的领域外不适用、脆弱性(很容易被欺骗)。更重要的是,评估代价和最佳结果是一个复杂的决策问题,需要在经济性、个体需求、社会文化、道德考量等许多方面之中做出权衡。更糟糕的是,这些因素可能是一环套一环的:一个有偏倚的模型可能会隐含着一些代价,可以表现为模型自己做出错的预测,也可以表现为外人对模型的公平性的评估不准确。一个脆弱的模型可能会包含一些盲点,在某些时候会产生错的离谱的糟糕决定。就像面对任何决策系统一样,使用黑盒系统的时候仍然要配合知识、判断力和责任心。

根据定义,人类无法解释一个黑盒算法是如何给出某个具体的答案的。但是,当黑盒系统能够带来最佳的产出,或者给出错误答案的代价很小,或者能够启发新的思维的时候,它们仍然可以为我们带来价值。

虽然AI的思考过程是带有限制的、可能包含偏倚甚至可能直接就是错误的,但它们毕竟和人类的思考方式有很大的区别,有可能可以揭示新的联系和新的方法。这样一来,黑盒系统就有了第三种可以使用的场景:作为引导人类思考和质疑的工具。比如在某项突破性的医学影像研究中,科学家们训练了一个深度学习系统来根据眼部照片诊断糖尿病性视网膜病变,得到的结果能够近似或者超过一组眼科专家的表现。更令人惊奇的是,这个系统还可以一并分析得出眼科诊断中不会涉及的别的信息,包括心脏病风险高低、年龄、性别等等。在此之前从来没有人注意过不同性别的视网膜之间会有什么区别,所以这个黑盒子系统的发现就给科研人员们提供了新的线索,可以进一步探究不同性别的视网膜之间到底有何区别。对于这些引发的问题的研究也就不再继续属于可解释的AI系统以及人类智慧的黑盒系统领域。

说了一圈,我们可以再来看看一开始提到的DeepThought给出的答案「42」。我们没法用黑盒AI系统寻找因果关系、构建知识和逻辑系统以及达成理解,一个黑盒系统也没办法告诉我们桥为什么会塌、生命和宇宙的种种问题的答案是什么、以及解释世间的一切。至少目前,这些问题都属于人类智慧和逐渐发展的可解释AI的领域。但同时,我们也仍然可以用适当的方式接受黑盒系统。黑盒系统可以对科学、技术、工程、数学等等领域产生潜在且正面的影响,可以产生价值、优化结果以及启发创新。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 黑盒
    +关注

    关注

    0

    文章

    5

    浏览量

    8107
  • 人工智能系统

    关注

    0

    文章

    38

    浏览量

    10574
  • 深度学习
    +关注

    关注

    73

    文章

    5493

    浏览量

    121007

原文标题:不要一棍子打翻所有黑盒模型,其实可以让它们发挥作用

文章出处:【微信号:worldofai,微信公众号:worldofai】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    LMK04832配置时钟输出时,IDL和ODL怎么配置?有没有统做法?

    为了优化相噪,LMK04832配置时钟输出时,IDL和ODL的配置般怎么考虑,有没有统做法?还是说根据所研发产品的实际情况去调试,由调试结果决定是开启还是关闭改配置? 比如245.76MHz
    发表于 11-08 08:14

    基于简仪科技产品的水器阵列测试系统解决方案

    器阵列测试系统种用于监测水下声音的重要工具,特别适用于海洋生态研究、水下通信和声纳应用等领域。这种系统能够实时采集多通道声音数据,并通过FFT分析来提取关键信息,从而为科研人员
    的头像 发表于 10-29 10:03 120次阅读
    基于简仪科技产品的水<b class='flag-5'>听</b>器阵列测试<b class='flag-5'>系统</b>解决方案

    ATG-2042功率信号源在多频共振水器研制中的应用

    实验名称:功率信号源在多频共振水器研制中频率响应实验验证中的应用 实验目的:目前水器多为宽频带,提高整体频带的灵敏度成本高、制作工艺复杂。因此,需要种可以方便调节工作频带的高灵敏度水
    的头像 发表于 10-21 15:41 138次阅读
    ATG-2042功率信号源在多频共振水<b class='flag-5'>听</b>器研制中的应用

    TAS2505的MCLK是否可以使用颗cmos晶振提供?频率是多少最好

    我们目前有个设计,由于host侧的I2S只支持slave模式,需要使用TAS2505的I2S master mode,请问TAS2505是否可以支持master模式?如果可以支持master,请问TAS2505的MCLK是否
    发表于 10-12 07:35

    聚徽-工控体机是否需要重装系统怎么判断

    判断工控体机是否需要重装系统,可以根据以下几个方面来综合考虑:
    的头像 发表于 09-11 09:27 188次阅读

    OPA660可以用什么芯片替代?

    我现在使用的OTA芯片OPA660听说已经停产,请问可以用什么芯片替代?
    发表于 09-11 06:48

    无功补偿器直手动运行是否可行

    无功补偿器般用于自动地监测和调节电力系统中的无功功率,以确保系统的功率因数保持在合适的范围内。手动运行无功补偿器可能是可行的,但通常情况下不是最有效的做法
    的头像 发表于 06-03 14:10 473次阅读

    功能测试是白盒还是黑盒测试

    功能测试是软件测试的种方法,主要用于验证软件的功能是否满足需求规格说明书中的要求。功能测试可以采用白盒测试或黑盒测试的方法,具体取决于测试的目的和需求。本文将详细介绍功能测试的概念、白盒测试和
    的头像 发表于 05-30 14:53 762次阅读

    国产DSP有哪些型号

    女朋友刚入坑DSP,毕业去家军工企业,听说是搞dsp,而且使用的是国产的,但是不知道使用哪款,想在入职前学下,避免到时候啥都不会,被嫌弃。
    发表于 04-22 13:41

    什么是光纤水系统?光纤水器的主要元器件

    光纤水器的安装过程是个相对复杂且需要高度专业技术的操作。需要根据具体的应用场景和需求,将光纤水器部署在水下的合适位置,以确保其能够有效地接收和处理声音信号。
    的头像 发表于 03-13 10:00 1464次阅读
    什么是光纤水<b class='flag-5'>听</b>器<b class='flag-5'>系统</b>?光纤水<b class='flag-5'>听</b>器的主要元器件

    光纤矢量水器工作原理浅析

    光纤矢量水器是种新型的水声测量设备,其工作原理是通过高灵敏度的光学相干检测,将水声振动转换成光信号,再通过光纤传至信号处理系统提取声信号信息。
    的头像 发表于 02-04 15:30 4761次阅读
    光纤矢量水<b class='flag-5'>听</b>器工作原理浅析

    软件测评的等价类设计方法

    、性能问题 5、初始化和终止错误 三、黑盒测试的优点: 1、有针对性地找问题,并且定位问题更加准确 2、黑盒测试可以证明产品是否达到用户要求的功能,是否符合用户的工作要求 用户
    发表于 12-29 10:22

    24位ADC做般数据采集,接口信号线与MCU做隔离与直连两种做法,对数据采集精度有多大影响?

    对这方面有点糊涂,想请教下24位ADC做般数据采集,接口信号线与MCU做隔离与直连两种做法,对数据采集精度有多大影响?给大致分析下,以便参考下是否要采取隔离措施。
    发表于 12-21 06:07

    AD7194的模拟地和数字地最好应在什么位置接入系统地?

    AD7194的模拟地和数字地最好应在什么位置接入系统地?
    发表于 12-19 06:10

    什么是ABS view?讲下ABS view的作用

    ABS view是abstract view的简写。其实我猜测也是为了口头表达方便,硬是把abstract view说成ABS,乍一听以为是防抱死系统
    的头像 发表于 12-06 15:31 522次阅读