0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI系统存在巨大缺陷 看图识物比不上人类幼儿

罗欣 来源:Quanta Magazine 作者:佚名 2018-10-11 14:25 次阅读

人类,1分;AI,0分。

上个月,来自约克大学和多伦多大学的两名研究人员合作发表了一篇论文:The Elephant in the Room,在学界引起巨大反响。通过实验,他们发现现有人工智能系统还存在巨大缺陷,它们在“看图识物”这类视觉任务上的表现甚至还比不上人类幼儿。

看罢这篇论文,加里·马库斯表达了对研究人员的赞许:“这是一篇聪明而重要的论文,它提醒我们所谓的‘深度学习’还没有那么‘深刻’。”他是纽约大学的认知心理学教授,也是优步(Uber)人工智能实验室的负责人。

这项成果出现在计算机视觉领域,论文设计的任务很常规:训练一个机器学习系统,让它学会检测和分类图像中的对象。随着自动驾驶汽车离真正落地越来越近,学界对机器的视觉处理技术一直寄予厚望。为了保障安全,计算机必须能从一幅街景图中准确分辨哪个是鸟,哪个是自行车,即便达不到超人水平,它们至少也应该和被替代的人眼一样好用。

但是,这个任务并不简单,它突出了人类视觉的复杂性——以及构建模仿系统的高难度。在这项研究中,研究人员首先展示了一个能检测、识别客厅场景下物品的计算机视觉系统,它的性能很不错,能发现客厅里有一把椅子、一个人和书架上的书。之后,他们在同一幅图中加入了一个异常物体——一只大象,这时系统却“指鹿为马”了,它开始把椅子称为沙发,把大象称为椅子,还忽视了之前能“看”到的其他物品。

对此,论文作者之一Amir Rosenfeld认为:“这些奇怪现象的出现,表明了目前的物体检测系统是多么脆弱。”他们没能在论文中解释为什么会出现这种脆弱,但提出了一个破有见地的猜想:

这和人类具备,而AI没有的一项能力有关——人类在看图识物时能理解图像中是否存在令人困惑的东西,从而让自己去看第二眼。

房间里的大象

人类视觉和机器视觉很不一样。

当我们睁开双眼时,眼球开始收集大量视觉信息,并把它们输送给大脑快速处理,这时我们知道天是蓝的,草是绿的,万物在不断生长。

相比之下,机器在生成“视觉”上更费力。它们看待事物的方式类似用盲文阅读,其中图像的像素就是“文字”,通过在像素上运行各类算法,机器最终能生成关于目标物体的越来越复杂的表达形式。运行这一复杂过程的系统是神经网络,它由许多“层”构成。

输入一幅图像后,神经网络会逐层提取图像中的细节,比如各个像素的颜色和亮度,层数越深,它提取到的特征就越抽象。在过程结束时,它会对根据这些特征对其正在观察的内容输出最佳预测。

这个过程意味着相比人类,神经网络能把握更多人眼难辨的细节。事实上,现在基于神经网络的系统已经在许多视觉处理任务上超越人类,比如依据品种对狗进行分类。这些成功应用提高了人们对技术的期待,研究人员也开始着手研究,看计算机视觉系统是否能帮助汽车快速通过拥挤的街道。

但是,这项技术的成功也激励了一批人去探索它的脆弱性,比如近几年非常流行的“对抗样本”。通过在原图上做一些肉眼几乎看不到的扰动,新图像就能欺骗人工智能系统,让它把“虎斑猫”分类成“鳄梨酱”,把3D打印的“乌龟”分类为“步枪”。这些研究不是杞人忧天,试想一下,如果有人恶意在道路标志上添加了这种扰动,致使自动驾驶汽车误读、漏读路标,那车上乘客的生命安全该如何保障?

论文中的研究具有相同的精神。研究人员向机器展示了一个普通的客厅生活场景:一名男子正坐在破旧椅子边缘,前倾身体,聚精会神地玩着游戏。如下图所示,在“思考”片刻后,神经网络正确检测到了一系列物体:椅子、手提包、杯子、笔记本电脑、人、书籍、电视机、瓶子、时钟

但是,当他们在场景中引入了一些不协调的东西——一只大象后,神经网络就被新加入的像素迷惑了。如下图所示,在几次试验中,神经网络开始把大象识别为椅子,把椅子识别为沙发,它也忽略了靠近大象一侧的一排书。即便是离大象较远的物体,系统也存在错漏情况。

这个发现之所以令学界震惊,是因为实验展示的是现在最基础、最通行的物体检测技术,虽然客厅内突然出现一头大象并不现实,但公路上出现一只火鸡确实可能的。现实道路上会发生很多意料之外的事,根据论文结果,我们有理由怀疑,自动驾驶汽车会因为路边突然出现的一只火鸡,而无法检测到车前的行人。

正如罗恩菲尔德说的:“如果房间里真的有一头大象,那你肯定会注意到它,但这个系统却甚至没能检测到它的存在。”

万事皆有因果

当人类看到意想不到的东西时,我们会先愣一下,然后才恍然大悟。这是一个具有真实认知意义的常见现象——它恰好揭示了为什么神经网络无法处理“怪异”场景。

现如今,最先进的物体检测神经网络还是以“前馈”的方式工作,这意味着信息流经神经网络时是单向的,从输入细粒度像素开始,到检测曲线、检测形状、检测场景,再到最后输出最佳预测。为了确保预测的准确性,它必须在整个过程中不断收集“有用”信息,但这种单向性也意味着如果早期信息存在某种错误,那这些错误就会污染预测结果。

论文作者之一Tsotsos表示:“从神经网络顶部开始,我们确实可以探索和结果相关的一切内容,但我们也有可能让每个位置的每个特征都对每一个可能的输出作出干扰。”

举一个大家都理解的例子。假设图中有一个圆和一个正方形,它们颜色各异,一个是红的,一个是蓝的。现在要求你在短时间内观察图片,并迅速答出正方形是什么颜色的。如果注意力够集中,我们可能一瞥就能给出答案;如果有些头昏脑胀,我们可能看了一眼后还会有点迷惑,然后自然而然地会去重新看一遍。而且当我们看第二遍时,注意力是高度集中在观察正方形颜色上的。

简而言之,人类的视觉系统如果没有获得想要的答案,它会回头看看自己在哪里犯了错。而这个过程可以用1990年《Behavioral and Brain Sciences》一篇论文中提到的概念——选择性调整模型(ST)来解释。如上图所示,那篇论文假设视觉处理架构在结构上是金字塔形的,该网络内的节点接收前馈和反馈连接。当刺激输入视觉系统时,首先它会以前馈的方式激活与其连接的金字塔内的所有节点;之后,输出的结果再以反馈的方式重新回到之前的节点中,激活倒置子金字塔。

这个模型的优势在于人类能依靠前馈和反馈,选择感兴趣的时空区域,选择与当前任务相关的事物并选择最佳视点,同时,我们也能通过修剪不相关的内容来限制任务相关的搜索空间,只考虑之前有过提示信息的位置,用位置/特征信息抑制感受野中的干扰,更简单、高效的获取最佳结果。

而大多数神经网络缺乏这种反馈能力,这也是科研人员一直无法有所突破的研究难点。现在使用前馈网络的一个优点是容易训练——只需让输入通过一个6层神经网络,但是,如果我们希望未来机器也能“先愣一下,然后才恍然大悟”,它们就必须理解什么时候该回头看看,什么时候该简单前馈。

人脑可以在这些过程之间无缝切换,但神经网络还需要一个新的理论框架才能做同样的事情。

就在本月,谷歌上线了一个对抗样本挑战Unrestricted Adversarial Examples Challenge,他们向社区征集参赛鸟/自行车分类器,要求参赛的“对抗者”可以在输入有扰动的图像后,依然准确分类鸟和自行车;而“攻击者”的目标是生成一张包含鸟的图像,让“对抗者”分类器把它分类成自行车。这离构建选择性调整模型还有不小距离,但这是通向解决问题的第一步——也是不可或缺的一步。

本文来源:Quanta Magazine

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4771

    浏览量

    100715
  • AI
    AI
    +关注

    关注

    87

    文章

    30728

    浏览量

    268887
  • 机器学习
    +关注

    关注

    66

    文章

    8406

    浏览量

    132565
收藏 人收藏

    评论

    相关推荐

    人类智慧水平AI即将到来,AI芯片已提前布局

    拥有人类智慧水平的AI即将出现,但不必恐惧,Altman认为这种AI对世界的影响远没有人们想象得那么严重。   人类水平AI即将到来   从
    的头像 发表于 01-22 06:44 2593次阅读

    基于缺陷生成路径的AI质检新范式

    在全球化的制造业格局中,产品质量问题一直是悬在企业头顶的一把达摩克利斯之剑。特别是近年来,随着消费者对产品质量的要求越来越高,任何微小的缺陷都可能引发大规模的产品召回,造成巨大的经济损失和社会影响
    的头像 发表于 11-15 01:05 250次阅读
    基于<b class='flag-5'>缺陷</b>生成路径的<b class='flag-5'>AI</b>质检新范式

    莫拉维克悖论与多模态AI:迈向机器人认知的新时代

    莫拉维克悖论揭示了人工智能系统在处理高级推理与基本感知运动技能上的巨大差异。对于AI而言,复杂的逻辑任务似乎比人类习以为常的感知运动技能更容易实现。这一悖论凸显了当前
    的头像 发表于 10-26 15:00 591次阅读

    60G婴幼儿呼吸心跳检测专用雷达模块 感应距离0.8-1.5米

    每年因呼吸道疾病死亡的新生儿高达200万。主要原因是婴幼儿的呼吸系统和免疫系统尚未没有发育完全,抵抗力能力差,极容易感染呼吸道疾病。除此以外,婴幼儿在睡眠时稍不注意,便容易发生俯卧、坠
    的头像 发表于 09-28 08:09 320次阅读
    60G婴<b class='flag-5'>幼儿</b>呼吸心跳检测专用雷达模块 感应距离0.8-1.5米

    使用TI Edge AI Studio和AM62A进行基于视觉AI缺陷检测

    电子发烧友网站提供《使用TI Edge AI Studio和AM62A进行基于视觉AI缺陷检测.pdf》资料免费下载
    发表于 09-03 10:38 0次下载
    使用TI Edge <b class='flag-5'>AI</b> Studio和AM62A进行基于视觉<b class='flag-5'>AI</b>的<b class='flag-5'>缺陷</b>检测

    基于鸿蒙Next模拟扫图的一个过程

    一、功能介绍(基础) 基于鸿蒙Next模拟扫图的一个过程,扫描到图片,提示出相关的图片内容,是一个什么东西。 二、使用场景(大类) 支付、社交、信息获取、在线调查、教育学习等等。 三、实现步骤
    发表于 08-21 15:04

    平衡创新与伦理:AI时代的隐私保护和算法公平

    机制,还包括了数据的来源、处理方式以及使用目的的明确披露。这样不仅有助于监管机构进行审查,也让普通用户能够理解AI系统的决策依据,从而减少因“黑箱操作”带来的不信任和误解。例如,在AI辅助医疗诊断中
    发表于 07-16 15:07

    基于AI深度学习的缺陷检测系统

    在工业生产中,缺陷检测是确保产品质量的关键环节。传统的人工检测方法不仅效率低下,且易受人为因素影响,导致误检和漏检问题频发。随着人工智能技术的飞速发展,特别是深度学习技术的崛起,基于AI深度学习的缺陷检测
    的头像 发表于 07-08 10:30 1364次阅读

    基于一种AI辅助可穿戴微流控比色传感器系统

    存在的挑战限制了这项技术的实际应用。 据麦姆斯咨询报道,为了克服这些挑战,来自中国石油大学(华东)的研究人员开发了一种人工智能(AI)辅助的可穿戴微流控比色传感器系统AI-WMCS)
    的头像 发表于 06-29 10:57 1.1w次阅读
    基于一种<b class='flag-5'>AI</b>辅助可穿戴微流控比色传感器<b class='flag-5'>系统</b>

    智谋纪 AI+Multi LED 打开人类健康新宝藏

    技术。 智谋纪创始人&CEO朱东亮先生受邀出席论坛,带来题为《AI+ Multi LED,打开人类健康新宝藏》的专题演讲。 演讲精彩瞬间回顾:AI+ Multi LED,智谋纪AI照明
    的头像 发表于 06-17 12:23 325次阅读
    智谋纪 <b class='flag-5'>AI</b>+Multi LED 打开<b class='flag-5'>人类</b>健康新宝藏

    请问STM32硬件I2C存在什么缺陷

    我看野火的库函数开发手册里面感觉用I2C用的挺顺的呀 为什么张洋却说STM32的I2C有缺陷 不推荐用 请问下 各位在使用I2C的时候碰到过什么情况吗 我怎么都没感觉到I2C的缺陷 能否说下这个缺陷是什么
    发表于 05-16 07:46

    幼儿园校园广播系统(IP网络广播)方案

    幼儿园校园广播系统(IP网络广播),采用“技术先进、架构科学、经济实用、利于拓展、方便维护”的设计理念,设计为IP数字网络传输架构,通过TCP/IP协议在局域网中传输音频和控制信号,信号以数字方式
    的头像 发表于 04-11 15:51 820次阅读
    <b class='flag-5'>幼儿</b>园校园广播<b class='flag-5'>系统</b>(IP网络广播)方案

    NVIDIA在加速因智能AI大模型落地应用方面的重要作用介绍

    本案例介绍了 NVIDIA 在加速因智能 AI 大模型落地应用方面的重要作用。生成式大模型已广泛应用于各领域,通过学习人类思维方式,能快速挖掘海量内容,满足不同需求。
    的头像 发表于 03-29 15:28 622次阅读

    富士通发布最新的人工智能(AI)战略,聚焦深化人类AI之间的协作

    富士通株式会社(以下简称“富士通”)发布了最新的集团人工智能(AI)战略,聚焦深化人类AI之间的协作,并提出了将AI作为“可信赖的助手”这一愿景,为提升
    的头像 发表于 02-21 17:09 818次阅读
    富士通发布最新的人工智能(<b class='flag-5'>AI</b>)战略,聚焦深化<b class='flag-5'>人类</b>与<b class='flag-5'>AI</b>之间的协作

    奥特曼称相信AI无法替代人类

    奥特曼称相信AI无法替代人类 AI对于人类的威胁一直有很多讨论,各有不同观点,很多人对于科幻电影中的场景AI机器人伤害
    的头像 发表于 01-19 11:43 871次阅读