基于对图像识别的深度学习算法的逐点剖析-电子发烧友网

如今，深度学习已经贯穿于我们的生活，无论是汽车自动驾驶、AI 医学诊断，还是面部、声音识别技术，无一没有 AI 的参与。然而，尽管人们早已明了深度学习的输入和输出，却对其具体的学习过程一无所知。

近日，针对这一问题，奥本大学（Auburn university）计算机科学和软件工程副教授 Anh Nguyen 对图像识别的深度学习算法进行了逐点剖析；无独有偶，加州大学欧文分校（UC Irine）计算机科学副教授 Sameer Singh 正在制作归因图（attribution maps），以帮助理解为何自然语言算法懂得与你交谈，并说出一些涉及种族主义的话。

机器学习（machine learning）是人工智能的一种形式，它使用大量的数据来训练自己对某些问题形成算法。例如，向机器提供成千上万张标有“猫”的照片，它就能学会识别“猫”这一生物。

Nguyen 说，机器学习的想法可以追溯到 20 世纪 50 年代，但直到最近，计算机才能够有效地处理大量数据，并得出精确结果。到 20 世纪 90 年代，机器学习算法仅使用简单的概念，但很明显，现实生活中存在各种复杂的问题，从而需要更复杂的算法，这就是深度学习的意义所在。

与机器学习不同，深度学习（deep learning）不需要结构化数据作为基础，利用人工神经网络（artificial neural net），即多个神经元一起工作，通过这些“神经元”来考虑数据并对数据进行分类。

神经网络非常擅长图像识别，当向它们提供足够的数据后，他们可以挑出人眼看不见的图案或差异。利用这一点，深度学习可以实现自动驾驶汽车的行人侦查或肿瘤筛查。

但是，当出现超出其参数范围的输入时，神经网络也会崩溃。在特定的，狭窄定义的任务中，深度学习通常优于人类，但是一旦神经网络失效时，往往会导致严重的后果。如果错误识别的图像发生在肿瘤患者身上或自动驾驶车上时，后果可能是致命的。

但问题是这些系统是如此的密集和复杂，人类无法理解它们，对人类来说，深度学习如同一个科技黑箱。除了令人不安之外，我们无法理解的计算机程序还可以做出一些不可预测的事情，并且当它们出错时，很难对其进行反向工程或纠正。

正如 Nguyen 所说， “归根结底，我们要搞清楚为什么神经网络的行为是这样，而不是相反。”

揭示神经网络的想法

能彻底搞乱人工智能的数据被称为“对抗性数据”，它会导致一个通常可靠的神经网络犯下奇怪的错误。静态的、波浪状的人字纹，以及五颜六色的条纹，可能被 AI 自信地识别为“蜈蚣”或“熊猫”。

不仅如此，一些常见的图像也会让深度学习人工智能崩溃。把消防车图片倒过来，AI 就会看到一个大雪橇；放大一辆公共汽车的窗户，它在 AI 眼中就变成了一个出气筒。

“令人震惊的是，我们发现这些网络会在某种程度上被这些奇怪的图案所愚弄，这是我们从未想象过的。”Nguyen 表示。

为了找出原因，Nguyen 创建了一个叫做 DeepVis 的工具来分析神经网络算法。该工具能够将深入学习 AI 的完整程序分离开来，并显示出单个神经元正在识别的内容。从这里开始，Nguyen 能够打破深入学习AI的连续工作进程，从而理解它是如何一步步达到最终检测结果的。

将识别对象简单的随机旋转几次，就足以将 AI 的分类精度从 77.5% 降到3%

由于神经网络这种复杂性，对其所做的“解剖”对于人工智能开发人员最有用，提供的大量细节可以帮助科学家们更深入地理解破解黑箱所需的神经网络训练，就好比医生对于肿瘤的研究一样。

但是，即使使用 DeepVis，黑箱的秘密可能也不会完全打开。神经元群的绝对复杂性可能让人类难以理解，毕竟它是一个黑箱。

2016 年，来自波士顿大学和微软研究院的研究人员为一种算法提供了 300 多万英文单词的数据集，数据从谷歌新闻文章中提龋研究人员重点关注那些最常用的英文单词，然后让算法做完形填空。

“男人（Man）之于程序员（computer programmer），那么女人（woman）之于什么”，机器通过算法“思考”后，得出答案：“家庭主妇（homemaker）”。

很明显， AI也会发出类似于人类社会的性别歧视和种族主义言论。为了找出其中的原因，专注于破解自然语言处理（NLP）算法黑箱并提出深度学习思维（deep learning thinking）这一概念的 Sameer Singh，使用了一种叫做归因图（attribution map）的工具：将语言插入到文本生成 NLP 算法中，归因图将突出显示某些部分，展示什么在神经网络内部“发光”也许是一个特定的字母组合。

Singh 的团队首先使用某些单词，开发出特殊的触发器，然后，他们按照归因图所说的算法最“感兴趣”的模板来修改这些单词，最终的结果是一连串的文字和半拼写错误，从而引发了某些看起来像“种族主义”的言论。

“突出显示的内容对模型的预测或输出有很大的影响，”Singh 说，利用这些信息，可以使用故意的对抗触发器来尝试发现问题，并理解深度学习算法中的联系。这足以让人们了解人工智能的想法。

虽然归因图也有缺点，不同的地图生成器可能彼此不一致，但是大概的理解可能是我们所能获得的最好的理解。

AI 黑箱 VS 人类黑箱

事实上，随着算法变得更加复杂、更加强大和不透明化，围绕黑箱的问题也进一步深入到哲学上：当我们人类自己的神经网络仍然神秘时，要求 AI 神经网络完全透明是公平的吗？

不得不承认，人类本身的神经网络也是一个黑箱。我们虽然知道一些物理结构，知道它们是如何工作，但对“思想”和“意识”的确切含义仍不清楚。

接下来我们是否应该思考，机器模仿人脑并继承其精确、灵活等优点的同时，是否也继承了人性中的偏见？

当然，随着未来科学家们在深度学习领域中不断取得的突破，由人类创造的 AI 黑箱终将变成“灰色”。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

图像识别

图像识别

+关注

关注
9

文章
524

浏览量
38518
机器学习

机器学习

+关注

关注
66

文章
8458

浏览量
133340
深度学习

深度学习

+关注

关注
73

文章
5525

浏览量
121816

AI图像识别摄像机

？AI图像识别摄像机是一种集成了先进算法和深度学习模型的智能监控设备。这些摄像机不仅能够捕捉视频画面，还能实时分析和处理所拍摄的内容，从而实现对特定对象、场景或行

发表于 11-08 10:38 •470次阅读

AI大模型在图像识别中的优势

大模型借助高性能的计算硬件和优化的算法，能够在短时间内完成对大量图像数据的处理和分析，显著提高了图像识别的效率。识别准确性：通过深度

发表于 10-23 15:01 •1471次阅读

深度识别算法包括哪些内容

：CNN是深度学习中处理图像和视频等具有网格结构数据的主要算法。它通过卷积层、池化层和全连接层等组件，实现对图像特征的自动提取和

发表于 09-10 15:28 •545次阅读

图像识别算法有哪几种

计算机科学家开始尝试使用计算机来处理和分析图像数据。最初的图像识别算法主要基于模板匹配和边缘检测等简单方法，但随着计算机硬件和算法的不断发展，图像识

发表于 07-16 11:22 •1613次阅读

图像检测和图像识别的原理、方法及应用场景

图像检测和图像识别是计算机视觉领域的两个重要概念，它们在许多应用场景中发挥着关键作用。 1. 定义 1.1 图像检测图像检测（Object Detection）是指在

发表于 07-16 11:19 •5330次阅读

图像识别算法都有哪些方法

传统方法和基于深度学习的方法。传统图像识别算法 1.1 边缘检测边缘检测是图像识别的基础，它用于检测

发表于 07-16 11:14 •6283次阅读

图像识别算法的提升有哪些

引言 图像识别是计算机视觉领域的核心任务之一，旨在使计算机能够自动地识别和理解图像中的内容。随着计算机硬件的发展和深度学习技术的突破，

发表于 07-16 11:12 •791次阅读

图像识别算法的优缺点有哪些

：图像识别算法可以快速地处理大量图像数据，提高工作效率。与传统的人工识别方法相比，图像识别算法可

发表于 07-16 11:09 •2087次阅读

图像识别算法的核心技术是什么

图像识别算法是计算机视觉领域的一个重要研究方向，其目标是使计算机能够像人类一样理解和识别图像中的内容。图像识别

发表于 07-16 11:02 •825次阅读

图像识别技术的原理是什么

图像识别技术是一种利用计算机视觉和机器学习技术对图像进行分析和理解的技术。它可以帮助计算机识别和理解图像中的对象、场景和活动。

发表于 07-16 10:46 •1627次阅读

图像识别属于人工智能吗

属于。图像识别是人工智能（Artificial Intelligence, AI）领域的一个重要分支。一、图像识别概述 1.1 定义 图像识别是指利用计算机技术对图像中的内容进行分析

发表于 07-16 10:44 •1484次阅读

opencv图像识别有什么算法

图像识别算法：边缘检测：边缘检测是图像识别中的基本步骤之一，用于识别图像中的边缘。常见的边缘检测算法

发表于 07-16 10:40 •1328次阅读

利用Matlab函数实现深度学习算法

在Matlab中实现深度学习算法是一个复杂但强大的过程，可以应用于各种领域，如图像识别、自然语言处理、时间序列预测等。这里，我将概述一个基本的流程，包括环境设置、数据准备、模型设计、训

发表于 07-14 14:21 •2595次阅读

如何利用CNN实现图像识别

卷积神经网络（CNN）是深度学习领域中一种特别适用于图像识别任务的神经网络结构。它通过模拟人类视觉系统的处理方式，利用卷积、池化等操作，自动提取图像中的特征，进而实现高效的

发表于 07-03 16:16 •1654次阅读

图像检测和图像识别的区别是什么

图像检测和图像识别是计算机视觉领域的两个重要研究方向，它们在许多应用场景中都有着广泛的应用。尽管它们在某些方面有相似之处，但它们之间还是存在一些明显的区别。本文将从多个角度对图像检测和图像识别

发表于 07-03 14:41 •1385次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

基于对图像识别的深度学习算法的逐点剖析

评论

AI图像识别摄像机

AI大模型在图像识别中的优势

深度识别算法包括哪些内容

图像识别算法有哪几种

图像检测和图像识别的原理、方法及应用场景

图像识别算法都有哪些方法

图像识别算法的提升有哪些

图像识别算法的优缺点有哪些

图像识别算法的核心技术是什么

图像识别技术的原理是什么

图像识别属于人工智能吗

opencv图像识别有什么算法

利用Matlab函数实现深度学习算法

如何利用CNN实现图像识别

图像检测和图像识别的区别是什么