MIT | 加上“反馈”,AI算法可以看得更清楚-电子发烧友网

人类识别物体的能力非常卓越。假如你在特殊光线下看一个杯子，或者从一个意想不到的方向去看杯子，你的大脑仍然很有可能认出这是一个杯子。这种精确的物体识别能力对人工智能开发者来说是一个难以实现的梦想，例如那些改进自动驾驶汽车导航的开发者。

虽然在视觉皮层中建立灵长类动物物体识别模型已经彻底改变了人工视觉识别系统，但是目前的深度学习系统相比生物系统已经被简化，并且还是难以识别一些物体，。

近日，麻省理工学院麦戈文研究所的研究员 James DiCarlo 和他的同事在 Nature Neuroscience 上发表的研究成果中提到，有证据表明，反馈可以提高灵长类动物大脑识别难识别物体的能力，添加反馈回路可以改进视觉应用中所用到的人工神经网络系统的性能。

图丨人工智能和深度学习视觉识别系统的艺术渲染图（来源：Christine Daniloff）

深度卷积神经网络（DCNN）是目前在快速时间尺度（小于 100 毫秒）上精确识别物体最成功的模型。它具有大体上与灵长类动物腹侧视觉流、皮质区域类似的结构，这一结构用来逐步建立所观察的物体的精确图像。然而，跟灵长类动物的腹侧神经系统相比，大多数的 DCNN 都很简单。

“在很长一段时间里，我们都没有获得一个基于模型的理解。因此，这一领域是通过将视觉识别建模作为前馈过程而开始的，”麻省理工学院大脑和认知科学系的系主任DiCarlo 解释道，“但是，我们知道，在跟物体识别相关的大脑区域中，存在着重复性解剖学连接。”

试想一下，前馈 DCNN 和视觉系统中首次尝试捕捉物体信息的部分，就像一条穿过一系列车站的地铁线，而反复出现的大脑网络就像街道，相互连接，但又不是单向的。大脑精确识别物体只需 200 毫秒，所以这些反复出现的联结是否在物体识别的关键步骤上起作用，目前仍不清楚。也许这些反复出现的联结只是为了长时间保持视觉系统协调。例如，街道上的排水沟缓慢地排出水和垃圾，但是并不需要很快地将人从小镇的一边转到另一边。

DiCarlo 和本研究的主要作者、CBMM 的博士后 Kohitij Kar 一起，开始验证快速识别物体过程中这些多次出现的结构的微妙作用是否被忽略了。

首先，作者需要确认灵长类动物大脑能详细解码的物体。识别物体这一过程对人工系统来说，充满了挑战，结果证明这很关键。

Kar 进一步解释道，“我们意识到，人工智能模型实际上并不是对处理每一幅或被遮挡、或处于混乱状态的图像都有问题。”

作者分别让深度学习系统，还有猴子和人类识别一些“有挑战性的”图片，结果灵长类动物可以很轻易地识别物体，但是前馈 DCNN 就不行。但是，当他们将合适的循环处理加入到这些 DCNN 中后，上述物体的识别突然变得轻而易举了。

Kar 采用了空间和时间精度极高的神经记录方法，来确定这些图片的处理对灵长类动物来说，是否真的如此琐碎。值得注意的是，他们发现，虽然对人类大脑来说，高难度图片的识别似乎很简单，但是它们实际上涉及到了额外的神经处理时间（大概是 30 毫秒），这表明循环在我们的大脑中也存在。

“计算机视觉界最近在人工神经网络上成功堆叠了越来越多的层次，并且具有循环连接的大脑结构也已经出现。”Kar 说。

心理学教授、贝克曼研究所智能系统主题的联合主席、非本研究作者 Diane Beck 进一步解释道：“由于完全前馈的深度卷积神经系统现在非常擅长预测灵长类动物的大脑活动，这引起了人们对于反馈连接在灵长类大脑中所起到的作用的疑问。这项研究表明，反馈连接很可能在物体识别中发挥作用。”

“这对自动驾驶汽车意味着什么呢？研究表明，假如深度学习想要类比灵长类大脑，那么深度学习中物体识别所涉及的结构就需要循环组件，并且研究指出如何在下一代智能机器中使用这一程序。”

“随着时间的变化，循环模型提供了对神经活动和行为的预测，”Kar 说。“我们现在可以模拟更复杂的任务。也许有一天，这个系统不仅可以识别物体，比如人，还可以执行人类大脑能够轻松进行的认知任务，比如体会他人的情绪。”

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
30698

浏览量
268852
MIT

MIT

+关注

关注
3

文章
253

浏览量
23388

原文标题：MIT最新研究：加上“反馈”，AI算法可以看得更清楚

文章出处：【微信号：deeptechchina，微信公众号：deeptechchina】欢迎添加关注！文章转载请注明出处。

更简单、更全能的系统级AI，OPPO Find X8首发AI一键问屏

10月18日，OPPO今日公布Find X8系列全新AI特性——「AI一键问屏」。Find X8系列通过集成全新的系统级AI，可以一键唤醒AI

发表于 10-18 15:21 •262次阅读

AI降噪算法的USB麦克风降噪模组

AI

深圳德宇科技有限公司
发布于 :2024年09月26日 11:34:09

负反馈可以分为哪几种类型

负反馈是一种在电子电路中广泛使用的技术，它可以提高电路的稳定性和性能。负反馈的概念负反馈是一种控制方法，它将系统的输出信号的一部分反馈到

发表于 08-16 14:29 •449次阅读

旗晟机器人智慧AI算法#人工智能

AI算法

jf_57022734
发布于 :2024年07月18日 17:44:48

平衡创新与伦理：AI时代的隐私保护和算法公平

的发展不应背离人类的伦理道德。在推动技术创新的同时，我们必须确保每一步都走得稳健和负责。通过提高透明度、保障算法公平性、保护个人隐私权以及加强国际合作，我们可以确保AI技术的健康发展，使其成为促进社会进步和增进人类福祉的力量。

发表于 07-16 15:07

ai大模型和算法有什么区别

复杂的问题。这些模型通常需要大量的数据和计算资源来训练和优化。例如，深度学习中的神经网络就是一种典型的AI大模型。算法则是一系列解决问题的步骤和规则，它们可以应用于各种领域，包括人工智能。算

发表于 07-16 10:09 •1760次阅读

主流边缘AI算法，在安防、零售、交通等领域的应用

边缘AI可以应用在哪些场景实现哪些功能。市面上主流的边缘AI算法应用目前市面上比较主流的边缘AI

发表于 05-13 01:56 •2957次阅读

risc-v多核芯片在AI方面的应用

得RISC-V多核芯片能够更好地适应AI算法的不同需求，包括深度学习、神经网络等，从而提高芯片的性能和效率，降低成本，使AI边缘计算晶片更具竞争力。再者，RISC-V的多核设计可以进

发表于 04-28 09:20

NanoEdge AI的技术原理、应用场景及优势

NanoEdge AI 是一种基于边缘计算的人工智能技术，旨在将人工智能算法应用于物联网（IoT）设备和传感器。这种技术的核心思想是将数据处理和分析从云端转移到设备本身，从而减少数据传输延迟、降低

发表于 03-12 08:09

加上拉电阻后的整体波形为什么可以向上移动呢？

FPGA输出3.3V发波，到74AC04非门的输出。为了使电平满足要求，可以在非门的输出端加上拉电阻，输出的波形整体向上移动了。加上拉电阻后的整体波形为什么可以向上移动呢？整体

发表于 02-22 06:42

AI算法的本质是模拟人类智能，让机器实现智能化

电子发烧友网报道（文/李弯弯）AI算法是人工智能领域中使用的算法，用于模拟、延伸和扩展人的智能。这些算法可以通过机器学习、深度学习、强化学习

发表于 02-07 00:07 •5742次阅读

AI如何助力我们构建更智能的空间？利用AI构建智能空间的5种方式

当下业界都聚焦于生成式 AI 如何推动未来变革，但我们也不妨回顾一下过去的一年，AI 如何助力我们构建更智能的空间。

发表于 01-24 18:19 •1070次阅读

AI大模型可以取代大学教育吗？

AI大模型

电子发烧友网官方
发布于 :2024年01月02日 16:27:52

AI大模型可以设计电路吗?

AI大模型

电子发烧友网官方
发布于 :2024年01月02日 15:09:29

测测这10个AI关键词你清楚几个？第4个今年最火

原文标题：测测这10个AI关键词你清楚几个？第4个今年最火文章出处：【微信公众号：微软科技】欢迎添加关注！文章转载请注明出处。

发表于 12-21 08:15 •542次阅读

搜索历史

MIT | 加上“反馈”,AI算法可以看得更清楚

评论

更简单、更全能的系统级AI，OPPO Find X8首发AI一键问屏

AI降噪算法的USB麦克风降噪模组

负反馈可以分为哪几种类型

旗晟机器人智慧AI算法#人工智能

平衡创新与伦理：AI时代的隐私保护和算法公平

ai大模型和算法有什么区别

主流边缘AI算法，在安防、零售、交通等领域的应用

risc-v多核芯片在AI方面的应用

NanoEdge AI的技术原理、应用场景及优势

加上拉电阻后的整体波形为什么可以向上移动呢？

AI算法的本质是模拟人类智能，让机器实现智能化

AI如何助力我们构建更智能的空间？利用AI构建智能空间的5种方式

AI大模型可以取代大学教育吗？

AI大模型可以设计电路吗?

测测这10个AI关键词你清楚几个？第4个今年最火