70年来AI研究方面的苦涩教训：我们过于依靠人类知识了-电子发烧友网

强化学习之父Richard S. Sutton认为，过去70年来AI研究的最大教训，就是我们过于依赖人类的既有知识，轻视了智能体本身的学习能力，将本该由智能体发挥自身作用“学习和搜索”变成了人类主导“记录和灌输”。未来这种现象应该改变，也必须改变。

近日，强化学习之父、加拿大计算机科学家Richard S. Sutton在其个人网站上发文，指出了过去70年来AI研究方面的苦涩教训：我们过于依靠人类知识了。

Sutton认为，过去70年来，AI研究走过的最大弯路，就是过于重视人类既有经验和知识，研究人员在训练AI模型时，往往想将人类知识灌输给智能体，而不是让智能体自己去探索。这实际上只是个记录的过程，并未实现真正的学习。

事实证明，这种基于人类知识的所谓”以人为本“的方法，并未收到很好的效果，尤其是在可用计算力迅猛增长的大背景下，在国际象棋、围棋、计算机视觉等热门领域，智能体本身已经可以自己完成”规模化搜索和学习“，取得的效果要远好于传统方法。

Sutton由此认为，过去的教训必须总结，未来的研究中，应该让AI智能体能够像我们一样自己去发现，而不是将我们发现的东西记下来，因为后者只会让我们更难以了解发现的过程究竟是怎样的。

以下为文章原文：

在过去70年中，人工智能研究中得出的一个最大教训是，通用化的方法最终往往是最有效的，而且能够大幅提升性能。造成这个结果的最终原因是摩尔定律，或者说，是摩尔定律总结出的计算力随时间的变化趋势。

大多数人工智能研究都有个假设前提，即智能体的可用计算力是一个不变的常量，也就是说，提升性能的方法可能就只有利用人类自己的知识了。但是，如果项目周期比一般情况较长时，一定会有丰富的计算力可以投入使用。从短期来看，研究人员可以利用自己掌握的相关领域的人类知识来换取性能提升，但从长远来看，唯一重要的还是计算力。

我们完全没有必要让这两者相互对立起来，但实际上，它们往往就是相互对立的。项目时间有限，把时间花在计算力上，就不能花在人类知识的利用上。研究人员在心理上往往会偏向某一种方式。人类知识方法往往使解决问题的方法变得复杂化，与利用利用计算力得出的通用化方法相比，适应性上不如前者。

不少AI研究人员用了很长时间才明白这个教训，所以我觉得这个问题值得单独拿出来讲一讲。

过去70年AI研究的深刻教训：靠人类知识，远不如靠智能体自己

1997年，IBM的计算机“深蓝”击败了世界冠军卡斯帕罗夫，“深蓝”的开发就是基于大规模的深度搜索。而当时，大多数计算机象棋研究人员采用的方法，都是利用人类对国际象棋特殊结构的理解。

当一个简单的、基于搜索的方法在专门的软硬件上显示出强大性能时，彼时基于人类知识的国际象棋研究人员沮丧地表示，这次“野蛮搜索“可能压倒了人类的经验和知识，取得了胜利，但这无论如何不是人们下棋的方式。这些研究人员一直希望基于“人类知识”的方法能够获胜，因为没有实现这一点，他们的失望溢于言表。

计算机围棋中也出现了类似的研究模式，不过比国际象棋迟来了20年。研究人员希望通过人类知识或棋局的独有特征，来避开大规模搜索，但所有这些努力都证明是用错了地方，而且，在搜索大规模应用之后，这种错误显得更加明显了。

同样重要的是，通过智能体的自我学习来学习价值功能。像大规模搜索一样，AI需要通过自对弈和通用学习来提升性能，实现大规模的计算应用。

搜索和学习是在AI研究中利用计算力的两种最重要的技术。在计算机围棋中，研究人员最初的方向也是利用人类知识，搜索用的比较少，很长时间以后，才通过搜索和学习获得了更大的成功。

在语音识别方面，早期的研究利用了一系列基于人类知识的专门方法：词汇、音素、人类声道知识等。而比较新的方法更偏向统计性，并且计算量更大，基于隐马尔可夫模型（HMM）。与国际象棋和围棋一样，在语音识别领域，同样是统计方法战胜了基于人类知识的方法。这导致所有NLP研究在近几十年内发生了重大变化，统计和计算在这一领域占据了主导地位。最近的语音识别领域中，深度学习的兴起是这个趋势的最新体现。

深度学习方法对人类知识的依赖更少，应用了更多的计算，以及对大量训练集的学习，生成性能更高语音识别系统。和棋类对弈一样，研究人员一开始总是想让系统按照人类的思维的方式运作，试图将人类知识放输入系统，但事实证明，最终是适得其反，而且极大地浪费了研究人员的时间。随着计算力的迅速增长，研究人员也找到了能够高效利用计算力的方式。

在计算机视觉领域也是如此，早期研究将“视觉”设想为搜索的边缘或广义圆柱体。但今天这一切都被抛弃了。现代深度学习神经网络仅使用卷积和某些不变性的概念，并且表现得更好。

这是一个很大的教训。我们仍然没有完全理解这个领域，因为我们会继续犯下同样的错误。要看到这一点，并从中总结教训，即建立我们认为理解自身思考方式的体系，从长远来看解决不了问题，AI研究从重“人类知识”到重“计算和搜索”的演进过程，已经证明了这一点。

回顾过去，我们可以总结出下面几点认识：

1）AI研究人员经常想要将知识传给智能体

2）这个方式在短期内总是会有效，研究人员本人可以获得满意结果。

3）从长远来看，这种方式对未来的性能提升没有帮助，甚至有阻碍作用，

4）AI的突破性进展最终要通过基于搜索和学习进行规模化计算的方法来实现。

对于AI研究而言，最终的成功可能反而会充满了苦涩，很多人往往理解不了，因为它战胜的是“以人为本”的老方法。

要让智能体自己去搜索和发现，而不是靠人类

通用方法具备强大功能，即使可用计算力已经非常强大，我们仍然可以通过增加计算力来扩展的方法。而基于计算力的搜索和学习可以按照这一方向任意扩展下去。

第二个教训是，人类思维的实际内容的复杂程度是无可比拟的，我们不应该在尝试寻找关于思维内容的简单方法，如对空间、对象，多智能体或对称性的思维内容的简单方法。

所有这些在本质上都是复杂的外部世界的一部分，它们的复杂性是无穷无尽的，我们应该集中精力构建可以找到并捕获这种任意复杂性的”元方法“。构建这种“元方法”的关键在于，智能体能够找到很好的近似结果，但是具体执行搜索、进行发现的应该是智能体自己，而不是我们。我们希望AI智能体能够像我们一样自己去发现，而不是将我们发现的东西记下来，因为后者只会让我们更难以了解发现的过程究竟是怎样的。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
31364

浏览量
269769
智能体

智能体

+关注

关注
1

文章
163

浏览量
10600
强化学习

强化学习

+关注

关注
4

文章
268

浏览量
11275

原文标题：强化学习之父：AI研究70年教训深刻，未来探索要靠智能体自己

文章出处：【微信号：AI_era，微信公众号：新智元】欢迎添加关注！文章转载请注明出处。

【书籍评测活动NO.55】AI Agent应用与项目实战

的一些日程预测性地调整了今天的工作安排。在近日的Agent OpenDay上，智谱AI展示了在AI Agent（智能体）方面最新成果，发布了

发表于 01-13 11:04

马斯克预言：AI将全面超越人类智力

，到2025年底之前，AI的智力水平将有望超越单个人类的智力。而到了2027年至2028年间，AI

发表于 12-28 14:23 •254次阅读

AI在环境可持续发展方面的作用

近日，《联合国气候变化框架公约》缔约方会议第二十九次会议（COP29）在阿塞拜疆巴库落下帷幕，与会者们齐聚于此，共同应对气候变化。AI 在环境可持续发展方面的作用成为了本届大会关注的焦点。

发表于 11-27 11:24 •326次阅读

名单公布！【书籍评测活动NO.51】具身智能机器人系统 | 了解AI的下一个浪潮！

，这是机器人技术在理解和响应人类情感方面的一个重要步骤；谷歌的 Atlas 机器人和特斯拉的 Tesla Bot 展示了在物理能力和智能控制方面的先进成果；丰田的 T-HR3 机器人

发表于 11-11 10:20

雷迪埃已有70多年的历史，让我们来看看70年来的发展历程吧！

行业芯事行业资讯

上海雷迪埃
发布于 :2024年10月16日 11:30:18

AI for Science：人工智能驱动科学创新》第4章-AI与生命科学读后感

农业、环保等，为人类社会的可持续发展做出贡献。总结《AI for Science：人工智能驱动科学创新》第4章关于AI与生命科学的部分，为我们展示

发表于 10-14 09:21

《AI for Science：人工智能驱动科学创新》第二章AI for Science的技术支撑学习心得

的重要作用和价值，同时也看到了其面临的挑战和未来发展方向。这次学习不仅丰富了我的知识储备，还激发了我对AI for Science未来发展的期待和热情。我相信，在不久的将来，AI fo

发表于 10-14 09:16

名单公布！【书籍评测活动NO.44】AI for Science：人工智能驱动科学创新

芯片设计的自动化水平、优化半导体制造和封测的工艺和水平、寻找新一代半导体材料等方面提供帮助。第6章介绍了人工智能在化石能源科学研究、可再生能源科学研究、能源转型三个

发表于 09-09 13:54

罗杰·瑞迪:AI能力已远超我们人类

，AI作为一个新兴且强大的“物种”，其能力已远远超越了我们人类，这种超越不仅体现在计算能力上，更在于其持续学习、自我优化的能力，预示着一个全新时代的到来。

发表于 07-05 14:10 •374次阅读

蓝牙模块在车载导航方面的应用知识分析

蓝牙模块在车载导航方面的应用知识分析蓝牙作为一种近距离通信技术，目前已标配车载行业，如下从以下几个蓝牙协议方面讲述下蓝牙车载导航蓝牙基础知识学习介绍 1：HFP 全称为Hands F

发表于 06-21 17:11 •1051次阅读

智谋纪 AI+Multi LED 打开人类健康新宝藏

技术。智谋纪创始人&CEO朱东亮先生受邀出席论坛，带来题为《AI+ Multi LED，打开人类健康新宝藏》的专题演讲。演讲精彩瞬间回顾：AI+ Multi LED，智谋纪AI照明

发表于 06-17 12:23 •357次阅读

学习串口屏需要了解哪些方面的知识

学习串口屏需要掌握的知识主要包括以下几个方面

发表于 06-05 09:41 •472次阅读

名单公布！【书籍评测活动NO.33】做了50年软件开发，总结出60条经验教训，每一条都太扎心！

柯达公司工作了 18 年，曾担任过摄影研究科学家、软件开发人员、软件经理及软件过程和质量改进领导。Karl 拥有伊利诺伊大学的有机化学博士学位。 Karl 共著有

发表于 05-17 14:36

risc-v多核芯片在AI方面的应用

多核芯片在AI方面的应用具有广阔的前景和巨大的潜力。随着技术的不断进步和应用的深入，我们期待看到更多基于RISC-V多核芯片的AI解决方案在实际应用中得到验证和推广。

发表于 04-28 09:20

NVIDIA在加速识因智能AI大模型落地应用方面的重要作用介绍

本案例介绍了 NVIDIA 在加速识因智能 AI 大模型落地应用方面的重要作用。生成式大模型已广泛应用于各领域，通过学习人类思维方式，能快速挖掘海量内容，满足不同需求。

发表于 03-29 15:28 •668次阅读

搜索历史

70年来AI研究方面的苦涩教训：我们过于依靠人类知识了

评论

【书籍评测活动NO.55】AI Agent应用与项目实战

马斯克预言：AI将全面超越人类智力

AI在环境可持续发展方面的作用

名单公布！【书籍评测活动NO.51】具身智能机器人系统 | 了解AI的下一个浪潮！

雷迪埃已有70多年的历史，让我们来看看70年来的发展历程吧！

AI for Science：人工智能驱动科学创新》第4章-AI与生命科学读后感

《AI for Science：人工智能驱动科学创新》第二章AI for Science的技术支撑学习心得

名单公布！【书籍评测活动NO.44】AI for Science：人工智能驱动科学创新

罗杰·瑞迪:AI能力已远超我们人类

蓝牙模块在车载导航方面的应用知识分析

智谋纪 AI+Multi LED 打开人类健康新宝藏

学习串口屏需要了解哪些方面的知识

名单公布！【书籍评测活动NO.33】做了50年软件开发，总结出60条经验教训，每一条都太扎心！

risc-v多核芯片在AI方面的应用

NVIDIA在加速识因智能AI大模型落地应用方面的重要作用介绍