一种新型的机器学习算法刚刚攻克了一些对人工智能来说非常困难的电子游戏-电子发烧友网

在蒙特祖玛的复仇（Montezuma's Revenge）和玛雅人的冒险（Pi tfall!）这两款游戏里，如果有一个算法能记住游戏里的探索过程，那么这个算法就能帮助计算机和机器人更好地学习和适应真实世界。

由怀俄明大学的副教授 Jeff Clune 领导，来自优步在旧金山的人工智能研究团队，提供了一种新型的机器学习算法刚刚攻克了一些对人工智能来说非常困难的电子游戏。

（图片来源：麻省理工科技评论）

熟悉的人知道，人工智能算法已经在古老、优雅的策略游戏——围棋中击败了世界上最优秀的人类选手，围棋已经是是可以想象到的最困难的游戏之一。但是，来自上个世纪的 8 位计算机游戏时代的两个经典像素游戏——蒙特祖玛的复仇和玛雅人的冒险，一直困扰着人工智能研究人员。

这看似矛盾的背后其实是有原因的。蒙特祖玛的复仇和玛雅人的冒险虽然看似简单，但对本来就擅长征服电子游戏的强化学习来说仍是一大挑战。DeepMind 是谷歌母公司 Alphabet 的子公司，专注于人工智能领域，以其算法能够以专业玩家的水准来学习几个经典的电子游戏的而著名。强化学习算法在大多数游戏里效果都不错，因为它们可以根据正反馈（得分升高）调整他们的行为。强化学习的成功使人们产生了希望，认为人工智能算法可以自己教会自己做各种有用的事情，而这目前对机器来说是不可能做到的。

蒙特祖玛的复仇和玛雅人的冒险的问题是所需要的奖励（rewards）信号很少。两个游戏都涉及典型场景：主角要探索充满致命生物和陷阱的方块世界，在游戏中许多所必需的行为都无助于提高分数，只在长时间完成特定的一系列动作之后才会收到奖励信号。普通的强化学习算法甚至过不去蒙特祖玛的复仇和玛雅人的冒险的第一关，他们得分完全为零。

但是来自优步在旧金山的人工智能研究团队的算法，在一个给算法提供线索很少的环境中展示了一种完全不同的机器学习方法。这种方法引出了一些有趣的实际应用，Clune 和他的团队在 11 月 26 日发布的博客文章中写道，这可能可以应用在机器人学习中。这是因为未来的机器人需要弄清楚在一个只提供较少的奖励的复杂的环境中应该做些什么。

Uber 于 2016 年 12 月建立人工智能实验室，其目标是实现可能对其业务有用的基础性突破。更好的强化学习算法最终可用于自动驾驶和优化车辆路线等项目上。

很多人工智能研究人员经常通过指导强化学习算法不定时随机探索、同时为探索过程增加奖励——也就是所谓的”内在动机”（intrinsic motivation), 来试图解决蒙特祖玛的复仇与玛雅人的冒险遇到的问题。

但 Uber 的研究人员认为，这种方法忽略了人类探索好奇心的一个重要角度。“我们认为目前的”内在动机”算法的一个主要弱点是 detachment，”他们写道，“算法忘记了他们访问过的有价值的区域，他们不会回到那些区域，看看是否会产生新的状态。”

该团队设计了新的强化学习算法，称为 Go-Explore，这种算法可以记住之前的状态，并会在随后返回特定区域或重复特定任务，看看这样做是否会使效果变好。研究人员还发现，通过让人类玩家突出有趣或重要的区域来增加一些领域信息时，可以大大加快算法的学习过程。这一过程非常重要，因为在真实环境中，有很多情况是需要算法和人一起工作来解决一项艰巨的任务的。

他们的算法在蒙特祖玛的复仇中平均得分为 400,000 分——比人类玩家的平均值高出一个数量级。在玛雅人的冒险游戏中，平均得分为 21,000，同样远远超过大多数人类玩家。

“这些结果令人印象深刻，”研究强化学习的斯坦福大学助理教授 Emma Brunskill 说，“令人惊讶和兴奋的是，这些算法产生了如此巨大的优势。”

其他人工智能研究人员也一直在努力攻克这些电子游戏。10 月，旧金山的非营利组织——OpenAI 的一个团队，展示了一种能够在蒙特祖玛的复仇游戏中取得重大进展的算法。

就在最近，斯坦福大学的 Brunskill 小组在玛雅人的冒险游戏方面也取得了一些的进展，他们使用的方法与 Uber 团队类似。

现在人工智能算法可以解决这些视频游戏，真正的挑战是从街机游戏中脱离出来，解决现实问题。

Brunskill 同意这种算法可能对机器人技术产生重大影响。但是她表示，在其他现实世界的情况中，特别是那些涉及人类行为建模的情况，要远远困难得多。“想看看这种方法对于更复杂的环境表现的如何，这将非常有趣，”她说。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

机器人

机器人

+关注

关注
210

文章
28268

浏览量
206729
算法

算法

+关注

关注
23

文章
4604

浏览量
92712
机器学习

机器学习

+关注

关注
66

文章
8386

浏览量
132475

原文标题：Uber公司设计新型AI算法，有望对机器人工作产生巨大影响

文章出处：【微信号：IEEE_China，微信公众号：IEEE电气电子工程师】欢迎添加关注！文章转载请注明出处。

NPU与机器学习算法的关系

在人工智能领域，机器学习算法是实现智能系统的核心。随着数据量的激增和算法复杂度的提升，对计算资源

发表于 11-15 09:19 •361次阅读

嵌入式和人工智能究竟是什么关系?

嵌入式和人工智能究竟是什么关系? 嵌入式系统是一种特殊的系统，它通常被嵌入到其他设备或机器中，以实现特定功能。嵌入式系统具有非常强的适应性和灵活性，能够根据用户需求进行定制化设计。它

发表于 11-14 16:39

人工智能、机器学习和深度学习存在什么区别

人工智能指的是在某种程度上显示出类似人类智能的设备。AI有很多技术，但其中一个很大的子集是机器学习——让

发表于 10-24 17:22 •2466次阅读

《AI for Science：人工智能驱动科学创新》第6章人AI与能源科学读后感

、优化等方面的应用有了更清晰的认识。特别是书中提到的基于大数据和机器学习的能源管理系统，通过实时监测和分析能源数据，实现了能源的高效利用和智能

发表于 10-14 09:27

AI for Science：人工智能驱动科学创新》第4章-AI与生命科学读后感

很幸运社区给我一个阅读此书的机会，感谢平台。《AI for Science：人工智能驱动科学创新》第4章关于AI与生命科学的部分，为我们揭示了人工智能技术在生命科学领域中的广泛应用和

发表于 10-14 09:21

《AI for Science：人工智能驱动科学创新》第二章AI for Science的技术支撑学习心得

非常高兴本周末收到一本新书，也非常感谢平台提供阅读机会。这是一本挺好的书，包装精美，内容详实，干活满满。关于《AI for Science：人工

发表于 10-14 09:16

《AI for Science：人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

人工智能：科学研究的加速器第一章清晰地阐述了人工智能作为科学研究工具的强大功能。通过机器学习

发表于 10-14 09:12

risc-v在人工智能图像处理应用前景分析

与人工智能推荐系统中强大的图形处理器（GPU）一争高下。其独特的设计使得该处理器在功耗受限的条件下仍能实现高性能的图像处理任务。 Ceremorphic公司：该公司开发的分层学习处理器结合了

发表于 09-28 11:00

名单公布！【书籍评测活动NO.44】AI for Science：人工智能驱动科学创新

活的世界？编辑推荐《AI for Science：人工智能驱动科学创新》聚焦于人工智能与材料科学、生命科学、电子科学、能源科学、环境科学五大领域的交叉融合，通过深入浅出的语言和诸多实际应用案例，介绍

发表于 09-09 13:54

FPGA在人工智能中的应用有哪些？

FPGA（现场可编程门阵列）在人工智能领域的应用非常广泛，主要体现在以下几个方面：一、深度学习加速训练和推理过程加速：FPGA可以用来加速深度学

发表于 07-29 17:05

机器视觉和人工智能的关系与应用

机器视觉和人工智能的关系是一个广泛而深入的话题，涉及到计算机科学、电子工程、光学、图像处理、模式识别等多个领域。一、

发表于 07-16 10:27 •814次阅读

名单公布！【书籍评测活动NO.35】如何用「时间序列与机器学习」解锁未来？

的火热，全球金融市场的金融时间序列（如黄金价格、股票、期货等）也应用以深度学习（DL）为首的现代人工智能模型不断进行分析和预测。越来越多的专业和非专业公司，以及一些主要金融机构（银行、基金、

发表于 06-25 15:00

机器学习怎么进入人工智能

，人工智能已成为一个热门领域，涉及到多个行业和领域，例如语音识别、机器翻译、图像识别等。在编程中进行人工智能的关键是使用机器

发表于 04-04 08:41 •279次阅读

FPGA在深度学习应用中或将取代GPU

提供商外，英伟达还成立了专业的人工智能研究实验室。不过，机器学习软件公司 Mipsology 的首席执行官兼联合创始人卢多维奇•拉祖尔 (Ludovic Larzul) 表示，GPU 还存在着

发表于 03-21 15:19

嵌入式人工智能的就业方向有哪些?

嵌入式人工智能的就业方向有哪些? 在新一轮科技革命与产业变革的时代背景下，嵌入式人工智能成为国家新型基础建设与传统产业升级的核心驱动力。同时在此背景驱动下，众多名企也纷纷在嵌入式

发表于 02-26 10:17

搜索历史

一种新型的机器学习算法刚刚攻克了一些对人工智能来说非常困难的电子游戏

评论

NPU与机器学习算法的关系

嵌入式和人工智能究竟是什么关系?

人工智能、机器学习和深度学习存在什么区别

《AI for Science：人工智能驱动科学创新》第6章人AI与能源科学读后感

AI for Science：人工智能驱动科学创新》第4章-AI与生命科学读后感

《AI for Science：人工智能驱动科学创新》第二章AI for Science的技术支撑学习心得

《AI for Science：人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

risc-v在人工智能图像处理应用前景分析

名单公布！【书籍评测活动NO.44】AI for Science：人工智能驱动科学创新

FPGA在人工智能中的应用有哪些？

机器视觉和人工智能的关系与应用

名单公布！【书籍评测活动NO.35】如何用「时间序列与机器学习」解锁未来？

机器学习怎么进入人工智能

FPGA在深度学习应用中或将取代GPU

嵌入式人工智能的就业方向有哪些?