DeepMind部署自学AI 攻陷FPS“雷神之锤”-电子发烧友网

用AI攻占了国际象棋和围棋高地之后，DeepMind在第一人称射击游戏（FPS）上也有了新进展。

1997年5月“深蓝”击败国际象棋世界冠军卡斯巴罗夫，有玩家在庆幸，我不下象棋，只下围棋。

2017年5月AlphaGo打败围棋世界冠军柯洁，有玩家庆幸，还好，我不下棋。

2018年6月，OpenAI 人工智能在dota2 5V5模式中以4000分水平击败人类玩家，依旧有玩家庆幸，我不玩RPG（角色扮演）对战，我只玩FPS（第一人称射击）。

如今，FPS也被AI攻陷。

近日，DeepMind的研究人员在本周的《科学》杂志上发表了一篇论文，描述描述了一个完全无监督的自学程序，不仅能够学习如何玩“ Quake III Arena ”（雷神之锤III竞技场，一款第一人称射击游戏），还能设计出胜过人类团队的新颖战略。

国际象棋和围棋最初是用来模拟战争游戏的，但却对战争复盘的不好。因为这类游戏通常涉及一个或多个队友和敌人。而且一个优秀的战争游戏必然是三维展开。

DeepMind使用的AI叫For The Win（FTW），本质是用卷积神经网络直接通过屏幕上进行训练，屏幕数据会被传递到两个LSTM网络或能够学习长期依赖性的网络。这两个LSTM一个是在快速时间尺度上，另一个是在慢速时间尺度上运行。它们通过目标耦合，能够对游戏世界进行预测并通过模拟游戏控制器输出动作。

FTW总共训练了30个游戏角色，为他们提供了一系列队友和对手，并随机选择游戏阶段，以防止他们通过记忆惯性做出选择。每个角色都明确自己的奖励信号，从而拥有自己独特的目标（比如夺取旗帜）。此外，他们利用双层流程（two-tier process）来优化内部奖励，通过这些奖励加强学习，来制定最重要的游戏策略。每个角色都单独玩了大约450,000场比赛，相当于拥有大约四年的经验。

训练过后的FTW在地图，团队名单和团队规模选择方面都可以作出有利的选择。他们学习了类似人类的行为，例如跟随队友，在对手的基地露营，以及在一波攻击中捍卫他们自己的基地。而随着训练的进行，他们还学会避免人类玩家的一些弱点，比如过于关注队友的行为。

在一场有40名人类参加的比赛中，人类和AI在比赛中随机匹配（对手或队友），结果，AI大胜人类玩家，FTW的Elo评级（相当于获胜的概率）为1600，而最好的人类玩家也只有1300，人类玩家平均评级为1050。

伦敦全球大学计算机科学教授，DeepMind科学家Thore Graepel表示，这项工作显示了多智能体培训（multiagent）推动人工智能发展的潜力。这是人机交互和系统相互补充或协同工作的研究的一个重大进步。

AI训练思路

游戏分为两个阵营，两方的大本营在游戏时候开会随机设置在地图的两端。游戏中的玩家可以在游戏地图中“瞎逛”，借助地图中的建筑物、数目以及其他物品与玩家进行互动。

在游戏中，如果一方用激光击败了其他玩家，被击中的玩家丢掉旗帜，回大本营重生。

DeepMind采用的AI玩家会和人类有同样的视角，AI不知道其他玩家的信息，包括位置、状态等。另外这款游戏比其他棋牌游戏更能接近真实的战场。AI玩家从零开始，用强化学习训练，在游戏的开始，真实加入战场的AI角色是随机选择的，这会使得智能体的行为更能接近最初设置的策略目标。

每个智能体都能够为自己制定策略，这意味着不同角色会采用不同的战术，即不同AI玩家有不同的专攻方向。

当然，也会有限制，即在每1000次迭代后，系统会比较策略并评估整个团队在模仿与学习能力。如果一个智能体的获胜机会低于另一个智能体的70％，那么较弱的智能体会复制较强的智能体。同时，强化学习还要求AI通过其他指标的对比进行调整。

AI玩家在一开始就像一张白纸，研究人员给他们的目标不仅是游戏结束时候的得分，还要关注在游戏前期的得分。研究人员指出，如果奖励机制只和游戏结果有关（输/赢/平局），显然限制太少，导致学习效果非常不好，所以需要考虑动态的奖励机制，即根据游戏的点数流来变动。

当初始位置是随机生成时，AI通常击败人类玩家。即使人类已经练习了12个小时，他们仍然能够赢得25％的比赛，平局6%，剩下的是负。

然而，当两名职业游戏测试人员得到一张特别复杂的地图时，这张地图AI并没有见过。重新让AI在这张地图上训练的话，只需要6个小时的训练就能脱颖而出。

这一结果没有在论文说明，而是在向新闻界提供的一份补充文件中作了说明。

目前人们仍然可以在经过精心设计的定位战中击败AI，因为现实生活很少提供这样复盘重来的机会，毕竟淮海战役只能打一次！

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
30885

浏览量
269050
DeepMind

DeepMind

+关注

关注
0

文章
130

浏览量
10860

原文标题：Science最新：DeepMind部署自学AI，攻陷FPS“雷神之锤”

文章出处：【微信号：smartman163，微信公众号：网易智能】欢迎添加关注！文章转载请注明出处。

企业AI模型部署攻略

当下，越来越多的企业开始探索和实施AI模型，以提升业务效率和竞争力。然而，AI模型的部署并非易事，需要企业在多个层面进行细致的规划和准备。下面，AI部落小编为企业提供一份

发表于 12-23 10:31 •101次阅读

AI模型部署和管理的关系

AI模型的部署与管理是AI项目成功的两大支柱，它们之间既相互独立又紧密相连，共同推动着AI技术从实验室走向实际应用。

发表于 11-21 10:02 •152次阅读

如何在STM32f4系列开发板上部署STM32Cube.AI，

已下载STM32Cube.AI扩展包，但是无法使用，感觉像是没有部署AI模型，我是想要通过摄像头拍照，上传图像后，经过开发板处理器进行AI模型处理识别过后，告诉我识别结果，显示在TFL

发表于 11-18 09:39

NVIDIA与德勤共同部署适用于医疗健康的数字AI智能体

渥太华医院使用 NVIDIA AI 驱动的德勤 Frontline AI Teammate 来部署 AI 助手，以提供更好的患者体验并减轻管理负担。

发表于 11-13 11:37 •369次阅读

华迅光通AI计算加速800G光模块部署

，对人工智能服务器集群的需求也急剧上升。随着数据中心基础设施的不断扩大，光模块的使用量呈指数级增长。目前，200G和400G光模块已经大规模部署，800G光模块已经开始进入量产和引进阶段。为什么需要

发表于 11-13 10:16

企业AI模型部署怎么做

AI模型部署作为这一转型过程中的关键环节，其成功实施对于企业的长远发展至关重要。在此，AI部落小编为您介绍企业AI模型部署的步骤以及注意事项

发表于 11-04 10:15 •153次阅读

Arm推出GitHub平台AI工具，简化开发者AI应用开发部署流程

专为 GitHub Copilot 设计的 Arm 扩展程序，可加速从云到边缘侧基于 Arm 平台的开发。 Arm 原生运行器为部署云原生、Windows on Arm 以及云到边缘侧的 AI

发表于 10-31 18:51 •2083次阅读

Meta发布新AI模型自学评估器，探索减少人类参与度

近日，Facebook母公司Meta正式发布了一批来自其研究部门的新AI模型，其中一款名为「自学评估器」(Self-Taught Evaluator)的模型尤为引人注目。该模型或将成为降低AI开发

发表于 10-23 13:44 •300次阅读

谷歌DeepMind推出新一代药物研发AI模型AlphaFold 3

谷歌DeepMind公司近日重磅推出了一款名为AlphaFold 3的全新药物研发AI模型，这一创新技术将为科学家们提供前所未有的帮助，使他们能更精确地理解疾病机制，进而开发出更高效的治疗药物。

发表于 05-10 09:35 •396次阅读

NVIDIA推出OVX存储验证计划，加速AI部署

随着生成式AI的广泛应用，全球企业正积极寻求提升业务创新的途径。然而，复杂且耗时的IT基础设施部署成为阻碍企业快速启动AI工作负载的一大难题。

发表于 03-27 10:27 •401次阅读

120fps能否成为VR眩晕的“关键门槛”？

据悉，研究共招募了32位参与者，平均年龄介于18至51岁，男女比例均衡。每位参与者分别体验了60fps、90fps、120fps及180fps Hz的画面刷新率。实验数据表明，120

发表于 03-18 15:36 •784次阅读

使用CUBEAI部署tflite模型到STM32F0中，模型创建失败怎么解决？

看到CUBE_AI已经支持到STM32F0系列芯片，就想拿来入门嵌入式AI。生成的模型很小，是可以部署到F0上的，但是一直无法创建成功。查阅CUBE AI文档说在调用create

发表于 03-15 08:10

谷歌DeepMind推新AI模型Genie，能生成2D游戏平台

据报道，谷歌公司的DeepMind团队近期发布了AI模型Genie，此模型拥有多达110亿个参数，能够依据用户提供的图片及提示词创建出相当完整的2D游戏场景。

发表于 02-27 14:53 •781次阅读

谷歌DeepMind资深AI研究员创办AI Agent创企

近日，刚从谷歌DeepMind离职的资深AI研究员Ioannis Antonoglou宣布创办了一家名为“AI Agent”的创企。Ioannis Antonoglou常驻伦敦，此前曾担任谷歌

发表于 02-04 10:02 •791次阅读

谷歌DeepMind科学家欲建AI初创公司

据知情人士透露，谷歌人工智能部门DeepMind的两名杰出科学家Laurent Sifre和Karl Tuyls正在与投资者商讨在巴黎成立一家新的人工智能初创公司的事宜。

发表于 01-22 14:41 •494次阅读

搜索历史

DeepMind部署自学AI 攻陷FPS“雷神之锤”

评论