0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌AI发布足球游戏强化学习训练环境“足球引擎”

DPVg_AI_era 来源:lq 2019-06-15 10:33 次阅读

继围棋、Dota和星际争霸后,AI进军体育游戏了!近日,谷歌AI发布足球游戏强化学习训练环境“足球引擎”,智能体经过由易到难的强化学习自我比赛训练,成功完成跑动配合、防守反击、二过一、门前抢点得分等高级行为。足球游戏“虐电”要成为历史了吗?

强化学习(RL)的目标是培养能够与环境互动并解决复杂任务的智能体,开发出机器人技术的更多实际应用。近年来,让智能体玩游戏,如标志性的Atari主机游戏、围棋游戏,专业视频游戏等,如Dota 2或《星际争霸2》,推动了这一领域的快速发展。所有这些游戏都提供了极具挑战性的训练环境,可以以安全、可重复的方式快速测试新的算法和理念。

对于强化学习来说,足球类游戏尤其具有挑战性,因为智能体需要在短期内学会控制、学习陌生概念(比如传球),并在高水平的不同战略之间实现自然平衡。

为此,Google AI 发布了一个新的强化学习环境Google Research Football Environment,智能体的目标是掌握世界上最受欢迎的体育项目——足球。该环境以流行的足球视频游戏为模型,提供基于真实的3D足球模拟,由智能体控制球队中的一个或所有球员,学习如何传球,并设法突破对方的防守取得进球。这个环境由几个关键部分组成:高度优化的游戏引擎、一系列严格的基准,以及由易变难的强化学习场景。为了便于研究,我们在Github上发布了基础开源代码的测试版。

强化学习“足球引擎”:真实模拟足球场上常见场景事件

该强化学习环境的核心是一种先进的足球游戏模拟,称为“足球引擎”,它基于一个足球游戏版本经大量修改而成。根据两支对方球队的输入动作,模拟了足球比赛中的常见事件和场景,包括进球、犯规、角球和点球、越位等。“足球引擎”采用高度优化的C++代码编写,可以在现有的计算机上运行,无论是否依赖GPU渲染都可以运行。在单CPU六核计算机上的运行速度可以达到每天约2500万步。

“足球引擎”是一种先进的足球游戏环境模拟,支持所有主要的足球比赛规则,如开球(左上),进球(右上),犯规,出牌(左下),角球和点球(右下)和越位。

此外,该引擎还具备了针对强化学习的更多功能。首先,引擎可以从不同的状态表示中学习,包括玩家位置之类的语义信息,也可以从原始像素进行学习。其次,为了研究随机性对游戏的影响,可以在随机模式(默认设置即为随机模式)下运行,在该模式下,环境和对手AI动作中都存在随机性,而在确定模式中不存在随机性。第三,开箱即用,与广泛使用的OpenAI Gym API 兼容。研究人员可以通过使用键盘或游戏手柄与智能体对战,来获得对游戏的感觉。

训练基准:由易到难,进球和带球近门都有奖励

通过基准测试,研究人员为基于足球引擎的强化学习研究设立了一系列基准问题,其目标是针对固定的基于规则的对手进行“标准”的足球游戏,这些对手是为此而手工设计的。我们提供三个版本的基准:简单、普通和困难,实力由弱到强。

作为参考,本研究提供了两种最先进的强化学习算法的基准测试结果:DQN和IMPALA,它们既可以在一台机器上的多个进程中运行,也可以在多台机器上同时运行。我们针对两种奖励设置进行了研究,第一种设置提供的唯一奖励是取得进球。第二种设置为智能体将球移动至球门附近提供额外的奖励。

研究结果表明,简单模式下的基准测试似乎更适用于单机版算法的研究,困难模式的基准即使对于大规模分布式强化学习算法而言也具有很大的挑战性。基于环境的性质和基准测试的难度,我们期望这些测试和环境可用于研究当前的科学难题,例如样本有效的强化学习、稀疏奖励,或基于模型的强化学习等。

不同基线的不同难度级别的智能体的测试结果。对于简单模式基准测试的对手,DQN智能体训练2000万步即可战胜,而要战胜中等和困难模式的对手需要使用大规模分布式算法,如IMPALA,需要训练2亿步。

未来方向:从自训练到适应对手

为了完成完整的足球策略训练,研究人员还提供了“足球学院”,提供各种测试难度的多个场景。研究人员可以探索新的研究思路,测试更高级的概念,并为课程学习研究思路提供基础。

智能体可以从由易到难的场景中学习。“足球学院”场景示例包括,智能体必须学习如何在球员之间快速传接球,并学习如何进行防守反击。研究人员可以使用简单的API,进一步自定义场景并训练智能体解决更多问题。

由上至下:(1)一个成功的进攻策略,迎球跑动,面对门将射门得分。(2)策动并完成一次漂亮的反击。(3)应对前场2打1的简单方式。(4)角球后门前抢点得分。

此次提出的足球游戏智能体训练基准遵循的是标准的强化学习设置,由智能体与固定的对手竞争,竞争对手被视为环境的一部分。而实际上,足球是一个双方的游戏,是两个不同的球队之间的竞争,一方必须要适应对方的行动和战略。我们为研究这种环境提供了独特的机会,一旦我们完成了自游戏的测试,就可以进一步研究更多更有趣的测试环境。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6164

    浏览量

    105314
  • AI
    AI
    +关注

    关注

    87

    文章

    30763

    浏览量

    268909
  • 强化学习
    +关注

    关注

    4

    文章

    266

    浏览量

    11250

原文标题:FIFA变身AI主场:谷歌推出强化学习“足球引擎”完爆人类玩家

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    蚂蚁集团收购边塞科技,吴翼出任强化学习实验室首席科学家

    近日,专注于模型赛道的初创企业边塞科技宣布被蚂蚁集团收购。据悉,此次交易完成后,边塞科技将保持独立运营,而原投资人已全部退出。 与此同时,蚂蚁集团近期宣布成立强化学习实验室,旨在推动大模型强化学习
    的头像 发表于 11-22 11:14 568次阅读

    如何使用 PyTorch 进行强化学习

    强化学习(Reinforcement Learning, RL)是一种机器学习方法,它通过与环境的交互来学习如何做出决策,以最大化累积奖励。PyTorch 是一个流行的开源机器
    的头像 发表于 11-05 17:34 281次阅读

    谷歌AlphaChip强化学习工具发布,联发科天玑芯片率先采用

    近日,谷歌在芯片设计领域取得了重要突破,详细介绍了其用于芯片设计布局的强化学习方法,并将该模型命名为“AlphaChip”。据悉,AlphaChip有望显著加速芯片布局规划的设计流程,并帮助芯片在性能、功耗和面积方面实现更优表现。
    的头像 发表于 09-30 16:16 419次阅读

    AI引擎机器学习阵列指南

    AMD Versal AI Core 系列和 Versal AI Edge 系列旨在凭借 AI 引擎机器学习 ( ML ) 架构来提供突破性
    的头像 发表于 09-18 09:16 390次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>引擎</b>机器<b class='flag-5'>学习</b>阵列指南

    谷歌发布革命性AI游戏引擎GameNGen

    谷歌近期震撼推出全球首款完全由人工智能驱动的游戏引擎——GameNGen,这一创新技术标志着游戏开发领域的新纪元。GameNGen凭借其强大的计算能力,能够在单个TPU上实现每秒20帧
    的头像 发表于 08-29 18:07 881次阅读

    谷歌研究人员推出革命性首个AI驱动游戏引擎

    在科技日新月异的今天,人工智能(AI)正以前所未有的速度渗透到我们生活的每一个角落,从自动驾驶汽车到智能家居,无一不彰显着其巨大的潜力和无限可能。而最近,谷歌研究团队的一项突破性成果更是将AI的边界
    的头像 发表于 08-29 17:21 530次阅读

    苹果AI模型训练新动向:携手谷歌,未选英伟达

    近日,苹果公司发布的最新研究报告揭示了其在人工智能领域的又一重要战略选择——采用谷歌设计的芯片来训练AI模型,而非行业巨头英伟达的产品。这一决定在业界引起了广泛关注,尤其是在当前英伟
    的头像 发表于 08-01 18:11 918次阅读

    苹果承认使用谷歌芯片来训练AI

    苹果公司最近在一篇技术论文中披露,其先进的人工智能系统Apple Intelligence背后的两个关键AI模型,是在谷歌设计的云端芯片上完成预训练的。这一消息标志着在尖端AI
    的头像 发表于 07-30 17:03 728次阅读

    Python在AI中的应用实例

    Python在人工智能(AI)领域的应用极为广泛且深入,从基础的数据处理、模型训练到高级的应用部署,Python都扮演着至关重要的角色。以下将详细探讨Python在AI中的几个关键应用实例,包括机器
    的头像 发表于 07-19 17:16 1062次阅读

    谷歌借助Gemini AI系统深化对机器人的训练

    7月12日,国际科技界传来新动态,谷歌正借助其先进的Gemini AI系统,深化对旗下机器人的训练,旨在显著提升它们的导航能力和任务执行能力。DeepMind机器人团队最新发布的研究论
    的头像 发表于 07-12 16:29 628次阅读

    智能传感器改变欧洲杯,让现代足球更智能

    最近什么最火,话题最热 那肯定是欧洲杯啊! 欧洲杯如火如荼的进行着,这段时间各位小主们是不是都开始作息颠倒,为自己支持的球队呐喊助威呢! 小编我也是一个十足的足球爱好者,心中也有着一个足球梦, 黑马
    的头像 发表于 07-12 09:45 1895次阅读
    智能传感器改变欧洲杯,让现代<b class='flag-5'>足球</b>更智能

    晶科能源与曼城足球俱乐部达成全球合作伙伴关系

          全球领先的光伏及储能系统供应商——晶科能源宣布与曼城足球俱乐部达成为期数年的全球合作伙伴关系。 晶科能源将通过此次合作进一步扩大其品牌在全球范围的影响力。同时,曼城足球俱乐部也将在
    的头像 发表于 06-12 16:35 595次阅读

    通过强化学习策略进行特征选择

    更快更好地学习。我们的想法是找到最优数量的特征和最有意义的特征。在本文中,我们将介绍并实现一种新的通过强化学习策略的特征选择。我们先讨论强化学习,尤其是马尔可夫决策
    的头像 发表于 06-05 08:27 349次阅读
    通过<b class='flag-5'>强化学习</b>策略进行特征选择

    体育与TDK:使足球运动越来越狂热的VAR系统和传感器技术

    足球是一项受欢迎的运动,在世界范围内拥有着非常多的运动员和观众。由FIFA (国际足球联合会) 主办的世界杯每4年举办一次,是全球32支球队 (2026年48支球队) 聚集在一起,角逐足球冠军的大赛。
    的头像 发表于 03-27 14:19 793次阅读
    体育与TDK:使<b class='flag-5'>足球</b>运动越来越狂热的VAR系统和传感器技术

    谷歌模型训练软件有哪些功能和作用

    谷歌模型训练软件主要是指ELECTRA,这是一种新的预训练方法,源自谷歌AI。ELECTRA不仅拥有BERT的优势,而且在效率上更胜一筹。
    的头像 发表于 02-29 17:37 783次阅读