0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DeepMind AI以总比分 2:0 分别战胜两位职业人类选手

电子工程师 来源:lq 2019-01-28 09:30 次阅读

刚刚,在更复杂的《星际争霸 II》游戏中,DeepMind AI 以总比分 2:0 分别战胜两位职业人类选手。这或许是自 2017 年 AlphaGo 在围棋上战胜人类后,再次让人类刷新 AI 认知的人机大战。

此次与人类对战的 AI 是 AlphaGo 兄弟:AlphaStar。开赛前几个小时,DeepMind CEO 在 Twitter 上公布了这一名字。而在开赛前一天,DeepMind 宣布 AI 将与人类在《星际争霸 II》中公开对战的消息,并表示在《星际争霸 II》游戏的疯狂难度模式下,其 AI 的胜率为 50%。

需要说明的是,正如之前打 Dota 的 OpenAI 受到的降低反应速度一样,DeepMind 此次将 AlphaStar 的反应速度“限制”到 APM 280,大致相当于星际中等职业玩家的水平。就 AlphaStar 的表现来看,虽然最终在现场 PK 时输了最后一局比赛,但整体上还是完虐人类。

比赛开始,与 AlphaStar 对战的第一个职业选手是 TLO,其世界排名为第 68 位。此次人机大战是五局三胜制,TLO 虽然不是顶级星际选手,但让人足够惊叹的是,AlphaStar 最终在约五十分钟内结束战斗,以 3:0 的成绩获胜,人类职业选手似乎毫无还手之力。

先来简单回顾下人机大战第一场:AlphaStar 第一局一开始就表现的很有全局观,在 PvP 两矿打一矿的情况下,TLO 很快被击败;第二局一度打得很焦灼,但 AlphaStar 依然以 2:0 再赢一局;十分钟后,TLO 溃败给 AlphaStar,有网友说选手太初级,批评 TLO 作为职业选手在瞎打,没有尊重熬夜看人机大赛的观众。不过,也有人说 AI 很可怕。

如果说第一回合 AlphaStar 战胜的是“初级”选手,那随后与其对战的职业选手是世界排名第 19 位的 MaNa ,其职业水平至少是中上游。

上图显示的是 AlphaStar 的决策过程,具体比赛过程就不说了,结果是 MaNa 在大约 45 分钟内连输五局被 AlphaStar 斩落马下。

前一个职业选手 TLO 在 MaNa 输掉比赛后称,“相信我, 和一个像 AlphaStar 这样的对手比赛是非常困难的, 它的打法和人类完全不同,是你以前从未有过的经验。 AlphaStar 给人留下了极深的印象, 这在游戏 AI 中也是前所未有的。"

AlphaStar 遇神杀神,干脆利落。这次应该没人责怪 MaNa 打得不好,他显然拼尽了全力,而网友发出的慨叹是希望终结者不会来那么快。

但最后一局让网友们为人类命运紧张的情绪稍稍放松,与 MaNa 现场对战的 AlphaStar 一着不慎,让 MaNa 扳回一局,但最终以 1:5 输掉比赛。

AlphaStar 的来历

早在 2016 年,谷歌 DeepMind 的 AI 研究人员已经开始关注暴雪娱乐的《星际争霸 II》。通过游戏来确定 AI 是否可以胜过人类相对简单的复杂任务是 DeepMind 的研究人员长期以来都在尝试的项目。同年 11 月,DeepMind 曾在暴雪嘉年华上宣布与暴雪达成合作协议,将在《星际争霸》系列游戏中进行合作,将在游戏平台中引入机器学习方法,进行人工智能研究。

2017 年 8 月,Deepmind 与暴雪共同发布了合作计划的首个成果:基于《星际争霸 II》的人工智能研究环境 SC2LE,它允许研究者在 Linux 系统中接入游戏 API,开放了 65000 场比赛的数据缓存用于训练 AI,并将添加 50 万场游戏数据到缓存中。

2018 年,同样在暴雪嘉年华上,他们分享了人工智能模型在《星际争霸》游戏中的突破。人工智能模型能执行基本的宏观战略,还能防御像 Tower Rush 这样的激进战术。而刚刚结束的“星际争霸”赛则是是一项“重大挑战”,因为这要求 AI 智能体“实现和平衡一些子目标”,以便最终击败人类选手。

例如,虽然游戏的目标是击败对手,但玩家还必须考虑平衡多个子目标,比如收集资源(水晶和气矿)或建筑。此外,一场比赛的时间通常为几分钟到一小时不等,这意味着游戏中提早执行的行动会在很长时间不见成效。最后,由于玩家智能看到部分地图,这意味着智能体必须结合记忆与规划才能成功。

AlphaStar 背后的 AI 技术

在围棋任务中,对手间可以看到整个棋盘,但《星际争霸 II》与此不同,我们通常无法看到整个地图,需要派小兵出去侦查。而且游戏是不间断进行的,整个游戏甚至会有超过 5000 步的操作。

DeepMind 科学家 Oriol Vinyals 曾在去年的一场以《AI 对战星际争霸胜算几何?》的演讲中提到,这个游戏基本上就是建造一些建筑物以及单位,在同一个地图里与不同的组织相互竞争。在这个游戏中,哪怕只是建造建筑物,也需要做出许多决策。除此之外,他们还要不断收集和利用资源、建造不同的建筑物、不断扩张,因此整个游戏非常具有挑战性。

他们在这个游戏中使用的方法依旧是强化学习。他们要让 AI 模仿人类玩这个游戏的方式,但即使是模仿人类点击鼠标和敲击键盘的行为也非常困难,需要收集整个《星际争霸》玩家的行为进行分析。为此还引入了一个游戏引擎。

DeepMind 还为游戏过程设计了不同的指令和模式,这使得整个玩《星际争霸》的过程变得独一无二。如今,我们看到的 AlphaStar 正是上述想法的结晶。

现在的 AlphaStar 还是刚出生的婴幼儿,不过以其极快的进化速度,你也能想到日后的进化版会是多么无可匹敌。到现在,或许还有很多人期待 2 月 15 日 AlphaStar 与世界排名第一的 Serral 进行终极对决,但最终的结果可想而知。正如柯洁输给 AlphaGo 时面临的绝望一样,人类可能不愿意面对这样的现实:在更多复杂的场景中,人类可能正以难以想象的速度输给 AI。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    31845

    浏览量

    270674
  • 机器学习
    +关注

    关注

    66

    文章

    8453

    浏览量

    133166
  • DeepMind
    +关注

    关注

    0

    文章

    131

    浏览量

    10985

原文标题:2:0!谷歌 AI “AlphaStar“ 虐杀职业星际玩家

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    什么叫两位三通电磁阀,两位三通电磁阀在工业自动化的应用

    两位三通电磁阀是指具有个工作位置和三个通道的电磁阀。通常,这种电磁阀的工作位置包括常闭和常开种。当电磁阀处于常闭位置时,其中一个通道与另外个通道相连,而当电磁阀处于常开位置时
    的头像 发表于 01-17 14:30 357次阅读
    什么叫<b class='flag-5'>两位</b>三通电磁阀,<b class='flag-5'>两位</b>三通电磁阀在工业自动化的应用

    谷歌加速AI部门整合:AI Studio团队并入DeepMind

    近日,谷歌正紧锣密鼓地推进其人工智能(AI)部门的整合工作。据谷歌AI Studio主管Logan Kilpatrick在领英页面上的透露,谷歌已将AI Studio团队整体转移至DeepMi
    的头像 发表于 01-13 14:40 291次阅读

    【书籍评测活动NO.55】AI Agent应用与项目实战

    的一些日程预测性地调整了今天的工作安排。 在近日的Agent OpenDay上,智谱AI展示了在AI Agent(智能体)方面最新成果,发布了用AI替代人类执行任务的三款智能体,
    发表于 01-13 11:04

    通过SPI向TLV5614输入数字信号,修改串行数据前两位去同时使用路输出管脚时只有一路管脚是正常的,为什么?

    数据前两位(输出通道选择)去同时使用路输出管脚时,却发现只有一路管脚是正常的,而另外一只管脚的信号完全是0。这个问题困扰我很长时间了,我测过从SPI出来的信号,是正确的;我把芯片的
    发表于 01-07 06:10

    ADC量化位数只有两位,将采样结果做FFT分析后,发现二次谐波的幅度最大,请教是什么原因造成的?

    如题,ADC量化位数只有两位,将采样结果做FFT分析后,发现二次谐波的幅度最大,请教是什么原因造成的?
    发表于 12-26 06:23

    INA226并联电压反馈的十六进驻数据后两位FF不会变化吗?

    来说是比25FF大一点的数据,比如26XX什么的,可是只有我设定值达到1.02A是才能得到26FF。换句话说,INA226并联电压反馈的十六进驻数据后两位FF不会变化吗?小弟表述的不是太好,请各位大侠见谅。
    发表于 12-18 08:21

    AI智能体逼真模拟人类行为

    近日,据外媒最新报道,斯坦福大学、华盛顿大学与Google DeepMind的科研团队携手合作,成功开发出一种能够高度逼真模拟人类行为的AI智能体。 该智能体的构建得益于研究团队将详细的访谈记录
    的头像 发表于 11-26 10:24 505次阅读

    2TB内置机械硬盘的适用场景有哪些

    给电脑加装内置硬盘,是实现电脑存储空间自由立竿见影的一步,尤其是2TB内置机械硬盘,以其充足容量和出色的性价比,是个人用户和职业人士储存海量数据的首选。
    的头像 发表于 08-30 10:26 743次阅读

    NVIDIA黄仁勋和Meta马克·扎克伯格探讨开源AI的变革潜力

    两位领导者在 SIGGRAPH 2024 大会上探讨开源 AI 的变革潜力,推出 AI Studio,并互换皮夹克。
    的头像 发表于 08-13 16:24 665次阅读

    宜科FX20系列分布式I/O再添两位新成员

    宜科FX20系列分布式I/O再添两位新成员:四通道IO-Link主站模块和单通道脉冲输出模块。这款功能模块都是基于对IP20可扩展I/O市场的不同应用场景,为不同的行业应用带来更多的I/O解决方案。
    的头像 发表于 07-25 15:50 597次阅读

    三菱plcFx2N2AD可以接个压力传感器吗

    个不同压力点的监测和控制。本文将详细介绍三菱PLC FX2N-2AD接入个压力传感器的实现方法和注意事项。 概述 三菱PLC FX2N-2AD具有个模拟输入通道,
    的头像 发表于 06-20 10:13 897次阅读

    LTC2144-14个通道的最低两位都失效的原因?

    ;b01010101010101到14'b10101010101010之间相互切换。 但是实际调试时发现一下异常(本人确认引脚连接正常): 1.通道1的最低两位一直是2‘b11,其余12都正常. 1.通道
    发表于 05-28 07:39

    谷歌DeepMind推出新一代药物研发AI模型AlphaFold 3

    谷歌DeepMind公司近日重磅推出了一款名为AlphaFold 3的全新药物研发AI模型,这一创新技术将为科学家们提供前所未有的帮助,使他们能更精确地理解疾病机制,进而开发出更高效的治疗药物。
    的头像 发表于 05-10 09:35 467次阅读

    谷歌DeepMind推出SIMI通用AI智能体

    近日,谷歌的DeepMind团队发布了其最新研究成果——SIMI(Scalable Instructable Multiworld Agent),这是一个通用人工智能智能体,能够在多种3D虚拟环境
    的头像 发表于 03-18 11:39 1087次阅读

    谷歌DeepMind推新AI模型Genie,能生成2D游戏平台

    据报道,谷歌公司的DeepMind团队近期发布了AI模型Genie,此模型拥有多达110亿个参数,能够依据用户提供的图片及提示词创建出相当完整的2D游戏场景。
    的头像 发表于 02-27 14:53 866次阅读