0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

OpenAI“里程碑”的含金量到底高不高?

DPVg_AI_era 来源:未知 作者:李倩 2018-07-03 09:37 次阅读

上周,OpenAI Five击败DOTA2业余人类玩家,轰动游戏圈和AI圈,连比尔·盖茨都忍不住发推特点赞,称之为“里程碑事件”。这个事件对业界带来的影响有多大?技术含量有多高?新智元采访了数位国内外专家,他们并不全都赞同“里程碑”的观点。

上周,OpenAI自学习多智能体5v5团队战击败DOTA2业余人类玩家,成为轰动人工智能圈的一件大事。

这个事件的意义,不仅仅局限于AI“攻克”星际争霸或者Dota这样的复杂电子竞技游戏,而是代表着AI在决策智能上的能力大幅向前推进。

对于这件事,比尔·盖茨也发推文称赞:这是一件大事,因为它们的胜利需要团队合作和协作——这是推进人工智能的一个巨大里程碑。

不过,也有观点认为OpenAI这个“里程碑”只是在算力上的巨大胜利,并没有在算法上创新,他们只是扩展了已有的方法。

OpenAI“里程碑”的含金量到底高不高?

先来看技术:强化学习能够进行大但是可实现规模的长期规划

OpenAI Five之所以战胜DOTA2的业余选手,成为比尔·盖茨眼里的里程碑事件,主要原因在于它使用“近端策略优化”(PPO)的扩展版算法,在256个GPU和128000个CPU内核上进行训练。每个英雄都使用单独的LSTM,不使用人类数据,最终AI能够学会识别策略。

这种做法表明,强化学习能够进行大但却可实现规模(large but achievable scale)的长期规划,而不发生根本性的进展。

国内首家决策智能公司启元世界研究科学家、香港科技大学彭鹏博士认为,从Dota2中展现出来的群体智能来看,OpenAI Five无论从对整体局势的判断还是对局部战场的应对,都展现了很高的智能决策能力。

整体战略上,通过前期给辅助英雄一定的资源,让辅助英雄可以通过gank和push帮助队伍快速进入中期阶段,加快并试图掌握游戏节奏;能够快速集结起部分队员进行连续有效的gank;集中push敌方优势路和中路,逼迫对方在较难防守的位置交战。在团战中,对切入时机、距离控制、英雄的职责分配、集火目标选择和多种装备的灵活运用做的非常到位。

最令人惊讶的是,OpenAI Five直接在微操级别的动作空间中进行探索和学习,仅仅通过几天的训练就达到了上述的效果。虽然有12800 CPU cores和256 P100 GPU的加持,这一结果足以使大家对深度强化学习有更强的信心。

此外,尽管当前版本的OpenAI Five的补兵能力表现不佳,但它在选择优先攻击目标上已经达到专业水平。获得长期回报往往需要牺牲短期回报,例如发育后的金钱,因为团推时也需要耗费时间。这表明系统真正在进行长期的优化。

(关于更具体的实现过程,新智元此前有详细报道,读者可移步新智元知乎专栏阅读:

https://zhuanlan.zhihu.com/p/38499219)

OpenAI自有过人之处,Smerity高度评价

彭鹏博士认为,从技术角度来讲,OpenAI Five延续了OpenAI在1v1中所采用的建模方式,相比Deepmind主打的端到端学习(end-to-end learning),OpenAI Five直接使用语义信息作为模型的输入,极大地降低模型训练所需的计算力,这算是一个新进展。

另外,OpenAI Five也在reward function的构造也很有特色,在个人reward和团队reward之间做了很好的平衡;模型会在训练前期重视优化个人reward,而在训练后期开始注重团队reward。最后,OpenAI大规模高性能的Rapid系统设计也体现了他们的功力,同时调度上万的CPU和GPU资源,在自我对弈的过程中不断变强。

如果仅仅是通过算力提升来训练模型,恐怕不能称之为“里程碑”。

Metamind高级研究科学家Stephen Merity(即Smerity)在OpenAI Five的研究发布当天,连发数条推特,高度评价了这项成果。

Smerity本身是一名DOTA的深度玩家,他从WC3时代开始并且已经打了830小时的DOTA2,他认为这一影响远远超出了DOTA本身。

这些机器人从来没有见过传统的人类策略,它们只是按照规则和目标来玩游戏。如果有一种正和(positive sum)的方式来玩“人”的零和游戏,它一定会找到的。

我们可以预见未来社会中很多错综复杂的东西都没有了,为什么呢?因为这些自主系统将让我们意识到,现在我们的一些优化措施实际上是不成熟的,反而让问题变得复杂;这些系统还能让我们少走很多弯路,现在我们都是走了弯路以后才意识到自己绕了道。

作为人类,我们还不够聪明,无法看穿复杂和复杂交互的迷雾,但我们编写的系统或许可以。它们可能帮助我们实现几百年来我们一直不情愿地、迷茫地走向的目标——协作。

OpenAI并没有在算法上创新,谈不上“里程碑式的成就”

伦敦大学学院(UCL)的计算机教授汪军告诉新智元,AlphaGo之后,AI领域的下一大挑战就是多智能体强化学习(Multi-Agent reinforcement learning,MARL),也即让多个智能体学会合作与竞争。

DOTA、星际争霸,还有更多人熟悉的王者荣耀,都属于多智能体强化学习(MARL),但DOTA 5v5的设置相对更加简单。从去年开始,汪军在UCL的团队与上海的一家游戏公司合作,研究如何让AI玩王者荣耀。目前,包括DeepMind、Facebook、阿里、腾讯在内的很多机构,都在这些游戏上从事MARL研究,但尚未有团队公开实质性的突破。

OpenAI的工作让更多学者和公众关注MARL,这是一件好事,但如果说这是一项“里程碑式的成就”,则远远谈不上。

汪军说,OpenAI仅发布了blog,没有发布学术论文,目前对其科学性还比较难以评估。但从发布的blog上看不到算法的创新。他们只是扩展了已有的方法,然后上了大量的计算力——整整128000 CPU和 256 GPU,这样的硬件基础设施是一般的高校所不具备的。”

“OpenAI证明了使用现有的算法和trick,加上强大的计算力、工程力量和足够的耐心,是可以把这件事情做出来的。”

很可惜的是,OpenAI并没有针对游戏中AI如何合作去明晰建模,没有尝试去理解AI彼此合作的机制,模型还是单独的强化学习,把其他的英雄当成环境的一部分,并使用普通的团队和个体结合的奖励机制,通过大量试错取得了最后的结果。“只要有足够多的时间(也就是足够多的计算资源),你总能试出一些结果。”汪军说,因此它不太具有创新性。

汪军呼吁大家重视并扶持基础性的长期研究,将眼光放长远,“多多资助我们这些搞基础研究的一些GPU”,对领域长期健康发展做出积极贡献。

不过,汪军也非常肯定AlphaGo、OpenAI等机构的研究对产业带来的潜移默化的影响。“目前,阿里巴巴、百度、滴滴、京东、华为这些公司都在尝试把强化学习用在不同的场景,比如直接用在互联网广告、仓储物流、自动驾驶等场景上面,这就是AlphaGo带来的影响,大家都对强化学习非常关注。”

“据我所知,DeepMind已经把研究的一些能量输入到谷歌内部中,好像我们看到DeepMind还没有实现经济价值,其实已经让谷歌内部产生了效率。”汪军说。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1792

    文章

    47373

    浏览量

    238875
  • 智能体
    +关注

    关注

    1

    文章

    152

    浏览量

    10593
  • 强化学习
    +关注

    关注

    4

    文章

    267

    浏览量

    11266

原文标题:OpenAI战胜DOTA2人类玩家是“里程碑式成就”?有专家评含金量不高

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    e络盟达成micro:bit分销里程碑

    近日,全球电子元器件产品与解决方案分销商e络盟,与合作伙伴Micro:bit教育基金会共同宣布了一项重要里程碑:e络盟成功制造并分销了超过1000万台BBC micro:bit计算机。这一
    的头像 发表于 12-23 16:26 236次阅读

    破万亿!中国芯片出口迎来里程碑

    在全球科技竞争日益激烈的今天,中国芯片产业的发展备受瞩目。根据海关总署最新公布的数据,2023年前11个月,中国集成电路出口额首次突破1万亿元人民币,同比增长20.3%,这一里程碑式的成就标志着中国
    的头像 发表于 12-17 16:43 510次阅读
    破万亿!中国芯片出口迎来<b class='flag-5'>里程碑</b>

    e络盟实现重要里程碑:成功分销 1000 万套 micro:bit 设备

    安富利旗下全球电子元器件产品与解决方案分销商e络盟与合作伙伴 Micro:bit 教育基金会日前携手宣布,e络盟成功达成了制造并分销超过 1000 万台 BBC micro:bit 计算机的重大里程碑,以帮助全球青少年通过物理计算发现编程的乐趣。
    的头像 发表于 12-12 10:34 192次阅读
    e络盟实现重要<b class='flag-5'>里程碑</b>:成功分销 1000 万套 micro:bit 设备

    Coherent 意已实现出货150,000个OPSL的里程碑

    150,000 个 OPSL 且仍在增加Coherent 意的里程碑成就展现了光泵半导体激光器 (OPSL) 的持久优势。我们于 2002 年将第一款 OPSL(488 nm 蓝色
    的头像 发表于 11-22 06:31 166次阅读
    Coherent <b class='flag-5'>高</b>意已实现出货150,000个OPSL的<b class='flag-5'>里程碑</b>

    比亚迪达成新能源汽车下线千万辆里程碑

    近日,比亚迪迎来了其发展历程中的一个重要里程碑——第1000万辆新能源汽车正式下线。这一历史性的时刻标志着比亚迪在新能源汽车领域的卓越成就和持续创新。 此次下线的车型为腾势Z9,一款定位于D级市场
    的头像 发表于 11-19 14:16 586次阅读

    黑芝麻智能与Nullmax达成重要合作里程碑

    近日,自动驾驶技术领域的两大领先企业——黑芝麻智能与Nullmax宣布达成了一项重要的合作里程碑。双方基于黑芝麻智能的武当C1200家族芯片,共同推出了BEV无图方案,并成功实现了NOA领航辅助、记忆行车及记忆泊车等高阶智能驾驶功能。
    的头像 发表于 10-10 18:15 640次阅读

    OpenAI预计2029年实现盈利

    据最新报道,OpenAI预测其将在2029年实现盈利,届时年收入有望达到1000亿美元。然而,在达到这一里程碑之前,该公司将面临长期的财务挑战。
    的头像 发表于 10-10 16:39 290次阅读

    爱玛机电突破千万台电机产量里程碑

     在电动车行业迎来新里程碑的9月25日,爱玛科技集团股份有限公司(以下简称“爱玛科技”)宣布其机电事业部成功实现累计产量从300万台到1000万台的飞跃。这一成就不仅标志着爱玛机电在电动车动力领域的行业地位进一步巩固,也充分展示了中国在两轮电动车制造领域的强大创新能力和市场影响力。
    的头像 发表于 09-26 17:07 673次阅读

    特斯拉里程碑达成:第1亿颗4680电池震撼问世

    特斯拉的4680电池技术再次跨越重要里程碑,公司于9月15日欣然宣布,其第1亿颗创新性的4680电池已成功下线,这一成就标志着特斯拉在电池制造领域的飞速进展。特斯拉首席执行官埃隆·马斯克通过社交媒体向辛勤工作的电池团队致以热烈祝贺,彰显了公司对这一里程碑事件的自豪与重视。
    的头像 发表于 09-18 15:30 1262次阅读

    Waymo自动驾驶里程碑:Alphabet引领未来出行新篇章

    聚焦于Waymo近期达成的一周内完成10万次行程的里程碑成就,这一壮举在自动驾驶行业发展中无疑投下了震撼弹。
    的头像 发表于 08-26 17:14 1201次阅读

    特斯拉迎来里程碑:全球第1000万个电驱系统下线

    在科技日新月异的今天,电动汽车行业的领军企业特斯拉再次以非凡的成就震撼全球。8月1日,特斯拉官方宣布了一个具有历史意义的消息——全球第1000万个电驱系统正式下线,标志着特斯拉在电动汽车核心技术的自主研发与规模化生产上迈出了坚实的一步,迎来了其发展历程中的首个“一千万”里程碑
    的头像 发表于 08-01 16:40 1117次阅读

    泰凌微电子TLSR925X:低功耗物联网SoC新里程碑

    联网无线系统级芯片(SoC)——TLSR925X系列,标志着我国在低功耗物联网芯片领域实现了里程碑式的突破。
    的头像 发表于 07-05 10:07 715次阅读

    新闻集团与OpenAI签订内容授权协议

    新闻集团(News Corp)近日宣布与生成式人工智能(AI)公司OpenAI签订了一项具有里程碑意义的内容授权协议。此次合作旨在探索AI技术在新闻出版领域的潜力,并期望从中获得可观的收益。
    的头像 发表于 05-27 09:57 359次阅读

    它人机器人与俄罗斯的AVIALIFT正式携手,达成里程碑式合作

    4月15日,它人机器人与俄罗斯的AVIALIFT正式携手,达成里程碑式合作。这次合作不仅将我们的机器人产品、尖端技术和优质服务带到了广袤的俄罗斯,更是它人机器人在国际舞台上的一大飞跃。
    的头像 发表于 04-17 09:26 568次阅读
    它人机器人与俄罗斯的AVIALIFT正式携手,达成<b class='flag-5'>里程碑</b>式合作

    百度地图宣布城市车道级导航取得里程碑突破

    近日,百度地图宣布其城市车道级导航取得里程碑突破,已率先覆盖全国超100城普通道路。
    的头像 发表于 01-09 17:28 1222次阅读
    百度地图宣布城市车道级导航取得<b class='flag-5'>里程碑</b>突破