0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DeepMind又出AI大招

机器人技术与应用 来源:机器人技术与应用 作者:机器人技术与应用 2021-03-11 15:58 次阅读

DeepMind 公司因为研制出会下棋的人工智能AlphaGo和AlphaZero而声名鹊起,如今他们将注意力转向了另一种棋盘游戏:强权外交(Diplomacy),也被称为外交或者外交风云,是经典的桌面游戏之一。该游戏与围棋不同,它是七人游戏,需要游戏玩家既竞争又合作,并且每回合玩家都会同时进行移动,因此,每个玩家都必须推理其他玩家的想法,非常复杂。

研制一个能玩外交游戏的人工智能软件,DeepMind公司的计算机专家Andrea Tacchetti表示:“与游戏Go或国际象棋相比,这是一个本质上不同的问题。” 去年12月,Tacchetti和合作者在NeurIPS会议上就其系统发表了一篇论文,该论文介绍了能玩外交游戏的AI系统策略。

“外交”是一种策略游戏,在欧洲地图上划分为75个省。玩家建立并动员军队占领各省,直到控制了大部分补给中心的玩家获胜。玩家每回合写下自己的行动,然后执行。他们可以攻击或防御对方玩家,或者支援对方玩家的进攻和防御,建立联盟。在完整版中,玩家可以协商,为了方便人工智能研究,DeepMind公司使用了简单版的“No Press”策略,不需要人工智能软件发布策略与其他玩家进行沟通。

从历史上看,人工智能使用人工制定的策略来发挥决策作用。2019年,蒙特利尔研究所的Mila通过使用深度学习系统取得了胜利。他们基于150000个人类游戏的数据集,训练了一个称为DipNet的神经网络来模仿人类。DeepMind从DipNet版本开始,使用强化学习(一种反复试验)来完善它。但是,仅通过反复试验来探索可能性会带来问题。因此,他们调整了强化学习算法。在训练过程中,他们在每一步中都对对手的可能举动进行采样,计算出在这些情况下平均效果最佳的行动,然后训练自己的权重以偏向于此行动。经过训练,它跳过了采样过程,仅根据其学习的知识进行工作。Tacchetti说:“我们论文的信息是:我们可以在这样的环境中进行强化学习。” 他们设计的一个AI玩家与六个DipNet的AI赢了30%的时间(有14%的机会)。一个DipNet对抗他们的七个,仅赢得了3%的时间。

今年4月,Facebook将在ICLR会议上发表一篇论文,描述他们在“No Press”版本的外交游戏中的研究成果。他们建立了类似DipNet的网络,但是没有添加强化学习的元素,而是添加了一个“SearchBot”搜索玩家策略,SearchBot通过玩几回合来评估玩家的每种潜在策略(假设每个人都根据神经网络的首选选择后续行动)。策略不是一个最佳行动组合,而是由50个可能行动组成的一组概率(由神经网络建议)。

在真实游戏中进行这样的探索会减慢SearchBot的速度,但可以使它更优于DipNet。SearchBot在外交游戏网站上与人类进行了匿名比赛,在玩家中排名前2%。Facebook的计算机专家、论文的共同作者亚当·勒勒(Adam Lerer)说:“这是第一个被证明具有能与人类竞争的机器人。”

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1791

    文章

    47146

    浏览量

    238118
  • 强化学习
    +关注

    关注

    4

    文章

    266

    浏览量

    11241
  • DeepMind
    +关注

    关注

    0

    文章

    130

    浏览量

    10838

原文标题:DeepMind又出AI大招

文章出处:【微信号:robotmagazine,微信公众号:机器人技术与应用】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    谷歌Vertex AI助力企业生成式AI应用

    DeepMind 在模型技术方面积极探索创新,尤其着力于 Gemini 和 Imagen 的改进。我们的企业 AI 平台 Vertex AI 也推出了数十项突破性功能。
    的头像 发表于 09-09 15:59 493次阅读

    云开发AI助手

    AI
    草帽王路飞
    发布于 :2024年07月22日 14:41:54

    谷歌DeepMind被曝抄袭开源成果,论文还中了顶流会议

    谷歌DeepMind一篇中了顶流新生代会议CoLM 2024的论文被挂了,瓜主直指其抄袭了一年前就挂在arXiv上的一项研究。开源的那种。
    的头像 发表于 07-16 18:29 571次阅读
    谷歌<b class='flag-5'>DeepMind</b>被曝抄袭开源成果,论文还中了顶流会议

    AI终端应用元年到来,史密斯英特康突破AI芯片测试挑战

    2024年,文生视频工具——Sora的诞生为已然热闹的AI 应用领域又添了一把火。 近日,Google的人工智能(AI)研究实验室DeepMind表示,它正在开发为视频生成配乐的人
    的头像 发表于 06-21 11:10 348次阅读
    <b class='flag-5'>AI</b>终端应用元年到来,史密斯英特康突破<b class='flag-5'>AI</b>芯片测试挑战

    谷歌AI新突破:为无声视频智能配音

    近日,谷歌DeepMind团队公布了一项革命性的技术——利用AI为无声视频生成背景音乐的“video-to-audio”技术。这一技术的出现,不仅为视频创作领域带来了新的可能,也为观众带来了更加丰富的视听体验。
    的头像 发表于 06-21 10:50 482次阅读

    苹果WWDC 2024日程揭晓:大招码上来

    苹果公司近日公布了备受期待的2024年度WWDC(全球开发者大会)的详细日程安排。今年的WWDC将于太平洋时间6月10日至14日举行,活动口号“大招码上来”预示着苹果将带来一系列令人振奋的新技术和产品更新。
    的头像 发表于 05-30 09:24 746次阅读

    谷歌DeepMind发布人工智能模型AlphaFold最新版本

    谷歌DeepMind近日发布了人工智能模型AlphaFold的最新版本——AlphaFold 3,这一革命性的工具将在药物发现和疾病治疗领域发挥巨大作用。
    的头像 发表于 05-10 11:26 579次阅读

    谷歌DeepMind推出新一代药物研发AI模型AlphaFold 3

    谷歌DeepMind公司近日重磅推出了一款名为AlphaFold 3的全新药物研发AI模型,这一创新技术将为科学家们提供前所未有的帮助,使他们能更精确地理解疾病机制,进而开发出更高效的治疗药物。
    的头像 发表于 05-10 09:35 388次阅读

    微软斥资25亿英镑在伦敦新建AI Hub,推动AI技术发展与商业化落地

    同时,微软还在四月初宣布成立全新的Microsoft AI团队,由DeepMind与Inflection联合创始人Mustafa Suleyman担任负责人,全力推动Copilot项目实施。Jordan Hoffmann则将领衔领导位于伦敦的Microsoft
    的头像 发表于 04-09 16:22 480次阅读

    微软宣布组织架构调整,组建Microsoft AI

    微软,这家全球市值最高的科技巨头,近日宣布了一项重大的组织架构调整。公司决定组建全新的Microsoft AI部门,旨在统一管理和推进所有消费者AI产品和研究工作。为此,微软特地挖角了人工智能领域的知名人物——DeepMind
    的头像 发表于 03-21 10:52 842次阅读

    谷歌DeepMind推出SIMI通用AI智能体

    近日,谷歌的DeepMind团队发布了其最新研究成果——SIMI(Scalable Instructable Multiworld Agent),这是一个通用人工智能智能体,能够在多种3D虚拟环境
    的头像 发表于 03-18 11:39 948次阅读

    谷歌DeepMind推新AI模型Genie,能生成2D游戏平台

    据报道,谷歌公司的DeepMind团队近期发布了AI模型Genie,此模型拥有多达110亿个参数,能够依据用户提供的图片及提示词创建出相当完整的2D游戏场景。
    的头像 发表于 02-27 14:53 761次阅读

    谷歌DeepMind资深AI研究员创办AI Agent创企

    近日,刚从谷歌DeepMind离职的资深AI研究员Ioannis Antonoglou宣布创办了一家名为“AI Agent”的创企。Ioannis Antonoglou常驻伦敦,此前曾担任谷歌
    的头像 发表于 02-04 10:02 778次阅读

    谷歌DeepMind科学家欲建AI初创公司

    据知情人士透露,谷歌人工智能部门DeepMind的两名杰出科学家Laurent Sifre和Karl Tuyls正在与投资者商讨在巴黎成立一家新的人工智能初创公司的事宜。
    的头像 发表于 01-22 14:41 482次阅读

    再登Nature!DeepMind大模型突破60年数学难题,解法超出人类已有认知

    用大模型解决困扰数学家60多年的问题,谷歌DeepMind最新成果再登 Nature。 作者之一、谷歌DeepMind研究副总裁Pushmeet Kohli表示: 训练数据中不会有这个方案,它之前
    的头像 发表于 12-24 21:40 530次阅读
    再登Nature!<b class='flag-5'>DeepMind</b>大模型突破60年数学难题,解法超出人类已有认知