DeepMind又出AI大招-电子发烧友网

DeepMind 公司因为研制出会下棋的人工智能AlphaGo和AlphaZero而声名鹊起，如今他们将注意力转向了另一种棋盘游戏：强权外交（Diplomacy），也被称为外交或者外交风云，是经典的桌面游戏之一。该游戏与围棋不同，它是七人游戏，需要游戏玩家既竞争又合作，并且每回合玩家都会同时进行移动，因此，每个玩家都必须推理其他玩家的想法，非常复杂。

研制一个能玩外交游戏的人工智能软件，DeepMind公司的计算机专家Andrea Tacchetti表示：“与游戏Go或国际象棋相比，这是一个本质上不同的问题。” 去年12月，Tacchetti和合作者在NeurIPS会议上就其系统发表了一篇论文，该论文介绍了能玩外交游戏的AI系统策略。

“外交”是一种策略游戏，在欧洲地图上划分为75个省。玩家建立并动员军队占领各省，直到控制了大部分补给中心的玩家获胜。玩家每回合写下自己的行动，然后执行。他们可以攻击或防御对方玩家，或者支援对方玩家的进攻和防御，建立联盟。在完整版中，玩家可以协商，为了方便人工智能研究，DeepMind公司使用了简单版的“No Press”策略，不需要人工智能软件发布策略与其他玩家进行沟通。

从历史上看，人工智能使用人工制定的策略来发挥决策作用。2019年，蒙特利尔研究所的Mila通过使用深度学习系统取得了胜利。他们基于150000个人类游戏的数据集，训练了一个称为DipNet的神经网络来模仿人类。DeepMind从DipNet版本开始，使用强化学习（一种反复试验）来完善它。但是，仅通过反复试验来探索可能性会带来问题。因此，他们调整了强化学习算法。在训练过程中，他们在每一步中都对对手的可能举动进行采样，计算出在这些情况下平均效果最佳的行动，然后训练自己的权重以偏向于此行动。经过训练，它跳过了采样过程，仅根据其学习的知识进行工作。Tacchetti说：“我们论文的信息是：我们可以在这样的环境中进行强化学习。” 他们设计的一个AI玩家与六个DipNet的AI赢了30％的时间（有14％的机会）。一个DipNet对抗他们的七个，仅赢得了3％的时间。

今年4月，Facebook将在ICLR会议上发表一篇论文，描述他们在“No Press”版本的外交游戏中的研究成果。他们建立了类似DipNet的网络，但是没有添加强化学习的元素，而是添加了一个“SearchBot”搜索玩家策略，SearchBot通过玩几回合来评估玩家的每种潜在策略（假设每个人都根据神经网络的首选选择后续行动）。策略不是一个最佳行动组合，而是由50个可能行动组成的一组概率（由神经网络建议）。

在真实游戏中进行这样的探索会减慢SearchBot的速度，但可以使它更优于DipNet。SearchBot在外交游戏网站上与人类进行了匿名比赛，在玩家中排名前2％。Facebook的计算机专家、论文的共同作者亚当·勒勒（Adam Lerer）说：“这是第一个被证明具有能与人类竞争的机器人。”

责任编辑：lq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

人工智能

人工智能

+关注

关注
1791

文章
47146

浏览量
238118
强化学习

强化学习

+关注

关注
4

文章
266

浏览量
11241
DeepMind

DeepMind

+关注

关注
0

文章
130

浏览量
10838

原文标题：DeepMind又出AI大招

文章出处：【微信号：robotmagazine，微信公众号：机器人技术与应用】欢迎添加关注！文章转载请注明出处。

谷歌Vertex AI助力企业生成式AI应用

DeepMind 在模型技术方面积极探索创新，尤其着力于 Gemini 和 Imagen 的改进。我们的企业 AI 平台 Vertex AI 也推出了数十项突破性功能。

发表于 09-09 15:59 •493次阅读

云开发AI助手

草帽王路飞

发布于 :2024年07月22日 14:41:54

谷歌DeepMind被曝抄袭开源成果，论文还中了顶流会议

谷歌DeepMind一篇中了顶流新生代会议CoLM 2024的论文被挂了，瓜主直指其抄袭了一年前就挂在arXiv上的一项研究。开源的那种。

发表于 07-16 18:29 •571次阅读

谷歌<b class='flag-5'>DeepMind</b>被曝抄袭开源成果，论文还中了顶流会议

AI终端应用元年到来，史密斯英特康突破AI芯片测试挑战

2024年,文生视频工具——Sora的诞生为已然热闹的AI 应用领域又添了一把火。近日,Google的人工智能(AI)研究实验室DeepMind表示,它正在开发为视频生成配乐的人

发表于 06-21 11:10 •348次阅读

<b class='flag-5'>AI</b>终端应用元年到来，史密斯英特康突破<b class='flag-5'>AI</b>芯片测试挑战

谷歌AI新突破：为无声视频智能配音

近日，谷歌DeepMind团队公布了一项革命性的技术——利用AI为无声视频生成背景音乐的“video-to-audio”技术。这一技术的出现，不仅为视频创作领域带来了新的可能，也为观众带来了更加丰富的视听体验。

发表于 06-21 10:50 •482次阅读

苹果WWDC 2024日程揭晓：大招码上来

苹果公司近日公布了备受期待的2024年度WWDC（全球开发者大会）的详细日程安排。今年的WWDC将于太平洋时间6月10日至14日举行，活动口号“大招码上来”预示着苹果将带来一系列令人振奋的新技术和产品更新。

发表于 05-30 09:24 •746次阅读

谷歌DeepMind发布人工智能模型AlphaFold最新版本

谷歌DeepMind近日发布了人工智能模型AlphaFold的最新版本——AlphaFold 3，这一革命性的工具将在药物发现和疾病治疗领域发挥巨大作用。

发表于 05-10 11:26 •579次阅读

谷歌DeepMind推出新一代药物研发AI模型AlphaFold 3

谷歌DeepMind公司近日重磅推出了一款名为AlphaFold 3的全新药物研发AI模型，这一创新技术将为科学家们提供前所未有的帮助，使他们能更精确地理解疾病机制，进而开发出更高效的治疗药物。

发表于 05-10 09:35 •388次阅读

微软斥资25亿英镑在伦敦新建AI Hub，推动AI技术发展与商业化落地

同时，微软还在四月初宣布成立全新的Microsoft AI团队，由DeepMind与Inflection联合创始人Mustafa Suleyman担任负责人，全力推动Copilot项目实施。Jordan Hoffmann则将领衔领导位于伦敦的Microsoft

发表于 04-09 16:22 •480次阅读

微软宣布组织架构调整，组建Microsoft AI

微软，这家全球市值最高的科技巨头，近日宣布了一项重大的组织架构调整。公司决定组建全新的Microsoft AI部门，旨在统一管理和推进所有消费者AI产品和研究工作。为此，微软特地挖角了人工智能领域的知名人物——DeepMind的

发表于 03-21 10:52 •842次阅读

谷歌DeepMind推出SIMI通用AI智能体

近日，谷歌的DeepMind团队发布了其最新研究成果——SIMI（Scalable Instructable Multiworld Agent），这是一个通用人工智能智能体，能够在多种3D虚拟环境

发表于 03-18 11:39 •948次阅读

谷歌DeepMind推新AI模型Genie，能生成2D游戏平台

据报道，谷歌公司的DeepMind团队近期发布了AI模型Genie，此模型拥有多达110亿个参数，能够依据用户提供的图片及提示词创建出相当完整的2D游戏场景。

发表于 02-27 14:53 •761次阅读

谷歌DeepMind资深AI研究员创办AI Agent创企

近日，刚从谷歌DeepMind离职的资深AI研究员Ioannis Antonoglou宣布创办了一家名为“AI Agent”的创企。Ioannis Antonoglou常驻伦敦，此前曾担任谷歌

发表于 02-04 10:02 •778次阅读

谷歌DeepMind科学家欲建AI初创公司

据知情人士透露，谷歌人工智能部门DeepMind的两名杰出科学家Laurent Sifre和Karl Tuyls正在与投资者商讨在巴黎成立一家新的人工智能初创公司的事宜。

发表于 01-22 14:41 •482次阅读

再登Nature！DeepMind大模型突破60年数学难题，解法超出人类已有认知

用大模型解决困扰数学家60多年的问题，谷歌DeepMind最新成果再登 Nature。作者之一、谷歌DeepMind研究副总裁Pushmeet Kohli表示：训练数据中不会有这个方案，它之前

发表于 12-24 21:40 •530次阅读

搜索历史

DeepMind又出AI大招

评论