还记得AlphaGo在围棋上战胜人类那时候的轰动吗?现在一个名叫Pluribus的AI,在和世界扑克牌冠军对战的时候,完胜了人类。
也许你会认为AI能战胜人类在今天已经是司空见惯的事了。但这次具有突破性的是,这场对战不再是一对一,对手是15名人类顶尖扑克玩家。这也是AI首次在超过两个人的游戏中击败人类玩家。
这次的德州扑克比赛为期12天,比赛扑克牌有超过10,000,以六人无限制玩法,Pluribus和15名顶尖玩家以两种模式开展比赛。
▲Pluribus和五名职业扑克玩家对抗
第一种模式是1个Pluribus和5个人类玩家组赛,第二种模式是1个人类玩家和 5个Pluribus 组赛(每个Pluribus独立并没有相互配合)。第二种模式参赛的是2名作为扑克的传奇人物——Darren Elia和Chris Ferguson,后者曾获得6次世界冠军。
比赛的结果是,Pluribus全盘获胜。
假如它是人类玩家,按一个筹码值1美元,便能以每小时1,000美元的惊人速度不断赢钱。
Pluribus由Facebook的人工智能团队和卡内基梅隆大学计算机科学系人员共同研发,早在两年前他们已经研发出了Libratus的扑克游戏系统,一直都是德州扑克的单挑赛中的世界赢家。
在和单个人类比赛中,博弈论能为AI提供最佳策略,因此 AI 可以完全掌控通往胜利的“特定路线”,通过预测每次游戏结束的结果,从而为下一步的行为作决定。
但这对于涉及多方利益且没有明确条件的多人游戏场景并不适用。
由于Libratus难以确定所有玩家手里有什么牌,也不能了解对手的内心想法,从而无法捉摸对手是试探或是虚张声势,不能准确预知他们的每一个投注决定,因此游戏可以说是呈指数级地复杂化。
研究人员在Libratus的基础上构建了Pluribus,它的不同之处在于新使用了一种称为搜索功能的机制,能够对接下来的未知行为进行展望,而不是在预测最终结果后反推。
在同时应对其余几名玩家的复杂性之下,这种短期的敏锐性恰恰是最大的优势。
从Libratus到Pluribus的进步,可以发现AI随着进步,能够使用更少的资源和更低的成本去制造。
比起动辄十万美元的先进系统,Pluribus短短8天内创建,在云服务器上培训也只用了不到150美元的费用。如今的Pluribus只用两个CPU就能运行,而2016年的AlphaGo系统需要使用1,920个CPU才赢得游戏,而且Pluribus占用内存不到 128 GB,平均只需20秒就能下决定,速度是职业扑克玩家的两倍。
这次的成果也是展现了AI研究的巨大进展。由于扑克游戏隐藏了信息和运气元素,与人对弈时,它不能只是计算人类行为,而是要超越人类的行为。目前证明Pluribus已经可以对抗多个该领域内的顶尖人类,研究人员表示,客观上来说,AI已经被证明可以称为“超人”了。
对于后续的发展,联合开发者Noam Brown认为Pluribus已经到达了扑克游戏的极限,完成了最后一个挑战。接下来,这个技术将在更多场景被用到。例如网络安全、欺诈检测、金融谈判等等,甚至还可以帮自动驾驶汽车导航交通。
毕竟AI能在多人场景中使用,还能处理隐藏信息的能力,才更符合现实生活中的挑战。扑克游戏只是提供了一个现实世界的模型。
不过它的算法代码就不会公开了,毕竟一旦公开,可能会毁掉所有扑克牌的世界了。
-
计算机
+关注
关注
19文章
7417浏览量
87707 -
人工智能
+关注
关注
1791文章
46841浏览量
237521
原文标题:15名世界顶尖的扑克牌玩家,都输给了同一个对手。
文章出处:【微信号:luomajqrxt,微信公众号:机器人学堂】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论