0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI棋牌应用的现实意义

bzSh_drc_iite 来源:YXQ 2019-07-29 11:17 次阅读

AI在棋牌类游戏的应用,将促进博弈决策的研究,以棋牌类AI应用为基础的相关AI博弈工具,在经济金融领域的风险预测、军事领域的战局预测等方向有着广泛的应用前景。

半个多世纪以来,棋牌类游戏一直是人工智能(AI)发展创新的舞台。利用AI在被视作智力游戏的棋牌中打败人类,也一直是AI研究所追求的目标。从1997年IBM的超级电脑“深蓝”击败国际象棋世界冠军卡斯帕罗夫,到2016年谷歌开发的AI机器人AlphaGo战胜围棋世界冠军李世石,AI在棋牌类比赛中屡获突破。2019年7月,卡耐基梅隆大学与Facebook公司共同开发的AI机器人“Pluribus”,在无限制德州扑克6人对决比赛中战胜5名专家级人类玩家,AI在德州扑克战场再下一城。

Pluribus概况

Pluribus与人类的比赛分为两种模式:1个AI与5个人类玩家和5个AI与1个人类玩家,Pluribus在这两种模式中都取得了胜利。而为了战胜人类,Pluribus在策略、算法和能耗上进行了多次优化。

Pluribus研发的核心策略是运用改进版本的蒙特卡洛遗憾最小化算法(Monte Carlo Counter factual Regret Minimization,MCCFR),通过自我博弈的方式学习。Pluribus首先随机地选择玩法,通过蛮力计算得到收敛的结果,并对这些行动拟合概率分布,使得其实力在不断自我博弈中逐步变强。在整个学习过程中,AI机器人和自己进行对战,不使用任何人类游戏数据作为输入。

算法上,为了解决6名玩家的额外复杂性,Pluribus整合了新的在线搜索算法,使AI能够在游戏中向前预测并决定下一步该做什么,这种机制被称为搜索功能。以往的棋牌类算法的每一步决策都需要计算到游戏结束,而在线搜索算法只需搜索前面的几步即可。此外,Pluribus还利用了速度更快的新型self-play非完美信息游戏算法。基于上述两种算法,使得凭借极少的处理能力和内存来训练Pluribus成为可能。

能耗上,研究人员使用一个64核的服务器,利用不大于512GB的内存,在8天时间里完成了Pluribus的自我博弈训练,其成本大约为150美元,同其他自我对弈的AI研究相比,成本极低。而且算法上的进步,让研究人员可凭借较少的资源消耗实现极大的性能提升。

扑克AI和其他棋牌类AI的对比

扑克AI与棋类AI的基本原理相同,都采用蒙特卡洛搜索树算法作为基本算法,不依赖人类所提供的策略,在不断迭代的过程中实现自我学习。不同的是,棋类游戏中的棋子都展现在棋盘上,结果种类有限,所有的结果都是可推算的,这种情况被称为“完美信息博弈”;牌类游戏中无法知道对手的底牌,含有隐藏信息,结果可能是多样的,导致其计算难度和计算量大大增加,被称为“不完美信息博弈”。

棋类AI

棋类游戏包括西洋双陆棋、国际象棋、围棋等,比赛中所有的信息和决策公开,并且游戏对于玩家来说只有赢或输两种可能的结果,从某种意义上说,这使得训练AI变得更容易。棋类在理论上可通过计算机模拟出每一种可能的情况,从而进行完美信息动态博弈。这类完美信息博弈中AI机器人往往使用实时搜索。例如,当模型在决定下一步该如何走时,国际象棋AI通常会考虑以后的一些移动步骤,直到算法的前瞻到达深度上限。而围棋的棋盘变化可能性比可观测宇宙范围的原子总数还多,因此围棋AI主要通过深度学习技术训练用于判断结果输赢概率的价值网络,来增强AI对弈能力。

麻将AI

麻将AI的策略需要更多地增加得点的期望值,尽量增大和大牌的可能性,同时尽量避免对手的大牌点炮,这一打牌策略显然是有最优解的。为了有更大的可能性和大牌,AI需要通过手牌和弃牌池里的牌,计算进张(摸到有效牌)和鸣牌(吃、碰、杠)使手牌有进展的概率,进而计算和牌得分的期望值。目前最强的麻将AI机器人是日本东京大学开发的“暴打”。

扑克AI

以德州扑克为例,由于在游戏中,玩家无法获取已发生事件的全部信息(如对手的底牌等),因此这个游戏属于“不完美信息”(Imperfect Information)类游戏。德州扑克一直是人工智能领域最难以攻克的重大问题之一,因为和棋类游戏不同,扑克AI必须推理隐藏的信息,并慎重平衡自己策略。同时,相比棋类比赛,在扑克游戏中需要使用Bluff(吓唬)等更多游戏策略。

在Pluribus之前,AI机器人曾在两个参与者的完美信息零和博弈中取得了多次引人注目的成功,但大多数真实世界中的策略交互都涉及隐藏信息,且并非两个参与者的零和博弈。Pluribus的成功表明,在复杂的多参与者场景中,基于自我博弈和搜索算法的AI能够获得很好的效果。

AI棋牌应用的现实意义

Pluribus提出了在大型状态空间、隐藏信息中有效地解决博弈论推理挑战的方法,所开发出的技术很大程度上独立于扑克领域,可用于大量不完美信息博弈。Pluribus处理的诸多问题,与真实世界中的通用问题相对应,“不知道对手的牌”对应现实中的“不完整信息”,“下注策略和由此带来的结果”对应现实中的“风险管理”,“确认对手的模式,并进行利用”对应现实中的“智能体建模”,“Bluffing(扑克中的恐吓技巧)”对应现实中的“欺骗”,“处理对手欺骗的牌”对应现实中的“不可靠信息”。

事实上,棋牌类游戏的本质是竞争和对抗,由游戏规则定义其目标(评价标准),玩家使用各种策略达成目标,其中涉及数量可观的博弈过程。AI在棋牌类游戏的应用,将促进博弈决策的研究。以棋牌类AI应用为基础的相关AI博弈工具,在经济金融领域的风险预测、军事领域的战局预测等方向有着广泛的应用前景。

在经济金融领域,不论对经济发展的总体趋势预测,还是银行、保险、股市等细分行业的风险模型建立,都需要依靠大量“不完美信息”来决策。AI博弈工具可通过处理不完美信息来获得最佳决策。政府可利用AI博弈工具对社会行业的未来趋势进行预测,判断供需关系,合理有序引导行业健康发展。银行、保险公司可利用AI工具判断短期行业走势,高效评估企业风险,以决定是否达成交易。

在军事领域,具有自主学习功能的AI博弈工具与兵棋推演相结合,将爆发出极强的战斗力,帮助军队获取制胜先机。从上个世纪70年代初开始,美国陆军就按照“全自动兵棋”概念建立起“地面作战模拟系统”。20世纪90年代初,美军在海湾战争爆发前就使用兵棋游戏对整个战争进行了推演,而战争的过程几乎和美军事前的推演如出一辙。随着技术的进步,算法不断成熟使得算力需求进一步降低,同时计算技术朝着系统微型化和处理高速化方向发展,具备超强自主学习和计算能力的AI系统与作战模拟系统相结合,将提升对战局的预测和把控。未来,AI系统将有希望直接与战场指挥系统对接,其快速战局推演能力、高效制定作战方案的能力,将主导战争的胜负走向。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    211

    文章

    28413

    浏览量

    207034
  • AI
    AI
    +关注

    关注

    87

    文章

    30849

    浏览量

    269006

原文标题:人工智能技术在棋牌中的应用“Pluribus”及其现实意义

文章出处:【微信号:drc_iite,微信公众号:全球技术地图】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    固定式雷达波在线测流系统:保障河流防汛安全的 “流量卫士”

    固定式雷达波在线测流系统作为保障河流防汛安全的 “流量卫士”,具有重要的现实意义和广泛的应用前景。它以其高精度、实时在线、非接触式测量等特点,为河流防汛、水资源管理、水利工程管理和生态环境保护等方面提供了有力的技术支持。
    的头像 发表于 12-04 17:45 144次阅读
    固定式雷达波在线测流系统:保障河流防汛安全的 “流量卫士”

    人工智能与计算产业生态峰会暨哈尔滨新质生产力峰会圆满落幕

    以“数智龙江·向新而行”为主题的人工智能与计算产业生态峰会暨哈尔滨新质生产力峰会成功举办。新质生产力是以科技创新为主导的生产力,对新时代新征程推动高质量发展、推进现代化进程具有重大现实意义和深远
    的头像 发表于 12-04 11:18 272次阅读

    揭秘那些赚钱的无人自助场景!涂鸦IoT Core赋能无人棋牌房案例应用

    随着棋牌与台球领域的深度探索与持续创新,科学技术的不断突破与创新,雀江湖无人自助棋牌室解决方案将前沿的智能技术、人工智能算法与云计算能力深度融合,为行业树立了新的技术标杆。涂鸦智能的云开发者平台为
    的头像 发表于 11-16 01:04 236次阅读
    揭秘那些赚钱的无人自助场景!涂鸦IoT Core赋能无人<b class='flag-5'>棋牌</b>房案例应用

    浅谈光伏-直流智能充电桩有序充电策略与应用效果

    光伏-直流智能充电桩的有序充电策略具有重要的现实意义和应用价值。通过合理的规划和管理,可以充分发挥其优势,为电动汽车用户提供有效、便捷、环保的充电服务,同时也为能源转型和可持续发展做出贡献。
    的头像 发表于 11-11 13:48 323次阅读
    浅谈光伏-直流智能充电桩有序充电策略与应用效果

    AI云平台建设意义

    AI云平台,作为AI技术与云计算深度融合的产物,其建设不仅标志着技术创新的又一高峰,更蕴含着对社会经济发展、产业升级、创新生态构建等多方面的深远意义
    的头像 发表于 10-12 09:52 164次阅读

    智慧楼宇能源监测节能管理解决方案

    )能耗总量为19.1亿tce,占全国能源消费的36.3%。因此,实现智慧楼宇节能管理依旧具有重要价值和现实意义。 传统的能耗监测手段主要依靠人工抄表和巡检维护,集中汇总管理存在明显的迟滞,出现异常故障无从得知,加上难以快速查找搜索并进行
    的头像 发表于 09-14 10:54 260次阅读

    工业控制系统安全性分析与对策

    中断、设备损坏、数据泄露等严重后果,甚至威胁到国家安全和公共利益。因此,对工业控制系统的安全性进行深入分析,并提出相应的对策,具有重要的现实意义和战略价值。
    的头像 发表于 06-28 18:07 1187次阅读

    基于无人机高光谱遥感的荒漠化草原地物分类研究1.0

    本研究利用无人机高光谱遥感技术采集荒漠化草原遥感数据,运用人工智能图像分类技术,解决荒漠化草原地物分类与识别问题,具有自动化程度高、分类精度高等特点,是草原退化调查监测行之有效的方法,对于荒漠化草原生态保护具有重要的现实意义
    的头像 发表于 06-12 11:48 372次阅读
    基于无人机高光谱遥感的荒漠化草原地物分类研究1.0

    变频器产生的干扰及解决方案

    随着工业自动化技术的飞速发展,变频器作为现代电力传动系统的核心设备,广泛应用于电机调速、节能降耗等领域。然而,变频器在运行过程中会产生各种电磁干扰,对周围设备、系统甚至整个电网的稳定运行构成威胁。因此,研究变频器产生的干扰及其解决方案具有重要的现实意义和工程应用价值。
    的头像 发表于 06-11 11:43 2135次阅读

    应用DMAIC降低汽车线束开线工序质量损失

    DMAIC(定义、测量、分析、改进、控制)方法,对汽车线束开线工序进行持续改进,降低质量损失,提升生产效率,具有重要的现实意义。 首先,我们要明确定义问题。汽车线束开线工序中的质量损失主要表现在线束切割不准确、端子压
    的头像 发表于 05-30 10:30 393次阅读

    新能源汽车电池热管理中陶瓷材料的应用

    能、耐高温性能和抗腐蚀性能,并且在电池外壳隔热层、电池内部的导热材料、电池热散封装和电池热板设计等领域具有广泛的应用。本文对于新能源汽车的可持续发展具有重要的现实意义
    的头像 发表于 04-12 08:10 967次阅读
    新能源汽车电池热管理中陶瓷材料的应用

    浅谈能耗系统在节能降耗的应用

    。防止相关的资源过度使用问题。而对于相关的节能降耗工作来说。通过合理的使用用电计量方式。简单来说在整依的使用过程中使用用电计量方式,能够满足其现实意义,对使用的相关电量都进行整体的计算,然后在按照具体规定来对电量资源进
    的头像 发表于 02-20 15:27 376次阅读
    浅谈能耗系统在节能降耗的应用

    二进制、八进制、十六进制在现实当中有什么意义

    二进制、八进制、十六进制在现实当中有什么意义? 二进制、八进制和十六进制在现实生活中有着广泛的应用和重要的意义。这些进制系统在信息技术、计算机科学、通信、电子工程等领域扮演着至关重要的
    的头像 发表于 01-16 11:14 5399次阅读

    ALVA Systems携手合作伙伴打造AR智能巡检应用平台

    石化生产过程中涉及高温高压、易燃易爆以及有毒有害等高危因素,所以企业检维修工作的安全管理具有非常重要的现实意义
    的头像 发表于 01-10 10:15 647次阅读

    水泥行业能源管理及节能减排物联网解决方案

    工业物联网技术,探索能源管理及节能减排的新路径。 水泥行业节能减排对实现“双碳”目标具有重要现实意义。通过工业物联网实现能源数据化管理,并在保证生产效率的同时,实现能源的高效利用和环境的可持续发展。物通博联推
    的头像 发表于 01-09 14:00 505次阅读
    水泥行业能源管理及节能减排物联网解决方案