电子发烧友App

硬声App

扫码添加小助手

加入工程师交流群

0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示
电子发烧友网>电子资料下载>传感与控制>围棋人工智能基本原理及其意义

围棋人工智能基本原理及其意义

2017-09-13 | rar | 2.78 MB | 次下载 | 免费

资料介绍

  人工智能(Artificial Intelligence,AI)主要研究人类思

  维、行动中那些尚未算法化的功能行为, 使机器像人的大

  脑一样思考、行动。长期以来, 围棋作为一种智力博弈游

  戏, 以其变化莫测的博弈局面, 高度体现了人类的智慧, 为

  人工智能研究提供了一个很好的测试平台, 围棋人工智能

  也是人工智能领域的一个重要挑战。

  传统的计算机下棋程序的基本原理, 是通过有限步数

  的搜索树, 即采用数学和逻辑推理方法, 把每一种可能的

  路径都走一遍, 从中选举出最优路径, 使得棋局胜算最大。

  这种下棋思路是充分发挥计算机运算速度快、运算量大等

  优势的“暴力搜索法”, 是人类在对弈规定的时间限制内无

  法做到的。但是由于围棋局面数量太大, 这样的运算量对

  于计算机来讲也是相当之大, 目前的计算机硬件无法在对

  弈规定的时间内, 使用计算机占绝对优势的“暴力搜索法”

  完成围棋所有局面的择优, 所以这样的下棋思路不适用于

  围棋对弈。

  搜索量巨大的问题一直困扰着围棋人工智能, 使其发

  展停滞不前,直到2 0 0 6 年, 蒙特卡罗树搜索的应用出现,

  才使得围棋人工智能进入了崭新的阶段, 现代围棋人工智

  能的主要算法是基于蒙特卡洛树的优化搜索。

  2 围棋人工智能基本原理

  目前围棋人工智能最杰出的代表, 是由谷歌旗下人工

  智能公司DeepMind创造的AlphaGo围棋人工智能系统。它

  在与人类顶级围棋棋手的对弈中充分发挥了其搜索和计

  算的优势, 几乎在围棋界立于不败之地。

  Alph a G o系统的基本原理是将深度强化学习方法与蒙

  特卡洛树搜索结合, 使用有监督学习策略网络和价值网

  络, 极大减少了搜索空间, 即在搜索过程中的计算量, 提高

  了对棋局估计的准确度。

  2.1 深度强化学习方法

  深度学习源于人工神经网络的研究, 人类大量的视觉

  听觉信号的感知处理都是下意识的, 是基于大脑皮层神经

  网络的学习方法, 通过模拟大脑皮层推断分析数据的复杂

  层状网络结构, 使用包含复杂结构或由多重非线性变换构

  成的多个处理层对数据进行高层抽象, 其过程类似于人们

  识别物体标注图片。现如今, 应用最广泛的深度学习模型

  包括: 卷积神经网络、深度置信网络、堆栈自编码网络和递

  归神经网络等。

  强化学习源于动物学习、参数扰动自适应控制等理

  论, 通过模拟生物对环境以试错的方式进行交互达到对环

  境的最优适应的方式, 通过不断地反复试验, 将变化无常

  的动态情况与对应动作相匹配。强化学习系统设置状态、

  动作、状态转移概率和奖赏四个部分, 在当前状态下根据

  策略选择动作, 执行该过程并以当前转移概率转移到下一

  状态, 同时接收环境反馈回来的奖赏, 最终通过调整策略

  来最大化累积奖赏。

  深度学习具有较强的感知能力, 但缺乏一定的决策能

  力; 强化学习具有决策能力, 同样对感知问题无能为力。深

  度强化学习方法是将具有感知能力的深度学习和具有决

  策能力的强化学习结合起来, 优势互补, 用深度学习进行

  感知, 从环境中获取目标观测信息, 提供当前环境下的状

  态信息; 然后用强化学习进行决策, 将当前状态映射到相

  应动作, 基于初期汇报评判动作价值。

  深度强化学习为复杂系统的感知决策问题提供了一

  种全新的解决思路。

  2.2 蒙特卡洛树搜索

  蒙特卡洛树搜索是将蒙特卡洛方法与树搜索相结合

  形成的一种搜索方法。所谓蒙特卡洛方法是一种以概率统

  计理论为指导的强化学习方法, 它通常解决某些随机事件

  出现的概率问题, 或者是某随机变量的期望值等数字特征

  问题。通过与环境的交互, 从所采集的样本中学习, 获得关

  于决策过程的状态、动作和奖赏的大量数据, 最后计算出

  累积奖赏的平均值。

  蒙特卡洛树搜索算法是一种用于解决完美信息博弈

  (perfect information games,没有任何信息被隐藏的游戏)

  的方法,主要包含选择(Selection)、扩展(Expansion)、模拟

加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

下载该资料的人也在下载 下载该资料的人还在阅读
更多 >

评论

查看更多

下载排行

本周

  1. 1TC358743XBG评估板参考手册
  2. 1.36 MB  |  330次下载  |  免费
  3. 2开关电源基础知识
  4. 5.73 MB  |  11次下载  |  免费
  5. 3100W短波放大电路图
  6. 0.05 MB  |  4次下载  |  3 积分
  7. 4嵌入式linux-聊天程序设计
  8. 0.60 MB  |  3次下载  |  免费
  9. 5DIY动手组装LED电子显示屏
  10. 0.98 MB  |  3次下载  |  免费
  11. 6基于FPGA的C8051F单片机开发板设计
  12. 0.70 MB  |  2次下载  |  免费
  13. 751单片机PM2.5检测系统程序
  14. 0.83 MB  |  2次下载  |  免费
  15. 8基于51单片机的RGB调色灯程序仿真
  16. 0.86 MB  |  2次下载  |  免费

本月

  1. 1OrCAD10.5下载OrCAD10.5中文版软件
  2. 0.00 MB  |  234315次下载  |  免费
  3. 2555集成电路应用800例(新编版)
  4. 0.00 MB  |  33566次下载  |  免费
  5. 3接口电路图大全
  6. 未知  |  30323次下载  |  免费
  7. 4开关电源设计实例指南
  8. 未知  |  21549次下载  |  免费
  9. 5电气工程师手册免费下载(新编第二版pdf电子书)
  10. 0.00 MB  |  15349次下载  |  免费
  11. 6数字电路基础pdf(下载)
  12. 未知  |  13750次下载  |  免费
  13. 7电子制作实例集锦 下载
  14. 未知  |  8113次下载  |  免费
  15. 8《LED驱动电路设计》 温德尔著
  16. 0.00 MB  |  6656次下载  |  免费

总榜

  1. 1matlab软件下载入口
  2. 未知  |  935054次下载  |  免费
  3. 2protel99se软件下载(可英文版转中文版)
  4. 78.1 MB  |  537797次下载  |  免费
  5. 3MATLAB 7.1 下载 (含软件介绍)
  6. 未知  |  420027次下载  |  免费
  7. 4OrCAD10.5下载OrCAD10.5中文版软件
  8. 0.00 MB  |  234315次下载  |  免费
  9. 5Altium DXP2002下载入口
  10. 未知  |  233046次下载  |  免费
  11. 6电路仿真软件multisim 10.0免费下载
  12. 340992  |  191186次下载  |  免费
  13. 7十天学会AVR单片机与C语言视频教程 下载
  14. 158M  |  183279次下载  |  免费
  15. 8proe5.0野火版下载(中文版免费下载)
  16. 未知  |  138040次下载  |  免费