资料介绍
人工智能(Artificial Intelligence,AI)主要研究人类思
维、行动中那些尚未算法化的功能行为, 使机器像人的大
脑一样思考、行动。长期以来, 围棋作为一种智力博弈游
戏, 以其变化莫测的博弈局面, 高度体现了人类的智慧, 为
人工智能研究提供了一个很好的测试平台, 围棋人工智能
也是人工智能领域的一个重要挑战。
传统的计算机下棋程序的基本原理, 是通过有限步数
的搜索树, 即采用数学和逻辑推理方法, 把每一种可能的
路径都走一遍, 从中选举出最优路径, 使得棋局胜算最大。
这种下棋思路是充分发挥计算机运算速度快、运算量大等
优势的“暴力搜索法”, 是人类在对弈规定的时间限制内无
法做到的。但是由于围棋局面数量太大, 这样的运算量对
于计算机来讲也是相当之大, 目前的计算机硬件无法在对
弈规定的时间内, 使用计算机占绝对优势的“暴力搜索法”
完成围棋所有局面的择优, 所以这样的下棋思路不适用于
围棋对弈。
搜索量巨大的问题一直困扰着围棋人工智能, 使其发
展停滞不前,直到2 0 0 6 年, 蒙特卡罗树搜索的应用出现,
才使得围棋人工智能进入了崭新的阶段, 现代围棋人工智
能的主要算法是基于蒙特卡洛树的优化搜索。
2 围棋人工智能基本原理
目前围棋人工智能最杰出的代表, 是由谷歌旗下人工
智能公司DeepMind创造的AlphaGo围棋人工智能系统。它
在与人类顶级围棋棋手的对弈中充分发挥了其搜索和计
算的优势, 几乎在围棋界立于不败之地。
Alph a G o系统的基本原理是将深度强化学习方法与蒙
特卡洛树搜索结合, 使用有监督学习策略网络和价值网
络, 极大减少了搜索空间, 即在搜索过程中的计算量, 提高
了对棋局估计的准确度。
2.1 深度强化学习方法
听觉信号的感知处理都是下意识的, 是基于大脑皮层神经
网络的学习方法, 通过模拟大脑皮层推断分析数据的复杂
层状网络结构, 使用包含复杂结构或由多重非线性变换构
成的多个处理层对数据进行高层抽象, 其过程类似于人们
识别物体标注图片。现如今, 应用最广泛的深度学习模型
包括: 卷积神经网络、深度置信网络、堆栈自编码网络和递
归神经网络等。
强化学习源于动物学习、参数扰动自适应控制等理
论, 通过模拟生物对环境以试错的方式进行交互达到对环
境的最优适应的方式, 通过不断地反复试验, 将变化无常
的动态情况与对应动作相匹配。强化学习系统设置状态、
动作、状态转移概率和奖赏四个部分, 在当前状态下根据
策略选择动作, 执行该过程并以当前转移概率转移到下一
状态, 同时接收环境反馈回来的奖赏, 最终通过调整策略
来最大化累积奖赏。
深度学习具有较强的感知能力, 但缺乏一定的决策能
力; 强化学习具有决策能力, 同样对感知问题无能为力。深
度强化学习方法是将具有感知能力的深度学习和具有决
策能力的强化学习结合起来, 优势互补, 用深度学习进行
感知, 从环境中获取目标观测信息, 提供当前环境下的状
态信息; 然后用强化学习进行决策, 将当前状态映射到相
应动作, 基于初期汇报评判动作价值。
深度强化学习为复杂系统的感知决策问题提供了一
种全新的解决思路。
2.2 蒙特卡洛树搜索
蒙特卡洛树搜索是将蒙特卡洛方法与树搜索相结合
形成的一种搜索方法。所谓蒙特卡洛方法是一种以概率统
计理论为指导的强化学习方法, 它通常解决某些随机事件
出现的概率问题, 或者是某随机变量的期望值等数字特征
问题。通过与环境的交互, 从所采集的样本中学习, 获得关
于决策过程的状态、动作和奖赏的大量数据, 最后计算出
累积奖赏的平均值。
蒙特卡洛树搜索算法是一种用于解决完美信息博弈
(perfect information games,没有任何信息被隐藏的游戏)
的方法,主要包含选择(Selection)、扩展(Expansion)、模拟
- 步进马达基本原理 8次下载
- 电磁炉基本原理图下载 27次下载
- 直流电源系统基本原理
- 数模和模数转换的基本原理PPT课件下载 7次下载
- 开关电源的基本原理及组成、不同技术综述 50次下载
- 神经网络的基本原理 8次下载
- 半导体二极管参数符号及其意义总结 19次下载
- BP神经网络基本原理简介 16次下载
- 蚁群算法的基本原理及其改进算法.ppt 6次下载
- 实验二 AD09基本原理图的设计 0次下载
- 人工智能弥补医疗资源的不足与诊断肺癌的介绍及其意义 0次下载
- 傅立叶变换红外光谱仪的基本原理及其应用 7次下载
- 智能控制--模糊控制的基本原理 0次下载
- 人工智能及其应用 0次下载
- VoIP的基本原理与技术
- LLM预训练的基本概念、基本原理和主要优势 697次阅读
- 人工智能模型有哪些 421次阅读
- 人工智能深度学习的五大模型及其应用领域 2148次阅读
- 神经网络的基本原理 641次阅读
- 人工智能中文本分类的基本原理和关键技术 946次阅读
- 无功补偿装置的基本原理及作用 500次阅读
- 无功补偿的意义及基本原理 439次阅读
- 什么是人工智能上百个人工智能的经典问答 6027次阅读
- 浅析单片机中PWM的基本概念和基本原理 1.1w次阅读
- 六张图看懂人工智能的前世今生 4329次阅读
- 腾讯微信翻译团队开源的人工智能围棋项目 PhoenixGo 5788次阅读
- 人工智能为何这么热_人工智能价值与应用_无人机属于人工智能吗 7410次阅读
- 人工智能需要哪些知识_人工智能需要学什么_如何自学人工智能 4.4w次阅读
- 为什么要发展人工智能_发展人工智能经济意义分析 4.8w次阅读
- “人工智能+”或再掀新一轮热潮 经济形态迎巨变 475次阅读
下载排行
本周
- 1TC358743XBG评估板参考手册
- 1.36 MB | 330次下载 | 免费
- 2开关电源基础知识
- 5.73 MB | 11次下载 | 免费
- 3100W短波放大电路图
- 0.05 MB | 4次下载 | 3 积分
- 4嵌入式linux-聊天程序设计
- 0.60 MB | 3次下载 | 免费
- 5DIY动手组装LED电子显示屏
- 0.98 MB | 3次下载 | 免费
- 6基于FPGA的C8051F单片机开发板设计
- 0.70 MB | 2次下载 | 免费
- 751单片机PM2.5检测系统程序
- 0.83 MB | 2次下载 | 免费
- 8基于51单片机的RGB调色灯程序仿真
- 0.86 MB | 2次下载 | 免费
本月
- 1OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234315次下载 | 免费
- 2555集成电路应用800例(新编版)
- 0.00 MB | 33566次下载 | 免费
- 3接口电路图大全
- 未知 | 30323次下载 | 免费
- 4开关电源设计实例指南
- 未知 | 21549次下载 | 免费
- 5电气工程师手册免费下载(新编第二版pdf电子书)
- 0.00 MB | 15349次下载 | 免费
- 6数字电路基础pdf(下载)
- 未知 | 13750次下载 | 免费
- 7电子制作实例集锦 下载
- 未知 | 8113次下载 | 免费
- 8《LED驱动电路设计》 温德尔著
- 0.00 MB | 6656次下载 | 免费
总榜
- 1matlab软件下载入口
- 未知 | 935054次下载 | 免费
- 2protel99se软件下载(可英文版转中文版)
- 78.1 MB | 537797次下载 | 免费
- 3MATLAB 7.1 下载 (含软件介绍)
- 未知 | 420027次下载 | 免费
- 4OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234315次下载 | 免费
- 5Altium DXP2002下载入口
- 未知 | 233046次下载 | 免费
- 6电路仿真软件multisim 10.0免费下载
- 340992 | 191186次下载 | 免费
- 7十天学会AVR单片机与C语言视频教程 下载
- 158M | 183279次下载 | 免费
- 8proe5.0野火版下载(中文版免费下载)
- 未知 | 138040次下载 | 免费
评论
查看更多