-
内容大纲
这是一本深入浅出且极富趣味的深度学习入门书。本书选取深度学习近年来最重大的突破之一AlphaGo,将其背后的技术和原理娓娓道来,并配合一套基于BetaGo的开源代码,带领读者从零开始一步步实现自己的“AlphaGo”。本书侧重实践,深入浅出,庖丁解牛般地将深度学习和AlphaGo这样深奥的话题变得平易近人、触手可及,内容非常精彩。
全书共分为3个部分:第一部分介绍机器学习和围棋的基础知识,并构建一个最简围棋机器人,作为后面章节内容的基础;第二部分分层次深入介绍AlphaGo背后的机器学习和深度学习技术,包括树搜索、神经网络、深度学习机器人和强化学习,以及强化学习的几个高级技巧,包括策略梯度、价值评估方法、演员一评价方法3类技术;第三部分将前面两部分准备好的知识集成到一起,并最终引导读者实现自己的AlphaGo,以及改进版AlphaGo Zero。读完本书之后,读者会对深度学习这个学科以及AlphaGo的技术细节有非常全面的了解,为进一步深入钻研AI理论、拓展AI应用打下良好基础。
本书不要求读者对AI或围棋有任何了解,只需要了解基本的Python语法以及基础的线性代数和微积分知识。本书适合广大在校学生、技术人员,以及所有对AI、深度学习或围棋感兴趣的读者。 -
作者介绍
-
目录
第一部分 基础知识
第1章 走近深度学习:机器学习入门
1.1 什么是机器学习
1.1.1 机器学习与AI的关系
1.1.2 机器学习能做什么,不能做什么
1.2 机器学习示例
1.2.1 在软件应用中使用机器学习
1.2.2 监督学习
1.2.3 无监督学习
1.2.4 强化学习
1.3 深度学习
1.4 阅读本书能学到什么
1.5 小结
第2章 围棋与机器学习
2.1 为什么选择游戏
2.2 围棋快速入门
2.2.1 了解棋盘
2.2.2 落子与吃子
2.2.3 终盘与胜负计算
2.2.4 理解劫争
2.2.5 让子
2.3 更多学习资源
2.4 我们可以教会计算机什么
2.4.1 如何开局
2.4.2 搜索游戏状态
2.4.3 减少需要考虑的动作数量
2.4.4 评估游戏状态
2.5 如何评估围棋AI的能力
2.5.1 传统围棋评级
2.5.2 对围棋AI进行基准测试
2.6 小结
第3章 实现第一个围棋机器人
3.1 在Python中表达围棋游戏
3.1.1 实现围棋棋盘
3.1.2 在围棋中跟踪相连的棋组:棋链
3.1.3 在棋盘上落子和提子
3.2 跟踪游戏状态并检查非法动作
3.2.1 自吃
3.2.2 劫争
3.3 终盘
3.4 创建自己的第一个机器人:理论上最弱的围棋AI
3.5 使用Zobrist哈希加速棋局
3.6 人机对弈
3.7 小结
第二部分 机器学习和游戏AI
第4章 使用树搜索下棋
第5章 神经网络入门
第6章 为围棋数据设计神经网络
第7章 从数据中学习:构建深度学习机器人
第8章 实地部署围棋机器人
第9章 通过实践学习:强化学习
第10章 基于策略梯度的强化学习
第11章 基于价值评估方法的强化学习
第12章 基于演员-评价方法的强化学习
第三部分 一加一大于二
第13章 AlphaGo:全部集结
第14章 AlphaGo Zero:将强化学习集成到树搜索中
附录A 数学基础
附录B 反向传播算法
附录C 围棋程序与围棋服务器
附录D 用AWS来训练和部署围棋程序与围棋服务器
附录E 将机器人发布到OGS
同类热销排行榜
- 断舍离12.8
- 吃到自然瘦--天王天后养生顾问的择食之道12.8
- 中国居民膳食指南(2016科普版)11.2
- 跟着君之做饼干11.92
- 跟金牌月嫂坐月子/亲亲乐读系列15.92
- 捏捏小手百病消(彩图版)/火柴棒医生手记系列19.2
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...