-
内容大纲
多智能体强化学习(Multi-Agent Reinforcement Learning,MARL)是机器学习中的一个领域,研究多个智能体如何在共享环境中学习最优的交互方式。这一领域在现代生活中有着广泛的应用,包括自动驾驶、多机器人工厂、自动化交易和能源网络管理等。
本书是一部系统阐述多智能体强化学习理论与技术的权威著作,清晰而严谨地介绍了MARL的模型、解决方案概念、算法思想、技术挑战以及现代方法。书中首先介绍了该领域的基础知识,包括强化学习理论和算法的基础、交互式博弈模型、博弈中的不同解决方案概念以及支撑MARL研究的算法思想。随后,书中详细介绍了利用深度学习技术的现代MARL算法,涵盖集中训练与分散执行、价值分解、参数共享和自博弈等思想。本书还附带了一个用Python编写的MARL代码库,其中包括自包含且易于阅读的MARL算法实现。
本书技术内容以易于理解的语言解释,并通过大量示例进行说明,既为初学者阐明了MARL的概念,也为专业的读者提供了高层次的见解。 -
作者介绍
-
目录
译者序
前言
符号总览
第1章 引言
1.1 多智能体系统
1.2 多智能体强化学习
1.3 应用示例
1.3.1 多机器人仓库管理
1.3.2 棋盘游戏和电子游戏中的竞争性对战
1.3.3 自动驾驶
1.3.4 电子市场中的自动化交易
1.4 多智能体强化学习的挑战
1.5 多智能体强化学习的议题
1.6 本书内容和结构
第一部分 多智能体强化学习的基础
第2章 强化学习
2.1 一般定义
2.2 马尔可夫决策过程
2.3 期望折扣回报和最优策略
2.4 价值函数与贝尔曼方程
2.5 动态规划
2.6 时序差分学习
2.7 学习曲线评估
2.8 R(s,a,s')和R(s,a)的等价性
2.9 总结
第3章 博弈:多智能体交互模型
3.1 标准式博弈
3.2 重复标准式博弈
3.3 随机博弈
3.4 部分可观测随机博弈
3.5 建模通信
3.6 博弈中的知识假设
3.7 词典:强化学习与博弈论
3.8 总结
第4章 博弈的解概念
4.1 联合策略与期望回报
4.2 最佳响应
4.3 极小极大算法
4.4 纳什均衡
4.5 ε-纳什均衡
4.6 (粗)相关均衡
4.7 均衡解的概念局限性
4.8 帕雷托最优
4.9 社会福利和公平
……
第二部分 多智能体深度强化学习:算法与实践
多智能体强化学习研究综述
参考文献
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-

孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-

时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-

本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...
[
