-
内容大纲
《动态规划与最优控制——近似动态规划》共两卷,本书为第I卷,主要介绍动态规划与最优控制的基本方法,包括最短路径问题、精确和不精确状态信息、有限和无限阶段问题等经典模型,以及近似动态规划等理论方法。本书深入浅出,非常适合控制、优化、电子工程、计算机、工业工程等专业的研究生学习,也适合作为高年级本科生和本领域的研究者的参考书。 -
作者介绍
德梅萃·P.博塞克斯(Dimitri Bertsekas)曾在希腊国立雅典技术大学学习机械与电机工程,之后从麻省理工学院获得系统科学博士学位。曾先后在斯坦福大学工程与经济系统系和伊利诺伊大学香槟分校的电机工程系任教。1979年以来,他一直在麻省理工学院电机工程与计算机科学系任教,现任麦卡菲工程教授。其研究涉及多个领域,包括优化、控制、大规模计算和数据通信网络,并与其教学和著书工作联系紧密。他已撰写14本著作以及众多论文,其中数本著作在麻省理工学院被用作教材。他与动态规划之缘始于博士论文的研究,并通过学术论文、多本教材和学术专著一直延续至今。 Bertsekas 教授因其著作《神经元动态规划》(与John Tsitsiklis合著)荣获1997年INFORMS 授予的运筹学与计算机科学交叉领域的杰出研究成果奖、2000年希腊运筹学国家奖、2001年美国控制会议John R.Ragazzini奖以及2009年INFORMS Expository写作奖。2001年,他因为“基础性研究、实践并教育优化/控制理论,特别是在数据通信网络中的应用”当选美国工程院院士。 Bertsekas博士近些年出版的书包括《概率导论》第二版(2008年与John Tsitsiklis合著)和《凸优化理论》(2009),均由雅典娜科学出版社出版。 -
目录
第1章 动态规划算法
1.1 概述
1.2 基本问题
1.3 算法
1.4 状态增广和其他重新建模
1.5 一些数学问题
1.6 动态规划和极小化极大控制
1.7 注释、参考文献和习题
第2章 确定性系统和最短路径问题
2.1 有限状态系统和最短路径
2.2 一些最短路径的应用
2.2.1 关键路径分析
2.2.2 隐马尔可夫模型和瓦特比算法
2.3 最短路径算法
2.3.1 标签纠正方法
2.3.2 标签纠正变形-A*算法
2.3.3 分支定界
2.3.4 约束与多目标问题
2.4 注释、参考文献和习题
第3章 确定性连续时间最优控制
3.1 连续时间最优控制
3.2 哈密尔顿-雅可比-贝尔曼方程
3.3 庞特里亚金最小值原理
3.3.1 使用HJB方程的非正式推导
3.3.2 一种基于变分思想的推导
3.3.3 离散时间问题的最小值原理
3.4 最小值原理推广
3.4.1 固定的末端状态
3.4.2 自由初始状态
3.4.3 自由终止时间
3.4.4 时变系统与费用
3.4.5 奇异问题
3.5 注释、参考文献和习题
第4章 具有精确状态信息的问题
4.1 线性系统和二次型费用
4.2 库存控制
4.3 动态资本分析
4.4 最优停止问题
4.5 调度与交换的理由
4.6 不确定性的集合隶属度描述
4.6.1 集合隶属度估计
4.6.2 具有未知且有界扰动的控制
4.7 注释、参考文献和习题
第5章 不精确状态信息的问题
5.1 化简为精确信息的情形
5.2 线性系统和二次型费用
5.3 线性系统的最小方差控制
5.4 充分统计量
5.4.1 条件状态分布
5.4.2 有限状态系统
5.5 注释、参考文献和习题
第6章 近似动态规划
6.1 确定性等价和自适应控制
6.1.1 谨慎、探测和对偶控制
6.1.2 两阶段控制和识别能力
6.1.3 确定性等价控制和可辨识性
6.1.4 自调节调节器
6.2 开环反馈控制
6.3 有限前瞻策略
6.3.1 有限前瞻策略的性能界
6.3.2 有限前瞻中的计算问题
6.3.3 问题近似——强化分解
6.3.4 集结
6.3.5 后续费用的参数化近似
6.4 滚动算法
6.4.1 离散确定性问题
6.4.2 由仿真评价的Q-因子
6.4.3 Q-因子近似
6.5 模型预测控制及相关方法
6.5.1 滚动时段近似
6.5.2 模型预测控制中的稳定性问题
6.5.3 结构受限的策略
6.6 近似动态规划中的额外主题
6.6.1 离散化
6.6.2 其他近似方法
6.7 注释、参考文献和习题
第7章 无限阶段问题介绍
7.1 概览
7.2 随机最短路径问题
7.3 折扣问题
7.4 每阶段平均费用问题
7.5 半马尔可夫问题
7.6 注释、参考文献和习题
附录A 数学知识复习
A.1 集合
A.2 欧氏空间
A.3 矩阵
A.4 分析
A.5 凸集和凸函数
附录B 优化理论
B.1 最优解
B.2 最优性条件
B.3 二次型最小化
附录C 概率论
C.1 概率空间
C.2 随机变量
C.3 条件概率
附录D 关于有限状态马尔可夫链
D.1 平稳马尔可夫链
D.2 状态分类
D.3 极限概率
D.4 首达时间
附录E 卡尔曼滤波
E.1 最小二乘估计
E.2 线性最小二乘估计
E.3 状态估计一卡尔曼滤波器
E.4 稳定性方面
E.5 高斯-马尔可夫估计器
E.6 确定性最小二乘估计
附录F 随机线性系统模型
F.1 具有随机输入的线性系统
F.2 具有有理数谱的过程
F.3 ARMAX模型
附录G 不确定性下的决策问题建模
G.1 不确定性下的决策问题
G.2 期望效用理论和风险
G.3 随机最优控制问题
参考文献
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...