欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • 控制系统与强化学习/工业自动化与智能化丛书
      • 作者:(美)肖恩·梅恩|责编:刘锋//冯润峰|译者:王占山//王秋富//葛伊阳
      • 出版社:机械工业
      • ISBN:9787111775768
      • 出版日期:2025/04/01
      • 页数:420
    • 售价:59.6
  • 内容大纲

        本书旨在以具有微积分和矩阵代数背景的学生可以理解的方式,解释强化学习和优化控制背后的科学。本书的一个独特重点是算法设计,以获得学习算法的快收敛速度,以及对强化学习有时失败的原因的洞察。一开始就避开了高级随机过程理论,用更直观的确定性探测来代替学习的随机探索。一旦理解了这些思想,掌握植根于随机控制的技术就不难了。这些主题在本书的第二部分有所涉及,从马尔科夫链理论开始,以对强化学习的行为者批评方法的全新审视结束。
  • 作者介绍

  • 目录

    译者序
    前言
      第1章  引言
        1.1  本书涵盖的内容
        1.2  未深入探讨的内容
        1.3  参考资料
    第一部分  无噪声情况下的基础知识
      第2章  控制理论概述
        2.1  身边的控制问题
        2.2  该怎么办
        2.3  状态空间模型
          2.3.1  充分统计量与非线性
          2.3.2  状态增广和学习
          2.3.3  线性状态空间模型
          2.3.4  向牛顿和莱布尼茨致敬
        2.4  稳定性和性能
          2.4.1  总成本
          2.4.2  平衡点的稳定性
          2.4.3  李雅普诺夫函数
          2.4.4  技术证明
          2.4.5  连续时间域的几何
          2.4.6  线性状态空间模型
        2.5  展望未来:从控制理论到强化学习
          2.5.1  演员-评论家
          2.5.2  时间差分
          2.5.3  老虎机与探索
        2.6  如何忽略噪声
        2.7  示例
          2.7.1  华尔街
          2.7.2  山地车
          2.7.3  磁球
          2.7.4  倒立摆
          2.7.5  Pendubot和Acrobot
          2.7.6  合作赛艇
        2.8  习题
        2.9  注记
      第3章  最优控制
        3.1  总成本的价值函数
        3.2  贝尔曼方程
          3.2.1  值迭代
          3.2.2  策略改进
          3.2.3  佩龙-弗罗贝尼乌斯定理:简单介绍
        3.3  各种变形
          3.3.1  折扣成本
          3.3.2  最短路径问题
          3.3.3  有限时域
          3.3.4  模型预测控制
        3.4  逆动态规划
        3.5  贝尔曼方程是一个线性规划
        3.6  线性二次调节器

      ……
    第二部分  强化学习与随机控制
    附录
    参考文献