-
内容大纲
随着人工智能时代的到来,特别是AlphaGo、ChatGPT等突破性技术的问世,深度强化学习算法已展现出其独特的优势,并在处理复杂决策问题方面发挥出巨大潜力。深度强化学习算法将深度学习的感知能力与强化学习的决策能力相结合,实现了端到端的学习,是一种更加接近于人类思维方式的人工智能算法。然而,目前对深度强化学习算法的研究仍处于初步发展阶段,面临诸多挑战,包括样本利用效率低、“探索和利用”难以平衡及奖励函数设计困难等问题。本书系统阐述了深度强化学习算法的理论和原理,针对其在量化金融、工业运维等应用领域所面临的研究难点,展开相关研究,并创新性地提出相应的改进算法,以推动深度强化学习算法在智能决策领域的进一步发展。 -
作者介绍
-
目录
1 绪论
1.1 研究背景与研究意义
1.2 国内外研究现状综述
1.3 研究内容及创新
1.4 本书的组织结构
2 深度强化学习算法概述
2.1 强化学习算法的原理
2.2 最优价值算法
2.3 基于策略梯度的算法
2.4 小结
3 基于信息瓶颈理解正则化算法的工作原理
3.1 引言
3.2 相关工作
3.3 正则项的工作原理
3.4 实验
3.5 小结
4 多模块并行的单资产交易深度强化学习算法
4.1 引言
4.2 用于单资产交易的PMMRL算法
4.3 实验
4.4 小结
5 趋势一致的多智能体投资组合强化学习算法
5.1 引言
5.2 用于投资组合管理的深度强化学习算法
5.3 趋势一致正则项
5.4 实验
5.5 风险管理
5.6 小结
6 针对复杂多步骤任务的多环境并行的深度强化学习算法
6.1 引言
6.2 多环境并行的奖励塑形算法
6.3 数值实验
6.4 小结
7 深度强化学习在工业智能运维中的应用
7.1 引言
7.2 深度强化学习在智能运维中的优势
7.3 强化学习算法在各工业领域中的应用
7.4 小结
8 总结与展望
8.1 总结
8.2 展望
参考文献
与本书相关的研究成果
附录 A 技术指标
附录 B 评价指标
索引
后记
同类热销排行榜
- 向着光亮那方/谁的青春不迷茫系列16.8
- 你所谓的稳定不过是在浪费生命15.2
- 全球通史(从史前史到21世纪第7版修订版下)/培文书系21.6
- 答案之书(精)15.2
- 八万四千问18
- 万历十五年/黄仁宇作品系列10.4
- 耶路撒冷三千年(精)31.2
- 中国大历史/黄仁宇作品系列11.2
- 梦的解析15.92
- 鱼羊野史(第6卷11-12月晓松说历史上的今天)18
推荐书目
-

孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-

时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-

本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...
[
