编程其它

深入浅出强化学习:原理入门 中文pdf完整版[112MB] 含源代码

大小:112.3MB

安全无毒免费软件无广告
百度网盘下载1百度网盘下载2
热门排行

《深入浅出强化学习:原理入门》用通俗易懂的语言深入浅出地介绍了强化学习的基本原理,覆盖了传统的强化学习基本方法和当前炙手可热的深度强化学习方法。开篇从最基本的马尔科夫决策过程入手,将强化学习问题纳入到严谨的数学框架中,接着阐述了解决此类问题最基本的方法——动态规划方法,并从中总结出解决强化学习问题的基本思路:交互迭代策略评估和策略改善。

基于这个思路,分别介绍了基于值函数的强化学习方法和基于直接策略搜索的强化学习方法。最后介绍了逆向强化学习方法和近年具有代表性、比较前沿的强化学习方法。

除了系统地介绍基本理论,书中还介绍了相应的数学基础和编程实例。因此,《深入浅出强化学习:原理入门》既适合零基础的人员入门学习、也适合相关科研人员作为研究参考。

目录

1 绪论 1
第一篇 强化学习基础 17
2 马尔科夫决策过程 18
3 基于模型的动态规划方法 36
第二篇 基于值函数的强化学习方法 57
4 基于蒙特卡罗的强化学习方法 58
5 基于时间差分的强化学习方法 75
6 基于值函数逼近的强化学习方法 88
第三篇 基于直接策略搜索的强化学习方法 125
7 基于策略梯度的强化学习方法 126
8 基于置信域策略优化的强化学习方法 142
9 基于确定性策略搜索的强化学习方法 165
10 基于引导策略搜索的强化学习方法 171
第四篇 强化学习研究及前沿 185
11 逆向强化学习 186
12 组合策略梯度和值函数方法 202
13 值迭代网络 207
14 基于模型的强化学习方法:PILCO及其扩展 214

展开全部

大家还下载了

同类推荐
相关文章

友情提醒:请点击右上角的微信菜单选择使用浏览器打开下载(因为微信中不提供下载功能),点击任意处可关闭该提示信息,谢谢~