怎么才能最短时、高效、踏实的学习 Python?
关注者
26,446被浏览
2,379,858登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏
这本书的目的旨在整理不确定性条件下,决策判断相关的一系列知识及结果,就像普特曼在1994年写了一半关于马尔可夫决策过程的书,对马尔可夫决策过程理论进行详细整理。本书的一个主要目标是希望对一个连续决策问题的算法和理论进行完整整理,包括强化学习。从基本的统计决策理论出发,发展到强化学习问题和各种求解方法。这本书的结尾集中在模型和近似算法的当前最先进的科研成果。
本书最新pdf版免费下载地址: 强化学习免费新书-《不确定性决策与强化学习》pdf分享
本书目录
本书正文截图
本书pdf免费版pdf下载地址:强化学习免费新书-《不确定性决策与强化学习》pdf分享
往期精品内容推荐
自然语言处理任务相关经典论文、免费书籍、博客、tf代码整理分享
推荐系统原理、工程、大厂(Youtube、BAT、TMB)架构干活分享
自动化机器学习(AutoML)文献/工具/项目资源大列表分享
新书分享-嵌入式深度学习:持续性神经网路算法、结构和电路设计
8月最新-《可解释机器学习-Christoph Molnar》-新书分享
2019年BAT、TMD等互联网最新、最全面试题目及答案汇总