这本书的目的是将不确定情况下的决策基础结果集中在一处。特别的,目标是对序列决策制定问题的算法和理论给出统一的描述,包括强化学习。从基础的统计决策理论开始,我们进展到强化学习问题和各种解决方法。本书的最后聚焦于模型和近似算法的当前艺术状态。不确定性下的决策制定问题可以分解为两部分。首先,我们如何了解世界?这包括了关于我们最初对世界的不确定性建模的问题,以及从证据和我们的初始信仰中得出结论的问题。其次,考虑到可能改变我们结论的未来事件和观察,我们当前对世界的了解,我们应该如何决定要做什么?通常,这将涉及创建覆盖可能未来情况的长期计划。也就是说,在不确定性下规划时,我们还需要考虑在执行我们的计划时可能产生的未来知识。直观地说,执行涉及尝试新事物的计划应该提供更多的信息,但很难判断这些信息是否会有益。在已知能产生好结果的事物和试验新事物之间的选择被称为探索–利用困境,它是学习和规划互动的根源。这本书的第一部分,第1-4章,专注于非序列设置下的不确定性决策。这包括假设测试等场景,其中决策者必须根据可用证据选择一个行动。大部分的发展都是通过贝叶斯推理和决策理论的视角给出的,其中决策者对真实情况有一个主观信仰(以概率分布表示)。本书的第二部分,第5-8章,介绍了序列问题和马尔可夫决策过程的形式主义。其余章节致力于强化学习问题,这是最通用的不确定性下的序列决策问题之一。最后,我们增加了一些理论和实践练习,希望能帮助读者理解这些材料。

成为VIP会员查看完整内容
109

相关内容

【2023新书】强化学习导论(自适应计算与机器学习)
专知会员服务
74+阅读 · 2023年7月13日
现代自适应控制与强化学习,166页pdf
专知会员服务
107+阅读 · 2022年8月30日
【实用书】强化学习实战:Python,110页pdf
专知会员服务
146+阅读 · 2022年6月9日
【新书】分布式强化学习,280页pdf
专知会员服务
149+阅读 · 2021年12月19日
专知会员服务
241+阅读 · 2021年10月8日
【斯坦福经典书】强化学习在金融应用,414页pdf
专知会员服务
121+阅读 · 2021年3月30日
【斯坦福干货书】强化学习基金融领域应用,312页pdf
专知会员服务
132+阅读 · 2020年12月22日
【简明书】强化学习的基础,111页pdf
专知
1+阅读 · 2022年11月16日
【新书】分布式强化学习,280页pdf
专知
19+阅读 · 2021年12月19日
国家自然科学基金
38+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
4+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2023年7月14日
Arxiv
24+阅读 · 2021年6月25日
Arxiv
24+阅读 · 2020年3月11日
Arxiv
15+阅读 · 2019年9月30日
VIP会员
相关VIP内容
【2023新书】强化学习导论(自适应计算与机器学习)
专知会员服务
74+阅读 · 2023年7月13日
现代自适应控制与强化学习,166页pdf
专知会员服务
107+阅读 · 2022年8月30日
【实用书】强化学习实战:Python,110页pdf
专知会员服务
146+阅读 · 2022年6月9日
【新书】分布式强化学习,280页pdf
专知会员服务
149+阅读 · 2021年12月19日
专知会员服务
241+阅读 · 2021年10月8日
【斯坦福经典书】强化学习在金融应用,414页pdf
专知会员服务
121+阅读 · 2021年3月30日
【斯坦福干货书】强化学习基金融领域应用,312页pdf
专知会员服务
132+阅读 · 2020年12月22日
相关基金
国家自然科学基金
38+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
4+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员