【2023新书】不确定性决策与强化学习:理论与算法，251页pdf - 专知VIP

会员服务 ·

85

不确定性决策 · 强化学习 · 书籍 ·

2023 年 6 月 1 日

【2023新书】不确定性决策与强化学习:理论与算法，251页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

这本书的目的是将不确定情况下的决策基础结果集中在一处。特别的，目标是对序列决策制定问题的算法和理论给出统一的描述，包括强化学习。从基础的统计决策理论开始，我们进展到强化学习问题和各种解决方法。本书的最后聚焦于模型和近似算法的当前艺术状态。不确定性下的决策制定问题可以分解为两部分。首先，我们如何了解世界？这包括了关于我们最初对世界的不确定性建模的问题，以及从证据和我们的初始信仰中得出结论的问题。其次，考虑到可能改变我们结论的未来事件和观察，我们当前对世界的了解，我们应该如何决定要做什么？通常，这将涉及创建覆盖可能未来情况的长期计划。也就是说，在不确定性下规划时，我们还需要考虑在执行我们的计划时可能产生的未来知识。直观地说，执行涉及尝试新事物的计划应该提供更多的信息，但很难判断这些信息是否会有益。在已知能产生好结果的事物和试验新事物之间的选择被称为探索–利用困境，它是学习和规划互动的根源。这本书的第一部分，第1-4章，专注于非序列设置下的不确定性决策。这包括假设测试等场景，其中决策者必须根据可用证据选择一个行动。大部分的发展都是通过贝叶斯推理和决策理论的视角给出的，其中决策者对真实情况有一个主观信仰（以概率分布表示）。本书的第二部分，第5-8章，介绍了序列问题和马尔可夫决策过程的形式主义。其余章节致力于强化学习问题，这是最通用的不确定性下的序列决策问题之一。最后，我们增加了一些理论和实践练习，希望能帮助读者理解这些材料。

成为VIP会员查看完整内容

相关内容

不确定性决策

不确定性决策

【2023新书】强化学习导论(自适应计算与机器学习)

【2023新书】强化学习导论(自适应计算与机器学习)

专知会员服务

82+阅读 · 2023年7月13日

【2023新书】决策智能手册：在复杂世界中基于证据做出决策的实用步骤, 270页pdf

【2023新书】决策智能手册：在复杂世界中基于证据做出决策的实用步骤, 270页pdf

专知会员服务

181+阅读 · 2023年7月5日

现代自适应控制与强化学习，166页pdf

现代自适应控制与强化学习，166页pdf

专知会员服务

110+阅读 · 2022年8月30日

【实用书】强化学习实战：Python，110页pdf

【实用书】强化学习实战：Python，110页pdf

专知会员服务

148+阅读 · 2022年6月9日

【新书】分布式强化学习，280页pdf

【新书】分布式强化学习，280页pdf

专知会员服务

160+阅读 · 2021年12月19日

【干货书】贝叶斯推理和机器学习，610页pdf

专知会员服务

258+阅读 · 2021年10月8日

【斯坦福经典书】强化学习在金融应用，414页pdf

【斯坦福经典书】强化学习在金融应用，414页pdf

专知会员服务

127+阅读 · 2021年3月30日

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

专知会员服务

148+阅读 · 2021年1月18日

【斯坦福干货书】强化学习基金融领域应用，312页pdf

【斯坦福干货书】强化学习基金融领域应用，312页pdf

专知会员服务

134+阅读 · 2020年12月22日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知会员服务

232+阅读 · 2020年4月28日

【简明书】强化学习的基础，111页pdf

【简明书】强化学习的基础，111页pdf

专知

1+阅读 · 2022年11月16日

【2022新书】强化学习基础及其在金融中的应用，522页pdf

【2022新书】强化学习基础及其在金融中的应用，522页pdf

专知

10+阅读 · 2022年11月6日

【牛津大学博士论文】解释黑盒算法:认识论挑战和机器学习解决方案，247页pdf

【牛津大学博士论文】解释黑盒算法:认识论挑战和机器学习解决方案，247页pdf

专知

2+阅读 · 2022年10月26日

【2022新书】基于模糊随机变量的模糊统计推理，295页pdf

【2022新书】基于模糊随机变量的模糊统计推理，295页pdf

专知

9+阅读 · 2022年10月17日

【干货书】强化学习Python真实数据与实例应用，110页pdf

【干货书】强化学习Python真实数据与实例应用，110页pdf

专知

9+阅读 · 2022年10月13日

【CMU硬核书】现代自适应控制与强化学习，166页pdf

【CMU硬核书】现代自适应控制与强化学习，166页pdf

专知

4+阅读 · 2022年8月30日

【新书】分布式强化学习，280页pdf

【新书】分布式强化学习，280页pdf

专知

22+阅读 · 2021年12月19日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

专知

25+阅读 · 2019年11月23日

【强化学习】强化学习的应用场景、基本概念、数学模型和交易中的应用

【强化学习】强化学习的应用场景、基本概念、数学模型和交易中的应用

产业智能官

18+阅读 · 2019年1月1日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

41+阅读 · 2015年12月31日

高维混合数据异常知识发现的粒计算模型关键问题研究

国家自然科学基金

1+阅读 · 2014年12月31日

关于大数据处理分布式学习算法的可行性理论研究

国家自然科学基金

3+阅读 · 2013年12月31日

两类复杂机器环境的现代排序研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于模糊层次分析法的群体决策理论及其应用研究

国家自然科学基金

3+阅读 · 2012年12月31日

关于一类非凸全局优化和变分问题的研究

国家自然科学基金

0+阅读 · 2011年12月31日

模糊推理与不确定性决策理论的结合研究

国家自然科学基金

2+阅读 · 2011年12月31日

覆盖决策信息系统理论及其在复杂系统决策中的应用

国家自然科学基金

1+阅读 · 2011年12月31日

基于行为决策理论的决策分析方法及其应用研究

国家自然科学基金

4+阅读 · 2009年12月31日

基于抽象解释的逻辑程序验证研究

国家自然科学基金

1+阅读 · 2008年12月31日

Learning Multi-agent Skills for Tabular Reinforcement Learning using Factor Graphs

Arxiv

0+阅读 · 2023年7月21日

Learning from time-dependent streaming data with online stochastic algorithms

Arxiv

0+阅读 · 2023年7月18日

Quantum Network Discrimination

Arxiv

0+阅读 · 2023年7月14日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

A Survey of Deep Reinforcement Learning in Recommender Systems: A Systematic Review and Future Directions

Arxiv

14+阅读 · 2021年9月8日

Building Intelligent Autonomous Navigation Agents

Arxiv

24+阅读 · 2021年6月25日

Imbalance Problems in Object Detection: A Review

Arxiv

24+阅读 · 2020年3月11日

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Arxiv

26+阅读 · 2020年2月10日

The Book of Why: Review

Arxiv

15+阅读 · 2019年9月30日

Explainable Recommendation: A Survey and New Perspectives

Arxiv

11+阅读 · 2018年5月13日

VIP会员

相关主题

不确定性决策

相关VIP内容

【2023新书】强化学习导论(自适应计算与机器学习)

【2023新书】强化学习导论(自适应计算与机器学习)

专知会员服务

82+阅读 · 2023年7月13日

【2023新书】决策智能手册：在复杂世界中基于证据做出决策的实用步骤, 270页pdf

【2023新书】决策智能手册：在复杂世界中基于证据做出决策的实用步骤, 270页pdf

专知会员服务

181+阅读 · 2023年7月5日

现代自适应控制与强化学习，166页pdf

现代自适应控制与强化学习，166页pdf

专知会员服务

110+阅读 · 2022年8月30日

【实用书】强化学习实战：Python，110页pdf

【实用书】强化学习实战：Python，110页pdf

专知会员服务

148+阅读 · 2022年6月9日

【新书】分布式强化学习，280页pdf

【新书】分布式强化学习，280页pdf

专知会员服务

160+阅读 · 2021年12月19日

【干货书】贝叶斯推理和机器学习，610页pdf

专知会员服务

258+阅读 · 2021年10月8日

【斯坦福经典书】强化学习在金融应用，414页pdf

【斯坦福经典书】强化学习在金融应用，414页pdf

专知会员服务

127+阅读 · 2021年3月30日

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

专知会员服务

148+阅读 · 2021年1月18日

【斯坦福干货书】强化学习基金融领域应用，312页pdf

【斯坦福干货书】强化学习基金融领域应用，312页pdf

专知会员服务

134+阅读 · 2020年12月22日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知会员服务

232+阅读 · 2020年4月28日

热门VIP内容

开通专知VIP会员享更多权益服务

《小型无人机系统侦测追踪技术：声学、计算机视觉与深度学习融合方案》最新98页

《"牧羊人网格"拦截策略：实现无人机集群可靠拦截的新范式》

光纤无人机：反无人机系统的重大挑战

《作战建模与仿真实证研究》

相关资讯

【简明书】强化学习的基础，111页pdf

【简明书】强化学习的基础，111页pdf

专知

1+阅读 · 2022年11月16日

【2022新书】强化学习基础及其在金融中的应用，522页pdf

【2022新书】强化学习基础及其在金融中的应用，522页pdf

专知

10+阅读 · 2022年11月6日

【牛津大学博士论文】解释黑盒算法:认识论挑战和机器学习解决方案，247页pdf

【牛津大学博士论文】解释黑盒算法:认识论挑战和机器学习解决方案，247页pdf

专知

2+阅读 · 2022年10月26日

【2022新书】基于模糊随机变量的模糊统计推理，295页pdf

【2022新书】基于模糊随机变量的模糊统计推理，295页pdf

专知

9+阅读 · 2022年10月17日

【干货书】强化学习Python真实数据与实例应用，110页pdf

【干货书】强化学习Python真实数据与实例应用，110页pdf

专知

9+阅读 · 2022年10月13日

【CMU硬核书】现代自适应控制与强化学习，166页pdf

【CMU硬核书】现代自适应控制与强化学习，166页pdf

专知

4+阅读 · 2022年8月30日

【新书】分布式强化学习，280页pdf

【新书】分布式强化学习，280页pdf

专知

22+阅读 · 2021年12月19日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

专知

25+阅读 · 2019年11月23日

【强化学习】强化学习的应用场景、基本概念、数学模型和交易中的应用

【强化学习】强化学习的应用场景、基本概念、数学模型和交易中的应用

产业智能官

18+阅读 · 2019年1月1日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

41+阅读 · 2015年12月31日

高维混合数据异常知识发现的粒计算模型关键问题研究

国家自然科学基金

1+阅读 · 2014年12月31日

关于大数据处理分布式学习算法的可行性理论研究

国家自然科学基金

3+阅读 · 2013年12月31日

两类复杂机器环境的现代排序研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于模糊层次分析法的群体决策理论及其应用研究

国家自然科学基金

3+阅读 · 2012年12月31日

关于一类非凸全局优化和变分问题的研究

国家自然科学基金

0+阅读 · 2011年12月31日

模糊推理与不确定性决策理论的结合研究

国家自然科学基金

2+阅读 · 2011年12月31日

覆盖决策信息系统理论及其在复杂系统决策中的应用

国家自然科学基金

1+阅读 · 2011年12月31日

基于行为决策理论的决策分析方法及其应用研究

国家自然科学基金

4+阅读 · 2009年12月31日

基于抽象解释的逻辑程序验证研究

国家自然科学基金

1+阅读 · 2008年12月31日

相关论文

Learning Multi-agent Skills for Tabular Reinforcement Learning using Factor Graphs

Arxiv

0+阅读 · 2023年7月21日

Learning from time-dependent streaming data with online stochastic algorithms

Arxiv

0+阅读 · 2023年7月18日

Quantum Network Discrimination

Arxiv

0+阅读 · 2023年7月14日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

A Survey of Deep Reinforcement Learning in Recommender Systems: A Systematic Review and Future Directions

Arxiv

14+阅读 · 2021年9月8日

Building Intelligent Autonomous Navigation Agents

Arxiv

24+阅读 · 2021年6月25日

Imbalance Problems in Object Detection: A Review

Arxiv

24+阅读 · 2020年3月11日

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Arxiv

26+阅读 · 2020年2月10日

The Book of Why: Review

Arxiv

15+阅读 · 2019年9月30日

Explainable Recommendation: A Survey and New Perspectives

Arxiv

11+阅读 · 2018年5月13日

微信扫码咨询专知VIP会员