在近几十年中,强化学习(RL)已经成为解决复杂控制任务的有效方法。在通常使用的马尔可夫决策过程(MDP)框架中,环境被假定为一个固定的实体,无法从外部进行修改。然而,在许多实际场景中,环境可以在一定范围内被修改。这本书《在强化学习中利用环境可配置性》旨在形式化和研究环境配置的多样化方面。在传统的MDP中,智能体感知环境的状态并执行动作。作为结果,环境转换到新的状态并生成奖励信号。智能体的目标包括学习一个策略,即最大化长期奖励的动作处方。尽管环境配置在实际应用中经常出现,但该主题在文献中的探讨非常少。书中的贡献是理论的、算法的和实验的,可以大致分为三个部分。第一部分介绍了可配置马尔可夫决策过程(Conf-MDPs)的新颖形式化,以模拟环境提供的配置机会。书的第二部分专注于合作的Conf-MDP设置,并研究了寻找一个同时优化长期奖励的智能体策略和环境配置的问题。第三部分解决了Conf-MDP框架的两个特定应用:策略空间识别和控制频率适应。这本书将对所有将RL作为工作部分的人感兴趣。

成为VIP会员查看完整内容
51

相关内容

书籍在狭义上的理解是带有文字和图像的纸张的集合。广义的书则是一切传播信息的媒体。
【2023新书】流程系统工程的高级优化,206页pdf
专知会员服务
63+阅读 · 2023年9月25日
【2023新书】学习和控制的最优化理论,435页pdf
专知会员服务
107+阅读 · 2023年7月26日
【2023新书】深度学习时间序列分析,208页pdf
专知会员服务
188+阅读 · 2023年6月2日
【干货书】基于智能体的演化博弈动力学,207页pdf
专知会员服务
98+阅读 · 2023年4月3日
【2022新书】深度学习归一化技术,117页pdf
专知会员服务
96+阅读 · 2022年11月25日
【实用书】强化学习实战:Python,110页pdf
专知会员服务
147+阅读 · 2022年6月9日
【新书】感知和行动的贝叶斯模型,348页pdf
专知会员服务
71+阅读 · 2021年11月18日
专知会员服务
76+阅读 · 2021年7月23日
【2021新书】概率图模型:原理与应用,370页pdf
专知会员服务
231+阅读 · 2021年5月26日
【干货书】计算机科学离散数学,627页pdf
专知
60+阅读 · 2020年8月31日
国家自然科学基金
7+阅读 · 2017年12月31日
国家自然科学基金
11+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
26+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Arxiv
158+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
407+阅读 · 2023年3月31日
Arxiv
68+阅读 · 2023年3月26日
Arxiv
21+阅读 · 2023年3月17日
Arxiv
18+阅读 · 2021年3月16日
Arxiv
11+阅读 · 2018年7月31日
VIP会员
相关VIP内容
【2023新书】流程系统工程的高级优化,206页pdf
专知会员服务
63+阅读 · 2023年9月25日
【2023新书】学习和控制的最优化理论,435页pdf
专知会员服务
107+阅读 · 2023年7月26日
【2023新书】深度学习时间序列分析,208页pdf
专知会员服务
188+阅读 · 2023年6月2日
【干货书】基于智能体的演化博弈动力学,207页pdf
专知会员服务
98+阅读 · 2023年4月3日
【2022新书】深度学习归一化技术,117页pdf
专知会员服务
96+阅读 · 2022年11月25日
【实用书】强化学习实战:Python,110页pdf
专知会员服务
147+阅读 · 2022年6月9日
【新书】感知和行动的贝叶斯模型,348页pdf
专知会员服务
71+阅读 · 2021年11月18日
专知会员服务
76+阅读 · 2021年7月23日
【2021新书】概率图模型:原理与应用,370页pdf
专知会员服务
231+阅读 · 2021年5月26日
相关基金
国家自然科学基金
7+阅读 · 2017年12月31日
国家自然科学基金
11+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
26+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
相关论文
Arxiv
158+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
407+阅读 · 2023年3月31日
Arxiv
68+阅读 · 2023年3月26日
Arxiv
21+阅读 · 2023年3月17日
Arxiv
18+阅读 · 2021年3月16日
Arxiv
11+阅读 · 2018年7月31日
微信扫码咨询专知VIP会员