【2024新书】强化学习中利用环境可配置性，377页pdf - 专知VIP

会员服务 ·

33

书籍 · 强化学习 ·

2024 年 2 月 19 日

【2024新书】强化学习中利用环境可配置性，377页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

在近几十年中，强化学习（RL）已经成为解决复杂控制任务的有效方法。在通常使用的马尔可夫决策过程（MDP）框架中，环境被假定为一个固定的实体，无法从外部进行修改。然而，在许多实际场景中，环境可以在一定范围内被修改。这本书《在强化学习中利用环境可配置性》旨在形式化和研究环境配置的多样化方面。在传统的MDP中，智能体感知环境的状态并执行动作。作为结果，环境转换到新的状态并生成奖励信号。智能体的目标包括学习一个策略，即最大化长期奖励的动作处方。尽管环境配置在实际应用中经常出现，但该主题在文献中的探讨非常少。书中的贡献是理论的、算法的和实验的，可以大致分为三个部分。第一部分介绍了可配置马尔可夫决策过程（Conf-MDPs）的新颖形式化，以模拟环境提供的配置机会。书的第二部分专注于合作的Conf-MDP设置，并研究了寻找一个同时优化长期奖励的智能体策略和环境配置的问题。第三部分解决了Conf-MDP框架的两个特定应用：策略空间识别和控制频率适应。这本书将对所有将RL作为工作部分的人感兴趣。

成为VIP会员查看完整内容

53

相关内容

书籍在狭义上的理解是带有文字和图像的纸张的集合。广义的书则是一切传播信息的媒体。

【2023新书】流程系统工程的高级优化，206页pdf

【2023新书】流程系统工程的高级优化，206页pdf

专知会员服务

65+阅读 · 2023年9月25日

【2023新书】学习和控制的最优化理论，435页pdf

【2023新书】学习和控制的最优化理论，435页pdf

专知会员服务

110+阅读 · 2023年7月26日

【2023新书】深度学习时间序列分析，208页pdf

【2023新书】深度学习时间序列分析，208页pdf

专知会员服务

190+阅读 · 2023年6月2日

【2023新书】现实世界中的自然语言处理：文本处理、分析和分类，393页pdf

【2023新书】现实世界中的自然语言处理：文本处理、分析和分类，393页pdf

专知会员服务

112+阅读 · 2023年5月25日

【干货书】基于智能体的演化博弈动力学，207页pdf

【干货书】基于智能体的演化博弈动力学，207页pdf

专知会员服务

104+阅读 · 2023年4月3日

【2022新书】深度学习归一化技术，117页pdf

【2022新书】深度学习归一化技术，117页pdf

专知会员服务

97+阅读 · 2022年11月25日

【实用书】强化学习实战：Python，110页pdf

【实用书】强化学习实战：Python，110页pdf

专知会员服务

148+阅读 · 2022年6月9日

【新书】感知和行动的贝叶斯模型，348页pdf

【新书】感知和行动的贝叶斯模型，348页pdf

专知会员服务

75+阅读 · 2021年11月18日

【ICML2021-教程】无监督强化学习，285页ppt

专知会员服务

78+阅读 · 2021年7月23日

【2021新书】概率图模型：原理与应用，370页pdf

【2021新书】概率图模型：原理与应用，370页pdf

专知会员服务

237+阅读 · 2021年5月26日

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

专知

58+阅读 · 2023年4月5日

【硬核书】数学和Python机器学习的核心方法:构建逻辑的100个练习，216页pdf

【硬核书】数学和Python机器学习的核心方法:构建逻辑的100个练习，216页pdf

专知

17+阅读 · 2022年10月2日

【干货书】深度学习目标检测：原理与应用，276页pdf

【干货书】深度学习目标检测：原理与应用，276页pdf

专知

23+阅读 · 2022年9月24日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

29+阅读 · 2022年9月19日

【2022新书】深度学习基础：设计下一代机器智能算法，390页pdf

【2022新书】深度学习基础：设计下一代机器智能算法，390页pdf

专知

33+阅读 · 2022年7月15日

【2022新书】联邦学习：方法和应用的综合概述，531页pdf

【2022新书】联邦学习：方法和应用的综合概述，531页pdf

专知

27+阅读 · 2022年7月14日

【2022新书】机器学习中的概率数值计算，412页pdf

【2022新书】机器学习中的概率数值计算，412页pdf

专知

31+阅读 · 2022年7月7日

【经典书】全局优化算法：理论与应用，820页pdf

【经典书】全局优化算法：理论与应用，820页pdf

专知

40+阅读 · 2021年11月10日

【干货书】计算机科学离散数学，627页pdf

【干货书】计算机科学离散数学，627页pdf

专知

64+阅读 · 2020年8月31日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

核心化算法中的新技术研究

国家自然科学基金

8+阅读 · 2017年12月31日

语义Web知识库补全关键技术研究

国家自然科学基金

14+阅读 · 2017年12月31日

软件定义网络（SDN）环境下基于机器学习的路由预规划研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向Bug报告的软件故障重现方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

基于安全需求分析的内核保护方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

Biot模型基于有限元离散的多重网格算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于结构学习的非平行支持向量机最优化方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

215+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

473+阅读 · 2023年3月31日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

25+阅读 · 2023年1月13日

Deep learning: a statistical viewpoint

Arxiv

18+阅读 · 2021年3月16日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

19+阅读 · 2019年1月14日

Deep learning in agriculture: A survey

Arxiv

11+阅读 · 2018年7月31日

VIP会员

相关主题

相关VIP内容

【2023新书】流程系统工程的高级优化，206页pdf

【2023新书】流程系统工程的高级优化，206页pdf

专知会员服务

65+阅读 · 2023年9月25日

【2023新书】学习和控制的最优化理论，435页pdf

【2023新书】学习和控制的最优化理论，435页pdf

专知会员服务

110+阅读 · 2023年7月26日

【2023新书】深度学习时间序列分析，208页pdf

【2023新书】深度学习时间序列分析，208页pdf

专知会员服务

190+阅读 · 2023年6月2日

【2023新书】现实世界中的自然语言处理：文本处理、分析和分类，393页pdf

【2023新书】现实世界中的自然语言处理：文本处理、分析和分类，393页pdf

专知会员服务

112+阅读 · 2023年5月25日

【干货书】基于智能体的演化博弈动力学，207页pdf

【干货书】基于智能体的演化博弈动力学，207页pdf

专知会员服务

104+阅读 · 2023年4月3日

【2022新书】深度学习归一化技术，117页pdf

【2022新书】深度学习归一化技术，117页pdf

专知会员服务

97+阅读 · 2022年11月25日

【实用书】强化学习实战：Python，110页pdf

【实用书】强化学习实战：Python，110页pdf

专知会员服务

148+阅读 · 2022年6月9日

【新书】感知和行动的贝叶斯模型，348页pdf

【新书】感知和行动的贝叶斯模型，348页pdf

专知会员服务

75+阅读 · 2021年11月18日

【ICML2021-教程】无监督强化学习，285页ppt

专知会员服务

78+阅读 · 2021年7月23日

【2021新书】概率图模型：原理与应用，370页pdf

【2021新书】概率图模型：原理与应用，370页pdf

专知会员服务

237+阅读 · 2021年5月26日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】扩展可扩展会话推荐的边界

别想太多：高效 R1 风格大型推理模型综述

【ACMMM2025】EvoVLMA: 进化式视觉-语言模型自适应

智能体网络：用AI智能体编织下一代网络

相关资讯

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

专知

58+阅读 · 2023年4月5日

【硬核书】数学和Python机器学习的核心方法:构建逻辑的100个练习，216页pdf

【硬核书】数学和Python机器学习的核心方法:构建逻辑的100个练习，216页pdf

专知

17+阅读 · 2022年10月2日

【干货书】深度学习目标检测：原理与应用，276页pdf

【干货书】深度学习目标检测：原理与应用，276页pdf

专知

23+阅读 · 2022年9月24日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

29+阅读 · 2022年9月19日

【2022新书】深度学习基础：设计下一代机器智能算法，390页pdf

【2022新书】深度学习基础：设计下一代机器智能算法，390页pdf

专知

33+阅读 · 2022年7月15日

【2022新书】联邦学习：方法和应用的综合概述，531页pdf

【2022新书】联邦学习：方法和应用的综合概述，531页pdf

专知

27+阅读 · 2022年7月14日

【2022新书】机器学习中的概率数值计算，412页pdf

【2022新书】机器学习中的概率数值计算，412页pdf

专知

31+阅读 · 2022年7月7日

【经典书】全局优化算法：理论与应用，820页pdf

【经典书】全局优化算法：理论与应用，820页pdf

专知

40+阅读 · 2021年11月10日

【干货书】计算机科学离散数学，627页pdf

【干货书】计算机科学离散数学，627页pdf

专知

64+阅读 · 2020年8月31日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

相关基金

核心化算法中的新技术研究

国家自然科学基金

8+阅读 · 2017年12月31日

语义Web知识库补全关键技术研究

国家自然科学基金

14+阅读 · 2017年12月31日

软件定义网络（SDN）环境下基于机器学习的路由预规划研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向Bug报告的软件故障重现方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

基于安全需求分析的内核保护方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

Biot模型基于有限元离散的多重网格算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于结构学习的非平行支持向量机最优化方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

215+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

473+阅读 · 2023年3月31日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

25+阅读 · 2023年1月13日

Deep learning: a statistical viewpoint

Arxiv

18+阅读 · 2021年3月16日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

19+阅读 · 2019年1月14日

Deep learning in agriculture: A survey

Arxiv

11+阅读 · 2018年7月31日

微信扫码咨询专知VIP会员