【布朗大学David Abel博士论文】A Theory of Abstraction in Reinforcement Learning - 专知VIP

会员服务 ·

4

强化学习 · David Abel · 博士论文 · 强化学习抽象理论 ·

2022 年 3 月 16 日

【布朗大学David Abel博士论文】A Theory of Abstraction in Reinforcement Learning

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

A Theory of Abstraction in Reinforcement Learning.

论文链接：https://david-abel.github.io/thesis.pdf

强化学习定义了学习仅通过行动和观察做出好的决策的智能体所面临的问题。要成为有效的问题解决者，这些智能体必须有效地探索广阔的世界，从延迟的反馈中获得 credit，并归纳出新的经验，同时利用有限的数据、计算资源和感知带宽。抽象（abstraction）对于所有这些努力都是必不可少的。通过抽象，智能体可以搭建起关于其环境的简洁模型，这些模型支持一个合理的、适应性强的决策者所需的许多实践。

在这篇论文中，作者提出了一个强化学习中的抽象理论。具体来说，他首先提供了实现抽象过程的函数的三个要求。它们应该：1）保持接近最佳行为的表示；2 该被有效地学习和构造；3）减少规划或学习时间。

接下来，他提出了一套新的算法和分析结果，阐明了智能体如何能够根据这些需求学习抽象。

总的来说，这些结果提供了发现和使用抽象的部分路径，最小化了有效强化学习的复杂性。

成为VIP会员查看完整内容

25

相关内容

强化学习

强化学习（RL）是机器学习的一个领域，与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外，强化学习是三种基本的机器学习范式之一。强化学习与监督学习的不同之处在于，不需要呈现带标签的输入/输出对，也不需要显式纠正次优动作。相反，重点是在探索（未知领域）和利用（当前知识）之间找到平衡。该环境通常以马尔可夫决策过程（MDP）的形式陈述，因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于，后者不假设MDP的确切数学模型，并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

斯坦福大学最新【强化学习】2022课程，含ppt

斯坦福大学最新【强化学习】2022课程，含ppt

专知会员服务

131+阅读 · 2022年2月27日

不可错过！「强化学习导论」多伦多大学2021课程，附SLIDES与140页pdf

不可错过！「强化学习导论」多伦多大学2021课程，附SLIDES与140页pdf

专知会员服务

67+阅读 · 2021年3月24日

【DeepMind】基于模型的强化学习，174页ppt，Model-Based Reinforcement Learning

【DeepMind】基于模型的强化学习，174页ppt，Model-Based Reinforcement Learning

专知会员服务

89+阅读 · 2021年1月12日

「元强化学习」报告，斯坦福Chelsea Finn讲解，52页ppt，Meta Reinforcement Learning

「元强化学习」报告，斯坦福Chelsea Finn讲解，52页ppt，Meta Reinforcement Learning

专知会员服务

42+阅读 · 2021年1月11日

《强化学习导论》经典课程10讲，DeepMind大神David Silver主讲

《强化学习导论》经典课程10讲，DeepMind大神David Silver主讲

专知会员服务

86+阅读 · 2021年1月2日

【布朗大学David Abel博士论文】强化学习抽象理论，297页pdf

【布朗大学David Abel博士论文】强化学习抽象理论，297页pdf

专知会员服务

89+阅读 · 2020年12月17日

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

专知会员服务

121+阅读 · 2020年5月18日

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

专知会员服务

289+阅读 · 2020年3月10日

【伯克利，基于模型的强化学习：理论与实践】《Model-Based Reinforcement Learning:Theory and Practice》，Michael Janner

【伯克利，基于模型的强化学习：理论与实践】《Model-Based Reinforcement Learning:Theory and Practice》，Michael Janner

专知会员服务

35+阅读 · 2019年12月12日

【南洋理工大学课程】deep_reinforcement_learning（深度强化学习），109页ppt

【南洋理工大学课程】deep_reinforcement_learning（深度强化学习），109页ppt

专知会员服务

105+阅读 · 2019年11月2日

【布朗大学David Abel295页博士论文】探索强化学习抽象理论，获AAAI/ACM SIGAI博士论文奖提名

【布朗大学David Abel295页博士论文】探索强化学习抽象理论，获AAAI/ACM SIGAI博士论文奖提名

专知

0+阅读 · 2022年3月21日

295页博士论文探索强化学习抽象理论，获AAAI/ACM SIGAI博士论文奖提名

295页博士论文探索强化学习抽象理论，获AAAI/ACM SIGAI博士论文奖提名

机器之心

2+阅读 · 2022年3月20日

南大本科生论文获NeurIPS Poster！俞扬团队首次揭示强化学习「记忆池」最优利用方法

南大本科生论文获NeurIPS Poster！俞扬团队首次揭示强化学习「记忆池」最优利用方法

新智元

0+阅读 · 2021年12月16日

Acme框架真香！用过一次后，伦敦博士撰文大赞DeepMind强化学习框架

Acme框架真香！用过一次后，伦敦博士撰文大赞DeepMind强化学习框架

新智元

1+阅读 · 2021年6月25日

不可错过！「强化学习导论」多伦多大学2021课程，附SLIDES与140页pdf笔记

不可错过！「强化学习导论」多伦多大学2021课程，附SLIDES与140页pdf笔记

专知

1+阅读 · 2021年3月24日

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

专知

42+阅读 · 2020年3月10日

强化学习扫盲贴：从Q-learning到DQN

强化学习扫盲贴：从Q-learning到DQN

夕小瑶的卖萌屋

52+阅读 · 2019年10月13日

层级强化学习概念简介

层级强化学习概念简介

CreateAMind

19+阅读 · 2019年6月9日

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

专知

77+阅读 · 2018年8月7日

Hierarchical Imitation - Reinforcement Learning

Hierarchical Imitation - Reinforcement Learning

CreateAMind

19+阅读 · 2018年5月25日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

41+阅读 · 2015年12月31日

基于尺度相关感知误差测度近似全局优化的数字图像半色调方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

一类Monge-Ampère方程解的边界行为

国家自然科学基金

0+阅读 · 2013年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

基于行为决策理论的隐性目标决策模型与方法研究

国家自然科学基金

5+阅读 · 2012年12月31日

因果推断的统计方法

国家自然科学基金

26+阅读 · 2011年12月31日

复杂网络系统的有限时间同步控制研究

国家自然科学基金

0+阅读 · 2011年12月31日

排序问题的博弈分析和多目标排序

国家自然科学基金

1+阅读 · 2009年12月31日

矩阵分解的低延迟并行算法

国家自然科学基金

0+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

Leveraging Language to Learn Program Abstractions and Search Heuristics

Arxiv

0+阅读 · 2022年4月18日

Deep Interactive Bayesian Reinforcement Learning via Meta-Learning

Arxiv

1+阅读 · 2022年4月15日

The Importance of Credo in Multiagent Learning

The Importance of Credo in Multiagent Learning

Arxiv

1+阅读 · 2022年4月15日

A Survey on Reinforcement Learning for Recommender Systems

Arxiv

22+阅读 · 2021年9月22日

A Survey of Deep Reinforcement Learning in Recommender Systems: A Systematic Review and Future Directions

Arxiv

14+阅读 · 2021年9月8日

A Survey of Reinforcement Learning Techniques: Strategies, Recent Development, and Future Directions

A Survey of Reinforcement Learning Techniques: Strategies, Recent Development, and Future Directions

Arxiv

80+阅读 · 2020年1月19日

Learning Heuristics over Large Graphs via Deep Reinforcement Learning

Arxiv

12+阅读 · 2019年3月8日

Deep Reinforcement Learning: An Overview

Deep Reinforcement Learning: An Overview

Arxiv

17+阅读 · 2018年11月26日

A Multi-Objective Deep Reinforcement Learning Framework

A Multi-Objective Deep Reinforcement Learning Framework

Arxiv

16+阅读 · 2018年6月27日

DeepPath: A Reinforcement Learning Method for Knowledge Graph Reasoning

Arxiv

20+阅读 · 2018年1月8日

VIP会员

相关主题

强化学习抽象理论

相关VIP内容

斯坦福大学最新【强化学习】2022课程，含ppt

斯坦福大学最新【强化学习】2022课程，含ppt

专知会员服务

131+阅读 · 2022年2月27日

不可错过！「强化学习导论」多伦多大学2021课程，附SLIDES与140页pdf

不可错过！「强化学习导论」多伦多大学2021课程，附SLIDES与140页pdf

专知会员服务

67+阅读 · 2021年3月24日

【DeepMind】基于模型的强化学习，174页ppt，Model-Based Reinforcement Learning

【DeepMind】基于模型的强化学习，174页ppt，Model-Based Reinforcement Learning

专知会员服务

89+阅读 · 2021年1月12日

「元强化学习」报告，斯坦福Chelsea Finn讲解，52页ppt，Meta Reinforcement Learning

「元强化学习」报告，斯坦福Chelsea Finn讲解，52页ppt，Meta Reinforcement Learning

专知会员服务

42+阅读 · 2021年1月11日

《强化学习导论》经典课程10讲，DeepMind大神David Silver主讲

《强化学习导论》经典课程10讲，DeepMind大神David Silver主讲

专知会员服务

86+阅读 · 2021年1月2日

【布朗大学David Abel博士论文】强化学习抽象理论，297页pdf

【布朗大学David Abel博士论文】强化学习抽象理论，297页pdf

专知会员服务

89+阅读 · 2020年12月17日

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

专知会员服务

121+阅读 · 2020年5月18日

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

专知会员服务

289+阅读 · 2020年3月10日

【伯克利，基于模型的强化学习：理论与实践】《Model-Based Reinforcement Learning:Theory and Practice》，Michael Janner

【伯克利，基于模型的强化学习：理论与实践】《Model-Based Reinforcement Learning:Theory and Practice》，Michael Janner

专知会员服务

35+阅读 · 2019年12月12日

【南洋理工大学课程】deep_reinforcement_learning（深度强化学习），109页ppt

【南洋理工大学课程】deep_reinforcement_learning（深度强化学习），109页ppt

专知会员服务

105+阅读 · 2019年11月2日

热门VIP内容

开通专知VIP会员享更多权益服务

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

人工智能驱动弹药制造现代化：美国陆军转型之路

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

相关资讯

【布朗大学David Abel295页博士论文】探索强化学习抽象理论，获AAAI/ACM SIGAI博士论文奖提名

【布朗大学David Abel295页博士论文】探索强化学习抽象理论，获AAAI/ACM SIGAI博士论文奖提名

专知

0+阅读 · 2022年3月21日

295页博士论文探索强化学习抽象理论，获AAAI/ACM SIGAI博士论文奖提名

295页博士论文探索强化学习抽象理论，获AAAI/ACM SIGAI博士论文奖提名

机器之心

2+阅读 · 2022年3月20日

南大本科生论文获NeurIPS Poster！俞扬团队首次揭示强化学习「记忆池」最优利用方法

南大本科生论文获NeurIPS Poster！俞扬团队首次揭示强化学习「记忆池」最优利用方法

新智元

0+阅读 · 2021年12月16日

Acme框架真香！用过一次后，伦敦博士撰文大赞DeepMind强化学习框架

Acme框架真香！用过一次后，伦敦博士撰文大赞DeepMind强化学习框架

新智元

1+阅读 · 2021年6月25日

不可错过！「强化学习导论」多伦多大学2021课程，附SLIDES与140页pdf笔记

不可错过！「强化学习导论」多伦多大学2021课程，附SLIDES与140页pdf笔记

专知

1+阅读 · 2021年3月24日

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

专知

42+阅读 · 2020年3月10日

强化学习扫盲贴：从Q-learning到DQN

强化学习扫盲贴：从Q-learning到DQN

夕小瑶的卖萌屋

52+阅读 · 2019年10月13日

层级强化学习概念简介

层级强化学习概念简介

CreateAMind

19+阅读 · 2019年6月9日

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

专知

77+阅读 · 2018年8月7日

Hierarchical Imitation - Reinforcement Learning

Hierarchical Imitation - Reinforcement Learning

CreateAMind

19+阅读 · 2018年5月25日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

41+阅读 · 2015年12月31日

基于尺度相关感知误差测度近似全局优化的数字图像半色调方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

一类Monge-Ampère方程解的边界行为

国家自然科学基金

0+阅读 · 2013年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

基于行为决策理论的隐性目标决策模型与方法研究

国家自然科学基金

5+阅读 · 2012年12月31日

因果推断的统计方法

国家自然科学基金

26+阅读 · 2011年12月31日

复杂网络系统的有限时间同步控制研究

国家自然科学基金

0+阅读 · 2011年12月31日

排序问题的博弈分析和多目标排序

国家自然科学基金

1+阅读 · 2009年12月31日

矩阵分解的低延迟并行算法

国家自然科学基金

0+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

相关论文

Leveraging Language to Learn Program Abstractions and Search Heuristics

Arxiv

0+阅读 · 2022年4月18日

Deep Interactive Bayesian Reinforcement Learning via Meta-Learning

Arxiv

1+阅读 · 2022年4月15日

The Importance of Credo in Multiagent Learning

The Importance of Credo in Multiagent Learning

Arxiv

1+阅读 · 2022年4月15日

A Survey on Reinforcement Learning for Recommender Systems

Arxiv

22+阅读 · 2021年9月22日

A Survey of Deep Reinforcement Learning in Recommender Systems: A Systematic Review and Future Directions

Arxiv

14+阅读 · 2021年9月8日

A Survey of Reinforcement Learning Techniques: Strategies, Recent Development, and Future Directions

A Survey of Reinforcement Learning Techniques: Strategies, Recent Development, and Future Directions

Arxiv

80+阅读 · 2020年1月19日

Learning Heuristics over Large Graphs via Deep Reinforcement Learning

Arxiv

12+阅读 · 2019年3月8日

Deep Reinforcement Learning: An Overview

Deep Reinforcement Learning: An Overview

Arxiv

17+阅读 · 2018年11月26日

A Multi-Objective Deep Reinforcement Learning Framework

A Multi-Objective Deep Reinforcement Learning Framework

Arxiv

16+阅读 · 2018年6月27日

DeepPath: A Reinforcement Learning Method for Knowledge Graph Reasoning

Arxiv

20+阅读 · 2018年1月8日

微信扫码咨询专知VIP会员