【普林斯顿博士论文】基于深度模型的高效强化学习，186页pdf - 专知VIP

会员服务 ·

53

普林斯顿大学 (Princeton University) · 博士论文 · 强化学习 · 深度学习 · 深度强化学习 ·

2023 年 1 月 30 日

【普林斯顿博士论文】基于深度模型的高效强化学习，186页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

深度强化学习的最新进展已经证明了其在解决现实问题方面的巨大潜力。然而，有两个问题阻碍了强化学习的应用:效率和效果。**本文研究如何通过设计基于深度模型的算法来提高强化学习的效率和效果。****对动力学模型的访问使算法能够进行规划，这是顺序决策的关键。本文主要围绕在线强化学习、神经网络在深度强化学习中的表达能力、离线强化学习和安全强化学习四个主题展开研究。**对于在线强化学习，本文提出了一个具有理论保证的算法框架，利用在学习环境中学习到的策略在真实环境中可以获得的性能下界。通过实验验证了所提方法的有效性。对于深度强化学习中神经网络的表达能力，证明了在某些情况下，基于模型的方法比无模型的方法需要更少的表示能力来近似接近最优的策略，并根据经验表明，这在模拟机器人环境中可能是一个问题，基于模型的规划器可以帮助。对于离线强化学习，设计了一种算法，使策略能够保持在提供的专家演示集附近，以减少分布偏移，还进行了实验，证明了所提出方法在提高模拟环境中机械臂操纵任务成功率的有效性。对于安全强化学习，提出了一种用学到的动力学模型来证明安全状态的方法，实验表明，该方法可以在一组简单但具有挑战性的任务中学习一个不错的策略，没有一次安全违规，而基线算法有数百次安全违规。 https://dataspace.princeton.edu/handle/88435/dsp013197xq26c

成为VIP会员查看完整内容

83

相关内容

普林斯顿大学 (Princeton University)

普林斯顿大学 (Princeton University)

普林斯顿大学，又译 普林斯敦大学，常被直接称为 普林斯顿，是美国一所私立研究型大学，现为八所常青藤学校之一，绰号为老虎。

【普林斯顿大学博士论文】带约束和函数逼近的可证明强化学习，

【普林斯顿大学博士论文】带约束和函数逼近的可证明强化学习，

专知会员服务

42+阅读 · 2023年2月25日

【CMU博士论文】强化学习泛化性与效率研究，206页pdf

【CMU博士论文】强化学习泛化性与效率研究，206页pdf

专知会员服务

72+阅读 · 2023年2月23日

【普林斯顿博士论文】深度学习安全性，275页pdf

【普林斯顿博士论文】深度学习安全性，275页pdf

专知会员服务

65+阅读 · 2023年2月9日

【普林斯顿博士论文】神经符号机器学习推理，133页pdf

【普林斯顿博士论文】神经符号机器学习推理，133页pdf

专知会员服务

53+阅读 · 2023年2月1日

【普林斯顿博士论文】克服深度强化学习中的采样和探索挑战，135页pdf

【普林斯顿博士论文】克服深度强化学习中的采样和探索挑战，135页pdf

专知会员服务

60+阅读 · 2023年1月31日

【UIUC博士论文】高效多智能体深度强化学习，130页pdf

【UIUC博士论文】高效多智能体深度强化学习，130页pdf

专知会员服务

75+阅读 · 2023年1月14日

【CMU博士论文】鲁棒机器人操作的结构化先验学习，302页pdf

【CMU博士论文】鲁棒机器人操作的结构化先验学习，302页pdf

专知会员服务

25+阅读 · 2022年12月4日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知会员服务

105+阅读 · 2022年9月19日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知会员服务

89+阅读 · 2022年7月11日

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

专知会员服务

78+阅读 · 2019年10月27日

【斯坦福博士论文】生成模型中深度概率推理的扩展与应用，262页pdf

【斯坦福博士论文】生成模型中深度概率推理的扩展与应用，262页pdf

专知

8+阅读 · 2022年11月30日

神经网络如何安全可靠？牛津大学博士论文《贝叶斯神经网络的对抗鲁棒性》，206页pdf

神经网络如何安全可靠？牛津大学博士论文《贝叶斯神经网络的对抗鲁棒性》，206页pdf

专知

5+阅读 · 2022年11月10日

如何确保强化学习可靠？苏黎世联邦理工Turchetta, Matteo博士论文《强化学习中的安全性和鲁棒性》，218页pdf

如何确保强化学习可靠？苏黎世联邦理工Turchetta, Matteo博士论文《强化学习中的安全性和鲁棒性》，218页pdf

专知

9+阅读 · 2022年10月25日

【牛津大学博士论文】持续学习的高效机器学习，213页pdf

【牛津大学博士论文】持续学习的高效机器学习，213页pdf

专知

9+阅读 · 2022年10月19日

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

专知

12+阅读 · 2022年10月15日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

专知

8+阅读 · 2022年9月21日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

29+阅读 · 2022年9月19日

190页pdf伯克利博士论文《自适应持续的具身智能体》，系统全面阐述机器人技术

190页pdf伯克利博士论文《自适应持续的具身智能体》，系统全面阐述机器人技术

专知

3+阅读 · 2022年8月29日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知

19+阅读 · 2022年7月11日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

41+阅读 · 2015年12月31日

基于重要性采样的并行离策略强化学习方法研究

国家自然科学基金

23+阅读 · 2015年12月31日

基于模糊逻辑的大规模强化学习理论及方法

国家自然科学基金

7+阅读 · 2014年12月31日

神经网络随机学习算法的泛化性研究

国家自然科学基金

2+阅读 · 2013年12月31日

基于深度学习的层次化视觉注意模型研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

泛函网络代数理论与学习算法及泛化能力研究

国家自然科学基金

1+阅读 · 2011年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

21+阅读 · 2009年12月31日

基于敏感性的前向神经网络学习机制研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

Alternating Direction Method of Multipliers Based on $\ell_{2,0}$-norm for Multiple Measurement Vector Problem

Arxiv

0+阅读 · 2023年3月19日

Partition-Based Active Learning for Graph Neural Networks

Arxiv

0+阅读 · 2023年3月17日

Leveraging Large Language Models for Multiple Choice Question Answering

Arxiv

0+阅读 · 2023年3月17日

Metric-Free Exploration for Topological Mapping by Task and Motion Imitation in Feature Space

Arxiv

0+阅读 · 2023年3月16日

Maximum Margin Learning of t-SPNs for Cell Classification with Filtering

Arxiv

0+阅读 · 2023年3月16日

Sequential Recommendation with Graph Neural Networks

Arxiv

15+阅读 · 2021年6月27日

Neural Bellman-Ford Networks: A General Graph Neural Network Framework for Link Prediction

Arxiv

21+阅读 · 2021年6月16日

Few-Shot Graph Classification with Model Agnostic Meta-Learning

Arxiv

23+阅读 · 2020年3月18日

Hierarchical Graph Pooling with Structure Learning

Arxiv

13+阅读 · 2019年11月14日

Sequential Scenario-Specific Meta Learner for Online Recommendation

Sequential Scenario-Specific Meta Learner for Online Recommendation

Arxiv

16+阅读 · 2019年6月2日

VIP会员

相关主题

普林斯顿大学 (Princeton University)

深度强化学习

相关VIP内容

【普林斯顿大学博士论文】带约束和函数逼近的可证明强化学习，

【普林斯顿大学博士论文】带约束和函数逼近的可证明强化学习，

专知会员服务

42+阅读 · 2023年2月25日

【CMU博士论文】强化学习泛化性与效率研究，206页pdf

【CMU博士论文】强化学习泛化性与效率研究，206页pdf

专知会员服务

72+阅读 · 2023年2月23日

【普林斯顿博士论文】深度学习安全性，275页pdf

【普林斯顿博士论文】深度学习安全性，275页pdf

专知会员服务

65+阅读 · 2023年2月9日

【普林斯顿博士论文】神经符号机器学习推理，133页pdf

【普林斯顿博士论文】神经符号机器学习推理，133页pdf

专知会员服务

53+阅读 · 2023年2月1日

【普林斯顿博士论文】克服深度强化学习中的采样和探索挑战，135页pdf

【普林斯顿博士论文】克服深度强化学习中的采样和探索挑战，135页pdf

专知会员服务

60+阅读 · 2023年1月31日

【UIUC博士论文】高效多智能体深度强化学习，130页pdf

【UIUC博士论文】高效多智能体深度强化学习，130页pdf

专知会员服务

75+阅读 · 2023年1月14日

【CMU博士论文】鲁棒机器人操作的结构化先验学习，302页pdf

【CMU博士论文】鲁棒机器人操作的结构化先验学习，302页pdf

专知会员服务

25+阅读 · 2022年12月4日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知会员服务

105+阅读 · 2022年9月19日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知会员服务

89+阅读 · 2022年7月11日

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

专知会员服务

78+阅读 · 2019年10月27日

热门VIP内容

开通专知VIP会员享更多权益服务

大语言模型智能体强化学习：全景综述

《城市滨海地区：理解复杂多变环境下的指挥控制框架》50页报告

【伯克利博士论文】从推理服务到训练：面向大规模 LLM 智能体的高效系统

美空军“顶点2025”实验：推进AI在C2、动态目标锁定与联盟集成中的应用

相关资讯

【斯坦福博士论文】生成模型中深度概率推理的扩展与应用，262页pdf

【斯坦福博士论文】生成模型中深度概率推理的扩展与应用，262页pdf

专知

8+阅读 · 2022年11月30日

神经网络如何安全可靠？牛津大学博士论文《贝叶斯神经网络的对抗鲁棒性》，206页pdf

神经网络如何安全可靠？牛津大学博士论文《贝叶斯神经网络的对抗鲁棒性》，206页pdf

专知

5+阅读 · 2022年11月10日

如何确保强化学习可靠？苏黎世联邦理工Turchetta, Matteo博士论文《强化学习中的安全性和鲁棒性》，218页pdf

如何确保强化学习可靠？苏黎世联邦理工Turchetta, Matteo博士论文《强化学习中的安全性和鲁棒性》，218页pdf

专知

9+阅读 · 2022年10月25日

【牛津大学博士论文】持续学习的高效机器学习，213页pdf

【牛津大学博士论文】持续学习的高效机器学习，213页pdf

专知

9+阅读 · 2022年10月19日

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

专知

12+阅读 · 2022年10月15日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

专知

8+阅读 · 2022年9月21日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

29+阅读 · 2022年9月19日

190页pdf伯克利博士论文《自适应持续的具身智能体》，系统全面阐述机器人技术

190页pdf伯克利博士论文《自适应持续的具身智能体》，系统全面阐述机器人技术

专知

3+阅读 · 2022年8月29日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知

19+阅读 · 2022年7月11日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

41+阅读 · 2015年12月31日

基于重要性采样的并行离策略强化学习方法研究

国家自然科学基金

23+阅读 · 2015年12月31日

基于模糊逻辑的大规模强化学习理论及方法

国家自然科学基金

7+阅读 · 2014年12月31日

神经网络随机学习算法的泛化性研究

国家自然科学基金

2+阅读 · 2013年12月31日

基于深度学习的层次化视觉注意模型研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

泛函网络代数理论与学习算法及泛化能力研究

国家自然科学基金

1+阅读 · 2011年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

21+阅读 · 2009年12月31日

基于敏感性的前向神经网络学习机制研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

相关论文

Alternating Direction Method of Multipliers Based on $\ell_{2,0}$-norm for Multiple Measurement Vector Problem

Arxiv

0+阅读 · 2023年3月19日

Partition-Based Active Learning for Graph Neural Networks

Arxiv

0+阅读 · 2023年3月17日

Leveraging Large Language Models for Multiple Choice Question Answering

Arxiv

0+阅读 · 2023年3月17日

Metric-Free Exploration for Topological Mapping by Task and Motion Imitation in Feature Space

Arxiv

0+阅读 · 2023年3月16日

Maximum Margin Learning of t-SPNs for Cell Classification with Filtering

Arxiv

0+阅读 · 2023年3月16日

Sequential Recommendation with Graph Neural Networks

Arxiv

15+阅读 · 2021年6月27日

Neural Bellman-Ford Networks: A General Graph Neural Network Framework for Link Prediction

Arxiv

21+阅读 · 2021年6月16日

Few-Shot Graph Classification with Model Agnostic Meta-Learning

Arxiv

23+阅读 · 2020年3月18日

Hierarchical Graph Pooling with Structure Learning

Arxiv

13+阅读 · 2019年11月14日

Sequential Scenario-Specific Meta Learner for Online Recommendation

Sequential Scenario-Specific Meta Learner for Online Recommendation

Arxiv

16+阅读 · 2019年6月2日

微信扫码咨询专知VIP会员