在强化学习(RL)中使用先验知识已经变得无处不在,因为我们正在开发适合真实机器人的系统。最近的研究显示,人们对以行为先验的形式吸收先验知识的方法重新产生了兴趣。行为先验是指当处于特定状态时,可以为代理提出潜在有意义的行为的系统,包括经典手工制作的控制器、之前学习的策略、演示和最近潜在的技能模块。这些系统已经在RL中证明了其在加速训练、更安全探索和广泛任务推广方面的有效性。

本次研讨会的目标是将不同领域的研究人员聚集在一起,包括RL,机器人和控制,讨论行为先验可能在RL中发挥的作用。这包括我们可以学习/建模这些先验的各种方法,在RL框架内集成他们的经验的方法,以及他们的适用性来解决现实机器人中RL面临的一些关键挑战。

成为VIP会员查看完整内容
35

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【UAI2022】规避风险强化学习:算法和元算法,120页ppt
专知会员服务
25+阅读 · 2022年9月3日
【CMU博士论文】多视图上下文理解的知识增强表示学习
专知会员服务
33+阅读 · 2022年8月11日
基于模型的强化学习综述
专知会员服务
129+阅读 · 2022年7月13日
【CMU博士论文】通过记忆的元强化学习,118页pdf
专知会员服务
43+阅读 · 2022年6月23日
【ICRA2022】机器人强化学习工具教程, 附slides与视频
专知会员服务
38+阅读 · 2022年5月27日
专知会员服务
74+阅读 · 2021年7月23日
【斯坦福干货书】强化学习基金融领域应用,312页pdf
专知会员服务
132+阅读 · 2020年12月22日
【CMU博士论文】机器人深度强化学习,128页pdf
专知会员服务
123+阅读 · 2020年8月27日
基于模型的强化学习综述
专知
17+阅读 · 2022年7月13日
厦大最新《强化学习推荐系统》综述论文
机器学习与推荐算法
6+阅读 · 2021年9月24日
最新基于强化学习的推荐系统综述
机器学习与推荐算法
6+阅读 · 2021年9月10日
除了DQN/A3C,还有哪些高级强化学习成果
论智
14+阅读 · 2018年10月28日
关于强化学习(附代码,练习和解答)
深度学习
34+阅读 · 2018年1月30日
国家自然科学基金
35+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2010年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
国家自然科学基金
11+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年9月5日
Arxiv
0+阅读 · 2022年9月2日
Arxiv
15+阅读 · 2022年6月14日
VIP会员
相关VIP内容
【UAI2022】规避风险强化学习:算法和元算法,120页ppt
专知会员服务
25+阅读 · 2022年9月3日
【CMU博士论文】多视图上下文理解的知识增强表示学习
专知会员服务
33+阅读 · 2022年8月11日
基于模型的强化学习综述
专知会员服务
129+阅读 · 2022年7月13日
【CMU博士论文】通过记忆的元强化学习,118页pdf
专知会员服务
43+阅读 · 2022年6月23日
【ICRA2022】机器人强化学习工具教程, 附slides与视频
专知会员服务
38+阅读 · 2022年5月27日
专知会员服务
74+阅读 · 2021年7月23日
【斯坦福干货书】强化学习基金融领域应用,312页pdf
专知会员服务
132+阅读 · 2020年12月22日
【CMU博士论文】机器人深度强化学习,128页pdf
专知会员服务
123+阅读 · 2020年8月27日
相关资讯
相关基金
国家自然科学基金
35+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2010年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
国家自然科学基金
11+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员