强化学习在机器人中的应用，附视频与Slides，Animesh Garg, UoT - 专知VIP

会员服务 ·

18

强化学习 · 机器人 ·

2022 年 7 月 12 日

强化学习在机器人中的应用，附视频与Slides，Animesh Garg, UoT

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

在强化学习(RL)中使用先验知识已经变得无处不在，因为我们正在开发适合真实机器人的系统。最近的研究显示，人们对以行为先验的形式吸收先验知识的方法重新产生了兴趣。行为先验是指当处于特定状态时，可以为代理提出潜在有意义的行为的系统，包括经典手工制作的控制器、之前学习的策略、演示和最近潜在的技能模块。这些系统已经在RL中证明了其在加速训练、更安全探索和广泛任务推广方面的有效性。

本次研讨会的目标是将不同领域的研究人员聚集在一起，包括RL，机器人和控制，讨论行为先验可能在RL中发挥的作用。这包括我们可以学习/建模这些先验的各种方法，在RL框架内集成他们的经验的方法，以及他们的适用性来解决现实机器人中RL面临的一些关键挑战。

成为VIP会员查看完整内容

37

相关内容

强化学习

强化学习（RL）是机器学习的一个领域，与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外，强化学习是三种基本的机器学习范式之一。强化学习与监督学习的不同之处在于，不需要呈现带标签的输入/输出对，也不需要显式纠正次优动作。相反，重点是在探索（未知领域）和利用（当前知识）之间找到平衡。该环境通常以马尔可夫决策过程（MDP）的形式陈述，因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于，后者不假设MDP的确切数学模型，并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

301页pdf伯克利博士论文《可扩展机器人学习》，系统全面阐述机器人技术

301页pdf伯克利博士论文《可扩展机器人学习》，系统全面阐述机器人技术

专知会员服务

36+阅读 · 2022年8月16日

【CMU博士论文】通过记忆的元强化学习，118页pdf

【CMU博士论文】通过记忆的元强化学习，118页pdf

专知会员服务

49+阅读 · 2022年6月23日

【ICRA2022】机器人强化学习工具教程, 附slides与视频

【ICRA2022】机器人强化学习工具教程, 附slides与视频

专知会员服务

40+阅读 · 2022年5月27日

【ICML2021-教程】无监督强化学习，285页ppt

专知会员服务

79+阅读 · 2021年7月23日

【CMU博士论文】机器人深度强化学习，128页pdf

【CMU博士论文】机器人深度强化学习，128页pdf

专知会员服务

133+阅读 · 2020年8月27日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

【ICRA2022】机器人强化学习工具教程, 附slides与视频

【ICRA2022】机器人强化学习工具教程, 附slides与视频

专知

2+阅读 · 2022年5月27日

厦大最新《强化学习推荐系统》综述论文

厦大最新《强化学习推荐系统》综述论文

机器学习与推荐算法

8+阅读 · 2021年9月24日

除了DQN/A3C，还有哪些高级强化学习成果

除了DQN/A3C，还有哪些高级强化学习成果

论智

15+阅读 · 2018年10月28日

【强化学习】强化学习与控制理论的区别与联系；深度强化学习的课程笔记。

【强化学习】强化学习与控制理论的区别与联系；深度强化学习的课程笔记。

产业智能官

49+阅读 · 2018年7月4日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

41+阅读 · 2015年12月31日

双线性抛物最优控制问题有限元方法的超收敛性研究

国家自然科学基金

0+阅读 · 2013年12月31日

概率图模型学习及其在数据分析中的应用研究

国家自然科学基金

16+阅读 · 2013年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

21+阅读 · 2009年12月31日

Can an NN model plainly learn planar layouts?

Arxiv

0+阅读 · 2022年9月5日

Can an ML model plainly learn planar layouts?

Arxiv

0+阅读 · 2022年9月2日

A Class-Aware Representation Refinement Framework for Graph Classification

Arxiv

0+阅读 · 2022年9月2日

Transformers are Meta-Reinforcement Learners

Arxiv

15+阅读 · 2022年6月14日

Multi-Agent Simulation for AI Behaviour Discovery in Operations Research

Arxiv

40+阅读 · 2021年8月30日

VIP会员

相关主题

相关VIP内容

301页pdf伯克利博士论文《可扩展机器人学习》，系统全面阐述机器人技术

301页pdf伯克利博士论文《可扩展机器人学习》，系统全面阐述机器人技术

专知会员服务

36+阅读 · 2022年8月16日

【CMU博士论文】通过记忆的元强化学习，118页pdf

【CMU博士论文】通过记忆的元强化学习，118页pdf

专知会员服务

49+阅读 · 2022年6月23日

【ICRA2022】机器人强化学习工具教程, 附slides与视频

【ICRA2022】机器人强化学习工具教程, 附slides与视频

专知会员服务

40+阅读 · 2022年5月27日

【ICML2021-教程】无监督强化学习，285页ppt

专知会员服务

79+阅读 · 2021年7月23日

【CMU博士论文】机器人深度强化学习，128页pdf

【CMU博士论文】机器人深度强化学习，128页pdf

专知会员服务

133+阅读 · 2020年8月27日

热门VIP内容

开通专知VIP会员享更多权益服务

大模型推理时代的知识编辑

《利用人工智能对军事行动进行建模》

【MIT博士论文】加速科学发现的因果建模实践算法

机器人、无人机与实时影像：应对城市爆炸威胁的三大技术方案

相关资讯

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

【ICRA2022】机器人强化学习工具教程, 附slides与视频

【ICRA2022】机器人强化学习工具教程, 附slides与视频

专知

2+阅读 · 2022年5月27日

厦大最新《强化学习推荐系统》综述论文

厦大最新《强化学习推荐系统》综述论文

机器学习与推荐算法

8+阅读 · 2021年9月24日

除了DQN/A3C，还有哪些高级强化学习成果

除了DQN/A3C，还有哪些高级强化学习成果

论智

15+阅读 · 2018年10月28日

【强化学习】强化学习与控制理论的区别与联系；深度强化学习的课程笔记。

【强化学习】强化学习与控制理论的区别与联系；深度强化学习的课程笔记。

产业智能官

49+阅读 · 2018年7月4日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

41+阅读 · 2015年12月31日

双线性抛物最优控制问题有限元方法的超收敛性研究

国家自然科学基金

0+阅读 · 2013年12月31日

概率图模型学习及其在数据分析中的应用研究

国家自然科学基金

16+阅读 · 2013年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

21+阅读 · 2009年12月31日

相关论文

Can an NN model plainly learn planar layouts?

Arxiv

0+阅读 · 2022年9月5日

Can an ML model plainly learn planar layouts?

Arxiv

0+阅读 · 2022年9月2日

A Class-Aware Representation Refinement Framework for Graph Classification

Arxiv

0+阅读 · 2022年9月2日

Transformers are Meta-Reinforcement Learners

Arxiv

15+阅读 · 2022年6月14日

Multi-Agent Simulation for AI Behaviour Discovery in Operations Research

Arxiv

40+阅读 · 2021年8月30日

微信扫码咨询专知VIP会员