强化学习在机器人中的应用，附视频与Slides，Animesh Garg, UoT - 专知

会员服务 ·

0

强化学习在机器人中的应用，附视频与Slides，Animesh Garg, UoT

2022 年 7 月 12 日 专知

在强化学习(RL)中使用先验知识已经变得无处不在，因为我们正在开发适合真实机器人的系统。最近的研究显示，人们对以行为先验的形式吸收先验知识的方法重新产生了兴趣。行为先验是指当处于特定状态时，可以为代理提出潜在有意义的行为的系统，包括经典手工制作的控制器、之前学习的策略、演示和最近潜在的技能模块。这些系统已经在RL中证明了其在加速训练、更安全探索和广泛任务推广方面的有效性。

本次研讨会的目标是将不同领域的研究人员聚集在一起，包括RL，机器人和控制，讨论行为先验可能在RL中发挥的作用。这包括我们可以学习/建模这些先验的各种方法，在RL框架内集成他们的经验的方法，以及他们的适用性来解决现实机器人中RL面临的一些关键挑战。

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“TGAR” 就可以获取《强化学习在机器人中的应用，附视频与Slides，Animesh Garg, UoT》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取100000+AI(AI与军事、医药、公安等)主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取100000+AI主题知识资料

登录查看更多

2

相关内容

《从机器学习到自主智能》，图灵奖得主Yann LeCun最新报告，附192页ppt与视频

《从机器学习到自主智能》，图灵奖得主Yann LeCun最新报告，附192页ppt与视频

专知会员服务

66+阅读 · 2022年8月2日

【ICRA2022】机器人强化学习工具教程, 附slides与视频

【ICRA2022】机器人强化学习工具教程, 附slides与视频

专知会员服务

40+阅读 · 2022年5月27日

【UC伯克利Shreya Shankar】机器学习产品化

【UC伯克利Shreya Shankar】机器学习产品化

专知会员服务

30+阅读 · 2021年11月27日

【CVPR2021】面向机器人的预训练模型-一种通用方法，伯克利Pieter Abbeel教授，附slides与视频

专知会员服务

29+阅读 · 2021年6月28日

「元学习」最新AAAI2021-Tutorial，附视频与240页ppt

「元学习」最新AAAI2021-Tutorial，附视频与240页ppt

专知会员服务

117+阅读 · 2021年2月7日

最新《注意力机制》教程，112页ppt

专知会员服务

323+阅读 · 2020年11月24日

【DeepMind】强化学习教程，83页ppt

【DeepMind】强化学习教程，83页ppt

专知会员服务

158+阅读 · 2020年8月7日

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

专知会员服务

172+阅读 · 2020年6月25日

【斯坦福&Google】面向机器人的机器学习，63页PPT

【斯坦福&Google】面向机器人的机器学习，63页PPT

专知会员服务

26+阅读 · 2019年11月19日

【ALT 2019 Tutorials】强化学习的探索性开发（Exploration-Exploitation in Reinforcement Learning）

【ALT 2019 Tutorials】强化学习的探索性开发（Exploration-Exploitation in Reinforcement Learning）

专知会员服务

34+阅读 · 2019年3月21日

《从机器学习到自主智能》，图灵奖得主Yann LeCun最新报告，附192页ppt与视频

《从机器学习到自主智能》，图灵奖得主Yann LeCun最新报告，附192页ppt与视频

专知

3+阅读 · 2022年8月2日

IJCAI2022《对抗序列决策》教程，164页ppt

IJCAI2022《对抗序列决策》教程，164页ppt

专知

4+阅读 · 2022年7月27日

【ICML2022教程】智能交互式学习，80页ppt

【ICML2022教程】智能交互式学习，80页ppt

专知

1+阅读 · 2022年7月22日

51页PPT与视频！《因果性:反事实》教程，ULCA-Adnan Darwiche讲授

51页PPT与视频！《因果性:反事实》教程，ULCA-Adnan Darwiche讲授

专知

2+阅读 · 2022年7月8日

【MIT课程】深度学习不确定性，Google大脑Jasper Snoek演讲，附Slides与视频

【MIT课程】深度学习不确定性，Google大脑Jasper Snoek演讲，附Slides与视频

专知

2+阅读 · 2022年5月30日

【ICRA2022】机器人强化学习工具教程, 附slides与视频

【ICRA2022】机器人强化学习工具教程, 附slides与视频

专知

2+阅读 · 2022年5月27日

通俗易懂！MIT《深度强化学习》课程，附Slides与视频

通俗易懂！MIT《深度强化学习》课程，附Slides与视频

专知

1+阅读 · 2022年4月24日

【MILA-唐建】几何深度学习药物发现，87页ppt，附视频

【MILA-唐建】几何深度学习药物发现，87页ppt，附视频

专知

7+阅读 · 2022年2月17日

【ICML2020-Tutorial】因果强化学习-CRL，147页ppt，哥伦比亚大学-Elias Bareinboim

【ICML2020-Tutorial】因果强化学习-CRL，147页ppt，哥伦比亚大学-Elias Bareinboim

专知

13+阅读 · 2020年7月16日

【牛津大学&DeepMind】自监督学习教程，141页ppt

【牛津大学&DeepMind】自监督学习教程，141页ppt

专知

16+阅读 · 2020年5月29日

定位系统细胞启发的机器人情景认知地图构建与行为规划研究

国家自然科学基金

3+阅读 · 2015年12月31日

志愿者地理众包视频在智能城市管理中的应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于人类驾驶行为的移动机器人无标定优化视觉伺服方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于结构化集学习的视频稀疏编码理论与技术

国家自然科学基金

0+阅读 · 2012年12月31日

基于学习人类策略的动态稳定系统控制器切换方法研究

国家自然科学基金

2+阅读 · 2012年12月31日

带有资源依赖学习效应的多模态项目调度交互式群智能方法

国家自然科学基金

0+阅读 · 2012年12月31日

面向服务机器人的智能空间关键技术研究

国家自然科学基金

2+阅读 · 2012年12月31日

Nrf2-ARE通路在缺血/药物后处理中作用的研究

国家自然科学基金

0+阅读 · 2009年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

21+阅读 · 2009年12月31日

基于支持向量机的复杂连续系统强化学习控制研究

国家自然科学基金

11+阅读 · 2008年12月31日

Distributionally Robust Offline Reinforcement Learning with Linear Function Approximation

Arxiv

0+阅读 · 2022年9月14日

Economic state classification and portfolio optimisation with application to stagflationary environments

Arxiv

0+阅读 · 2022年9月13日

An Optimal Transport Formulation of Bayes' Law for Nonlinear Filtering Algorithms

Arxiv

0+阅读 · 2022年9月13日

Data Augmentation in Temporal and Polar Domains for Event-Based Learning

Arxiv

0+阅读 · 2022年9月13日

RTAW: An Attention Inspired Reinforcement Learning Method for Multi-Robot Task Allocation in Warehouse Environments

Arxiv

0+阅读 · 2022年9月13日

Fragile object transportation by a multi-robot system in an unknown environment using a semi-decentralized control approach

Arxiv

0+阅读 · 2022年9月12日

MassMIND: Massachusetts Maritime INfrared Dataset

Arxiv

0+阅读 · 2022年9月9日

RASR: Risk-Averse Soft-Robust MDPs with EVaR and Entropic Risk

Arxiv

1+阅读 · 2022年9月9日

Hearts Gym: Learning Reinforcement Learning as a Team Event

Arxiv

0+阅读 · 2022年9月7日

Time-Series Event Prediction with Evolutionary State Graph

Arxiv

14+阅读 · 2020年11月25日

VIP会员

相关主题

相关VIP内容

《从机器学习到自主智能》，图灵奖得主Yann LeCun最新报告，附192页ppt与视频

《从机器学习到自主智能》，图灵奖得主Yann LeCun最新报告，附192页ppt与视频

专知会员服务

66+阅读 · 2022年8月2日

【ICRA2022】机器人强化学习工具教程, 附slides与视频

【ICRA2022】机器人强化学习工具教程, 附slides与视频

专知会员服务

40+阅读 · 2022年5月27日

【UC伯克利Shreya Shankar】机器学习产品化

【UC伯克利Shreya Shankar】机器学习产品化

专知会员服务

30+阅读 · 2021年11月27日

【CVPR2021】面向机器人的预训练模型-一种通用方法，伯克利Pieter Abbeel教授，附slides与视频

专知会员服务

29+阅读 · 2021年6月28日

「元学习」最新AAAI2021-Tutorial，附视频与240页ppt

「元学习」最新AAAI2021-Tutorial，附视频与240页ppt

专知会员服务

117+阅读 · 2021年2月7日

最新《注意力机制》教程，112页ppt

专知会员服务

323+阅读 · 2020年11月24日

【DeepMind】强化学习教程，83页ppt

【DeepMind】强化学习教程，83页ppt

专知会员服务

158+阅读 · 2020年8月7日

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

专知会员服务

172+阅读 · 2020年6月25日

【斯坦福&Google】面向机器人的机器学习，63页PPT

【斯坦福&Google】面向机器人的机器学习，63页PPT

专知会员服务

26+阅读 · 2019年11月19日

【ALT 2019 Tutorials】强化学习的探索性开发（Exploration-Exploitation in Reinforcement Learning）

【ALT 2019 Tutorials】强化学习的探索性开发（Exploration-Exploitation in Reinforcement Learning）

专知会员服务

34+阅读 · 2019年3月21日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】扩展可扩展会话推荐的边界

别想太多：高效 R1 风格大型推理模型综述

【ACMMM2025】EvoVLMA: 进化式视觉-语言模型自适应

智能体网络：用AI智能体编织下一代网络

相关资讯

《从机器学习到自主智能》，图灵奖得主Yann LeCun最新报告，附192页ppt与视频

《从机器学习到自主智能》，图灵奖得主Yann LeCun最新报告，附192页ppt与视频

专知

3+阅读 · 2022年8月2日

IJCAI2022《对抗序列决策》教程，164页ppt

IJCAI2022《对抗序列决策》教程，164页ppt

专知

4+阅读 · 2022年7月27日

【ICML2022教程】智能交互式学习，80页ppt

【ICML2022教程】智能交互式学习，80页ppt

专知

1+阅读 · 2022年7月22日

51页PPT与视频！《因果性:反事实》教程，ULCA-Adnan Darwiche讲授

51页PPT与视频！《因果性:反事实》教程，ULCA-Adnan Darwiche讲授

专知

2+阅读 · 2022年7月8日

【MIT课程】深度学习不确定性，Google大脑Jasper Snoek演讲，附Slides与视频

【MIT课程】深度学习不确定性，Google大脑Jasper Snoek演讲，附Slides与视频

专知

2+阅读 · 2022年5月30日

【ICRA2022】机器人强化学习工具教程, 附slides与视频

【ICRA2022】机器人强化学习工具教程, 附slides与视频

专知

2+阅读 · 2022年5月27日

通俗易懂！MIT《深度强化学习》课程，附Slides与视频

通俗易懂！MIT《深度强化学习》课程，附Slides与视频

专知

1+阅读 · 2022年4月24日

【MILA-唐建】几何深度学习药物发现，87页ppt，附视频

【MILA-唐建】几何深度学习药物发现，87页ppt，附视频

专知

7+阅读 · 2022年2月17日

【ICML2020-Tutorial】因果强化学习-CRL，147页ppt，哥伦比亚大学-Elias Bareinboim

【ICML2020-Tutorial】因果强化学习-CRL，147页ppt，哥伦比亚大学-Elias Bareinboim

专知

13+阅读 · 2020年7月16日

【牛津大学&DeepMind】自监督学习教程，141页ppt

【牛津大学&DeepMind】自监督学习教程，141页ppt

专知

16+阅读 · 2020年5月29日

相关基金

定位系统细胞启发的机器人情景认知地图构建与行为规划研究

国家自然科学基金

3+阅读 · 2015年12月31日

志愿者地理众包视频在智能城市管理中的应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于人类驾驶行为的移动机器人无标定优化视觉伺服方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于结构化集学习的视频稀疏编码理论与技术

国家自然科学基金

0+阅读 · 2012年12月31日

基于学习人类策略的动态稳定系统控制器切换方法研究

国家自然科学基金

2+阅读 · 2012年12月31日

带有资源依赖学习效应的多模态项目调度交互式群智能方法

国家自然科学基金

0+阅读 · 2012年12月31日

面向服务机器人的智能空间关键技术研究

国家自然科学基金

2+阅读 · 2012年12月31日

Nrf2-ARE通路在缺血/药物后处理中作用的研究

国家自然科学基金

0+阅读 · 2009年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

21+阅读 · 2009年12月31日

基于支持向量机的复杂连续系统强化学习控制研究

国家自然科学基金

11+阅读 · 2008年12月31日

相关论文

Distributionally Robust Offline Reinforcement Learning with Linear Function Approximation

Arxiv

0+阅读 · 2022年9月14日

Economic state classification and portfolio optimisation with application to stagflationary environments

Arxiv

0+阅读 · 2022年9月13日

An Optimal Transport Formulation of Bayes' Law for Nonlinear Filtering Algorithms

Arxiv

0+阅读 · 2022年9月13日

Data Augmentation in Temporal and Polar Domains for Event-Based Learning

Arxiv

0+阅读 · 2022年9月13日

RTAW: An Attention Inspired Reinforcement Learning Method for Multi-Robot Task Allocation in Warehouse Environments

Arxiv

0+阅读 · 2022年9月13日

Fragile object transportation by a multi-robot system in an unknown environment using a semi-decentralized control approach

Arxiv

0+阅读 · 2022年9月12日

MassMIND: Massachusetts Maritime INfrared Dataset

Arxiv

0+阅读 · 2022年9月9日

RASR: Risk-Averse Soft-Robust MDPs with EVaR and Entropic Risk

Arxiv

1+阅读 · 2022年9月9日

Hearts Gym: Learning Reinforcement Learning as a Team Event

Arxiv

0+阅读 · 2022年9月7日

Time-Series Event Prediction with Evolutionary State Graph

Arxiv

14+阅读 · 2020年11月25日

大家都在搜

久别重逢话双塔

大型语言模型

国防科技创新

无人机航拍交通事故现场勘查处置系统——行业第一的警用事故处理软件

微信扫码咨询专知VIP会员