【ICML2021】预测观察进行模仿学习 - 专知VIP

会员服务 ·

3

ICML 2021 · 模仿学习 ·

2021 年 7 月 10 日

【ICML2021】预测观察进行模仿学习

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

模仿学习使智能体能够重用和适应他人来之不易的专业知识，为学习行为中的几个关键挑战提供了解决方案。虽然在现实世界中很容易观察行为，但可能无法访问底层操作。我们提出了一种新的方法，仅从观测中进行模仿，在具有挑战性的连续控制任务中达到与专家相当的性能，同时在与任务无关的观测存在时也表现出鲁棒性。我们的方法叫做FORM(“未来观察奖励模型”)，它来自逆RL目标，并使用专家行为模型进行模拟，该模型是通过对专家观察的生成模型学习而来的，不需要地面的真实行动。我们的研究表明，在DeepMind Control Suite基准上，FORM的性能与强基线IRL方法(GAIL)相当，而在存在与任务无关的特征时，FORM的性能优于GAIL。

https://www.zhuanzhi.ai/paper/5f5ad56870b9585c4ecc0ee498604daa

成为VIP会员查看完整内容

24

相关内容

ICML 2021

【ICML2021】逆约束强化学习

专知会员服务

33+阅读 · 2021年9月7日

【ICML2021】基于观察的跨域模仿学习

专知会员服务

20+阅读 · 2021年8月30日

【ICML2021】策略梯度贝叶斯鲁棒优化的模仿学习

专知会员服务

25+阅读 · 2021年6月15日

【ICML2021】模仿学习的超参数选择

专知会员服务

22+阅读 · 2021年5月27日

【ICML2021】来自观察的跨域模仿

【ICML2021】来自观察的跨域模仿

专知会员服务

18+阅读 · 2021年5月25日

NeurIPS 2020线上分享 | 南京大学直博生许天：模仿学习中行为克隆和对抗式方法的深度分析

NeurIPS 2020线上分享 | 南京大学直博生许天：模仿学习中行为克隆和对抗式方法的深度分析

机器之心

4+阅读 · 2020年11月10日

视频 | NeurIPS 2019分享：清华大学孙富春组提出全新模仿学习理论

视频 | NeurIPS 2019分享：清华大学孙富春组提出全新模仿学习理论

机器之心

11+阅读 · 2019年11月20日

ICML2018 模仿学习教程

ICML2018 模仿学习教程

专知

6+阅读 · 2018年7月14日

使用模仿学习攻克Atari最难游戏！DeepMind新论文解读

使用模仿学习攻克Atari最难游戏！DeepMind新论文解读

CreateAMind

6+阅读 · 2018年6月9日

【深度】Google提出「自监督」表征学习方法，让智能体通过「观察」认识世界

【深度】Google提出「自监督」表征学习方法，让智能体通过「观察」认识世界

GAN生成式对抗网络

7+阅读 · 2018年5月26日

Imitation by Predicting Observations

Imitation by Predicting Observations

Arxiv

4+阅读 · 2021年7月8日

Advances in Natural Language Question Answering: A Review

Advances in Natural Language Question Answering: A Review

Arxiv

5+阅读 · 2019年4月10日

Machine Learning: Basic Principles

Arxiv

26+阅读 · 2018年8月19日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

Visual Question Answering with Memory-Augmented Networks

Arxiv

4+阅读 · 2018年3月25日

VIP会员

相关主题

相关VIP内容

【ICML2021】逆约束强化学习

专知会员服务

33+阅读 · 2021年9月7日

【ICML2021】基于观察的跨域模仿学习

专知会员服务

20+阅读 · 2021年8月30日

【ICML2021】策略梯度贝叶斯鲁棒优化的模仿学习

专知会员服务

25+阅读 · 2021年6月15日

【ICML2021】模仿学习的超参数选择

专知会员服务

22+阅读 · 2021年5月27日

【ICML2021】来自观察的跨域模仿

【ICML2021】来自观察的跨域模仿

专知会员服务

18+阅读 · 2021年5月25日

热门VIP内容

开通专知VIP会员享更多权益服务

【伯克利博士论文】从推理服务到模型训练：面向大规模 LLM 智能体的高效系统构建

面向作战人员负责任地寻求生成式人工智能

《Hello-Agents》项目正式发布，一起从零学习智能体！

智能体 AI (Agentic AI) 的新进展：回归初心，预见未来

相关资讯

NeurIPS 2020线上分享 | 南京大学直博生许天：模仿学习中行为克隆和对抗式方法的深度分析

NeurIPS 2020线上分享 | 南京大学直博生许天：模仿学习中行为克隆和对抗式方法的深度分析

机器之心

4+阅读 · 2020年11月10日

视频 | NeurIPS 2019分享：清华大学孙富春组提出全新模仿学习理论

视频 | NeurIPS 2019分享：清华大学孙富春组提出全新模仿学习理论

机器之心

11+阅读 · 2019年11月20日

ICML2018 模仿学习教程

ICML2018 模仿学习教程

专知

6+阅读 · 2018年7月14日

使用模仿学习攻克Atari最难游戏！DeepMind新论文解读

使用模仿学习攻克Atari最难游戏！DeepMind新论文解读

CreateAMind

6+阅读 · 2018年6月9日

【深度】Google提出「自监督」表征学习方法，让智能体通过「观察」认识世界

【深度】Google提出「自监督」表征学习方法，让智能体通过「观察」认识世界

GAN生成式对抗网络

7+阅读 · 2018年5月26日

相关论文

Imitation by Predicting Observations

Imitation by Predicting Observations

Arxiv

4+阅读 · 2021年7月8日

Advances in Natural Language Question Answering: A Review

Advances in Natural Language Question Answering: A Review

Arxiv

5+阅读 · 2019年4月10日

Machine Learning: Basic Principles

Arxiv

26+阅读 · 2018年8月19日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

Visual Question Answering with Memory-Augmented Networks

Arxiv

4+阅读 · 2018年3月25日

微信扫码咨询专知VIP会员