【NeurIPS2021】用于解决模仿学习中因果混淆问题的察觉对象的正则化方法 - 专知

会员服务 ·

0

【NeurIPS2021】用于解决模仿学习中因果混淆问题的察觉对象的正则化方法

2021 年 11 月 22 日 专知

用于解决模仿学习中因果混淆问题的察觉对象的正则化方法

Object-Aware Regularization for Addressing Causal Confusion in Imitation Learning

论文摘要：行为克隆是一种有效的从专家示范中学习策略的方法。然而，行为克隆常会产生因果混淆问题，即学到的策略关注的是专家动作的一个明显的结果而非专家动作的因（即专家策略所关注的对象）。针对此问题，本文提出了一个察觉对象的正则化方法，主要思想是鼓励待学策略去均匀地关注所有对象，以防它把注意力全部放在与专家动作强相关的干扰变量上。具体方法分为两个阶段：（a）我们利用量子化向量变分自编码器的离散编码从图片中提取有语义的对象，然后（b）随机地将具有相同离散编码值的编码分量一起丢弃，即掩盖掉该语义对象。实验表明所提方法显著提升了行为克隆的性能，并在各种 Atari 环境及 CARLA 自动驾驶环境中超过了各种其他正则化方法和基于因果的方法，甚至优于可与环境交互的逆强化学习方法。

https://www.zhuanzhi.ai/paper/53fb95a858607df85bb6d17b317fae15

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“CCIL” 就可以获取《【NeurIPS2021】用于解决模仿学习中因果混淆问题的察觉对象的正则化方法》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

1

相关内容

因果混淆

【NeurIPS2021】基于关联与识别的少样本目标检测

【NeurIPS2021】基于关联与识别的少样本目标检测

专知会员服务

24+阅读 · 2021年11月29日

【NeurIPS2021】用于物体检测的实例条件知识蒸馏

【NeurIPS2021】用于物体检测的实例条件知识蒸馏

专知会员服务

20+阅读 · 2021年11月10日

【ICML2021】基于观察的跨域模仿学习

专知会员服务

20+阅读 · 2021年8月30日

【ICML2021】预测观察进行模仿学习

专知会员服务

24+阅读 · 2021年7月10日

模仿学习: 进展，分类和机会

专知会员服务

48+阅读 · 2021年7月2日

【ICML2021】模仿学习的超参数选择

专知会员服务

22+阅读 · 2021年5月27日

【CVPR2021】现实世界域泛化的自适应方法

【CVPR2021】现实世界域泛化的自适应方法

专知会员服务

58+阅读 · 2021年3月31日

【NeurIPS2020】因果推断学习教程，70页ppt

【NeurIPS2020】因果推断学习教程，70页ppt

专知会员服务

196+阅读 · 2020年12月12日

【CVPR2020-Oral】用于深度网络的任务感知超参数

【CVPR2020-Oral】用于深度网络的任务感知超参数

专知会员服务

28+阅读 · 2020年5月25日

【NeurIPS2019】模仿学习中的因果混乱问题 Causal Confusion in Imitation Learning

【NeurIPS2019】模仿学习中的因果混乱问题 Causal Confusion in Imitation Learning

专知会员服务

30+阅读 · 2019年12月10日

【CVPR2021】用于行人重识别的无监督多源域自适应

【CVPR2021】用于行人重识别的无监督多源域自适应

专知

8+阅读 · 2021年5月1日

【CVPR2021】CausalVAE: 引入因果结构的解耦表示学习

【CVPR2021】CausalVAE: 引入因果结构的解耦表示学习

专知

19+阅读 · 2021年3月28日

【AAAI2021】面向真实世界的鲁棒视觉信息提取:新的数据集和新颖的解决方案

【AAAI2021】面向真实世界的鲁棒视觉信息提取:新的数据集和新颖的解决方案

专知

12+阅读 · 2021年2月18日

时间序列预测方法综述

时间序列预测方法综述

专知

5+阅读 · 2020年12月15日

【AAAI2021】近似梯度下降的学习图神经网络

【AAAI2021】近似梯度下降的学习图神经网络

专知

8+阅读 · 2020年12月9日

【NeurIPS 2020】核基渐进蒸馏加法器神经网络

【NeurIPS 2020】核基渐进蒸馏加法器神经网络

专知

13+阅读 · 2020年10月19日

【NeurIPS2020】无限可能的联合对比学习

【NeurIPS2020】无限可能的联合对比学习

专知

3+阅读 · 2020年10月2日

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

专知

12+阅读 · 2020年6月9日

【ICML2020】小样本目标检测

【ICML2020】小样本目标检测

专知

7+阅读 · 2020年6月2日

【CVPR2020】从领域适应的角度重新思考长尾视觉识别的类平衡方法

【CVPR2020】从领域适应的角度重新思考长尾视觉识别的类平衡方法

专知

5+阅读 · 2020年4月12日

Aspect-based Sentiment Analysis through EDU-level Attentions

Arxiv

0+阅读 · 2022年2月5日

Waveform inversion via reduced order modeling

Arxiv

0+阅读 · 2022年2月3日

OnlineSTL: Scaling Time Series Decomposition by 100x

OnlineSTL: Scaling Time Series Decomposition by 100x

Arxiv

0+阅读 · 2022年2月3日

Object-Aware Regularization for Addressing Causal Confusion in Imitation Learning

Arxiv

7+阅读 · 2021年10月27日

Imitation by Predicting Observations

Imitation by Predicting Observations

Arxiv

4+阅读 · 2021年7月8日

Towards Facilitating Empathic Conversations in Online Mental Health Support: A Reinforcement Learning Approach

Arxiv

4+阅读 · 2021年1月19日

Linear SLAM: Linearising the SLAM Problems using Submap Joining

Linear SLAM: Linearising the SLAM Problems using Submap Joining

Arxiv

3+阅读 · 2018年9月18日

Compositional GAN: Learning Conditional Image Composition

Compositional GAN: Learning Conditional Image Composition

Arxiv

31+阅读 · 2018年7月19日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

AspEm: Embedding Learning by Aspects in Heterogeneous Information Networks

Arxiv

7+阅读 · 2018年3月5日

VIP会员

相关主题

相关VIP内容

【NeurIPS2021】基于关联与识别的少样本目标检测

【NeurIPS2021】基于关联与识别的少样本目标检测

专知会员服务

24+阅读 · 2021年11月29日

【NeurIPS2021】用于物体检测的实例条件知识蒸馏

【NeurIPS2021】用于物体检测的实例条件知识蒸馏

专知会员服务

20+阅读 · 2021年11月10日

【ICML2021】基于观察的跨域模仿学习

专知会员服务

20+阅读 · 2021年8月30日

【ICML2021】预测观察进行模仿学习

专知会员服务

24+阅读 · 2021年7月10日

模仿学习: 进展，分类和机会

专知会员服务

48+阅读 · 2021年7月2日

【ICML2021】模仿学习的超参数选择

专知会员服务

22+阅读 · 2021年5月27日

【CVPR2021】现实世界域泛化的自适应方法

【CVPR2021】现实世界域泛化的自适应方法

专知会员服务

58+阅读 · 2021年3月31日

【NeurIPS2020】因果推断学习教程，70页ppt

【NeurIPS2020】因果推断学习教程，70页ppt

专知会员服务

196+阅读 · 2020年12月12日

【CVPR2020-Oral】用于深度网络的任务感知超参数

【CVPR2020-Oral】用于深度网络的任务感知超参数

专知会员服务

28+阅读 · 2020年5月25日

【NeurIPS2019】模仿学习中的因果混乱问题 Causal Confusion in Imitation Learning

【NeurIPS2019】模仿学习中的因果混乱问题 Causal Confusion in Imitation Learning

专知会员服务

30+阅读 · 2019年12月10日

热门VIP内容

开通专知VIP会员享更多权益服务

操作系统智能体：基于多模态大模型（MLLM）的通用计算设备智能体综述

《美国太空军系统全生命周期建模、仿真与分析效能提升方案》最新84页报告

【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习

自主人工智能：未来战争是否将是自主化的？

相关资讯

【CVPR2021】用于行人重识别的无监督多源域自适应

【CVPR2021】用于行人重识别的无监督多源域自适应

专知

8+阅读 · 2021年5月1日

【CVPR2021】CausalVAE: 引入因果结构的解耦表示学习

【CVPR2021】CausalVAE: 引入因果结构的解耦表示学习

专知

19+阅读 · 2021年3月28日

【AAAI2021】面向真实世界的鲁棒视觉信息提取:新的数据集和新颖的解决方案

【AAAI2021】面向真实世界的鲁棒视觉信息提取:新的数据集和新颖的解决方案

专知

12+阅读 · 2021年2月18日

时间序列预测方法综述

时间序列预测方法综述

专知

5+阅读 · 2020年12月15日

【AAAI2021】近似梯度下降的学习图神经网络

【AAAI2021】近似梯度下降的学习图神经网络

专知

8+阅读 · 2020年12月9日

【NeurIPS 2020】核基渐进蒸馏加法器神经网络

【NeurIPS 2020】核基渐进蒸馏加法器神经网络

专知

13+阅读 · 2020年10月19日

【NeurIPS2020】无限可能的联合对比学习

【NeurIPS2020】无限可能的联合对比学习

专知

3+阅读 · 2020年10月2日

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

专知

12+阅读 · 2020年6月9日

【ICML2020】小样本目标检测

【ICML2020】小样本目标检测

专知

7+阅读 · 2020年6月2日

【CVPR2020】从领域适应的角度重新思考长尾视觉识别的类平衡方法

【CVPR2020】从领域适应的角度重新思考长尾视觉识别的类平衡方法

专知

5+阅读 · 2020年4月12日

相关论文

Aspect-based Sentiment Analysis through EDU-level Attentions

Arxiv

0+阅读 · 2022年2月5日

Waveform inversion via reduced order modeling

Arxiv

0+阅读 · 2022年2月3日

OnlineSTL: Scaling Time Series Decomposition by 100x

OnlineSTL: Scaling Time Series Decomposition by 100x

Arxiv

0+阅读 · 2022年2月3日

Object-Aware Regularization for Addressing Causal Confusion in Imitation Learning

Arxiv

7+阅读 · 2021年10月27日

Imitation by Predicting Observations

Imitation by Predicting Observations

Arxiv

4+阅读 · 2021年7月8日

Towards Facilitating Empathic Conversations in Online Mental Health Support: A Reinforcement Learning Approach

Arxiv

4+阅读 · 2021年1月19日

Linear SLAM: Linearising the SLAM Problems using Submap Joining

Linear SLAM: Linearising the SLAM Problems using Submap Joining

Arxiv

3+阅读 · 2018年9月18日

Compositional GAN: Learning Conditional Image Composition

Compositional GAN: Learning Conditional Image Composition

Arxiv

31+阅读 · 2018年7月19日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

AspEm: Embedding Learning by Aspects in Heterogeneous Information Networks

Arxiv

7+阅读 · 2018年3月5日

大家都在搜

大型语言模型

CMU博士论文

国防科技创新

软件无线电

再见，TD-SCDMA！

微信扫码咨询专知VIP会员