【ICML2022】DRIBO:基于多视图信息瓶颈的鲁棒深度强化学习

2022 年 8 月 13 日 专知


深度强化学习(DRL)智能体通常对其训练环境中看不到的视觉变化敏感。为了解决这个问题,我们利用RL的顺序特性来学习稳健的表示,这种表示只编码来自基于无监督多视图设置的观察的任务相关信息。具体地说,我们为时间数据引入了一个新的多视图信息瓶颈(MIB)目标的对比版本。我们用这个辅助目标从像素训练RL智能体来学习鲁棒的表示,它可以压缩与任务无关的信息,并可以预测与任务相关的动态。这种方法使我们能够训练出高性能的策略,这些策略能够抵御视觉干扰,并能够很好地推广到看不见的环境中。我们证明,当背景被自然视频取代时,我们的方法可以在DeepMind控制套件中不同的视觉控制任务集上实现SOTA性能。此外,我们还展示了在Procgen基准测试中,我们的方法优于已建立的基线,可以泛化到看不见的环境。我们的代码是开源的,可以在https://github上找到。com/BU-DEPEND-Lab/DRIBO。



专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“DRIBO” 就可以获取《【ICML2022】DRIBO:基于多视图信息瓶颈的鲁棒深度强化学习》专知下载链接

                       
专知,专业可信的人工智能知识分发 ,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取100000+AI(AI与军事、医药、公安等)主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取100000+AI主题知识资料
登录查看更多
0

相关内容

【ICML2022】基于少样本策略泛化的决策Transformer
专知会员服务
36+阅读 · 2022年7月11日
【ICML2022】鲁棒强化学习的策略梯度法
专知会员服务
37+阅读 · 2022年5月21日
专知会员服务
14+阅读 · 2021年7月21日
专知会员服务
23+阅读 · 2021年7月10日
专知会员服务
24+阅读 · 2021年6月15日
专知会员服务
21+阅读 · 2021年5月27日
专知会员服务
27+阅读 · 2021年5月24日
【ICML2020】用于强化学习的对比无监督表示嵌入
专知会员服务
27+阅读 · 2020年7月6日
【NeurIPS2022】分布式自适应元强化学习
专知
3+阅读 · 2022年10月8日
【NeurIPS2022】SparCL:边缘稀疏持续学习
专知
2+阅读 · 2022年9月22日
【ICML2022】时序自监督视频transformer
专知
1+阅读 · 2022年7月28日
【ICML2022】在线决策Transformer
专知
2+阅读 · 2022年7月27日
国家自然科学基金
41+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
45+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年11月22日
Arxiv
0+阅读 · 2022年11月21日
Arxiv
0+阅读 · 2022年11月18日
Arxiv
12+阅读 · 2021年11月1日
Multi-Domain Multi-Task Rehearsal for Lifelong Learning
Arxiv
12+阅读 · 2020年12月14日
Arxiv
15+阅读 · 2020年2月5日
Arxiv
12+阅读 · 2019年2月26日
VIP会员
相关VIP内容
【ICML2022】基于少样本策略泛化的决策Transformer
专知会员服务
36+阅读 · 2022年7月11日
【ICML2022】鲁棒强化学习的策略梯度法
专知会员服务
37+阅读 · 2022年5月21日
专知会员服务
14+阅读 · 2021年7月21日
专知会员服务
23+阅读 · 2021年7月10日
专知会员服务
24+阅读 · 2021年6月15日
专知会员服务
21+阅读 · 2021年5月27日
专知会员服务
27+阅读 · 2021年5月24日
【ICML2020】用于强化学习的对比无监督表示嵌入
专知会员服务
27+阅读 · 2020年7月6日
相关基金
国家自然科学基金
41+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
45+阅读 · 2009年12月31日
相关论文
Arxiv
0+阅读 · 2022年11月22日
Arxiv
0+阅读 · 2022年11月21日
Arxiv
0+阅读 · 2022年11月18日
Arxiv
12+阅读 · 2021年11月1日
Multi-Domain Multi-Task Rehearsal for Lifelong Learning
Arxiv
12+阅读 · 2020年12月14日
Arxiv
15+阅读 · 2020年2月5日
Arxiv
12+阅读 · 2019年2月26日
Top
微信扫码咨询专知VIP会员