【NeurIPS2022】持续强化学习中的解纠缠迁移

2022 年 10 月 3 日 专知


持续学习系统从以前看到的任务中迁移知识,以最大限度地提高新任务的性能的能力,是该领域的一个重大挑战,限制了持续学习解决方案对现实场景的适用性。因此,本研究旨在拓展我们对持续强化学习中迁移及其驱动力的理解。我们采用SAC作为底层RL算法,连续世界作为一组连续控制任务。我们系统地研究了SAC的不同组成部分(参与者和批评者、探索和数据)如何影响传输效果,并提供了关于各种建模选项的建议。最好的一组选择被称为ClonEx-SAC,是根据最近的Continual World基准进行评估的。ClonEx-SAC的最终成功率为87%,而PackNet的成功率为80%,是基准测试中最好的方法。此外,根据Continual World提供的度量,转移从0.18增长到0.54。

https://www.zhuanzhi.ai/paper/99cc5ece0419e33748b0af9d2cd8fdff

专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“CDRL” 就可以获取【NeurIPS2022】持续强化学习中的解纠缠迁移》专知下载链接

                       
专知,专业可信的人工智能知识分发 ,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取100000+AI(AI与军事、医药、公安等)主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取100000+AI主题知识资料
登录查看更多
0

相关内容

SAC:Selected Areas in Cryptography。 Explanation:密码术的选择区。 Publisher:Springer。 SIT:http://dblp.uni-trier.de/db/conf/sacrypt/
【AAAI2023】基于序图的因果结构强化学习
专知会员服务
23+阅读 · 2022年11月25日
专知会员服务
22+阅读 · 2021年10月6日
专知会员服务
22+阅读 · 2021年9月5日
专知会员服务
19+阅读 · 2021年8月30日
专知会员服务
23+阅读 · 2021年7月10日
【AAAI2021最佳论文】多智能体学习中的探索 - 利用
专知会员服务
35+阅读 · 2021年2月6日
最新《深度强化学习中的迁移学习》综述论文
专知会员服务
153+阅读 · 2020年9月20日
【ICML2020】持续图神经网络,Continuous Graph Neural Networks
专知会员服务
150+阅读 · 2020年6月28日
【NeurIPS2022】时序解纠缠表示学习
专知
1+阅读 · 2022年10月30日
【NeurIPS2022】分布式自适应元强化学习
专知
3+阅读 · 2022年10月8日
【ICML2022】几何多模态对比表示学习
专知
2+阅读 · 2022年7月17日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Arxiv
0+阅读 · 2022年11月22日
Arxiv
66+阅读 · 2022年4月13日
Arxiv
13+阅读 · 2022年1月20日
Arxiv
16+阅读 · 2021年7月18日
Arxiv
11+阅读 · 2018年4月25日
VIP会员
相关VIP内容
【AAAI2023】基于序图的因果结构强化学习
专知会员服务
23+阅读 · 2022年11月25日
专知会员服务
22+阅读 · 2021年10月6日
专知会员服务
22+阅读 · 2021年9月5日
专知会员服务
19+阅读 · 2021年8月30日
专知会员服务
23+阅读 · 2021年7月10日
【AAAI2021最佳论文】多智能体学习中的探索 - 利用
专知会员服务
35+阅读 · 2021年2月6日
最新《深度强化学习中的迁移学习》综述论文
专知会员服务
153+阅读 · 2020年9月20日
【ICML2020】持续图神经网络,Continuous Graph Neural Networks
专知会员服务
150+阅读 · 2020年6月28日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Top
微信扫码咨询专知VIP会员