【NeurIPS2022】持续强化学习中的解纠缠迁移 - 专知

会员服务 ·

0

【NeurIPS2022】持续强化学习中的解纠缠迁移

2022 年 10 月 3 日 专知

持续学习系统从以前看到的任务中迁移知识，以最大限度地提高新任务的性能的能力，是该领域的一个重大挑战，限制了持续学习解决方案对现实场景的适用性。因此，本研究旨在拓展我们对持续强化学习中迁移及其驱动力的理解。我们采用SAC作为底层RL算法，连续世界作为一组连续控制任务。我们系统地研究了SAC的不同组成部分(参与者和批评者、探索和数据)如何影响传输效果，并提供了关于各种建模选项的建议。最好的一组选择被称为ClonEx-SAC，是根据最近的Continual World基准进行评估的。ClonEx-SAC的最终成功率为87%，而PackNet的成功率为80%，是基准测试中最好的方法。此外，根据Continual World提供的度量，转移从0.18增长到0.54。

https://www.zhuanzhi.ai/paper/99cc5ece0419e33748b0af9d2cd8fdff

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“CDRL” 就可以获取《【NeurIPS2022】持续强化学习中的解纠缠迁移》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取100000+AI(AI与军事、医药、公安等)主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取100000+AI主题知识资料

登录查看更多

0

相关内容

SAC

SAC：Selected Areas in Cryptography。 Explanation：密码术的选择区。 Publisher：Springer。 SIT：http://dblp.uni-trier.de/db/conf/sacrypt/

【AAAI2023】基于序图的因果结构强化学习

【AAAI2023】基于序图的因果结构强化学习

专知会员服务

24+阅读 · 2022年11月25日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知会员服务

112+阅读 · 2022年10月6日

【NeurIPS2021】黑箱学习算法的信息理论泛化界

专知会员服务

23+阅读 · 2021年10月6日

【ICML2021】REPAINT:深度强化学习中的知识迁移

专知会员服务

23+阅读 · 2021年9月5日

【ICML2021】基于观察的跨域模仿学习

专知会员服务

20+阅读 · 2021年8月30日

【ICML2021】预测观察进行模仿学习

专知会员服务

24+阅读 · 2021年7月10日

【AAAI2021最佳论文】多智能体学习中的探索 - 利用

【AAAI2021最佳论文】多智能体学习中的探索 - 利用

专知会员服务

36+阅读 · 2021年2月6日

最新《深度强化学习中的迁移学习》综述论文

最新《深度强化学习中的迁移学习》综述论文

专知会员服务

157+阅读 · 2020年9月20日

【ICML2020】持续图神经网络，Continuous Graph Neural Networks

【ICML2020】持续图神经网络，Continuous Graph Neural Networks

专知会员服务

151+阅读 · 2020年6月28日

【CVPR2020】我们能用强化学习来学习图模型推断的启发规则吗?

专知会员服务

43+阅读 · 2020年5月5日

【NeurIPS2022】时序解纠缠表示学习

【NeurIPS2022】时序解纠缠表示学习

专知

1+阅读 · 2022年10月30日

【NeurIPS2022】分布式自适应元强化学习

【NeurIPS2022】分布式自适应元强化学习

专知

3+阅读 · 2022年10月8日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

【NeurIPS2022】通过模型转换的可解释强化学习

【NeurIPS2022】通过模型转换的可解释强化学习

专知

1+阅读 · 2022年10月4日

【硬核书】多智能体协调:强化学习方法，315页pdf

【硬核书】多智能体协调:强化学习方法，315页pdf

专知

4+阅读 · 2022年9月17日

【ICML2022】几何多模态对比表示学习

【ICML2022】几何多模态对比表示学习

专知

2+阅读 · 2022年7月17日

【硬核书】迁移学习多智能体强化学习系统，131页pdf

【硬核书】迁移学习多智能体强化学习系统，131页pdf

专知

5+阅读 · 2022年7月8日

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

专知

3+阅读 · 2022年4月19日

【NeurIPS 2021教程】UFC-César Lincoln C教授：<高斯过程>来龙去脉，216页ppt

【NeurIPS 2021教程】UFC-César Lincoln C教授：<高斯过程>来龙去脉，216页ppt

专知

1+阅读 · 2021年12月9日

【微信@CIKM2021 】强化学习推荐模型的知识蒸馏探索之路

【微信@CIKM2021 】强化学习推荐模型的知识蒸馏探索之路

专知

4+阅读 · 2021年12月4日

ASB3基因突变在大肠癌发生发展和转移中的作用及机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

噪声环境下腔量子电动力学量子计算与量子相干操控的理论研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于发动机暂态控制改善油电混合动力链节能与排放优化策略研究

国家自然科学基金

0+阅读 · 2013年12月31日

新型超导量子比特及相关宏观量子现象的研究

国家自然科学基金

0+阅读 · 2012年12月31日

无相互作用量子系统间的量子纠缠和量子关联研究

国家自然科学基金

0+阅读 · 2012年12月31日

miR-370-LIN28A信号通路在肝癌发生发展中的作用

国家自然科学基金

0+阅读 · 2012年12月31日

开放系统中的量子信息过程实验研究

国家自然科学基金

0+阅读 · 2012年12月31日

量子态动力学演化的多维谱学研究

国家自然科学基金

0+阅读 · 2012年12月31日

热噪声环境下的纳米机械振子的相互作用与量子态演化与操控理论

国家自然科学基金

0+阅读 · 2011年12月31日

基于固态系统的量子克隆和量子纠缠研究

国家自然科学基金

0+阅读 · 2011年12月31日

Quantum Multi-Agent Meta Reinforcement Learning

Arxiv

0+阅读 · 2022年11月22日

Beyond Just Vision: A Review on Self-Supervised Representation Learning on Multimodal and Temporal Data

Arxiv

28+阅读 · 2022年6月8日

Reinforcement Learning on Graph: A Survey

Arxiv

67+阅读 · 2022年4月13日

Cross-Domain Few-Shot Graph Classification

Arxiv

13+阅读 · 2022年1月20日

Challenges of Artificial Intelligence -- From Machine Learning and Computer Vision to Emotional Intelligence

Arxiv

19+阅读 · 2022年1月5日

Domain Generalization in Vision: A Survey

Arxiv

16+阅读 · 2021年7月18日

Generalizing to Unseen Domains: A Survey on Domain Generalization

Arxiv

30+阅读 · 2021年3月10日

CURL: Contrastive Unsupervised Representations for Reinforcement Learning

Arxiv

17+阅读 · 2020年4月28日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

CoNet: Collaborative Cross Networks for Cross-Domain Recommendation

Arxiv

13+阅读 · 2018年4月20日

VIP会员

相关主题

相关VIP内容

【AAAI2023】基于序图的因果结构强化学习

【AAAI2023】基于序图的因果结构强化学习

专知会员服务

24+阅读 · 2022年11月25日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知会员服务

112+阅读 · 2022年10月6日

【NeurIPS2021】黑箱学习算法的信息理论泛化界

专知会员服务

23+阅读 · 2021年10月6日

【ICML2021】REPAINT:深度强化学习中的知识迁移

专知会员服务

23+阅读 · 2021年9月5日

【ICML2021】基于观察的跨域模仿学习

专知会员服务

20+阅读 · 2021年8月30日

【ICML2021】预测观察进行模仿学习

专知会员服务

24+阅读 · 2021年7月10日

【AAAI2021最佳论文】多智能体学习中的探索 - 利用

【AAAI2021最佳论文】多智能体学习中的探索 - 利用

专知会员服务

36+阅读 · 2021年2月6日

最新《深度强化学习中的迁移学习》综述论文

最新《深度强化学习中的迁移学习》综述论文

专知会员服务

157+阅读 · 2020年9月20日

【ICML2020】持续图神经网络，Continuous Graph Neural Networks

【ICML2020】持续图神经网络，Continuous Graph Neural Networks

专知会员服务

151+阅读 · 2020年6月28日

【CVPR2020】我们能用强化学习来学习图模型推断的启发规则吗?

专知会员服务

43+阅读 · 2020年5月5日

热门VIP内容

开通专知VIP会员享更多权益服务

《物联网（IoT）中的无人机通信高效控制》135页

《在GNSS信号降级环境中利用共识实现无人机集群稳健协调》

中程单向攻击无人机的战略意义：俄乌战争启示

《面向无人机集群的避障动态传感器覆盖算法》最新38页

相关资讯

【NeurIPS2022】时序解纠缠表示学习

【NeurIPS2022】时序解纠缠表示学习

专知

1+阅读 · 2022年10月30日

【NeurIPS2022】分布式自适应元强化学习

【NeurIPS2022】分布式自适应元强化学习

专知

3+阅读 · 2022年10月8日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

【NeurIPS2022】通过模型转换的可解释强化学习

【NeurIPS2022】通过模型转换的可解释强化学习

专知

1+阅读 · 2022年10月4日

【硬核书】多智能体协调:强化学习方法，315页pdf

【硬核书】多智能体协调:强化学习方法，315页pdf

专知

4+阅读 · 2022年9月17日

【ICML2022】几何多模态对比表示学习

【ICML2022】几何多模态对比表示学习

专知

2+阅读 · 2022年7月17日

【硬核书】迁移学习多智能体强化学习系统，131页pdf

【硬核书】迁移学习多智能体强化学习系统，131页pdf

专知

5+阅读 · 2022年7月8日

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

专知

3+阅读 · 2022年4月19日

【NeurIPS 2021教程】UFC-César Lincoln C教授：<高斯过程>来龙去脉，216页ppt

【NeurIPS 2021教程】UFC-César Lincoln C教授：<高斯过程>来龙去脉，216页ppt

专知

1+阅读 · 2021年12月9日

【微信@CIKM2021 】强化学习推荐模型的知识蒸馏探索之路

【微信@CIKM2021 】强化学习推荐模型的知识蒸馏探索之路

专知

4+阅读 · 2021年12月4日

相关基金

ASB3基因突变在大肠癌发生发展和转移中的作用及机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

噪声环境下腔量子电动力学量子计算与量子相干操控的理论研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于发动机暂态控制改善油电混合动力链节能与排放优化策略研究

国家自然科学基金

0+阅读 · 2013年12月31日

新型超导量子比特及相关宏观量子现象的研究

国家自然科学基金

0+阅读 · 2012年12月31日

无相互作用量子系统间的量子纠缠和量子关联研究

国家自然科学基金

0+阅读 · 2012年12月31日

miR-370-LIN28A信号通路在肝癌发生发展中的作用

国家自然科学基金

0+阅读 · 2012年12月31日

开放系统中的量子信息过程实验研究

国家自然科学基金

0+阅读 · 2012年12月31日

量子态动力学演化的多维谱学研究

国家自然科学基金

0+阅读 · 2012年12月31日

热噪声环境下的纳米机械振子的相互作用与量子态演化与操控理论

国家自然科学基金

0+阅读 · 2011年12月31日

基于固态系统的量子克隆和量子纠缠研究

国家自然科学基金

0+阅读 · 2011年12月31日

相关论文

Quantum Multi-Agent Meta Reinforcement Learning

Arxiv

0+阅读 · 2022年11月22日

Beyond Just Vision: A Review on Self-Supervised Representation Learning on Multimodal and Temporal Data

Arxiv

28+阅读 · 2022年6月8日

Reinforcement Learning on Graph: A Survey

Arxiv

67+阅读 · 2022年4月13日

Cross-Domain Few-Shot Graph Classification

Arxiv

13+阅读 · 2022年1月20日

Challenges of Artificial Intelligence -- From Machine Learning and Computer Vision to Emotional Intelligence

Arxiv

19+阅读 · 2022年1月5日

Domain Generalization in Vision: A Survey

Arxiv

16+阅读 · 2021年7月18日

Generalizing to Unseen Domains: A Survey on Domain Generalization

Arxiv

30+阅读 · 2021年3月10日

CURL: Contrastive Unsupervised Representations for Reinforcement Learning

Arxiv

17+阅读 · 2020年4月28日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

CoNet: Collaborative Cross Networks for Cross-Domain Recommendation

Arxiv

13+阅读 · 2018年4月20日

大家都在搜

大型语言模型

CMU博士论文

久别重逢话双塔

软件无线电

国防科技创新

无人机测控通信自组网技术综述

微信扫码咨询专知VIP会员