【ICML2022】CtrlFormer: 通过Transformer学习视觉控制的可迁移状态表示 - 专知VIP

会员服务 ·

3

CtrlFormer · Transformer · 对比强化学习 ·

2022 年 6 月 21 日

【ICML2022】CtrlFormer: 通过Transformer学习视觉控制的可迁移状态表示

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

Transformer在学习视觉和语言表示方面取得了巨大的成功，这在各种下游任务中都是通用的。在视觉控制中，学习可在不同控制任务间迁移的可迁移状态表示对于减少训练样本的大小具有重要意义。然而，将Transformer移植到采样高效的视觉控制仍然是一个具有挑战性和未解决的问题。为此，我们提出了一种新颖的控制Transformer(CtrlFormer)，它具有许多现有技术所没有的吸引人的优点。首先，CtrlFormer在不同控制任务之间联合学习视觉令牌和策略令牌之间的自注意力机制，可以在不发生灾难性遗忘的情况下学习和迁移多任务表示。其次，我们精心设计了一个对比强化学习范式来训练CtrlFormer，使其能够达到较高的样本效率，这在控制问题中是非常重要的。例如，在DMControl基准测试中，不像最近的先进方法在使用100k样本迁移学习后在“Cartpole”任务中产生零分而失败，CtrlFormer可以在仅使用100k样本的情况下获得769±34的最先进的分数，同时保持之前任务的性能。代码和模型发布在我们的项目主页上。

https://www.zhuanzhi.ai/paper/9692ae63f6623f9fc8ad4d18583f4002

成为VIP会员查看完整内容

16

相关内容

CtrlFormer

【ICML2022】在线决策Transformer

【ICML2022】在线决策Transformer

专知会员服务

34+阅读 · 2022年7月27日

【ICML2022】通过评估演示者的专业知识进行模仿学习

【ICML2022】通过评估演示者的专业知识进行模仿学习

专知会员服务

17+阅读 · 2022年7月18日

【ICML2022】基于少样本策略泛化的决策Transformer

【ICML2022】基于少样本策略泛化的决策Transformer

专知会员服务

37+阅读 · 2022年7月11日

【ICML2021】使用Transformers编码的计算感知神经架构

专知会员服务

18+阅读 · 2021年9月15日

【ICML2021】通过文本生成统一视觉和语言任务

专知会员服务

19+阅读 · 2021年9月13日

【ICML2021】REPAINT:深度强化学习中的知识迁移

专知会员服务

23+阅读 · 2021年9月5日

【ICML2021】教师-学生设置中的持续学习:任务相似性的影响

专知会员服务

20+阅读 · 2021年9月1日

【ICML2021】核持续学习，Kernel Continual Learning

专知会员服务

32+阅读 · 2021年7月15日

【ICML2021】学习一个通用模板的少样本数据集泛化

专知会员服务

26+阅读 · 2021年5月23日

【NeurIPS 2020】视觉和语言表示学习的大规模对抗性训练

【NeurIPS 2020】视觉和语言表示学习的大规模对抗性训练

专知会员服务

15+阅读 · 2020年10月27日

【ICML2022】在线决策Transformer

【ICML2022】在线决策Transformer

专知

2+阅读 · 2022年7月27日

【ICML2022】序列决策的效用理论

【ICML2022】序列决策的效用理论

专知

1+阅读 · 2022年6月30日

【ICML2022】张量卷积神经网络的统一权值初始化范式

【ICML2022】张量卷积神经网络的统一权值初始化范式

专知

2+阅读 · 2022年6月8日

星际争霸II协作对抗基准超越SOTA，新型Transformer架构解决多智能体强化学习问题

星际争霸II协作对抗基准超越SOTA，新型Transformer架构解决多智能体强化学习问题

机器之心

0+阅读 · 2022年6月2日

【ICML2022】Orchestra: 通过全局一致聚类的无监督联邦学习

【ICML2022】Orchestra: 通过全局一致聚类的无监督联邦学习

专知

1+阅读 · 2022年5月27日

谷歌提出MaskGIT：掩码生成图像Transformer

谷歌提出MaskGIT：掩码生成图像Transformer

CVer

2+阅读 · 2022年3月21日

单一ViT模型执行多模态多任务，谷歌用协同训练策略实现多个SOTA

单一ViT模型执行多模态多任务，谷歌用协同训练策略实现多个SOTA

机器之心

1+阅读 · 2021年12月21日

SoCo: 通过目标级对比学习实现整个目标检测模型的预训练

SoCo: 通过目标级对比学习实现整个目标检测模型的预训练

极市平台

1+阅读 · 2021年11月16日

【ICML2021】教师-学生设置中的持续学习:任务相似性的影响

【ICML2021】教师-学生设置中的持续学习:任务相似性的影响

专知

1+阅读 · 2021年9月1日

中文版-BERT-预训练的深度双向Transformer语言模型-详细介绍

中文版-BERT-预训练的深度双向Transformer语言模型-详细介绍

深度学习与NLP

30+阅读 · 2019年3月30日

临界态对生物神经网络学习、记忆以及模式识别能力的影响

国家自然科学基金

0+阅读 · 2015年12月31日

无尾飞翼布局飞行器的操纵面故障强化学习最优自适应补偿控制研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于模糊逻辑的大规模强化学习理论及方法

国家自然科学基金

7+阅读 · 2014年12月31日

基于故障跟踪估计器的高压直流输电系统故障诊断

国家自然科学基金

0+阅读 · 2013年12月31日

基于海量语料自然标注信息的汉语自然语块分析

国家自然科学基金

0+阅读 · 2013年12月31日

基于非因果稳定逆的柔性机械臂学习控制

国家自然科学基金

0+阅读 · 2012年12月31日

驱动器饱和受限下分布式系统的合作控制

国家自然科学基金

0+阅读 · 2012年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

基于光纤与腔QED系统耦合的量子信息处理器

国家自然科学基金

0+阅读 · 2009年12月31日

激活成纤维细胞改善移植胰岛的再血管化

国家自然科学基金

0+阅读 · 2009年12月31日

Next-ViT: Next Generation Vision Transformer for Efficient Deployment in Realistic Industrial Scenarios

Arxiv

0+阅读 · 2022年8月8日

DyTox: Transformers for Continual Learning with DYnamic TOken eXpansion

Arxiv

0+阅读 · 2022年8月7日

Transformers as Meta-Learners for Implicit Neural Representations

Arxiv

0+阅读 · 2022年8月4日

mmFormer: Multimodal Medical Transformer for Incomplete Multimodal Learning of Brain Tumor Segmentation

Arxiv

2+阅读 · 2022年8月4日

Multimodal Learning with Transformers: A Survey

Arxiv

69+阅读 · 2022年6月13日

EDTER: Edge Detection with Transformer

Arxiv

11+阅读 · 2022年3月16日

SiT: Self-supervised vIsion Transformer

Arxiv

19+阅读 · 2021年4月8日

Heterogeneous Graph Transformer

Heterogeneous Graph Transformer

Arxiv

27+阅读 · 2020年3月3日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

Self-Attention with Relative Position Representations

Arxiv

14+阅读 · 2018年3月6日

VIP会员

相关主题

对比强化学习

相关VIP内容

【ICML2022】在线决策Transformer

【ICML2022】在线决策Transformer

专知会员服务

34+阅读 · 2022年7月27日

【ICML2022】通过评估演示者的专业知识进行模仿学习

【ICML2022】通过评估演示者的专业知识进行模仿学习

专知会员服务

17+阅读 · 2022年7月18日

【ICML2022】基于少样本策略泛化的决策Transformer

【ICML2022】基于少样本策略泛化的决策Transformer

专知会员服务

37+阅读 · 2022年7月11日

【ICML2021】使用Transformers编码的计算感知神经架构

专知会员服务

18+阅读 · 2021年9月15日

【ICML2021】通过文本生成统一视觉和语言任务

专知会员服务

19+阅读 · 2021年9月13日

【ICML2021】REPAINT:深度强化学习中的知识迁移

专知会员服务

23+阅读 · 2021年9月5日

【ICML2021】教师-学生设置中的持续学习:任务相似性的影响

专知会员服务

20+阅读 · 2021年9月1日

【ICML2021】核持续学习，Kernel Continual Learning

专知会员服务

32+阅读 · 2021年7月15日

【ICML2021】学习一个通用模板的少样本数据集泛化

专知会员服务

26+阅读 · 2021年5月23日

【NeurIPS 2020】视觉和语言表示学习的大规模对抗性训练

【NeurIPS 2020】视觉和语言表示学习的大规模对抗性训练

专知会员服务

15+阅读 · 2020年10月27日

热门VIP内容

开通专知VIP会员享更多权益服务

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

人工智能驱动弹药制造现代化：美国陆军转型之路

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

相关资讯

【ICML2022】在线决策Transformer

【ICML2022】在线决策Transformer

专知

2+阅读 · 2022年7月27日

【ICML2022】序列决策的效用理论

【ICML2022】序列决策的效用理论

专知

1+阅读 · 2022年6月30日

【ICML2022】张量卷积神经网络的统一权值初始化范式

【ICML2022】张量卷积神经网络的统一权值初始化范式

专知

2+阅读 · 2022年6月8日

星际争霸II协作对抗基准超越SOTA，新型Transformer架构解决多智能体强化学习问题

星际争霸II协作对抗基准超越SOTA，新型Transformer架构解决多智能体强化学习问题

机器之心

0+阅读 · 2022年6月2日

【ICML2022】Orchestra: 通过全局一致聚类的无监督联邦学习

【ICML2022】Orchestra: 通过全局一致聚类的无监督联邦学习

专知

1+阅读 · 2022年5月27日

谷歌提出MaskGIT：掩码生成图像Transformer

谷歌提出MaskGIT：掩码生成图像Transformer

CVer

2+阅读 · 2022年3月21日

单一ViT模型执行多模态多任务，谷歌用协同训练策略实现多个SOTA

单一ViT模型执行多模态多任务，谷歌用协同训练策略实现多个SOTA

机器之心

1+阅读 · 2021年12月21日

SoCo: 通过目标级对比学习实现整个目标检测模型的预训练

SoCo: 通过目标级对比学习实现整个目标检测模型的预训练

极市平台

1+阅读 · 2021年11月16日

【ICML2021】教师-学生设置中的持续学习:任务相似性的影响

【ICML2021】教师-学生设置中的持续学习:任务相似性的影响

专知

1+阅读 · 2021年9月1日

中文版-BERT-预训练的深度双向Transformer语言模型-详细介绍

中文版-BERT-预训练的深度双向Transformer语言模型-详细介绍

深度学习与NLP

30+阅读 · 2019年3月30日

相关基金

临界态对生物神经网络学习、记忆以及模式识别能力的影响

国家自然科学基金

0+阅读 · 2015年12月31日

无尾飞翼布局飞行器的操纵面故障强化学习最优自适应补偿控制研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于模糊逻辑的大规模强化学习理论及方法

国家自然科学基金

7+阅读 · 2014年12月31日

基于故障跟踪估计器的高压直流输电系统故障诊断

国家自然科学基金

0+阅读 · 2013年12月31日

基于海量语料自然标注信息的汉语自然语块分析

国家自然科学基金

0+阅读 · 2013年12月31日

基于非因果稳定逆的柔性机械臂学习控制

国家自然科学基金

0+阅读 · 2012年12月31日

驱动器饱和受限下分布式系统的合作控制

国家自然科学基金

0+阅读 · 2012年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

基于光纤与腔QED系统耦合的量子信息处理器

国家自然科学基金

0+阅读 · 2009年12月31日

激活成纤维细胞改善移植胰岛的再血管化

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Next-ViT: Next Generation Vision Transformer for Efficient Deployment in Realistic Industrial Scenarios

Arxiv

0+阅读 · 2022年8月8日

DyTox: Transformers for Continual Learning with DYnamic TOken eXpansion

Arxiv

0+阅读 · 2022年8月7日

Transformers as Meta-Learners for Implicit Neural Representations

Arxiv

0+阅读 · 2022年8月4日

mmFormer: Multimodal Medical Transformer for Incomplete Multimodal Learning of Brain Tumor Segmentation

Arxiv

2+阅读 · 2022年8月4日

Multimodal Learning with Transformers: A Survey

Arxiv

69+阅读 · 2022年6月13日

EDTER: Edge Detection with Transformer

Arxiv

11+阅读 · 2022年3月16日

SiT: Self-supervised vIsion Transformer

Arxiv

19+阅读 · 2021年4月8日

Heterogeneous Graph Transformer

Heterogeneous Graph Transformer

Arxiv

27+阅读 · 2020年3月3日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

Self-Attention with Relative Position Representations

Arxiv

14+阅读 · 2018年3月6日

微信扫码咨询专知VIP会员