【ICML2022】基于少样本策略泛化的决策Transformer

2022 年 7 月 11 日 专知


人们可以利用以前的经验,并从少量的演示中学习新的任务。与旨在通过更好的算法设计实现快速适应的离线元强化学习相比,我们研究了架构诱导偏差对少样本学习能力的影响。我们提出了一种基于提示的决策Transformer (Prompt- DT),它利用了Transformer体系结构和提示框架的顺序建模能力,实现离线RL中的少样本适应。我们设计了轨迹提示,其中包含了几个样本的演示片段,并编码了特定任务的信息来指导策略的生成。我们在5个MuJoCo控制基准测试中的实验表明,Prompt-DT是一个强大的少样本学习器,无需对看不见的目标任务进行任何额外的微调。Prompt-D比它的变体和强元离线RL基线有很大的优势,它的轨迹提示只包含几个时间步。Prompt-D对于提示长度的更改也很稳健,并且可以泛化到分布外(OOD)环境。项目页面:https://mxu34.github.io/PromptDT/。



https://www.zhuanzhi.ai/paper/cf161afe08921d24ebd168d7aafa3415


专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“PMDT” 就可以获取【ICML2022】基于少样本策略泛化的决策Transformer》专知下载链接

                       
专知,专业可信的人工智能知识分发 ,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取100000+AI(AI与军事、医药、公安等)主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取100000+AI主题知识资料
登录查看更多
1

相关内容

【ICML2022】Transformer是元强化学习器
专知会员服务
50+阅读 · 2022年6月15日
【ICML2022】鲁棒强化学习的策略梯度法
专知会员服务
34+阅读 · 2022年5月21日
【AAAI2022】跨域少样本图分类
专知会员服务
29+阅读 · 2022年1月22日
专知会员服务
24+阅读 · 2021年6月15日
专知会员服务
26+阅读 · 2021年5月24日
专知会员服务
22+阅读 · 2021年5月23日
【CVPR2021】现实世界域泛化的自适应方法
专知会员服务
53+阅读 · 2021年3月31日
【ICML2022】时序自监督视频transformer
专知
1+阅读 · 2022年7月28日
【ICML2022】在线决策Transformer
专知
2+阅读 · 2022年7月27日
【ICML2022】序列决策的效用理论
专知
1+阅读 · 2022年6月30日
【CVPR2022】视频对比学习的概率表示
专知
1+阅读 · 2022年4月12日
【ICML2021】基于观察的跨域模仿学习
专知
2+阅读 · 2021年8月30日
国家自然科学基金
36+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
14+阅读 · 2022年5月6日
Arxiv
17+阅读 · 2021年1月21日
Arxiv
13+阅读 · 2019年1月26日
VIP会员
相关VIP内容
【ICML2022】Transformer是元强化学习器
专知会员服务
50+阅读 · 2022年6月15日
【ICML2022】鲁棒强化学习的策略梯度法
专知会员服务
34+阅读 · 2022年5月21日
【AAAI2022】跨域少样本图分类
专知会员服务
29+阅读 · 2022年1月22日
专知会员服务
24+阅读 · 2021年6月15日
专知会员服务
26+阅读 · 2021年5月24日
专知会员服务
22+阅读 · 2021年5月23日
【CVPR2021】现实世界域泛化的自适应方法
专知会员服务
53+阅读 · 2021年3月31日
相关资讯
相关基金
国家自然科学基金
36+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员