【ICML2023】多任务分层对抗逆强化学习 - 专知VIP

会员服务 ·

11

ICML 2023 · 强化学习 · 多任务模仿学习 ·

2023 年 5 月 25 日

【ICML2023】多任务分层对抗逆强化学习

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

多任务模仿学习 (MIL) 旨在基于多任务专家演示训练能够执行任务分布的策略，这对通用机器人至关重要。现有的 MIL 算法在复杂长水平任务上的数据效率低下且表现不佳。我们开发了多任务层次对抗逆强化学习 (MH-AIRL) 以学习层次结构化的多任务策略，这对于具有长视野的组合任务更有利，并且通过识别和跨任务传输可重复使用的基本技能，具有更高的专家数据效率。为实现这一目标，MH-AIRL 有效地综合了基于上下文的多任务学习、AIRL (一种 IL 方法) 和层次策略学习。此外，MH-AIRL 可以应用于没有任务或技能注释的演示 (即，只有状态动作对)，这在实践中更易获取。MH-AIRL 的每个模块都提供了理论依据，而在挑战性的多任务设置上的评估证明，与 SOTA MIL 基线相比，MH-AIRL 学到的多任务策略具有优越的性能和可转移性。

成为VIP会员查看完整内容

22

相关内容

ICML 2023

国际机器学习大会(International Conference on Machine Learning，简称ICML ) 是由国际机器学习学会（IMLS）主办的机器学习国际顶级会议。 2023年7月23日至29日周六在夏威夷会议中心举行。

【ICML2023】在受限逆强化学习中的可识别性和泛化能力

【ICML2023】在受限逆强化学习中的可识别性和泛化能力

专知会员服务

26+阅读 · 2023年6月5日

【KDD2023】基于弱信息的强图神经网络学习

【KDD2023】基于弱信息的强图神经网络学习

专知会员服务

39+阅读 · 2023年6月4日

【ICML2022】通过评估演示者的专业知识进行模仿学习

【ICML2022】通过评估演示者的专业知识进行模仿学习

专知会员服务

17+阅读 · 2022年7月18日

【ICML2022】基于少样本策略泛化的决策Transformer

【ICML2022】基于少样本策略泛化的决策Transformer

专知会员服务

37+阅读 · 2022年7月11日

【ICML2022】序列决策的效用理论

【ICML2022】序列决策的效用理论

专知会员服务

16+阅读 · 2022年6月30日

【ICML2022】CtrlFormer: 通过Transformer学习视觉控制的可迁移状态表示

【ICML2022】CtrlFormer: 通过Transformer学习视觉控制的可迁移状态表示

专知会员服务

16+阅读 · 2022年6月21日

【ICML2022】Transformer是元强化学习器

【ICML2022】Transformer是元强化学习器

专知会员服务

56+阅读 · 2022年6月15日

【ICML2021】预测观察进行模仿学习

专知会员服务

24+阅读 · 2021年7月10日

【ICML2021】为开放博弈中的学习建模行为多样性。

专知会员服务

37+阅读 · 2021年5月29日

【论文】欺骗学习（Learning by Cheating）

【论文】欺骗学习（Learning by Cheating）

专知会员服务

28+阅读 · 2020年1月3日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

【ICML2022】DRIBO:基于多视图信息瓶颈的鲁棒深度强化学习

【ICML2022】DRIBO:基于多视图信息瓶颈的鲁棒深度强化学习

专知

0+阅读 · 2022年8月13日

【TPAMI2022】TransCL：基于Transformer的压缩学习，更灵活更强大

【TPAMI2022】TransCL：基于Transformer的压缩学习，更灵活更强大

专知

4+阅读 · 2022年8月2日

【ICML2022】时序自监督视频transformer

【ICML2022】时序自监督视频transformer

专知

1+阅读 · 2022年7月28日

【ICML2022】在线决策Transformer

【ICML2022】在线决策Transformer

专知

2+阅读 · 2022年7月27日

IJCAI2022《对抗序列决策》教程，164页ppt

IJCAI2022《对抗序列决策》教程，164页ppt

专知

4+阅读 · 2022年7月27日

【ICML2022】分支强化学习

【ICML2022】分支强化学习

专知

0+阅读 · 2022年7月23日

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

专知

40+阅读 · 2020年6月20日

ICCV2019|基于全局类别表征的小样本学习

ICCV2019|基于全局类别表征的小样本学习

极市平台

11+阅读 · 2019年9月21日

「元学习」解析：学习如何梯度下降与学习新的算法

「元学习」解析：学习如何梯度下降与学习新的算法

AI研习社

12+阅读 · 2018年5月1日

飞行器三维不变矩特征提取与识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

PSD-95/kalirin-7/Rac1信号通路在七氟烷致幼期大鼠远期学习记忆能力损害中的作用

国家自然科学基金

0+阅读 · 2015年12月31日

三维复杂地形环境下基于无人机追逃问题的航路规划方法研究

国家自然科学基金

24+阅读 · 2015年12月31日

面向异构环境的多任务多视图学习算法研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

基于主动特征选择的非合作航天器鲁棒视觉导航方法

国家自然科学基金

0+阅读 · 2013年12月31日

搜索竞价中关键字最优化策略研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于自适应神经网络的小型无人机高精度控制方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

移动机器人基于三维激光测距的室内场景认知与物体识别

国家自然科学基金

0+阅读 · 2012年12月31日

面向综合力学环境预测的回归多任务学习研究

国家自然科学基金

0+阅读 · 2012年12月31日

Vehicle Dispatching and Routing of On-Demand Intercity Ride-Pooling Services: A Multi-Agent Hierarchical Reinforcement Learning Approach

Arxiv

0+阅读 · 2023年7月13日

Efficient SGD Neural Network Training via Sublinear Activated Neuron Identification

Arxiv

0+阅读 · 2023年7月13日

Multiple Instance Learning via Iterative Self-Paced Supervised Contrastive Learning

Arxiv

0+阅读 · 2023年7月11日

RényiTester: A Variational Approach to Testing Differential Privacy

Arxiv

0+阅读 · 2023年7月10日

Learning Imbalanced Data with Vision Transformers

Arxiv

11+阅读 · 2023年3月8日

A Survey on Transformers in Reinforcement Learning

Arxiv

31+阅读 · 2023年1月8日

CReST: A Class-Rebalancing Self-Training Framework for Imbalanced Semi-Supervised Learning

Arxiv

11+阅读 · 2021年2月18日

Making Pre-trained Language Models Better Few-shot Learners

Arxiv

14+阅读 · 2020年12月31日

Knowledge Graph Transfer Network for Few-Shot Recognition

Arxiv

15+阅读 · 2019年11月21日

Deep learning for time series classification: a review

Arxiv

12+阅读 · 2019年3月14日

VIP会员

相关主题

多任务模仿学习

相关VIP内容

【ICML2023】在受限逆强化学习中的可识别性和泛化能力

【ICML2023】在受限逆强化学习中的可识别性和泛化能力

专知会员服务

26+阅读 · 2023年6月5日

【KDD2023】基于弱信息的强图神经网络学习

【KDD2023】基于弱信息的强图神经网络学习

专知会员服务

39+阅读 · 2023年6月4日

【ICML2022】通过评估演示者的专业知识进行模仿学习

【ICML2022】通过评估演示者的专业知识进行模仿学习

专知会员服务

17+阅读 · 2022年7月18日

【ICML2022】基于少样本策略泛化的决策Transformer

【ICML2022】基于少样本策略泛化的决策Transformer

专知会员服务

37+阅读 · 2022年7月11日

【ICML2022】序列决策的效用理论

【ICML2022】序列决策的效用理论

专知会员服务

16+阅读 · 2022年6月30日

【ICML2022】CtrlFormer: 通过Transformer学习视觉控制的可迁移状态表示

【ICML2022】CtrlFormer: 通过Transformer学习视觉控制的可迁移状态表示

专知会员服务

16+阅读 · 2022年6月21日

【ICML2022】Transformer是元强化学习器

【ICML2022】Transformer是元强化学习器

专知会员服务

56+阅读 · 2022年6月15日

【ICML2021】预测观察进行模仿学习

专知会员服务

24+阅读 · 2021年7月10日

【ICML2021】为开放博弈中的学习建模行为多样性。

专知会员服务

37+阅读 · 2021年5月29日

【论文】欺骗学习（Learning by Cheating）

【论文】欺骗学习（Learning by Cheating）

专知会员服务

28+阅读 · 2020年1月3日

热门VIP内容

开通专知VIP会员享更多权益服务

操作系统智能体：基于多模态大模型（MLLM）的通用计算设备智能体综述

《美国太空军系统全生命周期建模、仿真与分析效能提升方案》最新84页报告

【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习

自主人工智能：未来战争是否将是自主化的？

相关资讯

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

【ICML2022】DRIBO:基于多视图信息瓶颈的鲁棒深度强化学习

【ICML2022】DRIBO:基于多视图信息瓶颈的鲁棒深度强化学习

专知

0+阅读 · 2022年8月13日

【TPAMI2022】TransCL：基于Transformer的压缩学习，更灵活更强大

【TPAMI2022】TransCL：基于Transformer的压缩学习，更灵活更强大

专知

4+阅读 · 2022年8月2日

【ICML2022】时序自监督视频transformer

【ICML2022】时序自监督视频transformer

专知

1+阅读 · 2022年7月28日

【ICML2022】在线决策Transformer

【ICML2022】在线决策Transformer

专知

2+阅读 · 2022年7月27日

IJCAI2022《对抗序列决策》教程，164页ppt

IJCAI2022《对抗序列决策》教程，164页ppt

专知

4+阅读 · 2022年7月27日

【ICML2022】分支强化学习

【ICML2022】分支强化学习

专知

0+阅读 · 2022年7月23日

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

专知

40+阅读 · 2020年6月20日

ICCV2019|基于全局类别表征的小样本学习

ICCV2019|基于全局类别表征的小样本学习

极市平台

11+阅读 · 2019年9月21日

「元学习」解析：学习如何梯度下降与学习新的算法

「元学习」解析：学习如何梯度下降与学习新的算法

AI研习社

12+阅读 · 2018年5月1日

相关基金

飞行器三维不变矩特征提取与识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

PSD-95/kalirin-7/Rac1信号通路在七氟烷致幼期大鼠远期学习记忆能力损害中的作用

国家自然科学基金

0+阅读 · 2015年12月31日

三维复杂地形环境下基于无人机追逃问题的航路规划方法研究

国家自然科学基金

24+阅读 · 2015年12月31日

面向异构环境的多任务多视图学习算法研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

基于主动特征选择的非合作航天器鲁棒视觉导航方法

国家自然科学基金

0+阅读 · 2013年12月31日

搜索竞价中关键字最优化策略研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于自适应神经网络的小型无人机高精度控制方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

移动机器人基于三维激光测距的室内场景认知与物体识别

国家自然科学基金

0+阅读 · 2012年12月31日

面向综合力学环境预测的回归多任务学习研究

国家自然科学基金

0+阅读 · 2012年12月31日

相关论文

Vehicle Dispatching and Routing of On-Demand Intercity Ride-Pooling Services: A Multi-Agent Hierarchical Reinforcement Learning Approach

Arxiv

0+阅读 · 2023年7月13日

Efficient SGD Neural Network Training via Sublinear Activated Neuron Identification

Arxiv

0+阅读 · 2023年7月13日

Multiple Instance Learning via Iterative Self-Paced Supervised Contrastive Learning

Arxiv

0+阅读 · 2023年7月11日

RényiTester: A Variational Approach to Testing Differential Privacy

Arxiv

0+阅读 · 2023年7月10日

Learning Imbalanced Data with Vision Transformers

Arxiv

11+阅读 · 2023年3月8日

A Survey on Transformers in Reinforcement Learning

Arxiv

31+阅读 · 2023年1月8日

CReST: A Class-Rebalancing Self-Training Framework for Imbalanced Semi-Supervised Learning

Arxiv

11+阅读 · 2021年2月18日

Making Pre-trained Language Models Better Few-shot Learners

Arxiv

14+阅读 · 2020年12月31日

Knowledge Graph Transfer Network for Few-Shot Recognition

Arxiv

15+阅读 · 2019年11月21日

Deep learning for time series classification: a review

Arxiv

12+阅读 · 2019年3月14日

微信扫码咨询专知VIP会员