【IJCAI2020】基于生成对抗模仿学习的多模态模仿学习算法框架 - 专知VIP

会员服务 ·

8

多模态模仿学习 · 生成对抗网络 ·

2020 年 5 月 26 日

【IJCAI2020】基于生成对抗模仿学习的多模态模仿学习算法框架

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

模仿学习是一种基于专家示教重建期望策略的方法，一直是AI领域的研究热点。为了提升模仿学习的通用性和在实际工程中的应用，相关的研究方向吸引了大量学术和工业界人士，其中利用多模态模仿学习提升模仿学习效果是重要的方向之一。例如，应用于自动驾驶中的驾驶行为学习，真实驾驶员示教数据由于驾驶技能和行为习惯的多样性呈现多种模态并服从不同的分布，如果直接利用行为克隆（Behavioral Cloning，BC）或逆向强化学习（Inverse Reinforcement Learning，IRL）容易导致模态坍塌问题（mode collapse problem），因缺乏发现和区分示教数据中的模态变化的能力。为了针对多模态示教数据进行有效的模仿，我们提出了一种基于生成对抗模仿学习（Generative Adversarial Imitation Learning，GAIL）的多模态模仿学习算法框架（图3），称为Triple-GAIL，通过对模态选择和行为模仿联合学习并利用模态选择器增量式生成数据促进模态区分优化模仿效果。Triple-GAIL在GAIL的基础上增加了一个模态选择器（Selector）用于区分多个模态，并和生成器（Generator）一起持续生成状态-动作-模态数据序列，达到数据增广的目的，而判别器（Discriminator）用于区分状态-动作-模态数据序列是否来自于专家示教数据。与已有多模态模仿学习方法相比，Triple-GAIL既可以直接通过指定模态生成行为轨迹，也可以直接利用模态选择器基于历史数据判断模态。

成为VIP会员查看完整内容

58

相关内容

多模态模仿学习

多模态模仿学习

【ICML2020】基于图感知逻辑回归和抢占式查询候选集生成的属性图上主动学习策略

【ICML2020】基于图感知逻辑回归和抢占式查询候选集生成的属性图上主动学习策略

专知会员服务

13+阅读 · 2020年7月9日

【ICML2020】用于强化学习的对比无监督表示嵌入

【ICML2020】用于强化学习的对比无监督表示嵌入

专知会员服务

28+阅读 · 2020年7月6日

【IJCAI2020-华为诺亚】面向深度强化学习的策略迁移框架

【IJCAI2020-华为诺亚】面向深度强化学习的策略迁移框架

专知会员服务

28+阅读 · 2020年5月25日

【ACL2020】对抗性文本生成，Improving Adversarial Text Generation

专知会员服务

52+阅读 · 2020年5月5日

【基于模型的强化学习的博弈论框架】A Game Theoretic Framework for Model Based Reinforcement Learning

【基于模型的强化学习的博弈论框架】A Game Theoretic Framework for Model Based Reinforcement Learning

专知会员服务

131+阅读 · 2020年4月19日

【WWW2020-人大】通过对抗性学习从用户-项目交互数据中挖掘隐含的实体偏好以完成知识图谱补全

【WWW2020-人大】通过对抗性学习从用户-项目交互数据中挖掘隐含的实体偏好以完成知识图谱补全

专知会员服务

48+阅读 · 2020年4月1日

【重庆大学】基于生成式对抗网络的推荐系统:一个问题驱动的视角

【重庆大学】基于生成式对抗网络的推荐系统:一个问题驱动的视角

专知会员服务

18+阅读 · 2020年3月15日

基于生成对抗网络的模仿学习综述, 苏州大学，计算机学报

专知会员服务

47+阅读 · 2020年2月1日

【AAAI2020】知识图谱的生成式对抗零样本关系学习，Generative Adversarial Zero-Shot Relational Learning for Knowledge Graphs

【AAAI2020】知识图谱的生成式对抗零样本关系学习，Generative Adversarial Zero-Shot Relational Learning for Knowledge Graphs

专知会员服务

64+阅读 · 2020年1月11日

【AAAI2020论文】分类感知的生成式对抗网络，具有分类文本生成的层次进化学习 (附pdf)

专知会员服务

21+阅读 · 2019年11月19日

Github 项目推荐 | PyTorch 实现的 GAN 文本生成框架

Github 项目推荐 | PyTorch 实现的 GAN 文本生成框架

AI研习社

35+阅读 · 2019年6月10日

ICML 2019 | 强化学习用于推荐系统，蚂蚁金服提出生成对抗用户模型

ICML 2019 | 强化学习用于推荐系统，蚂蚁金服提出生成对抗用户模型

机器之心

8+阅读 · 2019年6月4日

TPAMI | 从虚拟到现实，一种基于强化学习的端到端主动目标跟踪方法

TPAMI | 从虚拟到现实，一种基于强化学习的端到端主动目标跟踪方法

AI科技评论

6+阅读 · 2019年4月25日

强化学习与文本生成

强化学习与文本生成

微信AI

41+阅读 · 2019年4月4日

CMU论文解读：基于GAN和VAE的跨模态图像生成

CMU论文解读：基于GAN和VAE的跨模态图像生成

PaperWeekly

9+阅读 · 2018年8月20日

【学界】生成式对抗网络：从生成数据到创造智能

【学界】生成式对抗网络：从生成数据到创造智能

GAN生成式对抗网络

6+阅读 · 2018年6月14日

ICASSP最佳学生论文：深度对抗声学模型训练框架

ICASSP最佳学生论文：深度对抗声学模型训练框架

专知

14+阅读 · 2018年4月28日

一文概览用于数据集增强的对抗生成网络架构

一文概览用于数据集增强的对抗生成网络架构

论智

357+阅读 · 2018年3月16日

探幽深度生成模型的两种方法：VAE和GAN

探幽深度生成模型的两种方法：VAE和GAN

AI前线

15+阅读 · 2018年3月10日

GAN | GAN介绍（1）

GAN | GAN介绍（1）

KingsGarden

79+阅读 · 2017年3月13日

Representation Learning with Contrastive Predictive Coding

Arxiv

6+阅读 · 2019年1月22日

GAN-QP: A Novel GAN Framework without Gradient Vanishing and Lipschitz Constraint

GAN-QP: A Novel GAN Framework without Gradient Vanishing and Lipschitz Constraint

Arxiv

5+阅读 · 2018年12月15日

Multi-turn Dialogue Response Generation in an Adversarial Learning Framework

Arxiv

4+阅读 · 2018年6月11日

GANE: A Generative Adversarial Network Embedding

Arxiv

5+阅读 · 2018年5月21日

Feasibility Based Large Margin Nearest Neighbor Metric Learning

Arxiv

3+阅读 · 2018年5月2日

Controllable Generative Adversarial Network

Arxiv

5+阅读 · 2018年5月1日

Event Extraction with Generative Adversarial Imitation Learning

Arxiv

13+阅读 · 2018年4月21日

TVAE: Triplet-Based Variational Autoencoder using Metric Learning

Arxiv

3+阅读 · 2018年4月3日

KBGAN: Adversarial Learning for Knowledge Graph Embeddings

Arxiv

6+阅读 · 2018年2月20日

SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient

Arxiv

5+阅读 · 2017年8月25日

VIP会员

相关主题

多模态模仿学习

生成对抗网络

相关VIP内容

【ICML2020】基于图感知逻辑回归和抢占式查询候选集生成的属性图上主动学习策略

【ICML2020】基于图感知逻辑回归和抢占式查询候选集生成的属性图上主动学习策略

专知会员服务

13+阅读 · 2020年7月9日

【ICML2020】用于强化学习的对比无监督表示嵌入

【ICML2020】用于强化学习的对比无监督表示嵌入

专知会员服务

28+阅读 · 2020年7月6日

【IJCAI2020-华为诺亚】面向深度强化学习的策略迁移框架

【IJCAI2020-华为诺亚】面向深度强化学习的策略迁移框架

专知会员服务

28+阅读 · 2020年5月25日

【ACL2020】对抗性文本生成，Improving Adversarial Text Generation

专知会员服务

52+阅读 · 2020年5月5日

【基于模型的强化学习的博弈论框架】A Game Theoretic Framework for Model Based Reinforcement Learning

【基于模型的强化学习的博弈论框架】A Game Theoretic Framework for Model Based Reinforcement Learning

专知会员服务

131+阅读 · 2020年4月19日

【WWW2020-人大】通过对抗性学习从用户-项目交互数据中挖掘隐含的实体偏好以完成知识图谱补全

【WWW2020-人大】通过对抗性学习从用户-项目交互数据中挖掘隐含的实体偏好以完成知识图谱补全

专知会员服务

48+阅读 · 2020年4月1日

【重庆大学】基于生成式对抗网络的推荐系统:一个问题驱动的视角

【重庆大学】基于生成式对抗网络的推荐系统:一个问题驱动的视角

专知会员服务

18+阅读 · 2020年3月15日

基于生成对抗网络的模仿学习综述, 苏州大学，计算机学报

专知会员服务

47+阅读 · 2020年2月1日

【AAAI2020】知识图谱的生成式对抗零样本关系学习，Generative Adversarial Zero-Shot Relational Learning for Knowledge Graphs

【AAAI2020】知识图谱的生成式对抗零样本关系学习，Generative Adversarial Zero-Shot Relational Learning for Knowledge Graphs

专知会员服务

64+阅读 · 2020年1月11日

【AAAI2020论文】分类感知的生成式对抗网络，具有分类文本生成的层次进化学习 (附pdf)

专知会员服务

21+阅读 · 2019年11月19日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】扩展可扩展会话推荐的边界

别想太多：高效 R1 风格大型推理模型综述

【ACMMM2025】EvoVLMA: 进化式视觉-语言模型自适应

智能体网络：用AI智能体编织下一代网络

相关资讯

Github 项目推荐 | PyTorch 实现的 GAN 文本生成框架

Github 项目推荐 | PyTorch 实现的 GAN 文本生成框架

AI研习社

35+阅读 · 2019年6月10日

ICML 2019 | 强化学习用于推荐系统，蚂蚁金服提出生成对抗用户模型

ICML 2019 | 强化学习用于推荐系统，蚂蚁金服提出生成对抗用户模型

机器之心

8+阅读 · 2019年6月4日

TPAMI | 从虚拟到现实，一种基于强化学习的端到端主动目标跟踪方法

TPAMI | 从虚拟到现实，一种基于强化学习的端到端主动目标跟踪方法

AI科技评论

6+阅读 · 2019年4月25日

强化学习与文本生成

强化学习与文本生成

微信AI

41+阅读 · 2019年4月4日

CMU论文解读：基于GAN和VAE的跨模态图像生成

CMU论文解读：基于GAN和VAE的跨模态图像生成

PaperWeekly

9+阅读 · 2018年8月20日

【学界】生成式对抗网络：从生成数据到创造智能

【学界】生成式对抗网络：从生成数据到创造智能

GAN生成式对抗网络

6+阅读 · 2018年6月14日

ICASSP最佳学生论文：深度对抗声学模型训练框架

ICASSP最佳学生论文：深度对抗声学模型训练框架

专知

14+阅读 · 2018年4月28日

一文概览用于数据集增强的对抗生成网络架构

一文概览用于数据集增强的对抗生成网络架构

论智

357+阅读 · 2018年3月16日

探幽深度生成模型的两种方法：VAE和GAN

探幽深度生成模型的两种方法：VAE和GAN

AI前线

15+阅读 · 2018年3月10日

GAN | GAN介绍（1）

GAN | GAN介绍（1）

KingsGarden

79+阅读 · 2017年3月13日

相关论文

Representation Learning with Contrastive Predictive Coding

Arxiv

6+阅读 · 2019年1月22日

GAN-QP: A Novel GAN Framework without Gradient Vanishing and Lipschitz Constraint

GAN-QP: A Novel GAN Framework without Gradient Vanishing and Lipschitz Constraint

Arxiv

5+阅读 · 2018年12月15日

Multi-turn Dialogue Response Generation in an Adversarial Learning Framework

Arxiv

4+阅读 · 2018年6月11日

GANE: A Generative Adversarial Network Embedding

Arxiv

5+阅读 · 2018年5月21日

Feasibility Based Large Margin Nearest Neighbor Metric Learning

Arxiv

3+阅读 · 2018年5月2日

Controllable Generative Adversarial Network

Arxiv

5+阅读 · 2018年5月1日

Event Extraction with Generative Adversarial Imitation Learning

Arxiv

13+阅读 · 2018年4月21日

TVAE: Triplet-Based Variational Autoencoder using Metric Learning

Arxiv

3+阅读 · 2018年4月3日

KBGAN: Adversarial Learning for Knowledge Graph Embeddings

Arxiv

6+阅读 · 2018年2月20日

SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient

Arxiv

5+阅读 · 2017年8月25日

微信扫码咨询专知VIP会员