【强化学习研讨会|Microsoft Research】为构建智能体奠定自然语言基础（Grounding Natural Language for Building Embodied Agents） - 专知VIP

会员服务 ·

0

智能体 · 模仿学习 · 预训练语言模型 · 多模态 · 强化学习 ·

2019 年 10 月 3 日

【强化学习研讨会|Microsoft Research】为构建智能体奠定自然语言基础（Grounding Natural Language for Building Embodied Agents）

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

主题: Grounding Natural Language for Building Embodied Agents

简介：

在过去的两年中，语言和视觉交叉领域出现了一些新的任务。其中最受欢迎的是2018年引入的视觉语言导航(VLN)任务。该任务将一个智能体随机放置在家中，并根据自然语言命令指示它们导航到目标目的地。要在这个领域取得成功，需要构建多模态语言地基，允许智能体成功地导航，同时对视觉语言动态进行推理。在MSR中，我们通过结合使用搜索、模仿学习和预训练的方法，显著地推动了这一领域的最新技术。关于VLN之类任务的基本假设是，我们将构建执行命令的智能体。我们训练这些智能体的方法是通过提供观察-操作元组的示例，将其转换为单向语言。我们训练我们的智能体执行我们的命令，但没有必要教智能体如何应对环境中的不确定性。在这个演讲,我将提出我们的最近在强化学习,模仿学习和VLN任务上的预训练方法方面的工作,并将我们的新思路转化为一个更一般的问题，以理解系统如何请求和接受帮助，从而探索视觉语言导航研究领域的技术转移和推广。

作者简介：

Asli Celikyilmaz是微软研究院首席研究员，主要研究兴趣在深度学习和自然语言处理领域，对长文本生成、自动摘要、改进编解码器模型、会话对话建模有更广泛的兴趣。

成为VIP会员查看完整内容

3

相关内容

智能体

智能体，顾名思义，就是具有智能的实体，英文名是Agent。

ACL2020 开始了！看这份Tutorial《开放域问答》，普林斯顿陈丹琦

ACL2020 开始了！看这份Tutorial《开放域问答》，普林斯顿陈丹琦

专知会员服务

59+阅读 · 2020年7月5日

【DeepMind硬核课】深度学习计算机视觉前沿进展，附124页ppt

【DeepMind硬核课】深度学习计算机视觉前沿进展，附124页ppt

专知会员服务

168+阅读 · 2020年6月30日

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

专知会员服务

121+阅读 · 2020年5月18日

【微软-ACL2020】TinyMBERT: Multi-Stage Distillation Framework for Massive Multi-lingual NER

【微软-ACL2020】TinyMBERT: Multi-Stage Distillation Framework for Massive Multi-lingual NER

专知会员服务

36+阅读 · 2020年4月14日

【ICML2020投稿论文-CMU-DeepMind-Google】用于评估跨语言泛化的大规模多语言多任务基准

【ICML2020投稿论文-CMU-DeepMind-Google】用于评估跨语言泛化的大规模多语言多任务基准

专知会员服务

14+阅读 · 2020年3月27日

【DeepMind-牛津-CMU-CVPR2020】无监督词映射视觉基准，Visual Grounding in Video

【DeepMind-牛津-CMU-CVPR2020】无监督词映射视觉基准，Visual Grounding in Video

专知会员服务

12+阅读 · 2020年3月13日

【DeepMind-牛津-CMU-CVPR2020】无监督文字翻译视频中的视觉基础，Visual Grounding in Video for Unsupervised Word Translation

【DeepMind-牛津-CMU-CVPR2020】无监督文字翻译视频中的视觉基础，Visual Grounding in Video for Unsupervised Word Translation

专知会员服务

13+阅读 · 2020年3月12日

【华盛顿大学】用于视觉和语言导航的多视图学习，Multi-View Learning for Vision-and-Language Navigation

【华盛顿大学】用于视觉和语言导航的多视图学习，Multi-View Learning for Vision-and-Language Navigation

专知会员服务

31+阅读 · 2020年3月11日

【微软亚洲研究院】CodeBERT:用于编程和自然语言的预训练模型，CodeBERT: A Pre-Trained Model for Programming and Natural Languages

【微软亚洲研究院】CodeBERT:用于编程和自然语言的预训练模型，CodeBERT: A Pre-Trained Model for Programming and Natural Languages

专知会员服务

32+阅读 · 2020年2月21日

【强化学习研讨会|Microsoft Research】多智能体强化学习 Scalable and Robust Multi-Agent Reinforcement Learning，46页pdf，美国东北大学|Christopher Amato

【强化学习研讨会|Microsoft Research】多智能体强化学习 Scalable and Robust Multi-Agent Reinforcement Learning，46页pdf，美国东北大学|Christopher Amato

专知会员服务

26+阅读 · 2019年10月3日

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

专知

25+阅读 · 2019年11月23日

PlaNet 简介：用于强化学习的深度规划网络

PlaNet 简介：用于强化学习的深度规划网络

谷歌开发者

13+阅读 · 2019年3月16日

实录分享 | 计算未来轻沙龙：对话系统研究进展（视频 + PPT）

实录分享 | 计算未来轻沙龙：对话系统研究进展（视频 + PPT）

PaperWeekly

15+阅读 · 2018年9月3日

微软研究院开源项目TextWorld：可用于强化学习训练的文本游戏

微软研究院开源项目TextWorld：可用于强化学习训练的文本游戏

专知

5+阅读 · 2018年8月11日

微信高级研究员解析深度学习在NLP中的发展和应用 | 公开课笔记

微信高级研究员解析深度学习在NLP中的发展和应用 | 公开课笔记

人工智能头条

10+阅读 · 2018年7月22日

NLP领域的ImageNet时代到来：词嵌入「已死」，语言模型当立

NLP领域的ImageNet时代到来：词嵌入「已死」，语言模型当立

机器之心

4+阅读 · 2018年7月9日

不用地图如何导航？DeepMind提出新型双路径强化学习「智能体」架构

不用地图如何导航？DeepMind提出新型双路径强化学习「智能体」架构

极市平台

3+阅读 · 2018年4月11日

用于神经机器翻译的全并行文本生成

用于神经机器翻译的全并行文本生成

全球人工智能

7+阅读 · 2017年11月13日

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

产业智能官

41+阅读 · 2017年8月11日

CAA | 【智能自动化学科前沿讲习班第1期】微软秦涛主管研究员：从单智能体学习到多智能体学习

CAA | 【智能自动化学科前沿讲习班第1期】微软秦涛主管研究员：从单智能体学习到多智能体学习

中国自动化学会

3+阅读 · 2017年8月11日

Imitation Learning for Fashion Style Based on Hierarchical Multimodal Representation

Imitation Learning for Fashion Style Based on Hierarchical Multimodal Representation

Arxiv

8+阅读 · 2020年4月13日

Visual Grounding in Video for Unsupervised Word Translation

Visual Grounding in Video for Unsupervised Word Translation

Arxiv

7+阅读 · 2020年3月11日

XLNet: Generalized Autoregressive Pretraining for Language Understanding

Arxiv

14+阅读 · 2019年6月19日

Learning from Dialogue after Deployment: Feed Yourself, Chatbot!

Learning from Dialogue after Deployment: Feed Yourself, Chatbot!

Arxiv

6+阅读 · 2019年1月16日

Dialogue Natural Language Inference

Arxiv

7+阅读 · 2018年11月1日

Paraphrase Generation with Deep Reinforcement Learning

Paraphrase Generation with Deep Reinforcement Learning

Arxiv

4+阅读 · 2018年8月23日

Relational Deep Reinforcement Learning

Relational Deep Reinforcement Learning

Arxiv

10+阅读 · 2018年6月28日

Neural Models for Key Phrase Detection and Question Generation

Arxiv

4+阅读 · 2018年5月30日

Analyzing Language Learned by an Active Question Answering Agent

Arxiv

6+阅读 · 2018年1月23日

Distance-based Self-Attention Network for Natural Language Inference

Arxiv

10+阅读 · 2017年12月6日

VIP会员

相关主题

预训练语言模型

相关VIP内容

ACL2020 开始了！看这份Tutorial《开放域问答》，普林斯顿陈丹琦

ACL2020 开始了！看这份Tutorial《开放域问答》，普林斯顿陈丹琦

专知会员服务

59+阅读 · 2020年7月5日

【DeepMind硬核课】深度学习计算机视觉前沿进展，附124页ppt

【DeepMind硬核课】深度学习计算机视觉前沿进展，附124页ppt

专知会员服务

168+阅读 · 2020年6月30日

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

专知会员服务

121+阅读 · 2020年5月18日

【微软-ACL2020】TinyMBERT: Multi-Stage Distillation Framework for Massive Multi-lingual NER

【微软-ACL2020】TinyMBERT: Multi-Stage Distillation Framework for Massive Multi-lingual NER

专知会员服务

36+阅读 · 2020年4月14日

【ICML2020投稿论文-CMU-DeepMind-Google】用于评估跨语言泛化的大规模多语言多任务基准

【ICML2020投稿论文-CMU-DeepMind-Google】用于评估跨语言泛化的大规模多语言多任务基准

专知会员服务

14+阅读 · 2020年3月27日

【DeepMind-牛津-CMU-CVPR2020】无监督词映射视觉基准，Visual Grounding in Video

【DeepMind-牛津-CMU-CVPR2020】无监督词映射视觉基准，Visual Grounding in Video

专知会员服务

12+阅读 · 2020年3月13日

【DeepMind-牛津-CMU-CVPR2020】无监督文字翻译视频中的视觉基础，Visual Grounding in Video for Unsupervised Word Translation

【DeepMind-牛津-CMU-CVPR2020】无监督文字翻译视频中的视觉基础，Visual Grounding in Video for Unsupervised Word Translation

专知会员服务

13+阅读 · 2020年3月12日

【华盛顿大学】用于视觉和语言导航的多视图学习，Multi-View Learning for Vision-and-Language Navigation

【华盛顿大学】用于视觉和语言导航的多视图学习，Multi-View Learning for Vision-and-Language Navigation

专知会员服务

31+阅读 · 2020年3月11日

【微软亚洲研究院】CodeBERT:用于编程和自然语言的预训练模型，CodeBERT: A Pre-Trained Model for Programming and Natural Languages

【微软亚洲研究院】CodeBERT:用于编程和自然语言的预训练模型，CodeBERT: A Pre-Trained Model for Programming and Natural Languages

专知会员服务

32+阅读 · 2020年2月21日

【强化学习研讨会|Microsoft Research】多智能体强化学习 Scalable and Robust Multi-Agent Reinforcement Learning，46页pdf，美国东北大学|Christopher Amato

【强化学习研讨会|Microsoft Research】多智能体强化学习 Scalable and Robust Multi-Agent Reinforcement Learning，46页pdf，美国东北大学|Christopher Amato

专知会员服务

26+阅读 · 2019年10月3日

热门VIP内容

开通专知VIP会员享更多权益服务

《复杂工程系统模型驱动设计决策支持系统：早期设计阶段挑战》最新138页

《日本陆上自卫队2040年作战方式与未来作战研究》最新23页slides

人工智能作为战争武器

《后勤保障》最新23页

相关资讯

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

专知

25+阅读 · 2019年11月23日

PlaNet 简介：用于强化学习的深度规划网络

PlaNet 简介：用于强化学习的深度规划网络

谷歌开发者

13+阅读 · 2019年3月16日

实录分享 | 计算未来轻沙龙：对话系统研究进展（视频 + PPT）

实录分享 | 计算未来轻沙龙：对话系统研究进展（视频 + PPT）

PaperWeekly

15+阅读 · 2018年9月3日

微软研究院开源项目TextWorld：可用于强化学习训练的文本游戏

微软研究院开源项目TextWorld：可用于强化学习训练的文本游戏

专知

5+阅读 · 2018年8月11日

微信高级研究员解析深度学习在NLP中的发展和应用 | 公开课笔记

微信高级研究员解析深度学习在NLP中的发展和应用 | 公开课笔记

人工智能头条

10+阅读 · 2018年7月22日

NLP领域的ImageNet时代到来：词嵌入「已死」，语言模型当立

NLP领域的ImageNet时代到来：词嵌入「已死」，语言模型当立

机器之心

4+阅读 · 2018年7月9日

不用地图如何导航？DeepMind提出新型双路径强化学习「智能体」架构

不用地图如何导航？DeepMind提出新型双路径强化学习「智能体」架构

极市平台

3+阅读 · 2018年4月11日

用于神经机器翻译的全并行文本生成

用于神经机器翻译的全并行文本生成

全球人工智能

7+阅读 · 2017年11月13日

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

产业智能官

41+阅读 · 2017年8月11日

CAA | 【智能自动化学科前沿讲习班第1期】微软秦涛主管研究员：从单智能体学习到多智能体学习

CAA | 【智能自动化学科前沿讲习班第1期】微软秦涛主管研究员：从单智能体学习到多智能体学习

中国自动化学会

3+阅读 · 2017年8月11日

相关论文

Imitation Learning for Fashion Style Based on Hierarchical Multimodal Representation

Imitation Learning for Fashion Style Based on Hierarchical Multimodal Representation

Arxiv

8+阅读 · 2020年4月13日

Visual Grounding in Video for Unsupervised Word Translation

Visual Grounding in Video for Unsupervised Word Translation

Arxiv

7+阅读 · 2020年3月11日

XLNet: Generalized Autoregressive Pretraining for Language Understanding

Arxiv

14+阅读 · 2019年6月19日

Learning from Dialogue after Deployment: Feed Yourself, Chatbot!

Learning from Dialogue after Deployment: Feed Yourself, Chatbot!

Arxiv

6+阅读 · 2019年1月16日

Dialogue Natural Language Inference

Arxiv

7+阅读 · 2018年11月1日

Paraphrase Generation with Deep Reinforcement Learning

Paraphrase Generation with Deep Reinforcement Learning

Arxiv

4+阅读 · 2018年8月23日

Relational Deep Reinforcement Learning

Relational Deep Reinforcement Learning

Arxiv

10+阅读 · 2018年6月28日

Neural Models for Key Phrase Detection and Question Generation

Arxiv

4+阅读 · 2018年5月30日

Analyzing Language Learned by an Active Question Answering Agent

Arxiv

6+阅读 · 2018年1月23日

Distance-based Self-Attention Network for Natural Language Inference

Arxiv

10+阅读 · 2017年12月6日

微信扫码咨询专知VIP会员