人工智能研究的长期目标是构建能够看到我们周围丰富视觉环境的智能体,用自然语言将这种理解传达给人类和其他智能体,并在物理或具身环境中行动。为此,计算机视觉和自然语言处理的最新进展取得了巨大的进展——从生成图像/视频的自然语言描述,到回答有关图像/视频的问题,再到就视觉内容进行自由形式的对话。

最近,在计算机视觉、自然语言处理和机器人领域,具身人工智能(即训练具身代理在自我中心感知中执行各种任务)吸引了大量的兴趣。视觉语言导航(VLN)是由Anderson和Wu等人提出的嵌入式人工智能的一个基本主题。

在本教程中,我们将不仅涵盖视觉和语言研究前沿的最新方法和原则,还将对VLN领域进行全面概述。

成为VIP会员查看完整内容
43

相关内容

专知会员服务
74+阅读 · 2021年7月21日
【CVPR2021】基于端到端预训练的视觉-语言表征学习
专知会员服务
37+阅读 · 2021年4月9日
【CVPR2021】细粒度多标签分类
专知会员服务
60+阅读 · 2021年3月8日
【CVPR2021】基于反事实推断的视觉问答框架
专知会员服务
26+阅读 · 2021年3月4日
【AAAI2021】预训练语言模型最新进展,附113页ppt和视频
专知会员服务
64+阅读 · 2021年2月23日
最新《域自适应视觉应用》ECCV2020教程,67页PPT
专知会员服务
26+阅读 · 2020年12月24日
最新《域自适应视觉应用》ECCV2020教程,43页PPT
专知会员服务
25+阅读 · 2020年11月5日
知识驱动的视觉知识学习,以VQA视觉问答为例,31页ppt
专知会员服务
35+阅读 · 2020年9月25日
【CVPR2021】细粒度多标签分类
专知
44+阅读 · 2021年3月8日
ICML2020 图神经网络的预训练
图与推荐
12+阅读 · 2020年4月4日
ICML2019《元学习》教程与必读论文列表
专知
42+阅读 · 2019年6月16日
VALSE2017系列之七:视觉与语言领域年度进展概述
深度学习大讲堂
9+阅读 · 2017年7月11日
深度学习在计算机视觉领域的前沿进展
我爱机器学习
11+阅读 · 2017年1月7日
Arxiv
19+阅读 · 2021年4月8日
Arxiv
8+阅读 · 2020年10月7日
Viewpoint Estimation-Insights & Model
Arxiv
3+阅读 · 2018年7月3日
VIP会员
相关VIP内容
专知会员服务
74+阅读 · 2021年7月21日
【CVPR2021】基于端到端预训练的视觉-语言表征学习
专知会员服务
37+阅读 · 2021年4月9日
【CVPR2021】细粒度多标签分类
专知会员服务
60+阅读 · 2021年3月8日
【CVPR2021】基于反事实推断的视觉问答框架
专知会员服务
26+阅读 · 2021年3月4日
【AAAI2021】预训练语言模型最新进展,附113页ppt和视频
专知会员服务
64+阅读 · 2021年2月23日
最新《域自适应视觉应用》ECCV2020教程,67页PPT
专知会员服务
26+阅读 · 2020年12月24日
最新《域自适应视觉应用》ECCV2020教程,43页PPT
专知会员服务
25+阅读 · 2020年11月5日
知识驱动的视觉知识学习,以VQA视觉问答为例,31页ppt
专知会员服务
35+阅读 · 2020年9月25日
相关资讯
【CVPR2021】细粒度多标签分类
专知
44+阅读 · 2021年3月8日
ICML2020 图神经网络的预训练
图与推荐
12+阅读 · 2020年4月4日
ICML2019《元学习》教程与必读论文列表
专知
42+阅读 · 2019年6月16日
VALSE2017系列之七:视觉与语言领域年度进展概述
深度学习大讲堂
9+阅读 · 2017年7月11日
深度学习在计算机视觉领域的前沿进展
我爱机器学习
11+阅读 · 2017年1月7日
微信扫码咨询专知VIP会员