视觉语言研究进展到哪了？CVPR2021视觉语言研究全面概述：预训练、视觉问答等，附视频与430页ppt

人工智能研究的长期目标是构建能够看到我们周围丰富视觉环境的智能体，用自然语言将这种理解传达给人类和其他智能体，并在物理或具身环境中行动。为此，计算机视觉和自然语言处理的最新进展取得了巨大的进展——从生成图像/视频的自然语言描述，到回答有关图像/视频的问题，再到就视觉内容进行自由形式的对话。

最近，在计算机视觉、自然语言处理和机器人领域，具身人工智能(即训练具身代理在自我中心感知中执行各种任务)吸引了大量的兴趣。视觉语言导航(VLN)是由Anderson和Wu等人提出的嵌入式人工智能的一个基本主题。

在本教程中，我们将不仅涵盖视觉和语言研究前沿的最新方法和原则，还将对VLN领域进行全面概述。

成为VIP会员查看完整内容

相关内容

视觉语言研究

关注 0

预训练如何用于机器翻译？字节跳动ACL2021这份190页ppt教程带你全面了解

专知会员服务

70+阅读 · 2021年8月2日

【ICML2021】深度架构持续学习，127页ppt

专知会员服务

76+阅读 · 2021年7月21日

【CVPR2021】基于端到端预训练的视觉-语言表征学习

专知会员服务

38+阅读 · 2021年4月9日

【CVPR2021】细粒度多标签分类

专知会员服务

61+阅读 · 2021年3月8日

【CVPR2021】基于反事实推断的视觉问答框架

专知会员服务

27+阅读 · 2021年3月4日

【AAAI2021】预训练语言模型最新进展，附113页ppt和视频

专知会员服务

65+阅读 · 2021年2月23日

最新《域自适应视觉应用》ECCV2020教程，67页PPT

专知会员服务

27+阅读 · 2020年12月24日

最新《域自适应视觉应用》ECCV2020教程，43页PPT

专知会员服务

27+阅读 · 2020年11月5日

知识驱动的视觉知识学习，以VQA视觉问答为例，31页ppt

专知会员服务

36+阅读 · 2020年9月25日

微软亚洲研究院新论文-《多模态预训练语言模型UniViLM》面向多模态理解和生成的统一视频和语言预训练模型

专知会员服务

109+阅读 · 2020年2月19日

【CVPR2021】细粒度多标签分类

专知

44+阅读 · 2021年3月8日

【CVPR2021】基于反事实推断的视觉问答框架

专知

38+阅读 · 2021年3月4日

【ICML2020-Tutorial】无标签表示学习，222页ppt，DeepMind

专知

30+阅读 · 2020年7月14日

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

专知

40+阅读 · 2020年6月20日

ICML2020 图神经网络的预训练

图与推荐

12+阅读 · 2020年4月4日

NLP+CV《桥接视觉与语言的研究综述》，带你全面了解视觉+语言最新应用和方法

中国人工智能学会

27+阅读 · 2019年7月24日

ICML2019《元学习》教程与必读论文列表

专知

42+阅读 · 2019年6月16日

【干货】基于属性学习和额外知识库的图像描述生成和视觉问答

专知

18+阅读 · 2017年12月25日

VALSE2017系列之七：视觉与语言领域年度进展概述

深度学习大讲堂

9+阅读 · 2017年7月11日

深度学习在计算机视觉领域的前沿进展

我爱机器学习

11+阅读 · 2017年1月7日

Causal Inference in Natural Language Processing: Estimation, Prediction, Interpretation and Beyond

Arxiv

21+阅读 · 2021年9月2日

SiT: Self-supervised vIsion Transformer

Arxiv

19+阅读 · 2021年4月8日

A Survey of Deep Meta-Learning

Arxiv

8+阅读 · 2020年10月7日

Unified Vision-Language Pre-Training for Image Captioning and VQA

Arxiv

8+阅读 · 2019年10月3日

End-to-End Open-Domain Question Answering with BERTserini

Arxiv

3+阅读 · 2019年9月18日

Advances in Natural Language Question Answering: A Review

Arxiv

5+阅读 · 2019年4月10日

Commonsense Reasoning for Natural Language Understanding: A Survey of Benchmarks, Resources, and Approaches

Arxiv

16+阅读 · 2019年4月2日

Viewpoint Estimation-Insights & Model

Arxiv

3+阅读 · 2018年7月3日

Supervised and Unsupervised Transfer Learning for Question Answering

Arxiv

4+阅读 · 2018年4月21日

A Unified approach for Conventional Zero-shot, Generalized Zero-shot and Few-shot Learning

Arxiv

4+阅读 · 2017年10月26日

VIP会员