【ACL2020-密歇根州立大学】语言和视觉推理的跨模态关联 - 专知

会员服务 ·

0

【ACL2020-密歇根州立大学】语言和视觉推理的跨模态关联

2020 年 5 月 14 日 专知

https://arxiv.org/pdf/2005.06035.pdf

本文处理学习和推理语言和视觉数据的相关下游任务的挑战，如视觉问题回答(VQA)和自然语言的视觉推理(NLVR)。我们设计了一个新颖的跨模态关联模块，用端到端框架在目标任务的监督下学习各种输入模态组件之间的关联表示，这比仅仅重塑原始表示空间更易于推广到未观测的数据。除了对文本实体和视觉实体之间的相关性进行建模外，我们还对文本中的实体关系和图像中的对象关系之间的高阶相关性进行建模。我们提出的方法使用公共基准，在两个不同的语言和视觉任务上显示出具有竞争力的性能，并改进了最新发布的结果。NLVR任务学习的输入空间对齐及其相关表示提高了VQA任务的训练效率。

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“CMR” 可以获取《语言和视觉推理的交叉模态关联》专知下载链接索引

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

3

相关内容

跨模态关联

跨模态关联

【ACL2020】多模态信息抽取，365页ppt

【ACL2020】多模态信息抽取，365页ppt

专知会员服务

150+阅读 · 2020年7月6日

【清华大学】低资源语言:回顾综述和未来的挑战，14页pdf

【清华大学】低资源语言:回顾综述和未来的挑战，14页pdf

专知会员服务

37+阅读 · 2020年6月16日

【CVPR2020-Tutorial】视觉的图网络结构表示学习，Google Chen Sun

【CVPR2020-Tutorial】视觉的图网络结构表示学习，Google Chen Sun

专知会员服务

43+阅读 · 2020年6月16日

KG-BERT：基于BERT的知识图谱补全，KG-BERT: BERT for Knowledge Graph Completion

KG-BERT：基于BERT的知识图谱补全，KG-BERT: BERT for Knowledge Graph Completion

专知会员服务

195+阅读 · 2020年5月31日

近期必读的5篇顶会WWW 2020【知识图谱+图神经网络（KG+GNN）】相关论文

近期必读的5篇顶会WWW 2020【知识图谱+图神经网络（KG+GNN）】相关论文

专知会员服务

151+阅读 · 2020年4月21日

【ACL2020】贝叶斯层次词表示学习，Boosting algorithms in energy research: A systematic review

【ACL2020】贝叶斯层次词表示学习，Boosting algorithms in energy research: A systematic review

专知会员服务

13+阅读 · 2020年4月16日

【微软-ACL2020】TinyMBERT: Multi-Stage Distillation Framework for Massive Multi-lingual NER

【微软-ACL2020】TinyMBERT: Multi-Stage Distillation Framework for Massive Multi-lingual NER

专知会员服务

36+阅读 · 2020年4月14日

普林斯顿大学陈丹琦主讲2020课程《深度学习自然语言处理》课程，21讲带你学习NLP最新技术

普林斯顿大学陈丹琦主讲2020课程《深度学习自然语言处理》课程，21讲带你学习NLP最新技术

专知会员服务

154+阅读 · 2020年3月29日

AAAI2020最新「图神经网络GNN模型与应用」305页ppt，密歇根州立大学

AAAI2020最新「图神经网络GNN模型与应用」305页ppt，密歇根州立大学

专知会员服务

345+阅读 · 2020年2月7日

【AAAI2020接受论文】隐式关系语言模型，CMU&微软，Latent Relation Language Models

【AAAI2020接受论文】隐式关系语言模型，CMU&微软，Latent Relation Language Models

专知会员服务

54+阅读 · 2019年11月12日

【慕尼黑工业大学-Matthias Niessner】人工智能驱动的视频合成及其意义，104页ppt

【慕尼黑工业大学-Matthias Niessner】人工智能驱动的视频合成及其意义，104页ppt

专知

6+阅读 · 2020年3月15日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

CCKS 2019 知识图谱评测技术报告：实体、关系、事件及问答

CCKS 2019 知识图谱评测技术报告：实体、关系、事件及问答

专知

24+阅读 · 2020年3月11日

Capsule Networks，胶囊网络，57页ppt，布法罗大学

Capsule Networks，胶囊网络，57页ppt，布法罗大学

专知

12+阅读 · 2020年2月29日

【WWW2020论文-香港中文大学】MAGNN:异构图嵌入的集合图神经网络

【WWW2020论文-香港中文大学】MAGNN:异构图嵌入的集合图神经网络

专知

33+阅读 · 2020年2月13日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

12+阅读 · 2020年2月12日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

66+阅读 · 2020年2月11日

AAAI2020接受论文揭晓，1591篇上榜，接收率20.6%！最新论文抢鲜看

AAAI2020接受论文揭晓，1591篇上榜，接收率20.6%！最新论文抢鲜看

专知

42+阅读 · 2019年11月11日

【NAACL2019】182页PPT带你回顾自然语言推断的前世今生

【NAACL2019】182页PPT带你回顾自然语言推断的前世今生

专知

36+阅读 · 2019年6月4日

视觉推理任务中的ImageNet：斯坦福GQA数据集重磅发布

视觉推理任务中的ImageNet：斯坦福GQA数据集重磅发布

专知

23+阅读 · 2019年1月30日

Differentiable Reasoning on Large Knowledge Bases and Natural Language

Arxiv

12+阅读 · 2019年12月17日

Span-based Joint Entity and Relation Extraction with Transformer Pre-training

Arxiv

7+阅读 · 2019年9月17日

Fine-tune BERT for Extractive Summarization

Arxiv

3+阅读 · 2019年9月5日

QA4IE: A Question Answering based Framework for Information Extraction

Arxiv

4+阅读 · 2019年1月28日

Read + Verify: Machine Reading Comprehension with Unanswerable Questions

Arxiv

3+阅读 · 2018年11月15日

Commonsense for Generative Multi-Hop Question Answering Tasks

Arxiv

4+阅读 · 2018年9月17日

Interpretable and Compositional Relation Learning by Joint Training with an Autoencoder

Arxiv

4+阅读 · 2018年5月24日

Did the Model Understand the Question?

Arxiv

4+阅读 · 2018年5月14日

An Attention-Based Word-Level Interaction Model: Relation Detection for Knowledge Base Question Answering

Arxiv

6+阅读 · 2018年1月30日

Tell-and-Answer: Towards Explainable Visual Question Answering using Attributes and Captions

Arxiv

9+阅读 · 2018年1月27日

VIP会员

相关主题

跨模态关联

相关VIP内容

【ACL2020】多模态信息抽取，365页ppt

【ACL2020】多模态信息抽取，365页ppt

专知会员服务

150+阅读 · 2020年7月6日

【清华大学】低资源语言:回顾综述和未来的挑战，14页pdf

【清华大学】低资源语言:回顾综述和未来的挑战，14页pdf

专知会员服务

37+阅读 · 2020年6月16日

【CVPR2020-Tutorial】视觉的图网络结构表示学习，Google Chen Sun

【CVPR2020-Tutorial】视觉的图网络结构表示学习，Google Chen Sun

专知会员服务

43+阅读 · 2020年6月16日

KG-BERT：基于BERT的知识图谱补全，KG-BERT: BERT for Knowledge Graph Completion

KG-BERT：基于BERT的知识图谱补全，KG-BERT: BERT for Knowledge Graph Completion

专知会员服务

195+阅读 · 2020年5月31日

近期必读的5篇顶会WWW 2020【知识图谱+图神经网络（KG+GNN）】相关论文

近期必读的5篇顶会WWW 2020【知识图谱+图神经网络（KG+GNN）】相关论文

专知会员服务

151+阅读 · 2020年4月21日

【ACL2020】贝叶斯层次词表示学习，Boosting algorithms in energy research: A systematic review

【ACL2020】贝叶斯层次词表示学习，Boosting algorithms in energy research: A systematic review

专知会员服务

13+阅读 · 2020年4月16日

【微软-ACL2020】TinyMBERT: Multi-Stage Distillation Framework for Massive Multi-lingual NER

【微软-ACL2020】TinyMBERT: Multi-Stage Distillation Framework for Massive Multi-lingual NER

专知会员服务

36+阅读 · 2020年4月14日

普林斯顿大学陈丹琦主讲2020课程《深度学习自然语言处理》课程，21讲带你学习NLP最新技术

普林斯顿大学陈丹琦主讲2020课程《深度学习自然语言处理》课程，21讲带你学习NLP最新技术

专知会员服务

154+阅读 · 2020年3月29日

AAAI2020最新「图神经网络GNN模型与应用」305页ppt，密歇根州立大学

AAAI2020最新「图神经网络GNN模型与应用」305页ppt，密歇根州立大学

专知会员服务

345+阅读 · 2020年2月7日

【AAAI2020接受论文】隐式关系语言模型，CMU&微软，Latent Relation Language Models

【AAAI2020接受论文】隐式关系语言模型，CMU&微软，Latent Relation Language Models

专知会员服务

54+阅读 · 2019年11月12日

热门VIP内容

开通专知VIP会员享更多权益服务

《美国太空军系统全生命周期建模、仿真与分析效能提升方案》最新84页报告

《商用大语言模型的升级风险管理：国家安全运用》

自主人工智能：未来战争是否将是自主化的？

《从装备到文化：美陆军技术素养建设启示录》最新报告

相关资讯

【慕尼黑工业大学-Matthias Niessner】人工智能驱动的视频合成及其意义，104页ppt

【慕尼黑工业大学-Matthias Niessner】人工智能驱动的视频合成及其意义，104页ppt

专知

6+阅读 · 2020年3月15日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

CCKS 2019 知识图谱评测技术报告：实体、关系、事件及问答

CCKS 2019 知识图谱评测技术报告：实体、关系、事件及问答

专知

24+阅读 · 2020年3月11日

Capsule Networks，胶囊网络，57页ppt，布法罗大学

Capsule Networks，胶囊网络，57页ppt，布法罗大学

专知

12+阅读 · 2020年2月29日

【WWW2020论文-香港中文大学】MAGNN:异构图嵌入的集合图神经网络

【WWW2020论文-香港中文大学】MAGNN:异构图嵌入的集合图神经网络

专知

33+阅读 · 2020年2月13日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

12+阅读 · 2020年2月12日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

66+阅读 · 2020年2月11日

AAAI2020接受论文揭晓，1591篇上榜，接收率20.6%！最新论文抢鲜看

AAAI2020接受论文揭晓，1591篇上榜，接收率20.6%！最新论文抢鲜看

专知

42+阅读 · 2019年11月11日

【NAACL2019】182页PPT带你回顾自然语言推断的前世今生

【NAACL2019】182页PPT带你回顾自然语言推断的前世今生

专知

36+阅读 · 2019年6月4日

视觉推理任务中的ImageNet：斯坦福GQA数据集重磅发布

视觉推理任务中的ImageNet：斯坦福GQA数据集重磅发布

专知

23+阅读 · 2019年1月30日

相关论文

Differentiable Reasoning on Large Knowledge Bases and Natural Language

Arxiv

12+阅读 · 2019年12月17日

Span-based Joint Entity and Relation Extraction with Transformer Pre-training

Arxiv

7+阅读 · 2019年9月17日

Fine-tune BERT for Extractive Summarization

Arxiv

3+阅读 · 2019年9月5日

QA4IE: A Question Answering based Framework for Information Extraction

Arxiv

4+阅读 · 2019年1月28日

Read + Verify: Machine Reading Comprehension with Unanswerable Questions

Arxiv

3+阅读 · 2018年11月15日

Commonsense for Generative Multi-Hop Question Answering Tasks

Arxiv

4+阅读 · 2018年9月17日

Interpretable and Compositional Relation Learning by Joint Training with an Autoencoder

Arxiv

4+阅读 · 2018年5月24日

Did the Model Understand the Question?

Arxiv

4+阅读 · 2018年5月14日

An Attention-Based Word-Level Interaction Model: Relation Detection for Knowledge Base Question Answering

Arxiv

6+阅读 · 2018年1月30日

Tell-and-Answer: Towards Explainable Visual Question Answering using Attributes and Captions

Arxiv

9+阅读 · 2018年1月27日

大家都在搜

大型语言模型

CMU博士论文

国防科技创新

久别重逢话双塔

无人机航拍交通事故现场勘查处置系统——行业第一的警用事故处理软件

微信扫码咨询专知VIP会员