多模态视觉语言表征学习研究综述 - 专知

会员服务 ·

0

多模态视觉语言表征学习研究综述

2020 年 12 月 3 日 专知

我们生活在一个由大量不同模态内容构建而成的多媒体世界中，不同模态信息之间具有高度的相关性和互补性，多模态表征学习的主要目的就是挖掘出不同模态之间的共性和特性，产生出可以表示多模态信息的隐含向量.该文章主要介绍了目前应用较广的视觉语言表征的相应研究工作，包括传统的基于相似性模型的研究方法和目前主流的基于语言模型的预训练的方法.目前比较好的思路和解决方案是将视觉特征语义化然后与文本特征通过一个强大的特征抽取器产生出表征，其中Transformer[1]作为主要的特征抽取器被应用表征学习的各类任务中.文章分别从研究背景、不同研究方法的划分、测评方法、未来发展趋势等几个不同角度进行阐述.

http://www.jos.org.cn/jos/ch/reader/view_abstract.aspx?file_no=6125&flag=1

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“多模态视觉语言” 就可以获取《多模态视觉语言表征学习研究综述》专知下载链接

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

27

相关内容

多模态视觉语言表征学习

多模态视觉语言表征学习

虚假评论识别研究综述

专知会员服务

52+阅读 · 2021年1月19日

深度强化学习算法与应用研究现状综述

专知会员服务

138+阅读 · 2021年1月13日

三维人脸识别研究进展综述，12页pdf

专知会员服务

29+阅读 · 2020年12月16日

自然语言处理预训练模型的研究综述

专知会员服务

123+阅读 · 2020年12月9日

面向图的异常检测研究综述

专知会员服务

109+阅读 · 2020年10月27日

领域知识图谱研究综述

领域知识图谱研究综述

专知

17+阅读 · 2020年8月2日

深度学习模型可解释性的研究进展

深度学习模型可解释性的研究进展

专知

26+阅读 · 2020年8月1日

【中科院】命名实体识别技术综述

【中科院】命名实体识别技术综述

专知

16+阅读 · 2020年4月21日

多模态深度学习综述，18页pdf

多模态深度学习综述，18页pdf

专知

50+阅读 · 2020年3月29日

【综述】生成式对抗网络GAN最新进展综述

【综述】生成式对抗网络GAN最新进展综述

专知

61+阅读 · 2019年6月5日

A Survey on Visual Transformer

Arxiv

0+阅读 · 2021年1月30日

GAN Inversion: A Survey

Arxiv

19+阅读 · 2021年1月14日

A Survey on Contextual Embeddings

Arxiv

29+阅读 · 2020年3月16日

Deep Learning in Video Multi-Object Tracking: A Survey

Deep Learning in Video Multi-Object Tracking: A Survey

Arxiv

58+阅读 · 2019年7月31日

Span Based Open Information Extraction

Arxiv

3+阅读 · 2019年3月1日

VIP会员

相关主题

多模态视觉语言表征学习

多模态信息

相关VIP内容

虚假评论识别研究综述

专知会员服务

52+阅读 · 2021年1月19日

深度强化学习算法与应用研究现状综述

专知会员服务

138+阅读 · 2021年1月13日

三维人脸识别研究进展综述，12页pdf

专知会员服务

29+阅读 · 2020年12月16日

自然语言处理预训练模型的研究综述

专知会员服务

123+阅读 · 2020年12月9日

面向图的异常检测研究综述

专知会员服务

109+阅读 · 2020年10月27日

热门VIP内容

开通专知VIP会员享更多权益服务

前沿人工智能趋势报告（Frontier AI Trends Report）

【AAAI2026】善始则事半功倍：基于前缀优化的大语言模型推理强化学习

Andrej Karpathy：2025 年 LLM 年度回顾（2025 LLM Year in Review）

音退化问题：基于输入操控的鲁棒语音转换综述

相关资讯

领域知识图谱研究综述

领域知识图谱研究综述

专知

17+阅读 · 2020年8月2日

深度学习模型可解释性的研究进展

深度学习模型可解释性的研究进展

专知

26+阅读 · 2020年8月1日

【中科院】命名实体识别技术综述

【中科院】命名实体识别技术综述

专知

16+阅读 · 2020年4月21日

多模态深度学习综述，18页pdf

多模态深度学习综述，18页pdf

专知

50+阅读 · 2020年3月29日

【综述】生成式对抗网络GAN最新进展综述

【综述】生成式对抗网络GAN最新进展综述

专知

61+阅读 · 2019年6月5日

相关论文

A Survey on Visual Transformer

Arxiv

0+阅读 · 2021年1月30日

GAN Inversion: A Survey

Arxiv

19+阅读 · 2021年1月14日

A Survey on Contextual Embeddings

Arxiv

29+阅读 · 2020年3月16日

Deep Learning in Video Multi-Object Tracking: A Survey

Deep Learning in Video Multi-Object Tracking: A Survey

Arxiv

58+阅读 · 2019年7月31日

Span Based Open Information Extraction

Arxiv

3+阅读 · 2019年3月1日

大家都在搜

蓝牙安全攻防

大型语言模型

朱克爱德华兹家族

滴滴司机调度系统实践

微信扫码咨询专知VIP会员