【CVPR2021】一种基于知识蒸馏的弱监督图像文本匹配模型

会员服务 ·

【CVPR2021】一种基于知识蒸馏的弱监督图像文本匹配模型

2021 年 4 月 8 日 专知

一种基于知识蒸馏的弱监督图像文本匹配模型

Improving Weakly Supervised Visual Grounding by Contrastive Knowledge Distillation

本文由腾讯 AI Lab 主导完成。弱监督的图像文本匹配旨在学习仅使用图像句子的对应来得到细颗粒度的图像区域和短语的对应. 因此，主要的挑战在于训练期间图像区域和句子短语之间缺少匹配的数据。

为了应对这一挑战，我们在训练时利用了通用的物体检测器知识蒸馏，并提出了利用对比学习来得到图像和文本细颗粒度匹配的新方法。我们的方法在弱监督的视觉区域和短语匹配任务上超越了以前的方法。

https://www.zhuanzhi.ai/paper/d59e9b614122852f5a78b38a14d43921

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“CKD” 就可以获取《【CVPR2021】一种基于知识蒸馏的弱监督图像文本匹配模型》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

相关内容

文本匹配模型

关注 1

【CVPR2021】密集对比学习的自监督视觉预训练

专知会员服务

39+阅读 · 2021年5月16日

【CVPR2021】无监督时空表示学习的大规模研究

专知会员服务

23+阅读 · 2021年5月1日

【CVPR2021】基于Transformer的视频分割领域

专知会员服务

38+阅读 · 2021年4月16日

【CVPR2021】基于端到端预训练的视觉-语言表征学习

专知会员服务

38+阅读 · 2021年4月9日

【CVPR2021】基于相似性分布距离的无监督人脸图像质量评价

专知会员服务

32+阅读 · 2021年3月19日

【CVPR2021】空间一致性表示学习

专知会员服务

63+阅读 · 2021年3月12日

【CVPR2021】细粒度多标签分类

专知会员服务

61+阅读 · 2021年3月8日

【WWW2021】在语义文本匹配任务中利用先验知识引导BERT注意力

专知会员服务

42+阅读 · 2021年2月24日

【AAAI2021】基于双任务一致性的半监督医学图像分割

专知会员服务

31+阅读 · 2021年2月7日

【MLA 2019】图像的非监督增强匹配，清华大学张长水教授

专知会员服务

28+阅读 · 2019年11月6日

【CVPR2021】细粒度多标签分类

专知

44+阅读 · 2021年3月8日

【CVPR2021】半监督迁移学习的自适应一致性正则化

专知

41+阅读 · 2021年3月7日

【CVPR2021】基于反事实推断的视觉问答框架

专知

38+阅读 · 2021年3月4日

【AAAI2021】自监督对应学习的对比转换

专知

12+阅读 · 2020年12月11日

【ECCV2020-牛津大学】基于自监督学习的视频音视觉物体结构化

专知

8+阅读 · 2020年8月11日

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

专知

12+阅读 · 2020年6月9日

【ICML2020】小样本目标检测

专知

7+阅读 · 2020年6月2日

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

专知

14+阅读 · 2020年4月6日

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

专知

41+阅读 · 2020年3月25日

【北京大学】探索提取跨模态信息进行图像caption，Distilling Cross-Modal Information

专知

7+阅读 · 2020年3月5日

Vision Transformers with Patch Diversification

Arxiv

0+阅读 · 2021年6月10日

Verification of a Merkle Patricia Tree Library Using F*

Arxiv

0+阅读 · 2021年6月9日

Data-Efficient Instance Generation from Instance Discrimination

Arxiv

0+阅读 · 2021年6月8日

Region-aware Adaptive Instance Normalization for Image Harmonization

Arxiv

0+阅读 · 2021年6月5日

Mean Shift for Self-Supervised Learning

Arxiv

0+阅读 · 2021年5月15日

SiT: Self-supervised vIsion Transformer

Arxiv

19+阅读 · 2021年4月8日

Advanced Semantics for Commonsense Knowledge Extraction

Arxiv

6+阅读 · 2021年2月12日

Improving Weakly Supervised Visual Grounding by Contrastive Knowledge Distillation

Arxiv

13+阅读 · 2020年7月3日

Stacked Cross Attention for Image-Text Matching

Arxiv

3+阅读 · 2018年3月21日

Unpaired Image Captioning by Language Pivoting

Arxiv

4+阅读 · 2018年3月14日

VIP会员