【CVPR2022】基于渐进自蒸馏的鲁棒跨模态表示学习 - 专知VIP

会员服务 ·

4

跨模态表示学习 · 知识蒸馏 · CVPR 2022 ·

2022 年 4 月 13 日

【CVPR2022】基于渐进自蒸馏的鲁棒跨模态表示学习

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

CLIP视觉语言方法的学习目标未能有效地考虑到网络采集的图像描述数据集存在的多对多的噪声，导致其计算和数据效率低下。为了解决这一挑战，我们引入了一种基于跨模态对比学习的新训练框架，该框架使用渐进自蒸馏和软图像-文本对齐，以更有效地从噪声数据中学习鲁棒表示。我们的模型提炼自己的知识，为每个小批中的图像子集和标题动态地生成软对齐目标，然后用来更新其参数。在14个基准数据集上的广泛评估表明，我们的方法在多种设置下始终优于CLIP对应的方法，包括:(a)零样本分类，(b)线性探针传输，(c)图像-文本检索，而不增加计算成本。使用基于ImageNet的鲁棒性测试平台的分析表明，与经过ImageNet训练的模型和CLIP本身相比，我们的方法对自然分布转移提供了更好的有效鲁棒性。最后，使用两个数量级的数据集进行预训练表明，我们对CLIP的改进往往与训练示例的数量成比例。

https://arxiv.org/abs/2204.04588

成为VIP会员查看完整内容

20

相关内容

跨模态表示学习

跨模态表示学习

【CVPR2022】带噪声标签的少样本学习

【CVPR2022】带噪声标签的少样本学习

专知会员服务

42+阅读 · 2022年4月15日

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

专知会员服务

28+阅读 · 2022年3月16日

【AAAI2022】基于双流更新的视觉Transformer动态加速方法

【AAAI2022】基于双流更新的视觉Transformer动态加速方法

专知会员服务

24+阅读 · 2021年12月11日

【CVPR2021】基于噪声鲁棒深度学习的快速元更新策略

专知会员服务

20+阅读 · 2021年5月4日

【CVPR2021】现实世界域泛化的自适应方法

【CVPR2021】现实世界域泛化的自适应方法

专知会员服务

58+阅读 · 2021年3月31日

【CVPR2021】在类别不平衡的数据上施展半监督学习

专知会员服务

38+阅读 · 2021年3月29日

【CVPR2021】空间一致性表示学习

专知会员服务

63+阅读 · 2021年3月12日

【CVPR2021】神经网络中的知识演化

【CVPR2021】神经网络中的知识演化

专知会员服务

25+阅读 · 2021年3月11日

【CVPR2021】自监督几何感知

【CVPR2021】自监督几何感知

专知会员服务

46+阅读 · 2021年3月6日

【CVPR2021】跨模态检索的概率嵌入

【CVPR2021】跨模态检索的概率嵌入

专知会员服务

20+阅读 · 2021年3月2日

【CVPR2022】带噪声标签的少样本学习

【CVPR2022】带噪声标签的少样本学习

专知

1+阅读 · 2022年4月15日

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

专知

1+阅读 · 2022年3月16日

【CVPR2021】基于噪声鲁棒深度学习的快速元更新策略

【CVPR2021】基于噪声鲁棒深度学习的快速元更新策略

专知

2+阅读 · 2021年5月4日

（CVPR2021）基于结构保持的弱监督目标定位

（CVPR2021）基于结构保持的弱监督目标定位

专知

18+阅读 · 2021年5月1日

【CVPR2021】基于Transformer的视频分割领域

【CVPR2021】基于Transformer的视频分割领域

专知

2+阅读 · 2021年4月16日

【CVPR2021】基于端到端预训练的视觉-语言表征学习

【CVPR2021】基于端到端预训练的视觉-语言表征学习

专知

3+阅读 · 2021年4月9日

【CVPR2021】现实世界域泛化的自适应方法

【CVPR2021】现实世界域泛化的自适应方法

专知

5+阅读 · 2021年3月31日

CVPR2021-单目实时全身捕捉的方法

CVPR2021-单目实时全身捕捉的方法

专知

0+阅读 · 2021年3月18日

【CVPR2021】空间一致性表示学习

【CVPR2021】空间一致性表示学习

专知

0+阅读 · 2021年3月12日

【CVPR2021】跨模态检索的概率嵌入

【CVPR2021】跨模态检索的概率嵌入

专知

17+阅读 · 2021年3月2日

基于稀疏表达理论和RGBD图像的人脸表情识别

国家自然科学基金

0+阅读 · 2015年12月31日

方差正则化的分类模型选择方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

基于过完备分析算子学习的图像超分辨率重建变分模型与算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

面向多类图像分类的众包主动学习方法研究

国家自然科学基金

2+阅读 · 2013年12月31日

基于稀疏正则化和深度学习的湍流退化图像复原研究

国家自然科学基金

3+阅读 · 2013年12月31日

基于隐含关系的视觉显著学习方法

国家自然科学基金

0+阅读 · 2012年12月31日

基于稀疏语义表示的大规模图像分类问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于在线判别学习的鲁棒视觉跟踪算法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于视觉注意机制的多尺度图像融合的研究

国家自然科学基金

1+阅读 · 2009年12月31日

Epistemic Uncertainty-Weighted Loss for Visual Bias Mitigation

Arxiv

0+阅读 · 2022年4月20日

A Deeper Look into Aleatoric and Epistemic Uncertainty Disentanglement

Arxiv

0+阅读 · 2022年4月20日

NTIRE 2022 Challenge on Stereo Image Super-Resolution: Methods and Results

Arxiv

0+阅读 · 2022年4月20日

Semi-Supervised Super-Resolution

Arxiv

1+阅读 · 2022年4月19日

Self-Calibrated Efficient Transformer for Lightweight Super-Resolution

Arxiv

1+阅读 · 2022年4月19日

SPTS: Single-Point Text Spotting

Arxiv

0+阅读 · 2022年4月19日

Perfectly Balanced: Improving Transfer and Robustness of Supervised Contrastive Learning

Arxiv

0+阅读 · 2022年4月15日

A Survey on Visual Transformer

Arxiv

19+阅读 · 2020年12月23日

Improving Weakly Supervised Visual Grounding by Contrastive Knowledge Distillation

Arxiv

13+阅读 · 2020年7月3日

Meta-Learning with Dynamic-Memory-Based Prototypical Network for Few-Shot Event Detection

Arxiv

20+阅读 · 2019年10月25日

VIP会员

相关主题

跨模态表示学习

相关VIP内容

【CVPR2022】带噪声标签的少样本学习

【CVPR2022】带噪声标签的少样本学习

专知会员服务

42+阅读 · 2022年4月15日

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

专知会员服务

28+阅读 · 2022年3月16日

【AAAI2022】基于双流更新的视觉Transformer动态加速方法

【AAAI2022】基于双流更新的视觉Transformer动态加速方法

专知会员服务

24+阅读 · 2021年12月11日

【CVPR2021】基于噪声鲁棒深度学习的快速元更新策略

专知会员服务

20+阅读 · 2021年5月4日

【CVPR2021】现实世界域泛化的自适应方法

【CVPR2021】现实世界域泛化的自适应方法

专知会员服务

58+阅读 · 2021年3月31日

【CVPR2021】在类别不平衡的数据上施展半监督学习

专知会员服务

38+阅读 · 2021年3月29日

【CVPR2021】空间一致性表示学习

专知会员服务

63+阅读 · 2021年3月12日

【CVPR2021】神经网络中的知识演化

【CVPR2021】神经网络中的知识演化

专知会员服务

25+阅读 · 2021年3月11日

【CVPR2021】自监督几何感知

【CVPR2021】自监督几何感知

专知会员服务

46+阅读 · 2021年3月6日

【CVPR2021】跨模态检索的概率嵌入

【CVPR2021】跨模态检索的概率嵌入

专知会员服务

20+阅读 · 2021年3月2日

热门VIP内容

开通专知VIP会员享更多权益服务

【牛津博士论文】零样本强化学习综述

《美军条令：陆军指挥官与规划人员地理空间指南》60页

战术边缘指挥控制：防务面临的核心挑战

迈向开放世界检测：综述

相关资讯

【CVPR2022】带噪声标签的少样本学习

【CVPR2022】带噪声标签的少样本学习

专知

1+阅读 · 2022年4月15日

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

专知

1+阅读 · 2022年3月16日

【CVPR2021】基于噪声鲁棒深度学习的快速元更新策略

【CVPR2021】基于噪声鲁棒深度学习的快速元更新策略

专知

2+阅读 · 2021年5月4日

（CVPR2021）基于结构保持的弱监督目标定位

（CVPR2021）基于结构保持的弱监督目标定位

专知

18+阅读 · 2021年5月1日

【CVPR2021】基于Transformer的视频分割领域

【CVPR2021】基于Transformer的视频分割领域

专知

2+阅读 · 2021年4月16日

【CVPR2021】基于端到端预训练的视觉-语言表征学习

【CVPR2021】基于端到端预训练的视觉-语言表征学习

专知

3+阅读 · 2021年4月9日

【CVPR2021】现实世界域泛化的自适应方法

【CVPR2021】现实世界域泛化的自适应方法

专知

5+阅读 · 2021年3月31日

CVPR2021-单目实时全身捕捉的方法

CVPR2021-单目实时全身捕捉的方法

专知

0+阅读 · 2021年3月18日

【CVPR2021】空间一致性表示学习

【CVPR2021】空间一致性表示学习

专知

0+阅读 · 2021年3月12日

【CVPR2021】跨模态检索的概率嵌入

【CVPR2021】跨模态检索的概率嵌入

专知

17+阅读 · 2021年3月2日

相关基金

基于稀疏表达理论和RGBD图像的人脸表情识别

国家自然科学基金

0+阅读 · 2015年12月31日

方差正则化的分类模型选择方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

基于过完备分析算子学习的图像超分辨率重建变分模型与算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

面向多类图像分类的众包主动学习方法研究

国家自然科学基金

2+阅读 · 2013年12月31日

基于稀疏正则化和深度学习的湍流退化图像复原研究

国家自然科学基金

3+阅读 · 2013年12月31日

基于隐含关系的视觉显著学习方法

国家自然科学基金

0+阅读 · 2012年12月31日

基于稀疏语义表示的大规模图像分类问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于在线判别学习的鲁棒视觉跟踪算法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于视觉注意机制的多尺度图像融合的研究

国家自然科学基金

1+阅读 · 2009年12月31日

相关论文

Epistemic Uncertainty-Weighted Loss for Visual Bias Mitigation

Arxiv

0+阅读 · 2022年4月20日

A Deeper Look into Aleatoric and Epistemic Uncertainty Disentanglement

Arxiv

0+阅读 · 2022年4月20日

NTIRE 2022 Challenge on Stereo Image Super-Resolution: Methods and Results

Arxiv

0+阅读 · 2022年4月20日

Semi-Supervised Super-Resolution

Arxiv

1+阅读 · 2022年4月19日

Self-Calibrated Efficient Transformer for Lightweight Super-Resolution

Arxiv

1+阅读 · 2022年4月19日

SPTS: Single-Point Text Spotting

Arxiv

0+阅读 · 2022年4月19日

Perfectly Balanced: Improving Transfer and Robustness of Supervised Contrastive Learning

Arxiv

0+阅读 · 2022年4月15日

A Survey on Visual Transformer

Arxiv

19+阅读 · 2020年12月23日

Improving Weakly Supervised Visual Grounding by Contrastive Knowledge Distillation

Arxiv

13+阅读 · 2020年7月3日

Meta-Learning with Dynamic-Memory-Based Prototypical Network for Few-Shot Event Detection

Arxiv

20+阅读 · 2019年10月25日

微信扫码咨询专知VIP会员