【CVPR2022】基于渐进自蒸馏的鲁棒跨模态表示学习 - 专知

会员服务 ·

0

【CVPR2022】基于渐进自蒸馏的鲁棒跨模态表示学习

2022 年 4 月 13 日 专知

CLIP视觉语言方法的学习目标未能有效地考虑到网络采集的图像描述数据集存在的多对多的噪声，导致其计算和数据效率低下。为了解决这一挑战，我们引入了一种基于跨模态对比学习的新训练框架，该框架使用渐进自蒸馏和软图像-文本对齐，以更有效地从噪声数据中学习鲁棒表示。我们的模型提炼自己的知识，为每个小批中的图像子集和标题动态地生成软对齐目标，然后用来更新其参数。在14个基准数据集上的广泛评估表明，我们的方法在多种设置下始终优于CLIP对应的方法，包括:(a)零样本分类，(b)线性探针传输，(c)图像-文本检索，而不增加计算成本。使用基于ImageNet的鲁棒性测试平台的分析表明，与经过ImageNet训练的模型和CLIP本身相比，我们的方法对自然分布转移提供了更好的有效鲁棒性。最后，使用两个数量级的数据集进行预训练表明，我们对CLIP的改进往往与训练示例的数量成比例。

https://arxiv.org/abs/2204.04588

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“LPSD” 就可以获取《【CVPR2022】基于渐进自蒸馏的鲁棒跨模态表示学习》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取70000+AI(AI与军事、医药、公安等)主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取70000+AI主题知识资料

登录查看更多

4

相关内容

跨模态表示学习

跨模态表示学习

【CVPR2022】带噪声标签的少样本学习

【CVPR2022】带噪声标签的少样本学习

专知会员服务

42+阅读 · 2022年4月15日

【CVPR2021】基于噪声鲁棒深度学习的快速元更新策略

专知会员服务

20+阅读 · 2021年5月4日

【CVPR2021】现实世界域泛化的自适应方法

【CVPR2021】现实世界域泛化的自适应方法

专知会员服务

58+阅读 · 2021年3月31日

【CVPR2021】空间一致性表示学习

专知会员服务

63+阅读 · 2021年3月12日

【CVPR2021】自监督几何感知

【CVPR2021】自监督几何感知

专知会员服务

46+阅读 · 2021年3月6日

【CVPR2022】带噪声标签的少样本学习

【CVPR2022】带噪声标签的少样本学习

专知

1+阅读 · 2022年4月15日

【CVPR2021】基于噪声鲁棒深度学习的快速元更新策略

【CVPR2021】基于噪声鲁棒深度学习的快速元更新策略

专知

2+阅读 · 2021年5月4日

【CVPR2021】基于Transformer的视频分割领域

【CVPR2021】基于Transformer的视频分割领域

专知

2+阅读 · 2021年4月16日

【CVPR2021】空间一致性表示学习

【CVPR2021】空间一致性表示学习

专知

0+阅读 · 2021年3月12日

【CVPR2021】跨模态检索的概率嵌入

【CVPR2021】跨模态检索的概率嵌入

专知

17+阅读 · 2021年3月2日

基于稀疏表达理论和RGBD图像的人脸表情识别

国家自然科学基金

0+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

面向多类图像分类的众包主动学习方法研究

国家自然科学基金

2+阅读 · 2013年12月31日

基于近似动态规划的非线性系统鲁棒优化控制

国家自然科学基金

2+阅读 · 2012年12月31日

基于稀疏语义表示的大规模图像分类问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

A Deeper Look into Aleatoric and Epistemic Uncertainty Disentanglement

Arxiv

0+阅读 · 2022年4月20日

Adaptive Uncertainty-Weighted ADMM for Distributed Optimization

Arxiv

0+阅读 · 2022年4月19日

Semi-Supervised Super-Resolution

Arxiv

1+阅读 · 2022年4月19日

Self-Calibrated Efficient Transformer for Lightweight Super-Resolution

Arxiv

1+阅读 · 2022年4月19日

SiT: Self-supervised vIsion Transformer

Arxiv

19+阅读 · 2021年4月8日

VIP会员

相关主题

跨模态表示学习

相关VIP内容

【CVPR2022】带噪声标签的少样本学习

【CVPR2022】带噪声标签的少样本学习

专知会员服务

42+阅读 · 2022年4月15日

【CVPR2021】基于噪声鲁棒深度学习的快速元更新策略

专知会员服务

20+阅读 · 2021年5月4日

【CVPR2021】现实世界域泛化的自适应方法

【CVPR2021】现实世界域泛化的自适应方法

专知会员服务

58+阅读 · 2021年3月31日

【CVPR2021】空间一致性表示学习

专知会员服务

63+阅读 · 2021年3月12日

【CVPR2021】自监督几何感知

【CVPR2021】自监督几何感知

专知会员服务

46+阅读 · 2021年3月6日

热门VIP内容

开通专知VIP会员享更多权益服务

【伯克利博士论文】从推理服务到模型训练：面向大规模 LLM 智能体的高效系统构建

面向作战人员负责任地寻求生成式人工智能

《Hello-Agents》项目正式发布，一起从零学习智能体！

智能体 AI (Agentic AI) 的新进展：回归初心，预见未来

相关资讯

【CVPR2022】带噪声标签的少样本学习

【CVPR2022】带噪声标签的少样本学习

专知

1+阅读 · 2022年4月15日

【CVPR2021】基于噪声鲁棒深度学习的快速元更新策略

【CVPR2021】基于噪声鲁棒深度学习的快速元更新策略

专知

2+阅读 · 2021年5月4日

【CVPR2021】基于Transformer的视频分割领域

【CVPR2021】基于Transformer的视频分割领域

专知

2+阅读 · 2021年4月16日

【CVPR2021】空间一致性表示学习

【CVPR2021】空间一致性表示学习

专知

0+阅读 · 2021年3月12日

【CVPR2021】跨模态检索的概率嵌入

【CVPR2021】跨模态检索的概率嵌入

专知

17+阅读 · 2021年3月2日

相关基金

基于稀疏表达理论和RGBD图像的人脸表情识别

国家自然科学基金

0+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

面向多类图像分类的众包主动学习方法研究

国家自然科学基金

2+阅读 · 2013年12月31日

基于近似动态规划的非线性系统鲁棒优化控制

国家自然科学基金

2+阅读 · 2012年12月31日

基于稀疏语义表示的大规模图像分类问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

相关论文

A Deeper Look into Aleatoric and Epistemic Uncertainty Disentanglement

Arxiv

0+阅读 · 2022年4月20日

Adaptive Uncertainty-Weighted ADMM for Distributed Optimization

Arxiv

0+阅读 · 2022年4月19日

Semi-Supervised Super-Resolution

Arxiv

1+阅读 · 2022年4月19日

Self-Calibrated Efficient Transformer for Lightweight Super-Resolution

Arxiv

1+阅读 · 2022年4月19日

SiT: Self-supervised vIsion Transformer

Arxiv

19+阅读 · 2021年4月8日

大家都在搜

MIT博士论文

分布式事务

蓝牙安全攻防

【泡泡读者来搞】ROS、Simulink、Carsim的互联与规划、控制算法的验证

微信扫码咨询专知VIP会员