对比语言-图像预训练(Contrastive Language-Image Pre-training, CLIP)是构建现代视觉-语言基础模型的核心组成部分。尽管 CLIP 在下游任务中展现出出色的零样本(zero-shot)性能,其多模态特征空间仍然存在模态差距(modality gap)——即图像与文本特征之间的聚类差异,这限制了下游任务的表现。 虽然已有研究试图通过修改预训练或微调流程来缓解这一模态差距,但往往面临两个难题:需要大规模数据集带来的高昂训练成本,或在零样本性能上的显著下降。 本文提出了一种新的后预训练方法,命名为 CLIP-Refine,该方法介于 CLIP 的预训练与微调阶段之间。CLIP-Refine 的目标是对特征空间进行对齐,通过在小规模图文配对数据集上仅训练 1 个 epoch,实现无损的零样本性能优化。 为此,我们提出了两项关键技术: 1. 随机特征对齐(RaFA, Random Feature Alignment):通过最小化图像与文本特征与随机采样的参考向量之间的距离,使其分布趋向于共享的先验分布,从而实现模态间对齐。 1. 混合对比-蒸馏学习(HyCD, Hybrid Contrastive-Distillation):结合图文对的真实标签与预训练 CLIP 模型的输出,生成软标签,用于更新模型。这种方式在保留原有知识的同时,促进了新知识的学习,实现更优的特征对齐效果。

我们在多个分类与检索任务上进行了广泛实验,结果表明,CLIP-Refine 能有效缩小模态差距,并进一步提升 CLIP 模型的零样本性能。

成为VIP会员查看完整内容
7

相关内容

【CVPR2025】基于组合表示移植的图像编辑方法
专知会员服务
8+阅读 · 4月5日
【EMNLP2023】基于文本属性异构图的语言模型预训练
专知会员服务
22+阅读 · 2023年10月21日
【CVPR2023】GeoLayoutLM:视觉信息提取的几何预训练
专知会员服务
32+阅读 · 2023年4月25日
【AAAI2022】基于对比学习的预训练语言模型剪枝压缩
专知会员服务
28+阅读 · 2022年1月24日
【AAAI2021】知识增强的视觉-语言预训练技术 ERNIE-ViL
专知会员服务
26+阅读 · 2021年1月29日
专知会员服务
36+阅读 · 2020年11月29日
【KDD2020】图神经网络生成式预训练
专知
22+阅读 · 2020年7月3日
国家自然科学基金
14+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
Arxiv
166+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
452+阅读 · 2023年3月31日
Arxiv
68+阅读 · 2022年9月7日
Arxiv
18+阅读 · 2021年3月16日
Augmentation for small object detection
Arxiv
11+阅读 · 2019年2月19日
VIP会员
相关VIP内容
【CVPR2025】基于组合表示移植的图像编辑方法
专知会员服务
8+阅读 · 4月5日
【EMNLP2023】基于文本属性异构图的语言模型预训练
专知会员服务
22+阅读 · 2023年10月21日
【CVPR2023】GeoLayoutLM:视觉信息提取的几何预训练
专知会员服务
32+阅读 · 2023年4月25日
【AAAI2022】基于对比学习的预训练语言模型剪枝压缩
专知会员服务
28+阅读 · 2022年1月24日
【AAAI2021】知识增强的视觉-语言预训练技术 ERNIE-ViL
专知会员服务
26+阅读 · 2021年1月29日
专知会员服务
36+阅读 · 2020年11月29日
相关基金
国家自然科学基金
14+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
相关论文
微信扫码咨询专知VIP会员