精品内容

缩小CLIP规模:数据、架构与训练策略的全面分析
[IEEE TPAMI 2024] 将CLIP模型转换为端到端文本识别器
【CVPR2024】通过丰富的监督增强视觉-语言预训练
《多模态大模型少样本自适应》综述
专知会员服务
91+阅读 · 1月4日
【CVPR2022】三元组对比学习的视觉-语言预训练
专知会员服务
31+阅读 · 2022年3月3日
中科院自动化所徐波团队最新《视觉-语言预训练》综述
专知会员服务
66+阅读 · 2022年2月23日
专知会员服务
12+阅读 · 2021年10月11日
参考链接
微信扫码咨询专知VIP会员