成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
文本检索
关注
1
综合
百科
VIP
热门
动态
论文
精华
Rethinking Benchmarks for Cross-modal Image-text Retrieval
Arxiv
0+阅读 · 2023年4月21日
A data augmentation perspective on diffusion models and retrieval
Arxiv
1+阅读 · 2023年4月20日
Image-text Retrieval via preserving main Semantics of Vision
Arxiv
0+阅读 · 2023年4月20日
Chain of Thought Prompt Tuning in Vision Language Models
Arxiv
7+阅读 · 2023年4月16日
Converting ECG Signals to Images for Efficient Image-text Retrieval via Encoding
Arxiv
0+阅读 · 2023年4月13日
RECLIP: Resource-efficient CLIP by Training with Small Images
Arxiv
0+阅读 · 2023年4月12日
M-SpeechCLIP: Leveraging Large-Scale, Pre-Trained Models for Multilingual Speech to Image Retrieval
Arxiv
0+阅读 · 2023年4月10日
Exposing and Mitigating Spurious Correlations for Cross-Modal Retrieval
Arxiv
1+阅读 · 2023年4月6日
The style transformer with common knowledge optimization for image-text retrieval
Arxiv
0+阅读 · 2023年4月3日
Seeing What You Miss: Vision-Language Pre-training with Semantic Completion Learning
Arxiv
0+阅读 · 2023年3月26日
FlexiViT: One Model for All Patch Sizes
Arxiv
0+阅读 · 2023年3月23日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top