文本检索论文 - 专知

会员服务 ·

文本检索

MSTAR: Box-free Multi-query Scene Text Retrieval with Attention Recycling

Arxiv

0+阅读 · 12月22日

ASK: Adaptive Self-improving Knowledge Framework for Audio Text Retrieval

Arxiv

0+阅读 · 12月11日

Beyond Single Embeddings: Capturing Diverse Targets with Multi-Query Retrieval

Arxiv

0+阅读 · 11月4日

Rethinking Benchmarks for Cross-modal Image-text Retrieval

Arxiv

0+阅读 · 2023年4月21日

A data augmentation perspective on diffusion models and retrieval

Arxiv

1+阅读 · 2023年4月20日

Image-text Retrieval via preserving main Semantics of Vision

Arxiv

0+阅读 · 2023年4月20日

Chain of Thought Prompt Tuning in Vision Language Models

Arxiv

7+阅读 · 2023年4月16日

Converting ECG Signals to Images for Efficient Image-text Retrieval via Encoding

Arxiv

0+阅读 · 2023年4月13日

RECLIP: Resource-efficient CLIP by Training with Small Images

RECLIP: Resource-efficient CLIP by Training with Small Images

Arxiv

0+阅读 · 2023年4月12日

M-SpeechCLIP: Leveraging Large-Scale, Pre-Trained Models for Multilingual Speech to Image Retrieval

Arxiv

0+阅读 · 2023年4月10日

Exposing and Mitigating Spurious Correlations for Cross-Modal Retrieval

Arxiv

1+阅读 · 2023年4月6日

The style transformer with common knowledge optimization for image-text retrieval

Arxiv

0+阅读 · 2023年4月3日

Seeing What You Miss: Vision-Language Pre-training with Semantic Completion Learning

Arxiv

0+阅读 · 2023年3月26日

FlexiViT: One Model for All Patch Sizes

Arxiv

0+阅读 · 2023年3月23日

参考链接

微信扫码咨询专知VIP会员