成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
CLIP
关注
1
综合
百科
VIP
热门
动态
论文
精华
TAPT: Test-Time Adversarial Prompt Tuning for Robust Inference in Vision-Language Models
Arxiv
0+阅读 · 11月20日
CLIP Unreasonable Potential in Single-Shot Face Recognition
Arxiv
0+阅读 · 11月20日
CLIP-VG: Self-paced Curriculum Adapting of CLIP for Visual Grounding
Arxiv
0+阅读 · 11月19日
CLIP Unreasonable Potential in Single-Shot Face Recognition
Arxiv
0+阅读 · 11月19日
Vision-Language Model Fine-Tuning via Simple Parameter-Efficient Modification
Arxiv
0+阅读 · 11月19日
Gradient Normalization Provably Benefits Nonconvex SGD under Heavy-Tailed Noise
Arxiv
0+阅读 · 11月19日
MedCLIP-SAMv2: Towards Universal Text-Driven Medical Image Segmentation
Arxiv
0+阅读 · 11月18日
Teaching Video Diffusion Model with Latent Physical Phenomenon Knowledge
Arxiv
0+阅读 · 11月18日
Unconstrained Open Vocabulary Image Classification: Zero-Shot Transfer from Text to Image via CLIP Inversion
Arxiv
0+阅读 · 11月18日
Text-guided Zero-Shot Object Localization
Arxiv
0+阅读 · 11月18日
CorrCLIP: Reconstructing Correlations in CLIP with Off-the-Shelf Foundation Models for Open-Vocabulary Semantic Segmentation
Arxiv
0+阅读 · 11月15日
Exploring Zero-Shot Anomaly Detection with CLIP in Medical Imaging: Are We There Yet?
Arxiv
0+阅读 · 11月14日
Harnessing Vision Foundation Models for High-Performance, Training-Free Open Vocabulary Segmentation
Arxiv
0+阅读 · 11月14日
LLM2CLIP: Powerful Language Model Unlocks Richer Visual Representation
Arxiv
0+阅读 · 11月14日
AstroM$^3$: A self-supervised multimodal model for astronomy
Arxiv
0+阅读 · 11月13日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top