CLIP论文 - 专知

会员服务 ·

CLIP

AdSum: Two-stream Audio-visual Summarization for Automated Video Advertisement Clipping

AdSum: Two-stream Audio-visual Summarization for Automated Video Advertisement Clipping

Arxiv

0+阅读 · 10月30日

GRPO-Guard: Mitigating Implicit Over-Optimization in Flow Matching via Regulated Clipping

Arxiv

0+阅读 · 10月30日

LATex: Leveraging Attribute-based Text Knowledge for Aerial-Ground Person Re-Identification

Arxiv

0+阅读 · 10月30日

Defending Multimodal Backdoored Models by Repulsive Visual Prompt Tuning

Arxiv

0+阅读 · 10月30日

Adapter-state Sharing CLIP for Parameter-efficient Multimodal Sarcasm Detection

Arxiv

0+阅读 · 10月29日

Caption-Driven Explainability: Probing CNNs for Bias via CLIP

Caption-Driven Explainability: Probing CNNs for Bias via CLIP

Arxiv

0+阅读 · 10月29日

RETTA: Retrieval-Enhanced Test-Time Adaptation for Zero-Shot Video Captioning

Arxiv

0+阅读 · 10月28日

GeoClip: Geometry-Aware Clipping for Differentially Private SGD

Arxiv

0+阅读 · 10月27日

Few-Shot Remote Sensing Image Scene Classification with CLIP and Prompt Learning

Arxiv

0+阅读 · 10月28日

Caption-Driven Explainability: Probing CNNs for Bias via CLIP

Arxiv

0+阅读 · 10月28日

Advancing Compositional Awareness in CLIP with Efficient Fine-Tuning

Arxiv

0+阅读 · 10月28日

Does CLIP perceive art the same way we do?

Arxiv

0+阅读 · 10月28日

Can Less Precise Be More Reliable? A Systematic Evaluation of Quantization's Impact on CLIP Beyond Accuracy

Arxiv

0+阅读 · 10月27日

Two Causally Related Needles in a Video Haystack

Arxiv

0+阅读 · 10月24日

Modest-Align: Data-Efficient Alignment for Vision-Language Models

Arxiv

0+阅读 · 10月24日

参考链接

微信扫码咨询专知VIP会员