成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
跨模态
关注
3
综合
百科
VIP
热门
动态
论文
精华
MH-DETR: Video Moment and Highlight Detection with Cross-modal Transformer
Arxiv
0+阅读 · 2023年4月29日
FindVehicle and VehicleFinder: A NER dataset for natural language-based vehicle retrieval and a keyword-based cross-modal vehicle retrieval system
Arxiv
0+阅读 · 2023年4月21日
Rethinking Benchmarks for Cross-modal Image-text Retrieval
Arxiv
0+阅读 · 2023年4月21日
Is Cross-modal Information Retrieval Possible without Training?
Arxiv
0+阅读 · 2023年4月20日
CLaMP: Contrastive Language-Music Pre-training for Cross-Modal Symbolic Music Information Retrieval
Arxiv
0+阅读 · 2023年4月21日
Improving Speech Translation by Cross-Modal Multi-Grained Contrastive Learning
Arxiv
0+阅读 · 2023年4月20日
CrossFusion: Interleaving Cross-modal Complementation for Noise-resistant 3D Object Detection
Arxiv
0+阅读 · 2023年4月19日
EXIF as Language: Learning Cross-Modal Associations Between Images and Camera Metadata
Arxiv
0+阅读 · 2023年4月18日
Cross-Modal Causal Relational Reasoning for Event-Level Visual Question Answering
Arxiv
1+阅读 · 2023年4月18日
CoVLR: Coordinating Cross-Modal Consistency and Intra-Modal Structure for Vision-Language Retrieval
Arxiv
0+阅读 · 2023年4月15日
Robust Cross-Modal Knowledge Distillation for Unconstrained Videos
Arxiv
0+阅读 · 2023年4月16日
Detecting Out-of-Context Multimodal Misinformation with interpretable neural-symbolic model
Arxiv
0+阅读 · 2023年4月15日
TraVLR: Now You See It, Now You Don't! A Bimodal Dataset for Evaluating Visio-Linguistic Reasoning
Arxiv
0+阅读 · 2023年4月15日
Cross-domain Food Image-to-Recipe Retrieval by Weighted Adversarial Learning
Arxiv
0+阅读 · 2023年4月14日
Is Multimodal Vision Supervision Beneficial to Language?
Arxiv
0+阅读 · 2023年4月15日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top