成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
多模态
关注
129
多模态
综合
百科
VIP
热门
动态
论文
精华
HarmonicEval: Multi-modal, Multi-task, Multi-criteria Automatic Evaluation Using a Vision Language Model
Arxiv
1+阅读 · 2024年12月19日
MoMu-Diffusion: On Learning Long-Term Motion-Music Synchronization and Correspondence
Arxiv
1+阅读 · 2024年11月4日
Multimodal Industrial Anomaly Detection by Crossmodal Feature Mapping
Arxiv
1+阅读 · 2024年7月8日
Active Sensing Strategy: Multi-Modal, Multi-Robot Source Localization and Mapping in Real-World Settings with Fixed One-Way Switching
Arxiv
1+阅读 · 2024年7月1日
M3LEO: A Multi-Modal, Multi-Label Earth Observation Dataset Integrating Interferometric SAR and RGB Data
Arxiv
0+阅读 · 2024年6月6日
Crossmodal ASR Error Correction with Discrete Speech Units
Arxiv
0+阅读 · 2024年5月26日
Hierarchical Space-Time Attention for Micro-Expression Recognition
Arxiv
0+阅读 · 2024年5月6日
Let's Negotiate! A Survey of Negotiation Dialogue Systems
Arxiv
0+阅读 · 2024年2月2日
Bridging the Gap between Multi-focus and Multi-modal: A Focused Integration Framework for Multi-modal Image Fusion
Arxiv
0+阅读 · 2024年1月31日
Context-PEFT: Efficient Multi-Modal, Multi-Task Fine-Tuning
Arxiv
0+阅读 · 2023年12月14日
Cem Mil Podcasts: A Spoken Portuguese Document Corpus For Multi-modal, Multi-lingual and Multi-Dialect Information Access Research
Arxiv
0+阅读 · 2023年12月13日
Cross-Attention is Not Enough: Incongruity-Aware Dynamic Hierarchical Fusion for Multimodal Affect Recognition
Arxiv
0+阅读 · 2023年11月13日
Incongruity-Aware Hierarchical Crossmodal Transformer with Dynamic Modality Gating: A Study on Affect Recognition
Arxiv
0+阅读 · 2023年11月7日
MAFW: A Large-scale, Multi-modal, Compound Affective Database for Dynamic Facial Expression Recognition in the Wild
Arxiv
0+阅读 · 2023年8月14日
Toward Human-Like Social Robot Navigation: A Large-Scale, Multi-Modal, Social Human Navigation Dataset
Arxiv
0+阅读 · 2023年8月9日
参考链接
父主题
深度学习
多媒体
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top