成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
多媒体
关注
4
综合
百科
VIP
热门
动态
论文
精华
Contribution-Guided Asymmetric Learning for Robust Multimodal Fusion under Imbalance and Noise
Arxiv
0+阅读 · 10月30日
MORE: Multi-Organ Medical Image REconstruction Dataset
Arxiv
0+阅读 · 10月30日
ReCon-GS: Continuum-Preserved Gaussian Streaming for Fast and Compact Reconstruction of Dynamic Scenes
Arxiv
0+阅读 · 10月30日
Dependency Structure Augmented Contextual Scoping Framework for Multimodal Aspect-Based Sentiment Analysis
Arxiv
0+阅读 · 10月30日
AdSum: Two-stream Audio-visual Summarization for Automated Video Advertisement Clipping
Arxiv
0+阅读 · 10月30日
TRUST-VL: An Explainable News Assistant for General Multimodal Misinformation Detection
Arxiv
0+阅读 · 10月30日
ARECHO: Autoregressive Evaluation via Chain-Based Hypothesis Optimization for Speech Multi-Metric Estimation
Arxiv
0+阅读 · 10月30日
Unveiling Intrinsic Text Bias in Multimodal Large Language Models through Attention Key-Space Analysis
Arxiv
0+阅读 · 10月30日
Quality Over Quantity? LLM-Based Curation for a Data-Efficient Audio-Video Foundation Model
Arxiv
0+阅读 · 10月30日
PureKV: Plug-and-Play KV Cache Optimization with Spatial-Temporal Sparse Attention for Vision-Language Large Models
Arxiv
0+阅读 · 10月30日
Energy consumption assessment of a Virtual Reality Remote Rendering application over 5G networks
Arxiv
0+阅读 · 10月29日
XY-Cut++: Advanced Layout Ordering via Hierarchical Mask Mechanism on a Novel Benchmark
Arxiv
0+阅读 · 10月29日
YTLive: A Dataset of Real-World YouTube Live Streaming Sessions
Arxiv
0+阅读 · 10月24日
Hallucination Localization in Video Captioning
Arxiv
0+阅读 · 10月29日
Resi-VidTok: An Efficient and Decomposed Progressive Tokenization Framework for Ultra-Low-Rate and Lightweight Video Transmission
Arxiv
0+阅读 · 10月28日
参考链接
子主题
EG
IEEE Transactions on Circuits and Systems for Video Technology
视频
多模态
ACM Transactions on Multimedia Computing, Communications and Application
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top