成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
多媒体
关注
4
综合
百科
VIP
热门
动态
论文
精华
RoSMM: A Robust and Secure Multi-Modal Watermarking Framework for Diffusion Models
Arxiv
0+阅读 · 4月3日
Aligned Better, Listen Better for Audio-Visual Large Language Models
Arxiv
0+阅读 · 4月2日
L-LBVC: Long-Term Motion Estimation and Prediction for Learned Bi-Directional Video Compression
Arxiv
0+阅读 · 4月3日
Group-based Distinctive Image Captioning with Memory Difference Encoding and Attention
Arxiv
0+阅读 · 4月3日
Evaluating Semantic Variation in Text-to-Image Synthesis: A Causal Perspective
Arxiv
0+阅读 · 4月1日
$C^2$AV-TSE: Context and Confidence-aware Audio Visual Target Speaker Extraction
Arxiv
0+阅读 · 4月1日
Augmenting Multimodal LLMs with Self-Reflective Tokens for Knowledge-based Visual Question Answering
Arxiv
0+阅读 · 4月2日
SAV-SE: Scene-aware Audio-Visual Speech Enhancement with Selective State Space Model
Arxiv
0+阅读 · 4月2日
Video Quality Assessment for Resolution Cross-Over in Live Sports
Arxiv
0+阅读 · 4月1日
Virtual Reality and Artificial Intelligence as Psychological Countermeasures in Space and Other Isolated and Confined Environments: A Scoping Review
Arxiv
0+阅读 · 4月2日
Scaling Prompt Instructed Zero Shot Composed Image Retrieval with Image-Only Data
Arxiv
0+阅读 · 4月1日
Diffusion Model-Based Size Variable Virtual Try-On Technology and Evaluation Method
Arxiv
0+阅读 · 4月1日
Adaptive Low Light Enhancement via Joint Global-Local Illumination Adjustment
Arxiv
0+阅读 · 4月1日
Q-Adapt: Adapting LMM for Visual Quality Assessment with Progressive Instruction Tuning
Arxiv
0+阅读 · 4月2日
VidCRAFT3: Camera, Object, and Lighting Control for Image-to-Video Generation
Arxiv
0+阅读 · 4月2日
参考链接
子主题
EG
IEEE Transactions on Circuits and Systems for Video Technology
视频
多模态
ACM Transactions on Multimedia Computing, Communications and Application
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top