成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
多媒体
关注
4
综合
百科
VIP
热门
动态
论文
精华
Modular Conversational Agents for Surveys and Interviews
Arxiv
0+阅读 · 2024年12月22日
Content Adaptive Front End For Audio Classification
Arxiv
0+阅读 · 2024年12月23日
Linguistics-Vision Monotonic Consistent Network for Sign Language Production
Arxiv
0+阅读 · 2024年12月22日
VidCtx: Context-aware Video Question Answering with Image Models
Arxiv
0+阅读 · 2024年12月23日
VIoTGPT: Learning to Schedule Vision Tools in LLMs towards Intelligent Video Internet of Things
Arxiv
0+阅读 · 2024年12月22日
Reviewing Intelligent Cinematography: AI research for camera-based video production
Arxiv
0+阅读 · 2024年12月23日
L3TC: Leveraging RWKV for Learned Lossless Low-Complexity Text Compression
Arxiv
0+阅读 · 2024年12月21日
Predicting Satisfied User and Machine Ratio for Compressed Images: A Unified Approach
Arxiv
0+阅读 · 2024年12月23日
InterDance:Reactive 3D Dance Generation with Realistic Duet Interactions
Arxiv
0+阅读 · 2024年12月22日
Semi-Supervised Contrastive Learning for Controllable Video-to-Music Retrieval
Arxiv
0+阅读 · 2024年12月23日
One Framework to Rule Them All: Unifying Multimodal Tasks with LLM Neural-Tuning
Arxiv
0+阅读 · 2024年12月23日
Follow-Your-MultiPose: Tuning-Free Multi-Character Text-to-Video Generation via Pose Guidance
Arxiv
0+阅读 · 2024年12月21日
VERSA: A Versatile Evaluation Toolkit for Speech, Audio, and Music
Arxiv
0+阅读 · 2024年12月23日
ANID: How Far Are We? Evaluating the Discrepancies Between AI-synthesized Images and Natural Images through Multimodal Guidance
Arxiv
0+阅读 · 2024年12月23日
Hand1000: Generating Realistic Hands from Text with Only 1,000 Images
Arxiv
0+阅读 · 2024年12月21日
参考链接
子主题
EG
IEEE Transactions on Circuits and Systems for Video Technology
视频
多模态
ACM Transactions on Multimedia Computing, Communications and Application
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top