成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
多峰值
关注
2
综合
百科
VIP
热门
动态
论文
精华
Multimodal Safety Evaluation in Generative Agent Social Simulations
Arxiv
0+阅读 · 10月9日
FastUMI-100K: Advancing Data-driven Robotic Manipulation with a Large-scale UMI-style Dataset
Arxiv
0+阅读 · 10月9日
ERR@HRI 2.0 Challenge: Multimodal Detection of Errors and Failures in Human-Robot Conversations
Arxiv
0+阅读 · 10月9日
Towards Proprioception-Aware Embodied Planning for Dual-Arm Humanoid Robots
Arxiv
0+阅读 · 10月9日
Looking to Learn: Token-wise Dynamic Gating for Low-Resource Vision-Language Modelling
Arxiv
0+阅读 · 10月9日
LLaVA-OneVision-1.5: Fully Open Framework for Democratized Multimodal Training
Arxiv
0+阅读 · 10月9日
Leveraging Whisper Embeddings for Audio-based Lyrics Matching
Arxiv
0+阅读 · 10月9日
Better Together: Leveraging Unpaired Multimodal Data for Stronger Unimodal Models
Arxiv
0+阅读 · 10月9日
MM-HELIX: Boosting Multimodal Long-Chain Reflective Reasoning with Holistic Platform and Adaptive Hybrid Policy Optimization
Arxiv
0+阅读 · 10月9日
Beyond Single Frames: Can LMMs Comprehend Temporal and Contextual Narratives in Image Sequences?
Arxiv
0+阅读 · 10月9日
UniVideo: Unified Understanding, Generation, and Editing for Videos
Arxiv
0+阅读 · 10月9日
Personality-Enhanced Multimodal Depression Detection in the Elderly
Arxiv
0+阅读 · 10月9日
Efficient Generalization via Multimodal Co-Training under Data Scarcity and Distribution Shift
Arxiv
0+阅读 · 10月8日
A Multimodal Depth-Aware Method For Embodied Reference Understanding
Arxiv
0+阅读 · 10月9日
InstructX: Towards Unified Visual Editing with MLLM Guidance
Arxiv
0+阅读 · 10月9日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top