Recent progress in 3D reconstruction has made it easy to create realistic digital twins from everyday environments. However, current digital twins remain largely static and are limited to navigation and view synthesis without embodied interactivity. To bridge this gap, we introduce Dexterous World Model (DWM), a scene-action-conditioned video diffusion framework that models how dexterous human actions induce dynamic changes in static 3D scenes. Given a static 3D scene rendering and an egocentric hand motion sequence, DWM generates temporally coherent videos depicting plausible human-scene interactions. Our approach conditions video generation on (1) static scene renderings following a specified camera trajectory to ensure spatial consistency, and (2) egocentric hand mesh renderings that encode both geometry and motion cues to model action-conditioned dynamics directly. To train DWM, we construct a hybrid interaction video dataset. Synthetic egocentric interactions provide fully aligned supervision for joint locomotion and manipulation learning, while fixed-camera real-world videos contribute diverse and realistic object dynamics. Experiments demonstrate that DWM enables realistic and physically plausible interactions, such as grasping, opening, and moving objects, while maintaining camera and scene consistency. This framework represents a first step toward video diffusion-based interactive digital twins and enables embodied simulation from egocentric actions.


翻译:三维重建领域的最新进展使得从日常环境创建逼真数字孪生体变得容易。然而,当前数字孪生体在很大程度上仍保持静态,仅限于导航和视图合成,缺乏具身交互性。为弥合这一差距,我们提出灵巧世界模型(DWM),这是一个场景-动作条件化的视频扩散框架,用于建模灵巧的人类动作如何引发静态三维场景的动态变化。给定静态三维场景渲染和以自我为中心的手部运动序列,DWM能够生成时间连贯的视频,描绘合理的人-场景交互。我们的方法将视频生成条件设定在:(1)遵循指定相机轨迹的静态场景渲染,以确保空间一致性;(2)以自我为中心的手部网格渲染,其编码了几何与运动线索,以直接建模动作条件化的动态。为训练DWM,我们构建了一个混合交互视频数据集。合成的以自我为中心的交互为联合运动与操作学习提供了完全对齐的监督,而固定相机的真实世界视频则贡献了多样且逼真的物体动态。实验表明,DWM能够实现逼真且物理合理的交互,如抓握、开启和移动物体,同时保持相机与场景的一致性。该框架代表了迈向基于视频扩散的交互式数字孪生体的第一步,并实现了从以自我为中心的动作进行具身模拟。

0
下载
关闭预览

相关内容

【Tutorial】计算机视觉中的Transformer,98页ppt
专知
21+阅读 · 2021年10月25日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
Arxiv
0+阅读 · 12月23日
Arxiv
0+阅读 · 12月19日
VIP会员
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员