Human videos offer a scalable way to train robot manipulation policies, but lack the action labels needed by standard imitation learning algorithms. Existing cross-embodiment approaches try to map human motion to robot actions, but often fail when the embodiments differ significantly. We propose X-Sim, a real-to-sim-to-real framework that uses object motion as a dense and transferable signal for learning robot policies. X-Sim starts by reconstructing a photorealistic simulation from an RGBD human video and tracking object trajectories to define object-centric rewards. These rewards are used to train a reinforcement learning (RL) policy in simulation. The learned policy is then distilled into an image-conditioned diffusion policy using synthetic rollouts rendered with varied viewpoints and lighting. To transfer to the real world, X-Sim introduces an online domain adaptation technique that aligns real and simulated observations during deployment. Importantly, X-Sim does not require any robot teleoperation data. We evaluate it across 5 manipulation tasks in 2 environments and show that it: (1) improves task progress by 30% on average over hand-tracking and sim-to-real baselines, (2) matches behavior cloning with 10x less data collection time, and (3) generalizes to new camera viewpoints and test-time changes. Code and videos are available at https://portal-cornell.github.io/X-Sim/.


翻译:人类视频为训练机器人操作策略提供了可扩展的途径,但缺乏标准模仿学习算法所需的动作标签。现有的跨具身学习方法试图将人体运动映射到机器人动作,但在具身形态差异显著时往往失效。我们提出X-Sim,一种真实-仿真-真实框架,利用物体运动作为密集且可迁移的信号来学习机器人策略。X-Sim首先从RGBD人类视频重建逼真仿真环境,并通过追踪物体轨迹定义以物体为中心的奖励函数。这些奖励用于在仿真中训练强化学习(RL)策略。随后,通过使用多视角和不同光照渲染的合成轨迹,将习得的策略蒸馏为图像条件扩散策略。为实现向真实世界的迁移,X-Sim引入在线域适应技术,在部署过程中对齐真实与仿真观测值。值得注意的是,X-Sim无需任何机器人遥操作数据。我们在2个环境中的5项操作任务上评估该方法,结果表明:(1)相较于手动追踪和仿真到真实基线方法,平均任务进度提升30%;(2)仅需十分之一的数据收集时间即可达到行为克隆的效果;(3)能够泛化至新摄像机视角和测试时环境变化。代码与视频详见 https://portal-cornell.github.io/X-Sim/。

0
下载
关闭预览

相关内容

【CVPR2024】ViewDiff: 3D一致的图像生成与文本到图像模型
专知会员服务
30+阅读 · 2024年3月10日
UTC: 用于视觉对话的任务间对比学习的统一Transformer
专知会员服务
14+阅读 · 2022年5月4日
AAAI 2022 | ProtGNN:自解释图神经网络
专知
10+阅读 · 2022年2月28日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员