Learning from videos offers a promising path toward generalist robots by providing rich visual and temporal priors beyond what real robot datasets contain. While existing video generative models produce impressive visual predictions, they are difficult to translate into low-level actions. Conversely, latent-action models better align videos with actions, but they typically operate at the single-step level and lack high-level planning capabilities. We bridge this gap by introducing Skill Abstraction from Optical Flow (SOF), a framework that learns latent skills from large collections of action-free videos. Our key idea is to learn a latent skill space through an intermediate representation based on optical flow that captures motion information aligned with both video dynamics and robot actions. By learning skills in this flow-based latent space, SOF enables high-level planning over video-derived skills and allows for easier translation of these skills into actions. Experiments show that our approach consistently improves performance in both multitask and long-horizon settings, demonstrating the ability to acquire and compose skills directly from raw visual data.


翻译:从视频中学习为通用机器人提供了一条前景广阔的路径,其提供的丰富视觉与时间先验知识超越了真实机器人数据集所包含的内容。现有的视频生成模型虽然能产生令人印象深刻的视觉预测,但难以将其转化为低层动作。相反,潜在动作模型能更好地将视频与动作对齐,但它们通常仅在单步层面运行,缺乏高层规划能力。我们通过引入基于光流的技能抽象框架来弥合这一差距,该框架能从大量无动作视频集合中学习潜在技能。我们的核心思想是通过一个基于光流的中间表示来学习潜在技能空间,该表示能捕获与视频动态和机器人动作均对齐的运动信息。通过在这个基于光流的潜在空间中学习技能,SOF 实现了对视频衍生技能的高层规划,并使得这些技能更容易转化为动作。实验表明,我们的方法在多任务和长时域设置中均能持续提升性能,证明了直接从原始视觉数据中获取并组合技能的能力。

0
下载
关闭预览

相关内容

专知会员服务
38+阅读 · 2021年10月14日
专知会员服务
25+阅读 · 2021年9月25日
【AAAI2021】RSPNet: 相对速度感知的无监督视频表示学习
专知会员服务
19+阅读 · 2021年2月12日
Auto-Keras与AutoML:入门指南
云栖社区
18+阅读 · 2019年2月9日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
VIP会员
相关VIP内容
专知会员服务
38+阅读 · 2021年10月14日
专知会员服务
25+阅读 · 2021年9月25日
【AAAI2021】RSPNet: 相对速度感知的无监督视频表示学习
专知会员服务
19+阅读 · 2021年2月12日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
Top
微信扫码咨询专知VIP会员