具身系统不仅要模拟外部世界的模式,还需理解自身的运动动态。运动动态模型对于高效的技能习得和有效的规划至关重要。在本工作中,我们提出了神经运动模拟器 (MoSim),这是一种基于当前观测和动作预测具身系统未来物理状态的世界模型。MoSim 在物理状态预测方面达到了最先进的性能,并在多项下游任务中展现出竞争力的表现。该研究表明,当世界模型足够精确并能进行精确的长远预测时,它不仅能促进在想象世界中的高效技能习得,甚至可实现零样本强化学习。此外,MoSim 能将任何无模型强化学习(RL)算法转化为基于模型的方法,从而有效地将物理环境建模与 RL 算法开发解耦。这种分离使得 RL 算法与世界模型各自可以独立进步,从而显著提高样本利用效率和增强泛化能力。我们的研究表明,专注于运动动态的世界模型为开发更通用、更强大的具身系统指明了一个有前途的方向。

成为VIP会员查看完整内容
9

相关内容

【ICML2024】深度强化学习中的随机潜在探索
专知会员服务
19+阅读 · 2024年7月19日
【ICML2024】揭示大脑中视觉-语言整合的多模态网络
专知会员服务
29+阅读 · 2024年6月21日
【CVPR2024】贝叶斯扩散模型用于三维形状重建
专知会员服务
34+阅读 · 2024年3月12日
【WWW2024】元认知检索-增强大型语言模型
专知会员服务
50+阅读 · 2024年2月26日
【CVPR2021】多实例主动学习目标检测
专知会员服务
43+阅读 · 2021年4月18日
【ICML2020】持续终身学习的神经主题建模
专知会员服务
39+阅读 · 2020年6月22日
【CVPR2020】视觉推理-可微自适应计算时间
专知会员服务
13+阅读 · 2020年4月28日
【AAAI2023】用于图对比学习的谱特征增强
专知
18+阅读 · 2022年12月11日
【KDD2020】图神经网络生成式预训练
专知
22+阅读 · 2020年7月3日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Arxiv
165+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
452+阅读 · 2023年3月31日
Arxiv
76+阅读 · 2023年3月26日
Arxiv
165+阅读 · 2023年3月24日
Arxiv
24+阅读 · 2023年3月17日
VIP会员
相关VIP内容
【ICML2024】深度强化学习中的随机潜在探索
专知会员服务
19+阅读 · 2024年7月19日
【ICML2024】揭示大脑中视觉-语言整合的多模态网络
专知会员服务
29+阅读 · 2024年6月21日
【CVPR2024】贝叶斯扩散模型用于三维形状重建
专知会员服务
34+阅读 · 2024年3月12日
【WWW2024】元认知检索-增强大型语言模型
专知会员服务
50+阅读 · 2024年2月26日
【CVPR2021】多实例主动学习目标检测
专知会员服务
43+阅读 · 2021年4月18日
【ICML2020】持续终身学习的神经主题建模
专知会员服务
39+阅读 · 2020年6月22日
【CVPR2020】视觉推理-可微自适应计算时间
专知会员服务
13+阅读 · 2020年4月28日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员