MuJoCo is a powerful and efficient physics simulator widely used in robotics. One common way it is applied in practice is through Model Predictive Control (MPC), which uses repeated rollouts of the simulator to optimize future actions and generate responsive control policies in real time. To make this process more accessible, the open source library MuJoCo MPC (MJPC) provides ready-to-use MPC algorithms and implementations built directly on top of the MuJoCo simulator. However, MJPC relies on finite differencing (FD) to compute derivatives through the underlying MuJoCo simulator, which is often a key bottleneck that can make it prohibitively costly for time-sensitive tasks, especially in high-DOF systems or complex scenes. In this paper, we introduce the use of Web of Affine Spaces (WASP) derivatives within MJPC as a drop-in replacement for FD. WASP is a recently developed approach for efficiently computing sequences of accurate derivative approximations. By reusing information from prior, related derivative calculations, WASP accelerates and stabilizes the computation of new derivatives, making it especially well suited for MPC's iterative, fine-grained updates over time. We evaluate WASP across a diverse suite of MJPC tasks spanning multiple robot embodiments. Our results suggest that WASP derivatives are particularly effective in MJPC: it integrates seamlessly across tasks, delivers consistently robust performance, and achieves up to a 2$\mathsf{x}$ speedup compared to an FD backend when used with derivative-based planners, such as iLQG. In addition, WASP-based MPC outperforms MJPC's stochastic sampling-based planners on our evaluation tasks, offering both greater efficiency and reliability. To support adoption and future research, we release an open-source implementation of MJPC with WASP derivatives fully integrated.


翻译:MuJoCo是一款广泛应用于机器人领域的强大高效物理仿真器。在实践中,其常见应用方式是通过模型预测控制(MPC),该技术通过重复运行仿真器来优化未来动作,并实时生成响应式控制策略。为使该过程更易于使用,开源库MuJoCo MPC(MJPC)提供了直接构建于MuJoCo仿真器之上的即用型MPC算法与实现。然而,MJPC依赖有限差分法计算底层MuJoCo仿真器的导数,这常成为关键性能瓶颈,导致其在时间敏感任务中计算成本过高,特别是在高自由度系统或复杂场景中。本文提出在MJPC中使用仿射空间网络(WASP)导数作为有限差分法的即插即用替代方案。WASP是近期开发的一种高效计算精确导数近似序列的方法。通过复用先前相关导数计算的信息,WASP能加速并稳定新导数的计算,使其特别适用于MPC随时间进行的迭代式细粒度更新。我们在涵盖多种机器人形态的MJPC任务套件中对WASP进行评估。结果表明WASP导数在MJPC中表现尤为突出:它能跨任务无缝集成,提供持续稳健的性能,与基于导数的规划器(如iLQG)配合使用时,相比有限差分后端可实现高达2$\mathsf{x}$的加速。此外,基于WASP的MPC在我们的评估任务中超越了MJPC基于随机采样的规划器,在效率与可靠性方面均表现更优。为促进技术采纳与未来研究,我们发布了完整集成WASP导数的MJPC开源实现。

0
下载
关闭预览

相关内容

【ICML2024】上下文感知标记化的高效世界模型
专知会员服务
29+阅读 · 2024年7月2日
【KDD2023】增量式因果图学习用于在线无监督根源分析
专知会员服务
21+阅读 · 2023年5月20日
图机器学习 2.2-2.4 Properties of Networks, Random Graph
图与推荐
10+阅读 · 2020年3月28日
误差反向传播——CNN
统计学习与视觉计算组
30+阅读 · 2018年7月12日
大数据分析研究组开源Easy Machine Learning系统
中国科学院网络数据重点实验室
17+阅读 · 2017年6月13日
国家自然科学基金
1+阅读 · 2016年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
VIP会员
相关资讯
图机器学习 2.2-2.4 Properties of Networks, Random Graph
图与推荐
10+阅读 · 2020年3月28日
误差反向传播——CNN
统计学习与视觉计算组
30+阅读 · 2018年7月12日
大数据分析研究组开源Easy Machine Learning系统
中国科学院网络数据重点实验室
17+阅读 · 2017年6月13日
相关基金
国家自然科学基金
1+阅读 · 2016年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员