Optimal control is often used in robotics for planning a trajectory to achieve some desired behavior, as expressed by the cost function. Most works in optimal control focus on finding a single optimal trajectory, which is then typically tracked by another controller. In this work, we instead consider trajectory distribution as the solution of an optimal control problem, resulting in better tracking performance and a more stable controller. A Gaussian distribution is first obtained from an iterative Linear Quadratic Regulator (iLQR) solver. A short horizon Model Predictive Control (MPC) is then used to track this distribution. We show that tracking the distribution is more cost-efficient and robust as compared to tracking the mean or using iLQR feedback control. The proposed method is validated with kinematic control of 7-DoF Panda manipulator and dynamic control of 6-DoF quadcopter in simulation.


翻译:优化控制常常用于机器人中规划轨迹以实现某种理想行为,如成本函数所示。大多数在最佳控制中的工作重点是寻找单一的最佳轨迹,然后通常由另一个控制者跟踪。在这项工作中,我们把轨迹分布视为最佳控制问题的解决办法,从而更好地跟踪性能和更稳定的控制器。首先从迭接线性二次二次曲线调节(iLQR)解答器获得高斯分布。然后使用短期模型预测控制(MPC)来跟踪这一分布。我们表明,跟踪分布比跟踪平均值或使用iLQR反馈控制更具成本效益和稳健性。在模拟中,对7-DoF Panda操纵器和6-DoF四重机动态控制进行动态控制,从而验证了拟议方法。

0
下载
关闭预览

相关内容

专知会员服务
28+阅读 · 2021年8月2日
专知会员服务
62+阅读 · 2021年7月6日
【干货书】机器学习优化,509页pdf
专知会员服务
146+阅读 · 2021年2月26日
Fariz Darari简明《博弈论Game Theory》介绍,35页ppt
专知会员服务
109+阅读 · 2020年5月15日
【陈天奇】TVM:端到端自动深度学习编译器,244页ppt
专知会员服务
86+阅读 · 2020年5月11日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
基于 Carsim 2016 和 Simulink的无人车运动控制联合仿真(四)
RL 真经
CreateAMind
5+阅读 · 2018年12月28日
神经网络学习率设置
机器学习研究会
4+阅读 · 2018年3月3日
条件GAN重大改进!cGANs with Projection Discriminator
CreateAMind
8+阅读 · 2018年2月7日
【推荐】RNN/LSTM时序预测
机器学习研究会
25+阅读 · 2017年9月8日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
强化学习 cartpole_a3c
CreateAMind
9+阅读 · 2017年7月21日
Improving Hyperparameter Optimization by Planning Ahead
Imitation by Predicting Observations
Arxiv
4+阅读 · 2021年7月8日
Meta-Learning with Implicit Gradients
Arxiv
13+阅读 · 2019年9月10日
VIP会员
相关VIP内容
专知会员服务
28+阅读 · 2021年8月2日
专知会员服务
62+阅读 · 2021年7月6日
【干货书】机器学习优化,509页pdf
专知会员服务
146+阅读 · 2021年2月26日
Fariz Darari简明《博弈论Game Theory》介绍,35页ppt
专知会员服务
109+阅读 · 2020年5月15日
【陈天奇】TVM:端到端自动深度学习编译器,244页ppt
专知会员服务
86+阅读 · 2020年5月11日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
相关资讯
基于 Carsim 2016 和 Simulink的无人车运动控制联合仿真(四)
RL 真经
CreateAMind
5+阅读 · 2018年12月28日
神经网络学习率设置
机器学习研究会
4+阅读 · 2018年3月3日
条件GAN重大改进!cGANs with Projection Discriminator
CreateAMind
8+阅读 · 2018年2月7日
【推荐】RNN/LSTM时序预测
机器学习研究会
25+阅读 · 2017年9月8日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
强化学习 cartpole_a3c
CreateAMind
9+阅读 · 2017年7月21日
Top
微信扫码咨询专知VIP会员