We propose a two-phase risk-averse architecture for controlling stochastic nonlinear robotic systems. We present Risk-Averse Nonlinear Steering RRT* (RANS-RRT*) as an RRT* variant that incorporates nonlinear dynamics by solving a nonlinear program (NLP) and accounts for risk by approximating the state distribution and performing a distributionally robust (DR) collision check to promote safe planning. The generated plan is used as a reference for a low-level tracking controller. We demonstrate three controllers: finite horizon linear quadratic regulator (LQR) with linearized dynamics around the reference trajectory, LQR with robustness-promoting multiplicative noise terms, and a nonlinear model predictive control law (NMPC). We demonstrate the effectiveness of our algorithm using unicycle dynamics under heavy-tailed Laplace process noise in a cluttered environment.


翻译:我们提出了控制随机非线性机器人系统的两阶段风险规避结构。我们将风险-反非线性指导RRT* (RANS-RRT*)作为RRT* 变体,通过解决非线性程序(NLP)纳入非线性动态,并通过接近国家分布和进行分布强的碰撞检查来说明风险,以促进安全规划。产生的计划被用作低级跟踪控制器的参考。我们展示了三个控制器:环绕参照轨线性动态的有限地平线线线线线性线性二次曲线调节器(LQR),以强度促进多复制性噪音术语的LQR,以及非线性模型预测控制法(NMPC),我们展示了在封闭环境中使用重尾拉贝过程噪音下的单周期性动态的算法的有效性。

0
下载
关闭预览

相关内容

【干货书】机器学习速查手册,135页pdf
专知会员服务
127+阅读 · 2020年11月20日
强化学习最新教程,17页pdf
专知会员服务
182+阅读 · 2019年10月11日
MIT新书《强化学习与最优控制》
专知会员服务
282+阅读 · 2019年10月9日
LibRec 精选:AutoML for Contextual Bandits
LibRec智能推荐
7+阅读 · 2019年9月19日
RL 真经
CreateAMind
5+阅读 · 2018年12月28日
课程 | Andrew Ng 深度学习课程笔记3
黑龙江大学自然语言处理实验室
3+阅读 · 2017年9月15日
强化学习 cartpole_a3c
CreateAMind
9+阅读 · 2017年7月21日
VIP会员
相关资讯
LibRec 精选:AutoML for Contextual Bandits
LibRec智能推荐
7+阅读 · 2019年9月19日
RL 真经
CreateAMind
5+阅读 · 2018年12月28日
课程 | Andrew Ng 深度学习课程笔记3
黑龙江大学自然语言处理实验室
3+阅读 · 2017年9月15日
强化学习 cartpole_a3c
CreateAMind
9+阅读 · 2017年7月21日
Top
微信扫码咨询专知VIP会员