Controlling systems with complex, nonlinear dynamics poses a significant challenge, particularly in achieving efficient and robust control. In this paper, we propose a Dyna-Style Reinforcement Learning control framework that integrates Sparse Identification of Nonlinear Dynamics (SINDy) with Twin Delayed Deep Deterministic Policy Gradient (TD3) reinforcement learning. SINDy is used to identify a data-driven model of the system, capturing its key dynamics without requiring an explicit physical model. This identified model is used to generate synthetic rollouts that are periodically injected into the reinforcement learning replay buffer during training on the real environment, enabling efficient policy learning with limited data available. By leveraging this hybrid approach, we mitigate the sample inefficiency of traditional model-free reinforcement learning methods while ensuring accurate control of nonlinear systems. To demonstrate the effectiveness of this framework, we apply it to a bi-rotor system as a case study, evaluating its performance in stabilization and trajectory tracking. The results show that our SINDy-TD3 approach achieves superior accuracy and robustness compared to direct reinforcement learning techniques, highlighting the potential of combining data-driven modeling with reinforcement learning for complex dynamical systems.


翻译:控制具有复杂非线性动力学的系统是一项重大挑战,尤其是在实现高效鲁棒控制方面。本文提出一种Dyna风格的强化学习控制框架,将非线性动力学稀疏辨识(SINDy)与双延迟深度确定性策略梯度(TD3)强化学习相结合。SINDy用于建立系统的数据驱动模型,无需显式物理模型即可捕捉其关键动力学特性。该辨识模型用于生成合成轨迹,在真实环境训练期间定期注入强化学习的经验回放缓冲区,从而在有限数据条件下实现高效策略学习。通过这种混合方法,我们缓解了传统无模型强化学习方法的样本低效性问题,同时确保了对非线性系统的精确控制。为验证该框架的有效性,我们以双旋翼系统为案例进行研究,评估其在稳定控制和轨迹跟踪方面的性能。结果表明,与直接强化学习技术相比,我们的SINDy-TD3方法实现了更优的精度和鲁棒性,凸显了数据驱动建模与强化学习相结合在复杂动力学系统控制中的潜力。

0
下载
关闭预览

相关内容

【ICML2022】Sharp-MAML:锐度感知的模型无关元学习
专知会员服务
17+阅读 · 2022年6月10日
专知会员服务
41+阅读 · 2021年6月19日
ICLR'21 | GNN联邦学习的新基准
图与推荐
12+阅读 · 2021年11月15日
【NeurIPS2019】图变换网络:Graph Transformer Network
NAACL 2019 | 一种考虑缓和KL消失的简单VAE训练方法
PaperWeekly
20+阅读 · 2019年4月24日
国家自然科学基金
1+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关VIP内容
相关资讯
相关基金
国家自然科学基金
1+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员