项目名称: 基于学习人类策略的动态稳定系统控制器切换方法研究

项目编号: No.61273335

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 自动化技术、计算机技术

项目作者: 欧勇盛

作者单位: 中国科学院深圳先进技术研究院

项目金额: 79万元

中文摘要: 现有的传统控制方法对控制器切换过程中可能遇到的问题研究非常有限。然而,许多系统,特别是动态稳定系统,相当多的失稳都是发生在控制器切换过程中。例如,双足仿人机器人抬脚上楼梯时可能会翻倒等。人类和动物能够轻松的完成复杂的动态的运动控制,这种能力对于当前的机器人而言却存在很大的困难。本项目试图利用基于学习人类策略的控制方法,探讨动态稳定系统的控制器切换问题。从控制理论的角度,将人类智能与控制结合起来,研究在基于学习的这类系统控制器切换的理论与方法。采用基于学习方法的优点是可以避免对复杂和精确的动力学模型的依赖。这一问题的难点和关键问题是如何对建立高精度的模型以及非线性系统收敛域的估计方法。该项目的成功实施,将对双足仿人机器人,四足仿生机器人,两轮直立式代步车,自主单轮机器人等具有动态稳定性的机械系统控制性能的改善产生积极影响。

中文关键词: 学习人类策略;动态稳定系统;控制器切换;机器人;智能控制

英文摘要: So far, research works on the problems involving controller switching are still very limited. However, for most moving systems, especially dynamically stable systems, instability occurs during the control target switching. For example, a humanoid robot may fall down to the ground when it lifts its leg to go upstairs. While human beings and animals can easily perform complex and challenging actions and control their bodies very well, such behaviors are far beyond the capabilities of modern robots. In this project, we attempt to use learning-by-human-demonstration approach to address the controller switching problem for dynamically stable systems. From the perspective of control theory, by combining human intelligence and control systems, we investigate the theory and techniques for learning-based control switching of such systems. One of the advantages of adopting a learning approach is that it can avoid or reduce the dependency on sophisticated and accurate dynamic models. The main challenges lie in the development of a mechanism to effectively build up highly precise leaning models, and an estimation method for the convergence regions in such closed-loop nonlinear systems. The successful completion of this project will have significant and positive impact on improving the control performance of many dynamically

英文关键词: Learning from demonstration;Dynamically stable system;Controller switching;Robotics;Intelligent control

成为VIP会员查看完整内容
2

相关内容

【AAAI2022】一种基于状态扰动的鲁棒强化学习算法
专知会员服务
34+阅读 · 2022年1月31日
Kyoto大学Toshiyuki:快速复杂控制系统的实时优化,133页ppt
专知会员服务
27+阅读 · 2021年9月17日
专知会员服务
32+阅读 · 2021年9月14日
专知会员服务
125+阅读 · 2021年8月25日
专知会员服务
133+阅读 · 2021年2月17日
专知会员服务
84+阅读 · 2020年12月11日
【Cell 2020】神经网络中的持续学习
专知会员服务
59+阅读 · 2020年11月7日
我的天,强化学习还能用在自动驾驶领域?
夕小瑶的卖萌屋
1+阅读 · 2022年3月24日
基于自监督的可逆性强化学习方法
AI前线
4+阅读 · 2021年12月3日
【智能驾驶】史上最全自动驾驶系统解析
产业智能官
23+阅读 · 2017年8月21日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2014年12月31日
国家自然科学基金
14+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Arxiv
14+阅读 · 2021年8月5日
Arxiv
10+阅读 · 2020年11月26日
Arxiv
29+阅读 · 2020年3月16日
A Survey on Deep Learning for Named Entity Recognition
Arxiv
26+阅读 · 2020年3月13日
Arxiv
102+阅读 · 2020年3月4日
Arxiv
20+阅读 · 2019年9月7日
Few-shot Learning: A Survey
Arxiv
362+阅读 · 2019年4月10日
Arxiv
24+阅读 · 2018年10月24日
Arxiv
11+阅读 · 2018年4月25日
小贴士
相关VIP内容
【AAAI2022】一种基于状态扰动的鲁棒强化学习算法
专知会员服务
34+阅读 · 2022年1月31日
Kyoto大学Toshiyuki:快速复杂控制系统的实时优化,133页ppt
专知会员服务
27+阅读 · 2021年9月17日
专知会员服务
32+阅读 · 2021年9月14日
专知会员服务
125+阅读 · 2021年8月25日
专知会员服务
133+阅读 · 2021年2月17日
专知会员服务
84+阅读 · 2020年12月11日
【Cell 2020】神经网络中的持续学习
专知会员服务
59+阅读 · 2020年11月7日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2014年12月31日
国家自然科学基金
14+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
相关论文
Arxiv
14+阅读 · 2021年8月5日
Arxiv
10+阅读 · 2020年11月26日
Arxiv
29+阅读 · 2020年3月16日
A Survey on Deep Learning for Named Entity Recognition
Arxiv
26+阅读 · 2020年3月13日
Arxiv
102+阅读 · 2020年3月4日
Arxiv
20+阅读 · 2019年9月7日
Few-shot Learning: A Survey
Arxiv
362+阅读 · 2019年4月10日
Arxiv
24+阅读 · 2018年10月24日
Arxiv
11+阅读 · 2018年4月25日
微信扫码咨询专知VIP会员