项目名称: 数值求解最优控制: 动态规划方法
项目编号: No.60974032
项目类型: 面上项目
立项/批准年度: 2010
项目学科: 自动化技术、计算机技术
项目作者: 郭宝珠
作者单位: 中国科学院数学与系统科学研究院
项目金额: 31万元
中文摘要: 寻找最优反馈是控制理论梦寐寻以求的目标. 但是除去一般线性系统的LQ 或LQS问题外及其少量个别例子外, 对一般非线性系统, 特别是无穷维系统,最优控制问题的最优反馈律的解析求解是不可能的. 所以数值求解是唯一可能且有实践意义的途径. 目前的数值求解最优反馈律主要是基于Pontryagin极大值原理的打靶法. 这个方法有两个主要的问题, 一是要猜测初值, 二是求出的控制是开环的. 本项目采取完全不同的途径,即数值求出由Bellman动态规划导出的HJB 方程为基础的最优反馈控制数值解. HJB方程的解由1980年代发展的粘性解理论所保证. 即最优控制问题的值函数是相应的HJB方程的粘性解. 基于粘性解理论数值求解最优反馈控制刚开始于我们已经开展的几个成功的数值求解最优反馈控制的例子, 本项目将提出一般的算法并证明算法的收敛性,特别关注分布参数系统.
中文关键词: 动态规划;粘性解;最优控制;数值方法;收敛性
英文摘要:
英文关键词: dynamic programming;viscosity solution;optimal control;numerical algorithm;convergence