项目名称: 强化学习关键技术及其在机器人行为学习中的应用
项目编号: No.60974050
项目类型: 面上项目
立项/批准年度: 2010
项目学科: 自动化技术、计算机技术
项目作者: 程玉虎
作者单位: 中国矿业大学
项目金额: 31万元
中文摘要: 针对强化学习存在的基函数选取困难、学习速度慢及算法收敛性难以保证等问题,设计一类有效的强化学习控制方法,并将其应用于机器人行为学习领域。研究内容包括:基于图上测地高斯基函数的强化学习、基于自然策略梯度的强化学习、基于知识迁移的强化学习。为了能够有效反映机器人世界的拓扑结构,引入测地高斯基函数逼近值函数,并通过递归策略迭代实现机器人的在线、增量式学习;为避免由于值函数逼近误差造成的策略震荡,研究黎曼空间中的自然策略梯度强化学习算法;进一步,如果具有不同传感器-驱动器的异构机器人面临一系列相关或者类似任务时,借助于认知心理学中的知识迁移概念,实现源任务与目标任务间的自主映射以有效提高强化学习的速度。通过在移动机器人行为学习问题中的应用,验证上述强化学习控制方法的可行性和有效性。研究成果将深化和丰富现有的强化学习理论,增强机器人的自主能力。
中文关键词: 强化学习;行为学习;基函数;Actor-Critic学习;知识迁移
英文摘要:
英文关键词: reinforcement learning;behavior learning;basis function;Actor-Critic learning;knowledge transfer