项目名称: 基于多智能体强化学习的多机器人系统研究
项目编号: No.60905054
项目类型: 青年科学基金项目
立项/批准年度: 2010
项目学科: 金属学与金属工艺
项目作者: 段勇
作者单位: 沈阳工业大学
项目金额: 19万元
中文摘要: 多机器人系统的协调以及如何使群体机器人能够适应其任务环境的动态变化而自动地规划其任务处理行为一直是多机器人系统研究的主要问题,而强化学习方法能够使机器人在同环境的交互过程中学习决策能力和行为能力。基于此,本项目就以下内容展开研究工作:(1)研究强化学习状态空间量化方法,以解决强化学习的维数灾难问题;(2)研究利用函数逼近方法的非线性映射能力来实现强化学习的状态空间到动作空间的映射,以解决强化学习大规模、连续的状态空间和动作空间问题;(3)研究智能体预测方法和学习策略共享机制,以解决非马尔可夫过程的多智能体强化学习问题(4)研究强化学习在机器人足球比赛这种典型的多机器人系统中的应用,建立机器人足球决策系统的分级学习结构,使用研究的多智能体强化学习方法来实现各级任务的学习。因此,本项目的研究能够提高机器人的智能水平、自和学习能力,对实现多智能体之间的分工与协作有着重要的理论意义和实际价值。
中文关键词: 强化学习;多智能系统;机器人足球比赛;决策策略;
英文摘要:
英文关键词: Reinforcement learning;Multi-agent system;Robot soccer;Decision-making strategy;