项目名称: 基于交互式动态影响图的未知对手模型学习
项目编号: No.61375070
项目类型: 面上项目
立项/批准年度: 2013
项目学科: 自动化技术、计算机技术
项目作者: 曾一锋
作者单位: 厦门大学
项目金额: 76万元
中文摘要: 针对多Agent序贯决策优化问题,主体Agent需要识别其他Agent的真实模型,达到对其他Agent行为的准确预测。但是有限的主体Agent模型空间往往不能包括其他Agent的真实模型,这导致传统的贝叶斯公式不能被用来更新其他Agent模型的信度。本项目拟基于交互式动态影响图研究如何通过学习模型之间的相关性优化主体Agent的决策。通过结合多Agent决策系统、机器学习、信息论等技术,本项目采用互信息量化模型之间的相关性;构造动态隐性贝叶斯网络以准确地计算互信息;建立顺序学习技术以增强算法的适应性;根据相关性的实时变化动态优化模型空间;开发无人驾驶飞机仿真平台以验证模型及其算法的正确性;采用类人机器人对抗演练展示研究技术的实际效用。本项目将首次把在线机器学习方法融入到交互式动态影响图的求解过程中,从而克服传统贝叶斯方法更新模型的局限性,为解决实际多Agent序贯决策优问题提供坚实的基础。
中文关键词: 多智能体;概率图形模型;计划和推理;;
英文摘要: By identifying a true model of other agents, a subject agent is able to correctly predict other agents' behaviour so as to act in an optimal way. The limited model space of the subject agent may not always contain the true model of other agents, which lea
英文关键词: multiagent systems;probabilistic graphical models;planning and reasoning;;