项目名称: 变结构学习自动机的自适应与协同优化算法

项目编号: No.61272271

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 自动化技术、计算机技术

项目作者: 张军旗

作者单位: 同济大学

项目金额: 81万元

中文摘要: 学习自动机是一种基于强化学习机制的概率自动机,在与随机环境相互作用的过程中学习未知环境的概率特征。学习自动机自提出以来,其基础理论的研究取得较大发展,形成以变结构学习自动机为主流,并在模式识别、调度与分配、拥塞避免、博弈、马尔科夫链控制、函数优化等众多应用领域取得了显著的实际效果。本项目围绕变结构学习自动机的个体自适应与群体协同两个关键科学问题,首先针对目前变结构学习自动机对不同环境使用固定的结构变化方法并需手动调试参数,使得学习效率与应用范围受限的问题,定义环境的学习难度并提出变结构学习自动机的个体自适应学习范式与追击模式;然后,针对群体变结构自动机通常采用轮询的学习方式,缺乏有效的群体协同机制而导致群体学习能力受限的问题,提出基于群体智能的变结构学习自动机的群体协同算法;最后,针对基于随机反馈的高维多模态函数优化问题建模,发挥具备自适应学习与群体智能的变结构学习自动机的优化能力。

中文关键词: 学习自动机;变结构;自适应;协同;

英文摘要: Learning automaton is a reinforcement learning-based probabilistic automaton used to learn the probabilistic feature of the unknown random environment. Learning automata have been greatly developed in their theory and algorithms. They already gained success in many application fields, such as pattern recognition, scheduling and allocation, congestion avoidance, games, Markov chain control and function optimization. Variable structure learning automata represent the mainstream of the present research. This project concentrates on the self-adaptation and cooperation of the variable structure learning automata. First, we will define the learning difficulty of the environment and propose a self-adaptive learning paradigm and pursuit scheme to resolve the problem of fixed learning algorithm and tuned parameters for different environments. Then, we will propose the swarm intelligence based group cooperation algorithm instead of the commonly used polling approach. Finally, we will model the high-dimensional and multi-modal functions with random feedback using our proposed methods and achieve the optimization goal with adaptive learning and swarm intelligence-based variable structure learning automata.

英文关键词: Learning automata;Variable structure;Self-adaptative;Cooperative;

成为VIP会员查看完整内容
0

相关内容

图神经网络前沿进展与应用
专知会员服务
148+阅读 · 2022年1月24日
AAAI 2022 | 面向图数据的对抗鲁棒性研究
专知会员服务
21+阅读 · 2022年1月4日
Kyoto大学Toshiyuki:快速复杂控制系统的实时优化,133页ppt
专知会员服务
66+阅读 · 2021年7月25日
专知会员服务
74+阅读 · 2020年12月7日
专知会员服务
79+阅读 · 2020年12月6日
【康奈尔】最新《强化学习基础》CS 6789课程
专知会员服务
69+阅读 · 2020年9月27日
专知会员服务
43+阅读 · 2020年7月29日
【CMU】基于图神经网络的联合检测与多目标跟踪
专知会员服务
58+阅读 · 2020年6月24日
【CMU】深度学习模型中集成优化、约束和控制,33页ppt
专知会员服务
46+阅读 · 2020年5月23日
无人机集群对抗研究的关键问题
无人机
56+阅读 · 2018年9月16日
【团队新作】深度强化学习进展: 从AlphaGo到AlphaGo Zero
中国科学院自动化研究所
17+阅读 · 2018年1月31日
从浅层模型到深度模型:概览机器学习优化算法
机器之心
26+阅读 · 2017年7月9日
国家自然科学基金
21+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
22+阅读 · 2021年12月19日
Arxiv
11+阅读 · 2018年4月25日
小贴士
相关VIP内容
图神经网络前沿进展与应用
专知会员服务
148+阅读 · 2022年1月24日
AAAI 2022 | 面向图数据的对抗鲁棒性研究
专知会员服务
21+阅读 · 2022年1月4日
Kyoto大学Toshiyuki:快速复杂控制系统的实时优化,133页ppt
专知会员服务
66+阅读 · 2021年7月25日
专知会员服务
74+阅读 · 2020年12月7日
专知会员服务
79+阅读 · 2020年12月6日
【康奈尔】最新《强化学习基础》CS 6789课程
专知会员服务
69+阅读 · 2020年9月27日
专知会员服务
43+阅读 · 2020年7月29日
【CMU】基于图神经网络的联合检测与多目标跟踪
专知会员服务
58+阅读 · 2020年6月24日
【CMU】深度学习模型中集成优化、约束和控制,33页ppt
专知会员服务
46+阅读 · 2020年5月23日
相关基金
国家自然科学基金
21+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员