项目名称: 多目标下结构进化型再励学习方法及其实现技术研究

项目编号: No.60874047

项目类型: 面上项目

立项/批准年度: 2009

项目学科: 无线电电子学、电信技术

项目作者: 赵金

作者单位: 华中科技大学

项目金额: 30万元

中文摘要: 现代工程应用系统正朝着大规模、复杂化的方向发展,基于传统控制理论与方法往往难以获得合适的控制器以满足系统性能指标的要求,为了实现复杂、未知系统控制器的自主设计,本项目从多目标优化算法、再励学习收敛速度和精度、神经网络结构进化策略及基于进化硬件的神经网络动态重构方法等四个方面展开了深入研究,取得了一系列的成果。在多目标优化算法方面,提出了一种带个人偏好的多目标优化算法,能够根据设计者的偏好优化得到不同性能指标的控制器;在再励学习收敛速度方面,提出了一种基于贝叶斯估计的神经网络权重初始化方法,该方法能够保证神经网络初始化后具有一定的控制能力;在再励学习收敛精度方面,提出了一种基于同时扰动随机逼近和遗传算法相结合的方法,不仅能够在局部提高学习速度,而且还能提高算法逼近精度,改善控制器性能;在神经网络结构进化策略方面,提出了一种自结构模糊神经网络控制算法和一种基于相关性的网络结构剪枝算法,两种算法均能实现网络结构和权重二者的同时进化;在基于进化硬件的神经网络动态重构方面,提出了一种在FPGA内部实现神经元功能的坐标旋转数字计算机算法,该算法依靠移位和求和能够实现精确的指数函数计算。

中文关键词: 再励学习;多目标优化;神经网络;进化硬件;结构进化

英文摘要: With the development of modern application system which becomes large-scale and complicated, it isn't always possible to design controller to satisfy requirements of the system with traditional control theories. In order to design controller for unknown and complicated system automatically, this project researches on four aspects including multi-objective optimization algorithm, the convergence rate and precision of reinforcement learning, configuration evolutionary strategy of neural networks, and neural networks dynamic reconfiguration. In the multi-objective optimization aspect, it proposes a multi-objective optimization algorithm which designs different controller according to the personal preference automatically. In the convergence rate of reinforcement learning aspect, it proposes an Bayesian estimation based initialization algorithm for neural network, which makes the neural network have basic control ability after initialization. In the approximation precision aspect, it proposes a hybrid algorithm which combines simultaneous perturbation stochastic approximation with genetic algorithm. The hybrid algorithm doesn't only accelerate the convergence rate of reinforcement learning, but also improves the approximation precision of reinforcement learning. In the configuration evolutionary strategy of neural networks, it proposes a self-configuration algorithm of fuzzy neural network and a pruning algorithm based on correlation of the nodes. Both algorithms can evolve the configuration and weights of the neural networks. In the neural networks dynamic reconfiguration aspect, it proposes a new direct coordinate rotation digital computer (CORDIC) algorithm which used to form the neuron of neural network based on FPGA platform. The CORDIC algorithm can achieve fast and accurate computation of exponential function relying on shift and summation.

英文关键词: Reinforcement learning; Multi-objective optimization; Neural network; Evolvable Hardware; Configuration evolution

成为VIP会员查看完整内容
0

相关内容

深度神经网络 FPGA 设计进展、实现与展望
专知会员服务
57+阅读 · 2022年3月26日
深度神经网络FPGA设计进展、实现与展望
专知会员服务
34+阅读 · 2022年3月21日
专知会员服务
54+阅读 · 2021年10月4日
专知会员服务
61+阅读 · 2021年9月20日
逆优化: 理论与应用
专知会员服务
36+阅读 · 2021年9月13日
专知会员服务
94+阅读 · 2021年2月6日
专知会员服务
187+阅读 · 2021年2月4日
专知会员服务
83+阅读 · 2020年12月11日
【Cell 2020】神经网络中的持续学习
专知会员服务
59+阅读 · 2020年11月7日
深度学习模型压缩算法综述
极市平台
1+阅读 · 2021年12月3日
基于规则的建模方法的可解释性及其发展
专知
4+阅读 · 2021年6月23日
Layer Normalization原理及其TensorFlow实现
深度学习每日摘要
32+阅读 · 2017年6月17日
卷积神经网络(CNN)学习笔记1:基础入门
黑龙江大学自然语言处理实验室
14+阅读 · 2016年6月16日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月17日
Arxiv
31+阅读 · 2021年3月29日
Arxiv
10+阅读 · 2020年6月12日
小贴士
相关VIP内容
深度神经网络 FPGA 设计进展、实现与展望
专知会员服务
57+阅读 · 2022年3月26日
深度神经网络FPGA设计进展、实现与展望
专知会员服务
34+阅读 · 2022年3月21日
专知会员服务
54+阅读 · 2021年10月4日
专知会员服务
61+阅读 · 2021年9月20日
逆优化: 理论与应用
专知会员服务
36+阅读 · 2021年9月13日
专知会员服务
94+阅读 · 2021年2月6日
专知会员服务
187+阅读 · 2021年2月4日
专知会员服务
83+阅读 · 2020年12月11日
【Cell 2020】神经网络中的持续学习
专知会员服务
59+阅读 · 2020年11月7日
相关资讯
相关基金
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员