项目名称: 编码先验约束的高维小样本数据处理方法的研究

项目编号: No.61271385

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 无线电电子学、电信技术

项目作者: 韩飞

作者单位: 江苏大学

项目金额: 75万元

中文摘要: 传统的高维小样本数据处理方法将面向知识的符号学习与面向数据的统计学习对立,因而其处理性能不高、可解释性差。本项目结合先验约束运用粒子群优化(PSO)和极端学习机(ELM)从数据层、模型层和算法层上对高维小样本数据的处理进行研究。首先,用统计和聚类分析方法提取高维小样本数据中蕴含的特征分布和功能等先验信息(约束)。其次,用多种策略将先验约束编码进PSO进行特征选择。再次,将PSO与编码先验约束的混合投票方法相结合建立集成ELM模型。最后,在数据和模型的基础上,编码先验约束提高各ELM的性能。本项目以高维小样本的基因表达谱数据为研究对象,在对其处理中检验完善提出的方法。由于编码了问题中的先验约束,本课题的研究不但能提高高维小样本数据处理精度和速度,还大大增强机器学习的透明性。该课题为与机器学习有关的应用基础研究,它的深入研究必将给智能信息处理等领域带来新的发展,并促进国民经济其它行业的发展。

中文关键词: 先验信息;高维小样本数据;粒子群优化;极端学习机;

英文摘要: There is a chasm between symbolic learning working with knowledge and statistical learning working with data in traditinal methods of high-dimensional and small sample size data processing, which results in worse processing performance and interpretability of the traditional processing methods for high-dimensional and small sample size data. This project analyzes and studies high-dimensional and small sample size data from three layers, data, model and algorithm, by incorporating priori constraints into particle swarm optimization (PSO) and extreme learning machine (ELM). To begin with, some priori informations (constraints) related to feature distribution and function behind high-dimensional and small sample size data are extracted by using statistical and cluster methods. Then, PSO encoding the priori constraints with different strategies is used to perform feature selection of high-dimensional and small sample size data. Thirdly, a ensemble ELM model is established by combining PSO with hybrid voting coupling the priori constraints. Finally, based on the above data and model, the performance of the individual ELM in the ensemble model is improved by encoding the priori constraints. The project mainly studies high-dimensional and small sample size gene express profile, and tests and perfects the proposed met

英文关键词: prior information;high-dimensional and small sample size data;particle swarm optimization;extreme learning machine;

成为VIP会员查看完整内容
0

相关内容

面向知识图谱的图嵌入学习研究进展
专知会员服务
60+阅读 · 2021年11月3日
面向行人重识别的局部特征研究进展、挑战与展望
专知会员服务
26+阅读 · 2021年10月13日
专知会员服务
21+阅读 · 2021年9月23日
专知会员服务
52+阅读 · 2021年8月29日
《多任务学习》最新综述论文,20页pdf
专知会员服务
123+阅读 · 2021年4月6日
无参考图像质量评价研究进展
专知会员服务
29+阅读 · 2021年2月14日
基于生理信号的情感计算研究综述
专知会员服务
61+阅读 · 2021年2月9日
专知会员服务
30+阅读 · 2021年2月7日
专知会员服务
84+阅读 · 2020年12月11日
机器学习中原型学习研究进展
专知
0+阅读 · 2022年1月18日
再谈变分自编码器(VAE):估计样本概率密度
PaperWeekly
3+阅读 · 2021年12月23日
【博士论文】开放环境下的度量学习研究
专知
7+阅读 · 2021年12月4日
基于图神经网络的知识图谱研究进展
AI科技评论
20+阅读 · 2020年8月31日
【机器学习】深入剖析机器学习中的统计思想
产业智能官
14+阅读 · 2019年1月24日
基于信息理论的机器学习
专知
21+阅读 · 2017年11月23日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月17日
小贴士
相关VIP内容
面向知识图谱的图嵌入学习研究进展
专知会员服务
60+阅读 · 2021年11月3日
面向行人重识别的局部特征研究进展、挑战与展望
专知会员服务
26+阅读 · 2021年10月13日
专知会员服务
21+阅读 · 2021年9月23日
专知会员服务
52+阅读 · 2021年8月29日
《多任务学习》最新综述论文,20页pdf
专知会员服务
123+阅读 · 2021年4月6日
无参考图像质量评价研究进展
专知会员服务
29+阅读 · 2021年2月14日
基于生理信号的情感计算研究综述
专知会员服务
61+阅读 · 2021年2月9日
专知会员服务
30+阅读 · 2021年2月7日
专知会员服务
84+阅读 · 2020年12月11日
相关资讯
机器学习中原型学习研究进展
专知
0+阅读 · 2022年1月18日
再谈变分自编码器(VAE):估计样本概率密度
PaperWeekly
3+阅读 · 2021年12月23日
【博士论文】开放环境下的度量学习研究
专知
7+阅读 · 2021年12月4日
基于图神经网络的知识图谱研究进展
AI科技评论
20+阅读 · 2020年8月31日
【机器学习】深入剖析机器学习中的统计思想
产业智能官
14+阅读 · 2019年1月24日
基于信息理论的机器学习
专知
21+阅读 · 2017年11月23日
相关基金
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员