项目名称: 高维不平衡数据的集成学习算法研究

项目编号: No.11526161

项目类型: 专项基金项目

立项/批准年度: 2016

项目学科: 数理科学和化学

项目作者: 殷清燕

作者单位: 西安建筑科技大学

项目金额: 3万元

中文摘要: 实际应用中的数据集通常具有特征维数高和类分布不平衡双重特性,这些特性为高维不平衡数据的有效分类带来了极大挑战。集成学习利用多个基分类器的集成来解决同一分类问题,在提高分类器泛化能力和稳健性方面具有显著优势。本项目将以高维不平衡数据的有效分类为研究目标,深入分析现有集成学习算法在解决此类问题存在的不足,综合运用不平衡数据处理机制、先进的降维技术,探索其与基于特征子空间的集成学习算法的有机结合点,设计适用于高维不平衡数据的集成学习算法,并将这些算法应用于生物信息学中的基因表达数据分析和蛋白质结构预测等问题。该研究不仅为高维不平衡数据提供有效的分类算法,也将为解决相关的实际应用问题提供新技术和新方法,具有十分重要的科学意义和应用前景。

中文关键词: 集成学习;高维不平衡数据分类;特征选择;微阵列数据分析;

英文摘要: Data sets in practical application are usually characterized by high dimensions and imbalanced class distribution, it brings great challenges for effective classification of high-dimensional imbalanced data sets. Ensemble learning using multiple classifiers to solve the same problem, has a significant advantage in improving the classifier generalization and robustness. This project will revolve high-dimensional imbalanced classification problems, and integrate imbalanced data preprocessing mechanism, advanced dimension reduction technology and ensemble learning to design effective classification algorithms. At last, we will apply newly designed algorithms to resolve gene expression data classification and protein structure prediction problems in bioinformatics. The study not only provides effective high-dimensiona imbalanced classification algorithms, but also lay the foundation for solving practical problems in application. Hence, it has very important scientific significance and application prospects.

英文关键词: ensemble learning;high-dimensional imbalanced data classification;feature selection;microarray data analysis;

成为VIP会员查看完整内容
11

相关内容

集成学习是使用一系列学习器进行学习,并使用某种规则把各个学习结果进行整合从而获得比单个学习器更好的学习效果的一种机器学习方法。
【博士论文】开放环境下的度量学习研究
专知会员服务
46+阅读 · 2021年12月4日
【博士论文】机器学习中的标记增强理论 与应用研究
专知会员服务
29+阅读 · 2021年12月3日
专知会员服务
22+阅读 · 2021年10月6日
专知会员服务
25+阅读 · 2021年9月10日
【经典书】机器学习统计学,476页pdf
专知会员服务
120+阅读 · 2021年7月19日
专知会员服务
28+阅读 · 2021年6月7日
专知会员服务
36+阅读 · 2021年6月6日
基于深度学习的数据融合方法研究综述
专知会员服务
135+阅读 · 2020年12月10日
最新《统计机器学习》课程,26页ppt
专知会员服务
80+阅读 · 2020年8月30日
一文解决样本不均衡(全)
极市平台
5+阅读 · 2022年1月9日
【博士论文】开放环境下的度量学习研究
专知
7+阅读 · 2021年12月4日
【KDD2021】基于生成对抗图网络的不平衡网络嵌入
基于深度学习的数据融合方法研究综述
专知
31+阅读 · 2020年12月10日
如何理解模型的过拟合与欠拟合,以及如何解决?
七月在线实验室
12+阅读 · 2019年4月23日
非平衡数据集 focal loss 多类分类
AI研习社
33+阅读 · 2019年4月23日
机器学习中如何处理不平衡数据?
机器之心
13+阅读 · 2019年2月17日
手把手教你用LDA特征选择
AI研习社
12+阅读 · 2017年8月21日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
5+阅读 · 2011年12月31日
Age Optimal Sampling Under Unknown Delay Statistics
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月15日
Meta-Learning to Cluster
Arxiv
17+阅读 · 2019年10月30日
Learning Embedding Adaptation for Few-Shot Learning
Arxiv
16+阅读 · 2018年12月10日
小贴士
相关VIP内容
【博士论文】开放环境下的度量学习研究
专知会员服务
46+阅读 · 2021年12月4日
【博士论文】机器学习中的标记增强理论 与应用研究
专知会员服务
29+阅读 · 2021年12月3日
专知会员服务
22+阅读 · 2021年10月6日
专知会员服务
25+阅读 · 2021年9月10日
【经典书】机器学习统计学,476页pdf
专知会员服务
120+阅读 · 2021年7月19日
专知会员服务
28+阅读 · 2021年6月7日
专知会员服务
36+阅读 · 2021年6月6日
基于深度学习的数据融合方法研究综述
专知会员服务
135+阅读 · 2020年12月10日
最新《统计机器学习》课程,26页ppt
专知会员服务
80+阅读 · 2020年8月30日
相关资讯
一文解决样本不均衡(全)
极市平台
5+阅读 · 2022年1月9日
【博士论文】开放环境下的度量学习研究
专知
7+阅读 · 2021年12月4日
【KDD2021】基于生成对抗图网络的不平衡网络嵌入
基于深度学习的数据融合方法研究综述
专知
31+阅读 · 2020年12月10日
如何理解模型的过拟合与欠拟合,以及如何解决?
七月在线实验室
12+阅读 · 2019年4月23日
非平衡数据集 focal loss 多类分类
AI研习社
33+阅读 · 2019年4月23日
机器学习中如何处理不平衡数据?
机器之心
13+阅读 · 2019年2月17日
手把手教你用LDA特征选择
AI研习社
12+阅读 · 2017年8月21日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
5+阅读 · 2011年12月31日
微信扫码咨询专知VIP会员