高维不平衡数据的集成学习算法研究 - 专知基金

会员服务 ·

3

集成学习 · 特征选择 ·

2015 年 12 月 31 日

高维不平衡数据的集成学习算法研究

国家自然科学基金

国家自然科学基金委员会

项目名称： 高维不平衡数据的集成学习算法研究

项目编号： No.11526161

项目类型： 专项基金项目

立项/批准年度： 2016

项目学科： 数理科学和化学

项目作者： 殷清燕

作者单位： 西安建筑科技大学

项目金额： 3万元

中文摘要： 实际应用中的数据集通常具有特征维数高和类分布不平衡双重特性，这些特性为高维不平衡数据的有效分类带来了极大挑战。集成学习利用多个基分类器的集成来解决同一分类问题，在提高分类器泛化能力和稳健性方面具有显著优势。本项目将以高维不平衡数据的有效分类为研究目标，深入分析现有集成学习算法在解决此类问题存在的不足，综合运用不平衡数据处理机制、先进的降维技术，探索其与基于特征子空间的集成学习算法的有机结合点，设计适用于高维不平衡数据的集成学习算法，并将这些算法应用于生物信息学中的基因表达数据分析和蛋白质结构预测等问题。该研究不仅为高维不平衡数据提供有效的分类算法，也将为解决相关的实际应用问题提供新技术和新方法，具有十分重要的科学意义和应用前景。

中文关键词： 集成学习；高维不平衡数据分类；特征选择；微阵列数据分析；

英文摘要： Data sets in practical application are usually characterized by high dimensions and imbalanced class distribution, it brings great challenges for effective classification of high-dimensional imbalanced data sets. Ensemble learning using multiple classifiers to solve the same problem, has a significant advantage in improving the classifier generalization and robustness. This project will revolve high-dimensional imbalanced classification problems, and integrate imbalanced data preprocessing mechanism, advanced dimension reduction technology and ensemble learning to design effective classification algorithms. At last, we will apply newly designed algorithms to resolve gene expression data classification and protein structure prediction problems in bioinformatics. The study not only provides effective high-dimensiona imbalanced classification algorithms, but also lay the foundation for solving practical problems in application. Hence, it has very important scientific significance and application prospects.

英文关键词： ensemble learning；high-dimensional imbalanced data classification；feature selection；microarray data analysis；

成为VIP会员查看完整内容

15

相关内容

集成学习

集成学习是使用一系列学习器进行学习，并使用某种规则把各个学习结果进行整合从而获得比单个学习器更好的学习效果的一种机器学习方法。

【博士论文】开放环境下的度量学习研究

【博士论文】开放环境下的度量学习研究

专知会员服务

49+阅读 · 2021年12月4日

【博士论文】机器学习中的标记增强理论与应用研究

【博士论文】机器学习中的标记增强理论与应用研究

专知会员服务

30+阅读 · 2021年12月3日

【NeurIPS2021】黑箱学习算法的信息理论泛化界

专知会员服务

23+阅读 · 2021年10月6日

【KDD2021】基于生成对抗图网络的不平衡网络嵌入

专知会员服务

27+阅读 · 2021年9月10日

【经典书】机器学习统计学，476页pdf

【经典书】机器学习统计学，476页pdf

专知会员服务

122+阅读 · 2021年7月19日

[ICML2021]基于相似置信度学习的算法

专知会员服务

29+阅读 · 2021年6月7日

【ICML2021】深入研究不平衡回归问题

专知会员服务

37+阅读 · 2021年6月6日

基于深度学习的数据融合方法研究综述

基于深度学习的数据融合方法研究综述

专知会员服务

146+阅读 · 2020年12月10日

最新《统计机器学习》课程，26页ppt

最新《统计机器学习》课程，26页ppt

专知会员服务

82+阅读 · 2020年8月30日

【伯克利博士论文】统计与优化—统计学习算法的计算保障（附143页PDF全文下载）

【伯克利博士论文】统计与优化—统计学习算法的计算保障（附143页PDF全文下载）

专知会员服务

34+阅读 · 2019年10月26日

阿里达摩院最新《时间序列Transformer建模》综述论文

阿里达摩院最新《时间序列Transformer建模》综述论文

专知

6+阅读 · 2022年2月16日

一文解决样本不均衡（全）

一文解决样本不均衡（全）

极市平台

6+阅读 · 2022年1月9日

【博士论文】开放环境下的度量学习研究

【博士论文】开放环境下的度量学习研究

专知

7+阅读 · 2021年12月4日

【博士论文】机器学习中的标记增强理论与应用研究

【博士论文】机器学习中的标记增强理论与应用研究

专知

0+阅读 · 2021年12月3日

【KDD2021】基于生成对抗图网络的不平衡网络嵌入

【KDD2021】基于生成对抗图网络的不平衡网络嵌入

图与推荐

0+阅读 · 2021年9月12日

基于深度学习的数据融合方法研究综述

基于深度学习的数据融合方法研究综述

专知

35+阅读 · 2020年12月10日

如何理解模型的过拟合与欠拟合，以及如何解决？

如何理解模型的过拟合与欠拟合，以及如何解决？

七月在线实验室

12+阅读 · 2019年4月23日

非平衡数据集 focal loss 多类分类

非平衡数据集 focal loss 多类分类

AI研习社

33+阅读 · 2019年4月23日

机器学习中如何处理不平衡数据？

机器学习中如何处理不平衡数据？

机器之心

13+阅读 · 2019年2月17日

手把手教你用LDA特征选择

手把手教你用LDA特征选择

AI研习社

12+阅读 · 2017年8月21日

面向特征提取的低秩与稀疏图嵌入理论与算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于健康数据分析的半监督在线学习血糖预报建模算法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于数据引力分类方法的互联网非平衡流量早期识别研究

国家自然科学基金

0+阅读 · 2014年12月31日

稀疏支持向量机的理论、算法及应用研究

国家自然科学基金

0+阅读 · 2013年12月31日

面向不平衡数据分类的演化硬件集成学习方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向高维小样本数据的集成分类方法研究

国家自然科学基金

4+阅读 · 2012年12月31日

基于半监督集成学习的不平衡数据研究

国家自然科学基金

0+阅读 · 2012年12月31日

多视野高维复杂数据融合降维方法与理论研究

国家自然科学基金

2+阅读 · 2012年12月31日

基于先验知识的支持向量机的最优化模型与算法研究

国家自然科学基金

0+阅读 · 2011年12月31日

高维数据统计建模与分析

国家自然科学基金

6+阅读 · 2011年12月31日

Age Optimal Sampling Under Unknown Delay Statistics

Age Optimal Sampling Under Unknown Delay Statistics

Arxiv

0+阅读 · 2022年4月20日

GestureLens: Visual Analysis of Gestures in Presentation Videos

Arxiv

0+阅读 · 2022年4月19日

Double spending prevention of digital Euros using a web-of-trust

Double spending prevention of digital Euros using a web-of-trust

Arxiv

0+阅读 · 2022年4月18日

AI-driven Development Is Here: Should You Worry?

Arxiv

0+阅读 · 2022年4月15日

MetaSets: Meta-Learning on Point Sets for Generalizable Representations

Arxiv

0+阅读 · 2022年4月15日

SuperpixelGridCut, SuperpixelGridMean and SuperpixelGridMix Data Augmentation

Arxiv

0+阅读 · 2022年4月11日

Semi-Supervised AUC Optimization based on Positive-Unlabeled Learning

Arxiv

0+阅读 · 2022年4月11日

Information-theoretic generalization bounds for black-box learning algorithms

Arxiv

12+阅读 · 2021年10月4日

Meta-Learning to Cluster

Meta-Learning to Cluster

Arxiv

17+阅读 · 2019年10月30日

Learning Embedding Adaptation for Few-Shot Learning

Learning Embedding Adaptation for Few-Shot Learning

Arxiv

17+阅读 · 2018年12月10日

阅读: 0 点赞: 0

小贴士

登录享主题订阅及个性化推荐

相关主题

热门VIP内容

开通专知VIP会员享更多权益服务

【新书】《知识图谱与大语言模型的协同应用》，544页pdf

军事通信系统：安全行动的支柱

《缓解大语言模型（LLMs）幻觉：面向应用的检索增强生成（RAG）、推理与智能体系统综述》

【新书】机器学习系统，2620页pdf

相关VIP内容

【博士论文】开放环境下的度量学习研究

【博士论文】开放环境下的度量学习研究

专知会员服务

49+阅读 · 2021年12月4日

【博士论文】机器学习中的标记增强理论与应用研究

【博士论文】机器学习中的标记增强理论与应用研究

专知会员服务

30+阅读 · 2021年12月3日

【NeurIPS2021】黑箱学习算法的信息理论泛化界

专知会员服务

23+阅读 · 2021年10月6日

【KDD2021】基于生成对抗图网络的不平衡网络嵌入

专知会员服务

27+阅读 · 2021年9月10日

【经典书】机器学习统计学，476页pdf

【经典书】机器学习统计学，476页pdf

专知会员服务

122+阅读 · 2021年7月19日

[ICML2021]基于相似置信度学习的算法

专知会员服务

29+阅读 · 2021年6月7日

【ICML2021】深入研究不平衡回归问题

专知会员服务

37+阅读 · 2021年6月6日

基于深度学习的数据融合方法研究综述

基于深度学习的数据融合方法研究综述

专知会员服务

146+阅读 · 2020年12月10日

最新《统计机器学习》课程，26页ppt

最新《统计机器学习》课程，26页ppt

专知会员服务

82+阅读 · 2020年8月30日

【伯克利博士论文】统计与优化—统计学习算法的计算保障（附143页PDF全文下载）

【伯克利博士论文】统计与优化—统计学习算法的计算保障（附143页PDF全文下载）

专知会员服务

34+阅读 · 2019年10月26日

相关资讯

阿里达摩院最新《时间序列Transformer建模》综述论文

阿里达摩院最新《时间序列Transformer建模》综述论文

专知

6+阅读 · 2022年2月16日

一文解决样本不均衡（全）

一文解决样本不均衡（全）

极市平台

6+阅读 · 2022年1月9日

【博士论文】开放环境下的度量学习研究

【博士论文】开放环境下的度量学习研究

专知

7+阅读 · 2021年12月4日

【博士论文】机器学习中的标记增强理论与应用研究

【博士论文】机器学习中的标记增强理论与应用研究

专知

0+阅读 · 2021年12月3日

【KDD2021】基于生成对抗图网络的不平衡网络嵌入

【KDD2021】基于生成对抗图网络的不平衡网络嵌入

图与推荐

0+阅读 · 2021年9月12日

基于深度学习的数据融合方法研究综述

基于深度学习的数据融合方法研究综述

专知

35+阅读 · 2020年12月10日

如何理解模型的过拟合与欠拟合，以及如何解决？

如何理解模型的过拟合与欠拟合，以及如何解决？

七月在线实验室

12+阅读 · 2019年4月23日

非平衡数据集 focal loss 多类分类

非平衡数据集 focal loss 多类分类

AI研习社

33+阅读 · 2019年4月23日

机器学习中如何处理不平衡数据？

机器学习中如何处理不平衡数据？

机器之心

13+阅读 · 2019年2月17日

手把手教你用LDA特征选择

手把手教你用LDA特征选择

AI研习社

12+阅读 · 2017年8月21日

相关基金

面向特征提取的低秩与稀疏图嵌入理论与算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于健康数据分析的半监督在线学习血糖预报建模算法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于数据引力分类方法的互联网非平衡流量早期识别研究

国家自然科学基金

0+阅读 · 2014年12月31日

稀疏支持向量机的理论、算法及应用研究

国家自然科学基金

0+阅读 · 2013年12月31日

面向不平衡数据分类的演化硬件集成学习方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向高维小样本数据的集成分类方法研究

国家自然科学基金

4+阅读 · 2012年12月31日

基于半监督集成学习的不平衡数据研究

国家自然科学基金

0+阅读 · 2012年12月31日

多视野高维复杂数据融合降维方法与理论研究

国家自然科学基金

2+阅读 · 2012年12月31日

基于先验知识的支持向量机的最优化模型与算法研究

国家自然科学基金

0+阅读 · 2011年12月31日

高维数据统计建模与分析

国家自然科学基金

6+阅读 · 2011年12月31日

相关论文

Age Optimal Sampling Under Unknown Delay Statistics

Age Optimal Sampling Under Unknown Delay Statistics

Arxiv

0+阅读 · 2022年4月20日

GestureLens: Visual Analysis of Gestures in Presentation Videos

Arxiv

0+阅读 · 2022年4月19日

Double spending prevention of digital Euros using a web-of-trust

Double spending prevention of digital Euros using a web-of-trust

Arxiv

0+阅读 · 2022年4月18日

AI-driven Development Is Here: Should You Worry?

Arxiv

0+阅读 · 2022年4月15日

MetaSets: Meta-Learning on Point Sets for Generalizable Representations

Arxiv

0+阅读 · 2022年4月15日

SuperpixelGridCut, SuperpixelGridMean and SuperpixelGridMix Data Augmentation

Arxiv

0+阅读 · 2022年4月11日

Semi-Supervised AUC Optimization based on Positive-Unlabeled Learning

Arxiv

0+阅读 · 2022年4月11日

Information-theoretic generalization bounds for black-box learning algorithms

Arxiv

12+阅读 · 2021年10月4日

Meta-Learning to Cluster

Meta-Learning to Cluster

Arxiv

17+阅读 · 2019年10月30日

Learning Embedding Adaptation for Few-Shot Learning

Learning Embedding Adaptation for Few-Shot Learning

Arxiv

17+阅读 · 2018年12月10日

微信扫码咨询专知VIP会员