点击上方蓝字
关注我们
导读
在训练集具有不平衡类分布的情况下,训练目标是最优化总体分类精度的传统机器学习算法通常不能取得理想的分类性能,尤其是对于少数类样例不能有效地分类,然而这些少数类却往往是我们最感兴趣的。为了解决这一问题,学者们提出了一些有效的方法。其中,bagging集成算法与欠采样技术相结合的这类方法比其它的方法具有更好的性能,这包括bagging集成算法与过采样技术相结合的方法、代价敏感的方法等。尽管这些欠采样技术通过对多数类进行随机划分或采样保证了生成的基分类器之间的多样性,然而它们没有采取任何措施来确保各个基分类器具有较好的分类性能,这就限制了集成系统达到更优的分类性能。
另一方面,进化欠采样EUS作为一种新型的欠采样技术,它已成功地用于寻找最近邻分类器的最优多数类训练子集。受到这一启发,本文尝试将EUS用到欠采样bagging框架中并提出了一种基于EUS的bagging集成方法EUS-Bag,通过设计一种考虑了三个因素的新适应度函数来确保EUS更加适合bagging框架。使用这一适应度函数,EUS-Bag能够生成一些具有良好性能并且多样化的个体分类器。为了验证EUS-Bag的有效性,在22个二分类不平衡问题中开展了一系列对比实验,使用recall、geometric mean和AUC作为性能评价度量时得到的实现结果均表明EUS-Bag具有良好的分类性能。
文章精要
请长按下方二维码识别,阅读该文。
相关内容推荐:
FCS 12(2) 人工智能专栏 | 关于差异进化算法中变异个体的选择
FCS 12(1) 文章 | 多峰问题全局优化的分布式学习粒子群优化算法
FCS 12(1) 文章 | 多层次的中文垃圾短信高效识别方法
FCS 11(6) 文章 | 从Instagram图片轨迹中挖掘兴趣圈模式进行旅行线路推荐
FCS 11(6) 文章 | 图像检索基于颜色空间量化的聚类
FCS 11(5) 文章 | 使用维纳过程过采样技术改善不平衡数据的学习
FCS 11(5) 文章 | 基于上下文语言模型的时序文本流突发热点特征挖掘
FCS 11(5) 文章 | 基于人工神经网络的矩形钢管混凝土柱轴向承载力研究
FCS 11(4) 文章 | E-GrabCut: 一种经济的迭代视频目标提取方法
FCS 11(3) 文章 | 分层多智能体系统中的知识、信念、和肯定性推理
FCS 11(3) 文章 | 基于混合免疫方案的工作职位推荐系统
Frontiers of Computer Science
Frontiers of Computer Science (FCS)是由教育部主管、高等教育出版社出版、SpringerNature 公司海外发行的英文学术期刊。本刊于 2007 年创刊,双月刊,全球发行。主要刊登计算机科学领域具有创新性的综述论文、研究论文等。本刊主编为李未院士,执行主编为熊璋教授和周志华教授。编委会及青年 AE 团队由国内外知名学者及优秀青年学者组成。本刊被 SCI、Ei、DBLP、INSPEC、SCOPUS 和中国科学引文数据库(CSCD)核心库等收录,为 CCF 推荐期刊;两次入选“中国科技期刊国际影响力提升计划”;入选“第4届中国国际化精品科技期刊”。
长按二维码关注Frontiers of Computer Science公众号