一种解决类不平衡问题的进化欠采样bagging集成分类算法

2018 年 5 月 23 日 FCS

点击上方蓝字

关注我们

导读


       在训练集具有不平衡类分布的情况下,训练目标是最优化总体分类精度的传统机器学习算法通常不能取得理想的分类性能,尤其是对于少数类样例不能有效地分类,然而这些少数类却往往是我们最感兴趣的。为了解决这一问题,学者们提出了一些有效的方法。其中,bagging集成算法与欠采样技术相结合的这类方法比其它的方法具有更好的性能,这包括bagging集成算法与过采样技术相结合的方法、代价敏感的方法等。尽管这些欠采样技术通过对多数类进行随机划分或采样保证了生成的基分类器之间的多样性,然而它们没有采取任何措施来确保各个基分类器具有较好的分类性能,这就限制了集成系统达到更优的分类性能。

       另一方面,进化欠采样EUS作为一种新型的欠采样技术,它已成功地用于寻找最近邻分类器的最优多数类训练子集。受到这一启发,本文尝试将EUS用到欠采样bagging框架中并提出了一种基于EUS的bagging集成方法EUS-Bag,通过设计一种考虑了三个因素的新适应度函数来确保EUS更加适合bagging框架。使用这一适应度函数,EUS-Bag能够生成一些具有良好性能并且多样化的个体分类器。为了验证EUS-Bag的有效性,在22个二分类不平衡问题中开展了一系列对比实验,使用recall、geometric mean和AUC作为性能评价度量时得到的实现结果均表明EUS-Bag具有良好的分类性能。

文章精要

          请长按下方二维码识别,阅读该文。

相关内容推荐:

FCS 12(2) 人工智能专栏 | 关于差异进化算法中变异个体的选择

FCS 12(1) 文章 | 多峰问题全局优化的分布式学习粒子群优化算法

FCS 12(1) 文章 | 多层次的中文垃圾短信高效识别方法

FCS 11(6) 文章 | 从Instagram图片轨迹中挖掘兴趣圈模式进行旅行线路推荐

FCS 11(6) 文章 | 图像检索基于颜色空间量化的聚类

FCS 11(5) 文章 | 使用维纳过程过采样技术改善不平衡数据的学习

FCS 11(5) 文章 | 基于上下文语言模型的时序文本流突发热点特征挖掘

FCS 11(5) 文章 | 基于人工神经网络的矩形钢管混凝土柱轴向承载力研究

FCS 11(4) 文章 | 通用目标检测的局部结构化表示

FCS 11(4) 文章 | E-GrabCut: 一种经济的迭代视频目标提取方法

FCS 11(3) 文章 | 分层多智能体系统中的知识、信念、和肯定性推理

FCS 11(3) 文章 | 基于混合免疫方案的工作职位推荐系统




Frontiers of Computer Science



Frontiers of Computer Science (FCS)是由教育部主管、高等教育出版社出版、SpringerNature 公司海外发行的英文学术期刊。本刊于 2007 年创刊,双月刊,全球发行。主要刊登计算机科学领域具有创新性的综述论文、研究论文等。本刊主编为李未院士,执行主编为熊璋教授和周志华教授。编委会及青年 AE 团队由国内外知名学者及优秀青年学者组成。本刊被 SCI、Ei、DBLP、INSPEC、SCOPUS 和中国科学引文数据库(CSCD)核心库等收录,为 CCF 推荐期刊;两次入选“中国科技期刊国际影响力提升计划”;入选“第4届中国国际化精品科技期刊”。




长按二维码关注Frontiers of Computer Science公众号

登录查看更多
6

相关内容

【经典书】机器学习:贝叶斯和优化方法,1075页pdf
专知会员服务
404+阅读 · 2020年6月8日
基于多头注意力胶囊网络的文本分类模型
专知会员服务
77+阅读 · 2020年5月24日
【哈工大】基于抽取的高考作文生成
专知会员服务
36+阅读 · 2020年3月10日
【Science最新论文】XAI—可解释人工智能简述,机遇与挑战
专知会员服务
163+阅读 · 2019年12月21日
零样本图像分类综述 : 十年进展
专知会员服务
127+阅读 · 2019年11月16日
深度学习算法与架构回顾
专知会员服务
81+阅读 · 2019年10月20日
常用的模型集成方法介绍:bagging、boosting 、stacking
跨多个异构数据源的实体对齐
FCS
15+阅读 · 2019年3月13日
卷积自适应降噪自动编码器
FCS
8+阅读 · 2019年1月3日
基于样本选择的安全图半监督学习方法
一文了解采样方法
AI100
5+阅读 · 2018年7月6日
稀疏&集成的卷积神经网络学习
计算机视觉战队
6+阅读 · 2017年11月16日
Arxiv
7+阅读 · 2019年5月31日
Physical Primitive Decomposition
Arxiv
4+阅读 · 2018年9月13日
VIP会员
相关VIP内容
【经典书】机器学习:贝叶斯和优化方法,1075页pdf
专知会员服务
404+阅读 · 2020年6月8日
基于多头注意力胶囊网络的文本分类模型
专知会员服务
77+阅读 · 2020年5月24日
【哈工大】基于抽取的高考作文生成
专知会员服务
36+阅读 · 2020年3月10日
【Science最新论文】XAI—可解释人工智能简述,机遇与挑战
专知会员服务
163+阅读 · 2019年12月21日
零样本图像分类综述 : 十年进展
专知会员服务
127+阅读 · 2019年11月16日
深度学习算法与架构回顾
专知会员服务
81+阅读 · 2019年10月20日
相关资讯
常用的模型集成方法介绍:bagging、boosting 、stacking
跨多个异构数据源的实体对齐
FCS
15+阅读 · 2019年3月13日
卷积自适应降噪自动编码器
FCS
8+阅读 · 2019年1月3日
基于样本选择的安全图半监督学习方法
一文了解采样方法
AI100
5+阅读 · 2018年7月6日
稀疏&集成的卷积神经网络学习
计算机视觉战队
6+阅读 · 2017年11月16日
Top
微信扫码咨询专知VIP会员