项目名称: 面向不平衡分类任务的主动学习方法研究

项目编号: No.61305058

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 自动化技术、计算机技术

项目作者: 于化龙

作者单位: 江苏科技大学

项目金额: 23万元

中文摘要: 主动学习是机器学习及数据挖掘领域研究的重要方向之一,该技术通过主动选择学习样例的方式,可降低学习算法的样本复杂度,从而减少手工标注的代价。然而,当将传统的主动学习算法应用于不平衡分类任务时,其学习过程可能会受到无标记样本不平衡分布的影响,使算法难以获得令人满意的学习效果。本项目分别根据数据池和数据流等两类不平衡分类任务各自的特点,从"查询样本"的选择﹑学习过程的"平衡控制"及学习停止条件的判定等三个影响主动学习性能的关键步骤入手,研究可缓解不平衡样本分布影响的有效策略,进而提出适用于不平衡分类任务的主动学习算法。此外,还将根据多类不平衡分类任务自身的结构特点,扩展已有的研究成果,提出具有针对性的面向多类不平衡分类任务的主动学习算法。项目的研究成果有望在金融欺诈检测﹑网络入侵检测﹑垃圾邮件过滤、文本分类﹑视频监控及生物信息学等多个领域得到实际应用,因此具有较重要的理论与应用价值。

中文关键词: 类别不平衡学习;主动学习;不确定性度量;决策输出补偿;集成学习

英文摘要: Active learning is one of major research fields in machine learning and data mining. It can reduce the sample complex by actively selecting the samples to learn,further reduce label costs by human.However, traditional active learning algorithms often fail to produce excellent enough classification performance for skewed classification tasks, due to its learning process will be destroyed by imbalanced unlabeled sample distribution. This project will first analyze the features of pool-based and stream-based imbalanced classification tasks, respectively. Then the project will research the strategies to alleviate the effect of class imbalance from three aspects, which correspond to three key procedures in active learning: query sample selection, balance control and stopping decision. Based on the work above, an effective active learning algorithm, which is specifically designed for imbalanced classification tasks with unbabeled samples, can be proposed. Furthermore, this project will also investigate the structure features of multiclass imbalanced classification tasks and present effective active learning algorithms. The research findings can be widely applied in many real fields, including financial fraud detection, network intrusion detection, spam filtering, video monitoring, Bioinformatics etc., thus this resear

英文关键词: class imbalance learning;active learning;uncertainty measurement;decision output compensation;ensemble learning

成为VIP会员查看完整内容
4

相关内容

主动学习是机器学习(更普遍的说是人工智能)的一个子领域,在统计学领域也叫查询学习、最优实验设计。“学习模块”和“选择策略”是主动学习算法的2个基本且重要的模块。 主动学习是“一种学习方法,在这种方法中,学生会主动或体验性地参与学习过程,并且根据学生的参与程度,有不同程度的主动学习。” (Bonwell&Eison 1991)Bonwell&Eison(1991) 指出:“学生除了被动地听课以外,还从事其他活动。” 在高等教育研究协会(ASHE)的一份报告中,作者讨论了各种促进主动学习的方法。他们引用了一些文献,这些文献表明学生不仅要做听,还必须做更多的事情才能学习。他们必须阅读,写作,讨论并参与解决问题。此过程涉及三个学习领域,即知识,技能和态度(KSA)。这种学习行为分类法可以被认为是“学习过程的目标”。特别是,学生必须从事诸如分析,综合和评估之类的高级思维任务。
【AAAI2022】领域自适应的主动学习:一种基于能量的方法
专知会员服务
43+阅读 · 2021年12月6日
重邮高新波等最新《少样本目标检测算法》综述论文
专知会员服务
32+阅读 · 2021年11月2日
最新《计算机视觉持续学习进展》综述论文,22页pdf
专知会员服务
71+阅读 · 2021年9月25日
专知会员服务
95+阅读 · 2021年5月25日
领域自适应研究综述
专知会员服务
54+阅读 · 2021年5月5日
《多任务学习》最新综述论文,20页pdf
专知会员服务
123+阅读 · 2021年4月6日
【AAAI2021】基于双任务一致性的半监督医学图像分割
专知会员服务
30+阅读 · 2021年2月7日
专知会员服务
108+阅读 · 2020年10月27日
专知会员服务
29+阅读 · 2020年9月18日
基于深度神经网络的少样本学习综述
专知会员服务
169+阅读 · 2020年4月22日
机器学习中原型学习研究进展
专知
0+阅读 · 2022年1月18日
主动学习(Active Learning)概述及最新研究
PaperWeekly
2+阅读 · 2022年1月6日
【博士论文】开放环境下的度量学习研究
专知
7+阅读 · 2021年12月4日
领域自适应研究综述
专知
6+阅读 · 2021年5月5日
深度学习与计算机视觉任务应用综述
深度学习与NLP
50+阅读 · 2018年12月18日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
22+阅读 · 2018年8月30日
小贴士
相关VIP内容
【AAAI2022】领域自适应的主动学习:一种基于能量的方法
专知会员服务
43+阅读 · 2021年12月6日
重邮高新波等最新《少样本目标检测算法》综述论文
专知会员服务
32+阅读 · 2021年11月2日
最新《计算机视觉持续学习进展》综述论文,22页pdf
专知会员服务
71+阅读 · 2021年9月25日
专知会员服务
95+阅读 · 2021年5月25日
领域自适应研究综述
专知会员服务
54+阅读 · 2021年5月5日
《多任务学习》最新综述论文,20页pdf
专知会员服务
123+阅读 · 2021年4月6日
【AAAI2021】基于双任务一致性的半监督医学图像分割
专知会员服务
30+阅读 · 2021年2月7日
专知会员服务
108+阅读 · 2020年10月27日
专知会员服务
29+阅读 · 2020年9月18日
基于深度神经网络的少样本学习综述
专知会员服务
169+阅读 · 2020年4月22日
相关基金
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员