项目名称: 基于核、正则化与多目标优化技术的多标签分类算法及其应用研究

项目编号: No.60875001

项目类型: 面上项目

立项/批准年度: 2009

项目学科: 生物科学

项目作者: 许建华

作者单位: 南京师范大学

项目金额: 30万元

中文摘要: 多标签分类是指样本可以同时属于多个类别(或标签)的模式识别问题,其训练样本集包含着样本向量之间的相关信息、样本向量与标签之间的一对多映射关系及标签之间的相关信息。本项目利用核、正则化与多目标优化技术将这些信息融合到新的多标签分类算法。提出带零标签的高效多标签支持向量机,其训练速度在Yeast数据集上比著名的Rank-SVM算法快11倍以上,且不需要额外的线性回归阈值函数。利用样本的标签相关性,提出扩展的一对多多标签支持向量机来改善原始对应算法的性能。基于多目标进化优化算法NSGAII,构建基于双目标优化的多标签分类核算法。在数据集一对一分解后,保留子集中的双标签样本来刻画成对标签之间的相关性,构造双标签支持向量机与最小二乘支持向量机,然后提出两个基于一对一分解的多标签分类算法。综合逐类分解技术与支持向量数据描述算法,建立最快速的多标签核算法。为了反映样本集的样本多样性,提出带自适应权值估计的加权k近邻多标签算法。构造两个生物学应用的新多标签数据集。提供部分软件与数据集的下载,供国内外学者使用。本项目的研究使我们更好地理解和处理多标签问题,进一步拓展了模式识别理论与应用。

中文关键词: 多标签分类; 算法扩展; 数据分解; 支持向量机; 多目标优化

英文摘要: Multi-label classification is a special pattern recognition issue where some instances possibly belong to many classes (or labels) simultaneously. Its training sets involve correlation information among instance vectors and among labels, and one-to-many mapping relation from instance vectors to labels. In this project, several novel multi-label classification approaches are designed and implemented to integrate these kinds of information hidden in training sets using kernel, regularization and multi-objective optimization techniques. An efficient multi-label support vector machine without an additional linear regression threshold function is proposed, whose training procedure is at least 11 times faster than that of famouse Rank-SVM on Yeast data set. On the basis of label correlation of instances, an extended one-versus-rest support vector machine is presented to improve the classification performance of its original form. Based on multi-objective evolution optimization algorithm NSGAII, a double-objective optimization multi-label kernel method is introduced. To characterize pairwise label correlation, the double-label instances are utilized after a training set is divided into several two-class subsets in a pairwise way. Doule-label support vector machine and least squares support vector machine are built, and then two corresponding multi-label classification techniques are constructed. Combining one-by-one data decomposition trick with support vector data description, a fastest multi-label kernel machine is presented. To reflect instance diversity of training sets, we introduce weighted k-nearest neighbor method with an adaptive weight estimation. Two new biological multi-label data sets are constructed. Several software and data sets could be downloaded from our lab homepage, which could be used free for academic purpose. These researches let us understand and handle multi-label classification problems much better now than before, which develops pattern recognition theory and its applications further.

英文关键词: multi-label classification; algorithm extension; data decomposition; support vector machine; multi-objective optimization

成为VIP会员查看完整内容
1

相关内容

基于深度学习的图像目标检测算法综述
专知会员服务
97+阅读 · 2022年4月15日
专知会员服务
11+阅读 · 2021年7月16日
专知会员服务
16+阅读 · 2021年7月13日
专知会员服务
28+阅读 · 2021年6月7日
专知会员服务
29+阅读 · 2021年4月12日
专知会员服务
77+阅读 · 2020年12月6日
专知会员服务
42+阅读 · 2020年7月29日
专知会员服务
41+阅读 · 2020年2月20日
基于深度学习的图像目标检测算法综述
专知
2+阅读 · 2022年4月16日
约束进化算法及其应用研究综述
专知
0+阅读 · 2021年4月12日
最全综述:基于深度学习的三维重建算法
极市平台
12+阅读 · 2020年3月17日
标签间相关性在多标签分类问题中的应用
人工智能前沿讲习班
22+阅读 · 2019年6月5日
从最优化的角度看待 Softmax 损失函数
极市平台
31+阅读 · 2019年2月21日
Meta-Learning 元学习:学会快速学习
专知
24+阅读 · 2018年12月8日
目标跟踪算法分类
算法与数据结构
20+阅读 · 2018年9月28日
【深度学习基础】1.监督学习和最优化
微信AI
0+阅读 · 2017年6月7日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
13+阅读 · 2022年1月20日
Arxiv
12+阅读 · 2021年11月1日
Arxiv
21+阅读 · 2020年10月11日
Deformable Style Transfer
Arxiv
14+阅读 · 2020年3月24日
小贴士
相关VIP内容
基于深度学习的图像目标检测算法综述
专知会员服务
97+阅读 · 2022年4月15日
专知会员服务
11+阅读 · 2021年7月16日
专知会员服务
16+阅读 · 2021年7月13日
专知会员服务
28+阅读 · 2021年6月7日
专知会员服务
29+阅读 · 2021年4月12日
专知会员服务
77+阅读 · 2020年12月6日
专知会员服务
42+阅读 · 2020年7月29日
专知会员服务
41+阅读 · 2020年2月20日
相关资讯
基于深度学习的图像目标检测算法综述
专知
2+阅读 · 2022年4月16日
约束进化算法及其应用研究综述
专知
0+阅读 · 2021年4月12日
最全综述:基于深度学习的三维重建算法
极市平台
12+阅读 · 2020年3月17日
标签间相关性在多标签分类问题中的应用
人工智能前沿讲习班
22+阅读 · 2019年6月5日
从最优化的角度看待 Softmax 损失函数
极市平台
31+阅读 · 2019年2月21日
Meta-Learning 元学习:学会快速学习
专知
24+阅读 · 2018年12月8日
目标跟踪算法分类
算法与数据结构
20+阅读 · 2018年9月28日
【深度学习基础】1.监督学习和最优化
微信AI
0+阅读 · 2017年6月7日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员