项目名称: 特征选择中的全局最优搜索策略研究

项目编号: No.61202134

项目类型: 青年科学基金项目

立项/批准年度: 2013

项目学科: 计算机科学学科

项目作者: 严慧

作者单位: 南京理工大学

项目金额: 24万元

中文摘要: 特征选择是一门多学科的交叉研究方向,它涉及统计学、数据挖掘、模式识别和机器学习等相关学科,在生物信息学、医学、信息检索等诸多领域具有广泛应用前景。传统的特征选择以代价换取简单、快速的搜索策略实现,不能保证最优,甚至有时获得很不理想的特征子集。本项目以高维空间中的数据为研究对象,以全局最优特征子集的搜索方式为科学问题,深入挖掘特征抽取中的投影方式与特征选择中最优搜索之间的紧密联系,实现了两者在特定条件下的可通行。本项目研究的预期成果是:(1)采用特殊的矩阵投影方式替代传统特征选择流程中的逐渐增加(或删除)特征的搜索路径,力图构造一个存在全局最优解的组合优化问题;(2)定义出与矩阵投影方式相匹配的特征评估准则,包括基于信息熵、稀疏表示理论、图论的度量方式;(3)设计针对0-1大规模稀疏矩阵求解的优化算法。本项目对拓展传统特征搜索理论和算法有十分重要的意义,且具有十分广阔的应用前景。

中文关键词: 特征选择;同步特征选择;最优性;;

英文摘要: Feature selection is a multi-knowledge crossed research direction, since It refers to statistics, data mining, pattern recognition, machine learning and so on. Feature selection has been widely applied to Bioinformatics, medical science, information retrieval and so on. Traditional feature selection is achieved as a simple and fast search strategy, that can not guarantee an optimal solution and sometimes the obtained feature subset is far from perfect. This project, studying data in the high-dimensional space, solves the search solution for the global optimal feature subset. This project explores the relationship between matrix projection in feature extraction and optimal search direction and further proves the equivalence of both under some specified conditions. The anticipated achievements of this project are: (1) Instead of adding (or deleting) one feature gradually in traditional feature selection, this project adopts a special matrix projection. And it tries to construct a combinational optimization problem which has an global optimal solution.(2) This project defines some feature evaluation criterion that match the matrix projection, including evaluation criterions based on information entropy, sparse representation theory, subspace learning.(3) This project designs optimization algorithm for 0-1 large-sc

英文关键词: feature selection;joint feature selection;optimality;;

成为VIP会员查看完整内容
0

相关内容

特征选择( Feature Selection )也称特征子集选择( Feature Subset Selection , FSS ),或属性选择( Attribute Selection )。是指从已有的M个特征(Feature)中选择N个特征使得系统的特定指标最优化,是从原始特征中选择出一些最有效特征以降低数据集维度的过程,是提高学习算法性能的一个重要手段,也是模式识别中关键的数据预处理步骤。对于一个学习算法来说,好的学习样本是训练模型的关键。
机器学习必读新书-《凸优化算法原理详解》,334页pdf
专知会员服务
97+阅读 · 2022年1月4日
专知会员服务
56+阅读 · 2021年9月18日
专知会员服务
49+阅读 · 2021年8月4日
专知会员服务
22+阅读 · 2021年7月31日
专知会员服务
36+阅读 · 2021年6月16日
【CVPR2021】面向视频动作分割的高效网络结构搜索
专知会员服务
14+阅读 · 2021年3月14日
基于机器学习的数据库技术综述
专知会员服务
55+阅读 · 2021年1月2日
WXG招搜索/图学习算法工程师
图与推荐
0+阅读 · 2021年12月17日
微信搜索招聘内容策略算法工程师!
夕小瑶的卖萌屋
0+阅读 · 2021年10月22日
赶紧收藏!西瓜书《机器学习》完整笔记来了
大数据技术
29+阅读 · 2019年8月24日
基于二进制哈希编码快速学习的快速图像检索
极市平台
12+阅读 · 2018年5月17日
xgboost特征选择
数据挖掘入门与实战
39+阅读 · 2017年10月5日
手把手教你用LDA特征选择
AI研习社
12+阅读 · 2017年8月21日
机器学习(4)之线性判别式(附Python源码)
机器学习算法与Python学习
13+阅读 · 2017年7月11日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Directional Graph Networks
Arxiv
27+阅读 · 2020年12月10日
小贴士
相关VIP内容
机器学习必读新书-《凸优化算法原理详解》,334页pdf
专知会员服务
97+阅读 · 2022年1月4日
专知会员服务
56+阅读 · 2021年9月18日
专知会员服务
49+阅读 · 2021年8月4日
专知会员服务
22+阅读 · 2021年7月31日
专知会员服务
36+阅读 · 2021年6月16日
【CVPR2021】面向视频动作分割的高效网络结构搜索
专知会员服务
14+阅读 · 2021年3月14日
基于机器学习的数据库技术综述
专知会员服务
55+阅读 · 2021年1月2日
相关资讯
WXG招搜索/图学习算法工程师
图与推荐
0+阅读 · 2021年12月17日
微信搜索招聘内容策略算法工程师!
夕小瑶的卖萌屋
0+阅读 · 2021年10月22日
赶紧收藏!西瓜书《机器学习》完整笔记来了
大数据技术
29+阅读 · 2019年8月24日
基于二进制哈希编码快速学习的快速图像检索
极市平台
12+阅读 · 2018年5月17日
xgboost特征选择
数据挖掘入门与实战
39+阅读 · 2017年10月5日
手把手教你用LDA特征选择
AI研习社
12+阅读 · 2017年8月21日
机器学习(4)之线性判别式(附Python源码)
机器学习算法与Python学习
13+阅读 · 2017年7月11日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员