项目名称: 面向复杂数据基于流形学习的非线性降维算法研究

项目编号: No.61305069

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 自动化技术、计算机技术

项目作者: 陈静

作者单位: 广东工业大学

项目金额: 20万元

中文摘要: 复杂数据集是一种未经过数据预处理的原始数据集。稳健且实用的降维方法的缺乏,已成为严重制约从复杂数据中提取有用信息的重要因素,成为机器学习、数据挖掘和模式识别等领域急待解决的关键问题。本项目以复杂数据集降维所面临的难题为切入点,针对复杂数据集刻画对象特征的指标众多而采样数据可能位于高曲率流形之上,数据集内存在大量的局外点和噪声,部分数据包含标签信息等特殊问题开展研究,使用排除局外点的多流形学习、最小化噪声的流形切空间表示、半监督学习、自适应参数选择等方法,研究一种稳健的基于半监督流形学习的非线性降维算法。本项目的难点和关键问题是数值稳定的流形曲率测度的构建和半监督拓扑约束等距嵌入算法的研究。该项目的成功实施将使非线性降维算法可以应对复杂数据可能面临的各种特殊问题,从而使非线性降维的理论研究具有更好的实际意义。

中文关键词: 流形学习;半监督学习;非线性降维;;

英文摘要: Complex data sets contain raw data without preprocessing. The lack of robust and practical methods for dimensionality reduction makes it very difficult to extract useful information from complex data. It is also the key issue needed to be resolved in areas such as machine learning, data mining, pattern recognition, and so on. The project considers the difficulties of dimensionality reduction for complex data and will conduct researches around the following issues: the intrinsic dimension of complex data is high meanwhile data may be sampled from high curvature manifold; there are a large number of outliers and noise; part of the data contains label information. The project will use the methods including muti-manifold learning method with removing outliers, manifold tangent space representation with minimizing noise, semi-supervised learning, adaptive parameter selection, and so on, and will propose a robust nonlinear dimensionality reduction algorithm based on semi-supervised manifold learning. The difficulties and the key issues of this project are numerically stable measure of manifold curvature and semi-supervised topological constraints isometric embedding algorithm. The successful implementation of the project will enable nonlinear dimensionality reduction algorithm better deal with complex data sets, so th

英文关键词: Manifold learning;Semi-supervised learning;Nonlinear dimensionality reduction;;

成为VIP会员查看完整内容
2

相关内容

流形学习,全称流形学习方法(Manifold Learning),自2000年在著名的科学杂志《Science》被首次提出以来,已成为信息科学领域的研究热点。在理论和应用上,流形学习方法都具有重要的研究意义。假设数据是均匀采样于一个高维欧氏空间中的低维流形,流形学习就是从高维采样数据中恢复低维流形结构,即找到高维空间中的低维流形,并求出相应的嵌入映射,以实现维数约简或者数据可视化。它是从观测到的现象中去寻找事物的本质,找到产生数据的内在规律。
【干货书】Python金融分析,714页pdf掌握数据驱动金融
专知会员服务
94+阅读 · 2021年12月17日
专知会员服务
65+阅读 · 2021年7月18日
专知会员服务
18+阅读 · 2021年5月16日
专知会员服务
122+阅读 · 2021年4月29日
视频人脸识别进展综述
专知会员服务
55+阅读 · 2021年3月12日
专知会员服务
77+阅读 · 2020年12月6日
专知会员服务
45+阅读 · 2020年11月13日
专知会员服务
110+阅读 · 2020年3月20日
新书《面向机器学习和数据分析的特征工程》,419页pdf
专知会员服务
142+阅读 · 2019年10月10日
基于机器学习的自动化网络流量分析
CCF计算机安全专委会
4+阅读 · 2022年4月8日
主成分分析用于可视化(附链接)
大数据文摘
1+阅读 · 2022年3月14日
【PHM算法】PHM算法 | 故障诊断建模方法
产业智能官
66+阅读 · 2020年3月16日
人脸识别技术全面总结:从传统方法到深度学习
算法与数学之美
12+阅读 · 2019年2月27日
基于数据的分布式鲁棒优化算法及其应用【附PPT与视频资料】
人工智能前沿讲习班
26+阅读 · 2018年12月13日
基于二进制哈希编码快速学习的快速图像检索
极市平台
12+阅读 · 2018年5月17日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
3+阅读 · 2022年4月18日
Arxiv
14+阅读 · 2021年8月5日
Arxiv
14+阅读 · 2021年3月10日
Few-shot Learning: A Survey
Arxiv
362+阅读 · 2019年4月10日
A Survey on Deep Learning for Named Entity Recognition
Arxiv
73+阅读 · 2018年12月22日
Arxiv
136+阅读 · 2018年10月8日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
15+阅读 · 2018年2月4日
小贴士
相关VIP内容
【干货书】Python金融分析,714页pdf掌握数据驱动金融
专知会员服务
94+阅读 · 2021年12月17日
专知会员服务
65+阅读 · 2021年7月18日
专知会员服务
18+阅读 · 2021年5月16日
专知会员服务
122+阅读 · 2021年4月29日
视频人脸识别进展综述
专知会员服务
55+阅读 · 2021年3月12日
专知会员服务
77+阅读 · 2020年12月6日
专知会员服务
45+阅读 · 2020年11月13日
专知会员服务
110+阅读 · 2020年3月20日
新书《面向机器学习和数据分析的特征工程》,419页pdf
专知会员服务
142+阅读 · 2019年10月10日
相关资讯
基于机器学习的自动化网络流量分析
CCF计算机安全专委会
4+阅读 · 2022年4月8日
主成分分析用于可视化(附链接)
大数据文摘
1+阅读 · 2022年3月14日
【PHM算法】PHM算法 | 故障诊断建模方法
产业智能官
66+阅读 · 2020年3月16日
人脸识别技术全面总结:从传统方法到深度学习
算法与数学之美
12+阅读 · 2019年2月27日
基于数据的分布式鲁棒优化算法及其应用【附PPT与视频资料】
人工智能前沿讲习班
26+阅读 · 2018年12月13日
基于二进制哈希编码快速学习的快速图像检索
极市平台
12+阅读 · 2018年5月17日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
相关论文
Arxiv
3+阅读 · 2022年4月18日
Arxiv
14+阅读 · 2021年8月5日
Arxiv
14+阅读 · 2021年3月10日
Few-shot Learning: A Survey
Arxiv
362+阅读 · 2019年4月10日
A Survey on Deep Learning for Named Entity Recognition
Arxiv
73+阅读 · 2018年12月22日
Arxiv
136+阅读 · 2018年10月8日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
15+阅读 · 2018年2月4日
微信扫码咨询专知VIP会员