项目名称: 海量高维天体光谱数据挖掘及其并行化研究

项目编号: No.61272263

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 自动化技术、计算机技术

项目作者: 张继福

作者单位: 太原科技大学

项目金额: 80万元

中文摘要: 本项目针对国家重大科学工程LAMOST项目的三大科学任务,围绕拟解决的关键科学问题"寻找具有示踪性质的特殊天体以及宇宙未知规律的认识",对海量高维天体光谱数据挖掘及其并行化技术进行研究,主要研究内容包括:基于子空间和属性相关性的海量高维局部离群数据挖掘算法及其并行化;基于地址表和FIUT树结构的频繁模式挖掘算法及其并行化;面向天体光谱数据的关联规则约简与表示;集群环境下的数据挖掘算法性能优化与负载均衡;海量高维天体光谱离群数据并行挖掘技术;基于关联规则的海量高维天体光谱数据相关性分析并行化技术;Hadoop环境下的天体光谱数据挖掘系统。该课题的研究不仅为海量高维数据挖掘,拟提出一种有效的方法和途径,而且也可望为进一步提高LAMOST的科学产出,实现未知特殊天体光谱数据和天文规律的知识发现,以及未知特殊天体的交叉认证,提供核心支撑技术。

中文关键词: 海量高维数据挖掘;天体光谱;频繁模式;局部离群数据;并行化

英文摘要: Aiming at three major science tasks of the great national science engineering project LAMOST,this project makes research on massive and high dimensional data mining of celestial spectra data and its parallel technology around the key scientific issue which is "Looking for the special celestial body with tracing properties and the universe awareness of unknown laws". The main research work is as follow: Local outlier mining algorithm of massive and high dimensional data set and its parallelization based on subspace and attribute correlation analysis; Frequent pattern mining algorithm and its parallelization based on address table and FIUT tree structure; Celestial body spectrum-oriented reduction and representation of association rule; Performance optimization of data mining algorithms and load balancing under the cluster environments; Parallel oulier mining technology of massive and high dimensional celestial spectra ; The parallelization technology of correlation analysis of massive and high dimensional celestial spectra data based on association rule; Celestial spectra data mining system under Hadoop environments. The research on the project not only affords effective ways and means for massive and high dimensional data mining, but also further provides core support technologies for improving the scientific o

英文关键词: Massive and High Dimensional Data Mining;Celestial Spectrum;Frequent Pattern;Local Oultier;Parallelization

成为VIP会员查看完整内容
0

相关内容

数据价值释放与隐私保护计算应用研究报告,64页pdf
专知会员服务
39+阅读 · 2021年11月29日
【Manning新书】高级算法与数据结构,769页pdf
专知会员服务
185+阅读 · 2021年11月12日
专知会员服务
85+阅读 · 2021年8月8日
专知会员服务
51+阅读 · 2021年1月19日
专知会员服务
49+阅读 · 2020年8月27日
【经典书】统计学,806页pdf,解锁数据的力量
专知会员服务
79+阅读 · 2020年8月12日
基于知识图谱的推荐系统研究综述
专知会员服务
327+阅读 · 2020年8月10日
【电子书】大数据挖掘,Mining of Massive Datasets,附513页PDF
专知会员服务
103+阅读 · 2020年3月22日
机器学习中原型学习研究进展
专知
0+阅读 · 2022年1月18日
综述 | 异质信息网络分析与应用综述
专知
27+阅读 · 2020年8月8日
海量文本求topk相似:faiss库初探
AINLP
19+阅读 · 2020年5月29日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
红外弱小目标处理研究获进展
中科院之声
17+阅读 · 2017年11月19日
关于数据挖掘,有几本书推荐给你......
图灵教育
16+阅读 · 2017年10月11日
【大数据】数据挖掘与数据分析知识流程梳理
产业智能官
12+阅读 · 2017年9月22日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Antipatterns in Software Classification Taxonomies
Arxiv
0+阅读 · 2022年4月19日
Arxiv
13+阅读 · 2019年1月26日
Arxiv
11+阅读 · 2018年4月25日
小贴士
相关VIP内容
数据价值释放与隐私保护计算应用研究报告,64页pdf
专知会员服务
39+阅读 · 2021年11月29日
【Manning新书】高级算法与数据结构,769页pdf
专知会员服务
185+阅读 · 2021年11月12日
专知会员服务
85+阅读 · 2021年8月8日
专知会员服务
51+阅读 · 2021年1月19日
专知会员服务
49+阅读 · 2020年8月27日
【经典书】统计学,806页pdf,解锁数据的力量
专知会员服务
79+阅读 · 2020年8月12日
基于知识图谱的推荐系统研究综述
专知会员服务
327+阅读 · 2020年8月10日
【电子书】大数据挖掘,Mining of Massive Datasets,附513页PDF
专知会员服务
103+阅读 · 2020年3月22日
相关资讯
机器学习中原型学习研究进展
专知
0+阅读 · 2022年1月18日
综述 | 异质信息网络分析与应用综述
专知
27+阅读 · 2020年8月8日
海量文本求topk相似:faiss库初探
AINLP
19+阅读 · 2020年5月29日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
红外弱小目标处理研究获进展
中科院之声
17+阅读 · 2017年11月19日
关于数据挖掘,有几本书推荐给你......
图灵教育
16+阅读 · 2017年10月11日
【大数据】数据挖掘与数据分析知识流程梳理
产业智能官
12+阅读 · 2017年9月22日
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员