项目名称: 不确定性数据流自适应聚类分析及演化分析方法研究

项目编号: No.61202274

项目类型: 青年科学基金项目

立项/批准年度: 2013

项目学科: 计算机科学学科

项目作者: 杨悦

作者单位: 哈尔滨工程大学

项目金额: 25万元

中文摘要: 为迎合当前军事、经济、电信及科学计算等关键领域对其广泛涌现的不确定性数据流数据分析处理的强烈需求,本课题研究适合的不确定性数据流聚类分析及聚类演化分析方法,具有重要的理论价值和现实意义。课题开创性地研究基于Shannon熵超椭球体指标的不确定性度量方法,实现数据不确定性程度的量化描述,并在此基础上构建新的不确定性数据流模型,继而研究该模型下基于不确定加权密度树的不确定性数据流网格密度自适应聚类分析方法;同时研究基于聚类分布密度指标的不确定性数据流聚类有效性评价方法,并利用密度指数直方图实现最佳聚类数目的确定;课题创新性地研究基于灰度马尔可夫预测模型的聚类演化分析技术,实现不确定性数据流聚类演化过程的实时追踪与分析。本课题旨在通过以上研究,实现对不确定性数据流这一新兴重要数据形式进行高效准确的聚类分析处理,并通过聚类演化分析为不确定性数据流事件检测方法研究提供新的思路和探索。

中文关键词: 聚类分析;不确定性数据流;不确定性度量;衰减窗口;直方图

英文摘要: The research of clustering analysis and clustering evolution analysis method on uncertain data stream in this project is conducted in order to meet the data analysis strong demand on uncertain data stream which widespreadly emerge as the new data form in areas of economic, military, telecommunications and computing science, etc. This research project has important theoretical value and practical significance. The new uncertainty measure method based on Shannon entropy ellipsoid index multi-dimensional expanding will be researched to describe data uncertainty degree quantitatively. The uncertain data stream will construct new model under the uncertainty degree. Then we will research the method of uncertain data stream self-adaptive clustering method based on grid-density under the uncertain weighted density tree structure. At the same time, the clustering validity evaluation method will be researched based on clustering distribution density index which is organically combine of cluster compactness, inter-cluster separation degree and uncertainty. And determine the optimal number of clustering by density index histogram. This project will research clustering evolution analysis method innovatively based on gray Markov prediction model to tracking and analysis the clustering evolution process of uncertain data strea

英文关键词: Clustering Analysis;Uncertain data Stream;Uncertainty Measurement;Attenuation Window;Histogram

成为VIP会员查看完整内容
0

相关内容

聚类分析(Clustering)是无监督学习的一种,目的是将一组数据点分类,但没有训练数据集,区别于有监督的分类分析(Classification)。
算法分析导论, 593页pdf
专知会员服务
151+阅读 · 2021年8月30日
专知会员服务
53+阅读 · 2021年8月29日
专知会员服务
90+阅读 · 2021年7月9日
《多任务学习》最新综述论文,20页pdf
专知会员服务
124+阅读 · 2021年4月6日
专知会员服务
145+阅读 · 2021年2月3日
最新《时序数据分析》书稿,512页pdf
专知会员服务
113+阅读 · 2020年12月25日
【斯坦福经典书】统计学稀疏性:Lasso与泛化性,362页pdf
专知会员服务
37+阅读 · 2020年11月15日
最新【图神经网络计算】2020综述论文,23页PDF
专知会员服务
193+阅读 · 2020年10月3日
高效医疗图像分析的统一表示
专知会员服务
35+阅读 · 2020年6月23日
本科生的NeurIPS'21, 多视角对比图聚类
图与推荐
0+阅读 · 2021年11月1日
一文读懂机器学习模型的选择与取舍
DBAplus社群
13+阅读 · 2019年8月25日
用户研究:如何做用户画像分析
产品100干货速递
44+阅读 · 2019年5月9日
R语言数据挖掘利器:Rattle包
R语言中文社区
21+阅读 · 2018年11月17日
干货 :基于用户画像的聚类分析
数据分析
22+阅读 · 2018年5月17日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2010年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月15日
小贴士
相关VIP内容
算法分析导论, 593页pdf
专知会员服务
151+阅读 · 2021年8月30日
专知会员服务
53+阅读 · 2021年8月29日
专知会员服务
90+阅读 · 2021年7月9日
《多任务学习》最新综述论文,20页pdf
专知会员服务
124+阅读 · 2021年4月6日
专知会员服务
145+阅读 · 2021年2月3日
最新《时序数据分析》书稿,512页pdf
专知会员服务
113+阅读 · 2020年12月25日
【斯坦福经典书】统计学稀疏性:Lasso与泛化性,362页pdf
专知会员服务
37+阅读 · 2020年11月15日
最新【图神经网络计算】2020综述论文,23页PDF
专知会员服务
193+阅读 · 2020年10月3日
高效医疗图像分析的统一表示
专知会员服务
35+阅读 · 2020年6月23日
相关基金
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2010年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员