项目名称: 大数据环境下基于群体协同智能聚类的关键技术研究

项目编号: No.61472049

项目类型: 面上项目

立项/批准年度: 2015

项目学科: 其他

项目作者: 韩旭明

作者单位: 长春工业大学

项目金额: 80万元

中文摘要: 综合考虑大数据环境下海量数据的分析和处理需求,从理论和实验验证两方面进行深入研究。以影响聚类性能的关键因素:聚(簇)类中心、距离度量方法、相似度算子、聚类时间复杂度等作为研究重点,并结合近年不断涌现的新型群体智能算法,对其进行理论创新和改进。主要内容包括:(1)超大规模数据随机选取与抽样数据聚类稳定性研究;(2)多群体协同智能聚(簇)类中心研究;(3)相似度度量方法研究;(4)多群体协同智能进化策略研究。通过理论改进与创新,实现对构建高效聚类算法关键技术的有效解决方案;(5)在此基础上,提出阶段群体协同智能聚类算法。通过群体协同智能算法快速搜索,确定和初始化聚(簇)类中心;通过多群体协同智能进化策略,实现高效的簇内数据分布式聚类;(6)最终形成一个系统的、大数据环境下多群体协同智能聚类模型。丰富与发展基于海量数据的数据挖掘理论与算法,对智能理论研究及其在数据挖掘领域聚类研究具有重要意义。

中文关键词: 大数据;群体智能;协同进化;聚类;优化

英文摘要: With comprehensive consideration of the analysis and processing of massive data in big data environment, thorough theoretical and experimental researches were done in this study in search of new clustering methods. The researches focused on the key factors influencing clustering performance, such as cluster center, distance measure method, clustering number, similarity operator, time complexity etc. Theoretical innovation and optimization were performed by using the new swarm intelligence algorithms emerging in recent years. Its main content including: (1) The study on clustering stability of random selection and sample for super-scale data. (2) The center study of collaborative multi-swarm intelligent clustering. (3) The study of similarity measurement. (4) The strategy study of collaborative multi-swarm intelligent evolution. Through theoretical improvement and innovation, we implemented an effective solution to tackle with the key technology in building effective clustering algorithms. (5) Based on this, we also propose the clustering algorithm of collaborative multi-swarm intelligent with stage. Though the swift searching using collaborative multi-swarm intelligent clustering algorithm, we are able to determine and initialize the clustering centers; and through the collaborative multi-swarm intelligent evolution strategy, we are able to realize the distributed inner-clustering clustering.(6) Eventually, a systematic cooperative swarm intelligence clustering model that runs in big data was established. This study can enrich and expand the massive data -based theories and algorithms of data mining, and it is of practical meanings to the theoretical researches on intelligence and their clustering in the data mining field.

英文关键词: Big data;swarm intelligence;cooperative evolution;clustering;optimization

成为VIP会员查看完整内容
3

相关内容

从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术。明白这一点至关重要,也正是这一点促使该技术具备走向众多企业的潜力。大数据的4个“V”,或者说特点有四个层面:第一,数据体量巨大。从TB级别,跃升到PB级别;第二,数据类型繁多。前文提到的网络日志、视频、图片、地理位置信息等等。第三,价值密度低。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。第四,处理速度快。
中国信通院《新型智慧城市产业图谱研究报告》
专知会员服务
31+阅读 · 2022年3月9日
空间数据智能:概念、技术与挑战
专知会员服务
85+阅读 · 2022年2月3日
智能视频监控关键技术:行人再识别研究综述
专知会员服务
38+阅读 · 2021年12月30日
智能无人集群系统发展白皮书
专知会员服务
295+阅读 · 2021年12月20日
【博士论文】开放环境下的度量学习研究
专知会员服务
46+阅读 · 2021年12月4日
专知会员服务
24+阅读 · 2021年6月17日
专知会员服务
80+阅读 · 2020年6月20日
专知会员服务
123+阅读 · 2020年3月26日
【报名】TF52:智慧、融合、安全——智能科技车与路
中国计算机学会
0+阅读 · 2022年4月13日
基于机器学习的自动化网络流量分析
CCF计算机安全专委会
4+阅读 · 2022年4月8日
微信AI的高性能检测器,让识图更精准
微信AI
0+阅读 · 2021年4月22日
支持个性化学习的行为大数据可视化研究
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
19+阅读 · 2018年11月27日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
无人机集群对抗研究的关键问题
无人机
55+阅读 · 2018年9月16日
干货 :基于用户画像的聚类分析
数据分析
22+阅读 · 2018年5月17日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
3+阅读 · 2022年4月18日
Arxiv
14+阅读 · 2021年3月10日
Arxiv
32+阅读 · 2021年3月8日
Hierarchical Graph Capsule Network
Arxiv
20+阅读 · 2020年12月16日
Arxiv
11+阅读 · 2018年4月25日
小贴士
相关VIP内容
中国信通院《新型智慧城市产业图谱研究报告》
专知会员服务
31+阅读 · 2022年3月9日
空间数据智能:概念、技术与挑战
专知会员服务
85+阅读 · 2022年2月3日
智能视频监控关键技术:行人再识别研究综述
专知会员服务
38+阅读 · 2021年12月30日
智能无人集群系统发展白皮书
专知会员服务
295+阅读 · 2021年12月20日
【博士论文】开放环境下的度量学习研究
专知会员服务
46+阅读 · 2021年12月4日
专知会员服务
24+阅读 · 2021年6月17日
专知会员服务
80+阅读 · 2020年6月20日
专知会员服务
123+阅读 · 2020年3月26日
相关资讯
【报名】TF52:智慧、融合、安全——智能科技车与路
中国计算机学会
0+阅读 · 2022年4月13日
基于机器学习的自动化网络流量分析
CCF计算机安全专委会
4+阅读 · 2022年4月8日
微信AI的高性能检测器,让识图更精准
微信AI
0+阅读 · 2021年4月22日
支持个性化学习的行为大数据可视化研究
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
19+阅读 · 2018年11月27日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
无人机集群对抗研究的关键问题
无人机
55+阅读 · 2018年9月16日
干货 :基于用户画像的聚类分析
数据分析
22+阅读 · 2018年5月17日
相关基金
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员