项目名称: 大规模数据聚类的并行进化算法骨架研究
项目编号: No.61163006
项目类型: 地区科学基金项目
立项/批准年度: 2012
项目学科: 自动化技术、计算机技术
项目作者: 万剑怡
作者单位: 江西师范大学
项目金额: 49万元
中文摘要: 现实世界不断增长的海量数据对并行计算提出了更紧迫的要求,基于骨架的并行编程模型因具有良好的可编程性而利于并行计算的普及,然而目前较有影响的MapReduce模型对复杂问题的并行求解并不能充分支持。聚类问题是一个NP难的问题,大规模数据集上的聚类是当前模式识别等应用领域的基本问题之一,只能通过并行(分布式)计算有效求解。本项目将首先研究各种聚类问题及算法,对其可并行性进行形式化分析,重点研究进化算法对聚类问题的近似求解方法,然后应用算法骨架的思想,分析进化聚类算法中可并行实现的公共模式,构造出相应的算法骨架,并在PC集群环境下实现并行进化算法骨架的框架系统。在本框架系统中,用户不需涉及底层并行编程,只需编写骨架参数所需的顺序代码,就可以得到进化聚类算法的并行程序。由于并行骨架的问题无关性,该骨架框架还可扩展应用于开发进化算法求解类似的其他最优化问题的并行程序。
中文关键词: 数据挖掘;大规模数据聚类;并行化;群体智能算法;信息检索
英文摘要:
英文关键词: data mining;large-scale clustering;parallelization;swarm intelligence algorithm;information retrieval