项目名称: 大规模数据聚类的并行进化算法骨架研究

项目编号: No.61163006

项目类型: 地区科学基金项目

立项/批准年度: 2012

项目学科: 自动化技术、计算机技术

项目作者: 万剑怡

作者单位: 江西师范大学

项目金额: 49万元

中文摘要: 现实世界不断增长的海量数据对并行计算提出了更紧迫的要求,基于骨架的并行编程模型因具有良好的可编程性而利于并行计算的普及,然而目前较有影响的MapReduce模型对复杂问题的并行求解并不能充分支持。聚类问题是一个NP难的问题,大规模数据集上的聚类是当前模式识别等应用领域的基本问题之一,只能通过并行(分布式)计算有效求解。本项目将首先研究各种聚类问题及算法,对其可并行性进行形式化分析,重点研究进化算法对聚类问题的近似求解方法,然后应用算法骨架的思想,分析进化聚类算法中可并行实现的公共模式,构造出相应的算法骨架,并在PC集群环境下实现并行进化算法骨架的框架系统。在本框架系统中,用户不需涉及底层并行编程,只需编写骨架参数所需的顺序代码,就可以得到进化聚类算法的并行程序。由于并行骨架的问题无关性,该骨架框架还可扩展应用于开发进化算法求解类似的其他最优化问题的并行程序。

中文关键词: 数据挖掘;大规模数据聚类;并行化;群体智能算法;信息检索

英文摘要:

英文关键词: data mining;large-scale clustering;parallelization;swarm intelligence algorithm;information retrieval

成为VIP会员查看完整内容
0

相关内容

数据挖掘(Data mining)一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的信息和知识的过程。
【NeurIPS 2021】类比进化算法:设计统一的序列模型
专知会员服务
14+阅读 · 2021年10月30日
专知会员服务
14+阅读 · 2021年6月26日
专知会员服务
30+阅读 · 2021年6月24日
专知会员服务
26+阅读 · 2021年6月2日
专知会员服务
44+阅读 · 2020年11月13日
专知会员服务
47+阅读 · 2020年8月27日
大规模时间序列分析框架的研究与实现,计算机学报
专知会员服务
58+阅读 · 2020年7月13日
【元图(Meta-Graph):元学习小样本连接预测】
专知会员服务
62+阅读 · 2020年5月31日
【新书】Python中的经典计算机科学问题,224页PDF
专知会员服务
51+阅读 · 2019年12月31日
腾讯Angel Graph大规模图计算平台
专知
1+阅读 · 2022年4月11日
基于机器学习的自动化网络流量分析
CCF计算机安全专委会
4+阅读 · 2022年4月8日
变分自编码器VAE:一步到位的聚类方案
PaperWeekly
25+阅读 · 2018年9月18日
机器学习之确定最佳聚类数目的10种方法
炼数成金订阅号
13+阅读 · 2017年10月12日
文本聚类:从非结构化数据快速获取见解
Datartisan数据工匠
15+阅读 · 2017年10月12日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
11+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
87+阅读 · 2021年5月17日
Arxiv
15+阅读 · 2021年2月19日
Arxiv
99+阅读 · 2020年3月4日
Arxiv
23+阅读 · 2018年10月24日
小贴士
相关VIP内容
【NeurIPS 2021】类比进化算法:设计统一的序列模型
专知会员服务
14+阅读 · 2021年10月30日
专知会员服务
14+阅读 · 2021年6月26日
专知会员服务
30+阅读 · 2021年6月24日
专知会员服务
26+阅读 · 2021年6月2日
专知会员服务
44+阅读 · 2020年11月13日
专知会员服务
47+阅读 · 2020年8月27日
大规模时间序列分析框架的研究与实现,计算机学报
专知会员服务
58+阅读 · 2020年7月13日
【元图(Meta-Graph):元学习小样本连接预测】
专知会员服务
62+阅读 · 2020年5月31日
【新书】Python中的经典计算机科学问题,224页PDF
专知会员服务
51+阅读 · 2019年12月31日
相关资讯
腾讯Angel Graph大规模图计算平台
专知
1+阅读 · 2022年4月11日
基于机器学习的自动化网络流量分析
CCF计算机安全专委会
4+阅读 · 2022年4月8日
变分自编码器VAE:一步到位的聚类方案
PaperWeekly
25+阅读 · 2018年9月18日
机器学习之确定最佳聚类数目的10种方法
炼数成金订阅号
13+阅读 · 2017年10月12日
文本聚类:从非结构化数据快速获取见解
Datartisan数据工匠
15+阅读 · 2017年10月12日
相关基金
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
11+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员