项目名称: 特异群组挖掘算法研究
项目编号: No.61170096
项目类型: 面上项目
立项/批准年度: 2012
项目学科: 计算机科学学科
项目作者: 朱扬勇
作者单位: 复旦大学
项目金额: 56万元
中文摘要: 特异群组挖掘是一种新的数据挖掘任务,应用领域广泛,具有重要的应用价值。聚类、异常挖掘和特异群组挖掘属于根据数据对象的相似性来划分数据集的数据挖掘问题。其中,聚类是将大部分具有相似性的数据对象分到若干个簇中的过程;异常挖掘发现数据集当中明显不同于大部分对象(具有相似性)的数据对象;而特异群组挖掘是发现数据集当中明显不同于大部分数据对象(不具有相似性)的数据对象,其在问题定义、算法设计和应用效果都不同于聚类和异常挖掘,不能由现有的聚类、异常等数据挖掘技术实现。本项目在课题组前期工作的基础上,研究特异群组挖掘问题的形式化并设计特异群组挖掘算法,建立一个特异群组挖掘理论体系。主要研究内容包括:①特异群组挖掘问题的形式化;②特异群组的特异性度量的定义;③特异群组挖掘算法的设计;④BenchMark数据集的建立。本项目研究成果将为特异群组挖掘技术研究和应用奠定理论基础。
中文关键词: 特异群组挖掘;大数据;数据挖掘;相似性;异常
英文摘要:
英文关键词: abnormal groups mining;big data;data mining;similarity;outlier