项目名称: 基于算法选择的聚类统一框架研究
项目编号: No.61175054
项目类型: 面上项目
立项/批准年度: 2012
项目学科: 自动化技术、计算机技术
项目作者: 钟才明
作者单位: 宁波大学
项目金额: 56万元
中文摘要: 聚类分析是数据挖掘、模式识别、机器学习等研究领域对数据进行分析的重要工具之一。目前文献中各类聚类算法层出不穷,但通常一个算法只适合处理某类(或某几类)数据集,且用户对拟分析的数据并不具有先验知识,这导致实际应用中用户难以选择相对适合的聚类算法。研究者试图用多目标优化、集成学习等方法解决之,虽然这些方法在一定程度上提高了聚类方法的普适性,但仍存在方法复杂、稳定性差等缺点。本项目拟用算法选择的方法解决该问题。其思路为:1)构建经典聚类算法空间与典型数据集空间;2)建立数据集空间到算法空间的映射;3)定义数据集之间的相似性测度,并根据该测度将输入数据集分类,从而完成聚类算法的自动选择。其中最关键的科学问题是定义面向聚类算法的数据集之间的相似性测度。本项目的研究不仅仅为解决聚类算法的选择问题,还可以推广应用到分类算法的选择,并力争将聚类分析的框架成功应用到基因表达数据的处理。
中文关键词: 聚类集成;多目标优化聚类;数据集相似性;算法选择;
英文摘要:
英文关键词: Clustering ensemble;Multiple-objective clustering;Dataset similarity;Algorithm selection;