项目名称: 基于半监督学习的聚类集成机理及高效算法研究
项目编号: No.61170111
项目类型: 面上项目
立项/批准年度: 2012
项目学科: 自动化技术、计算机技术
项目作者: 杨燕
作者单位: 西南交通大学
项目金额: 55万元
中文摘要: 对半监督聚类集成的机理与关键技术进行系统研究,探索半监督聚类集成的理论基础及通用的学习模型,进而设计其高效算法及并行优化方法。研究内容包括五部分:1.建立有效的半监督聚类集成的理论基础,研究半监督聚类集成中的鲁棒性和稳定性等问题;2.构建满足鲁棒性和稳定性的半监督聚类集成通用模型,运用选择性和加权等策略,优选聚类分量,并以约束信息为指导,设计出性能更优的半监督共识函数;3.研究半监督聚类多样性分量的产生方法和聚类差异性的度量方法,以及它们对聚类集成性能的影响;4.分析聚类集成的影响因素,探讨聚类集成的最佳时机;5.研究半监督聚类集成模型处理海量数据的高效算法及其并行优化方法。这些问题的解决,对于改善聚类质量,充分体现半监督聚类集成在解决大规模复杂数据问题中的优势,完善集成学习和半监督学习的理论与方法,提高数据挖掘与知识发现的性能和拓展半监督聚类集成的应用领域等有重要意义。
中文关键词: 半监督学习;聚类集成;并行优化;聚类多样性;
英文摘要:
英文关键词: Semi-supervised learning;Clustering ensemble;Parallel optimization;Clustering diversity;