项目名称: 面向特定领域的谱聚类分析技术研究
项目编号: No.60903071
项目类型: 青年科学基金项目
立项/批准年度: 2010
项目学科: 金属学与金属工艺
项目作者: 李侃
作者单位: 北京理工大学
项目金额: 18万元
中文摘要: 互联网技术日益发展的同时,也导致了网上不良信息的大量传播。本项目针对网络不良信息这一特定领域开展谱聚类分析技术研究。设计适于样本外展点的核主成分分析和独立分量分析的谱聚类选择模型,提出基于样本外扩展的多路谱聚类算法,有效解决新增样本点的聚类问题;针对大规模数据,提出基于无填充不完全Cholesky分解的谱聚类算法,解决谱聚类在大规模数据的相似矩阵存储和特征值求解上的难题;研究适合非稳定数据和多类别数据的在线谱聚类算法。对于提出的算法,我们进行算法的性能测试、与最新的相近算法的比较测试来验证算法的性能,并将算法应用于网络不良信息的聚类分析中,以控制和减少网络不良信息。
中文关键词: 谱聚类;样本外扩展;不完全Cholesky分解;并行聚类;在线聚类
英文摘要:
英文关键词: spectral clustering;out-of-sample extension;incomplete Cholesky decomposit;parallel clustering;online clustering