题目: CAST: A Correlation-based Adaptive Spectral Clustering Algorithm on Multi-scale Data
摘要:
本文研究了利用光谱聚类方法对多尺度数据进行聚类的问题。传统的光谱聚类技术通过处理一个反映物体接近度的相似矩阵来发现聚类。对于多尺度数据,基于距离的相似度是无效的,因为稀疏聚类的对象可能相距很远,而密集聚类的对象必须足够近。可以通过将物体的“可达相似性”概念与给定的基于距离的相似性相结合,得到物体的系数矩阵,解决了多尺度数据的光谱聚类问题。本文提出了利用轨迹套索对系数矩阵进行正则化的算法CAST。证明了所得到的系数矩阵具有“分组效应”和“稀疏性”。我们表明,这两个特征意味着非常有效的光谱聚类。我们评估CAST和其它10种聚类方法在广泛的数据集w.r.t.各种应用。实验结果表明,该算法在多尺度数据的测试用例中具有良好的鲁棒性。