In this paper, we propose an ensemble learning algorithm named \textit{bagged $k$-distance for mode-based clustering} (\textit{BDMBC}) by putting forward a new measurement called the \textit{probability of localized level sets} (\textit{PLLS}), which enables us to find all clusters for varying densities with a global threshold. On the theoretical side, we show that with a properly chosen number of nearest neighbors $k_D$ in the bagged $k$-distance, the sub-sample size $s$, the bagging rounds $B$, and the number of nearest neighbors $k_L$ for the localized level sets, BDMBC can achieve optimal convergence rates for mode estimation. It turns out that with a relatively small $B$, the sub-sample size $s$ can be much smaller than the number of training data $n$ at each bagging round, and the number of nearest neighbors $k_D$ can be reduced simultaneously. Moreover, we establish optimal convergence results for the level set estimation of the PLLS in terms of Hausdorff distance, which reveals that BDMBC can find localized level sets for varying densities and thus enjoys local adaptivity. On the practical side, we conduct numerical experiments to empirically verify the effectiveness of BDMBC for mode estimation and level set estimation, which demonstrates the promising accuracy and efficiency of our proposed algorithm.
翻译:在本文中,我们提出一个名为\ textit{bload $k$-距离的混合学习算法(\ textit{BDMB}),方法是提出一个新的测量方法,称为“当地级别设置的可选性” (\ textit{blax}) (\ textit{PLLLS}),使我们能够找到所有密度不同且具有全球阈值的群集。在理论方面,我们表明,如果在包装的美元-距离中选择出一个最接近的邻居$k_D$的适当数目,在以美元计价的宽度、以美元为单位的分量的分量的大小、分量的分量的美元-美元、以美元为单位的美元、分量的分量的分量的分量的美元-美元(美元-美元-美元-美元)、分量的分量的分量的分量的美元、包轮的美元(BA$美元),以及最接近的近的邻居的量的量的量的量的值(美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-以及最接近的比近邻-美元-美元-美元-美元-美元-美元-地方级的比近邻-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-地方级-当地-地方级-地方级-地方级-地方级-地方级-地方级-地方级-当地级-当地邻居-地方级-地方级-当地-当地-地方级的计算-当地级-当地级-当地级-地方级的计算-当地级-当地级-地方级的计算-美元-美元-当地邻居-美元-