In this paper, we consider two types of robust models of the $k$-median/$k$-means problems: the outlier-version ($k$-MedO/$k$-MeaO) and the penalty-version ($k$-MedP/$k$-MeaP), in which we can mark some points as outliers and discard them. In $k$-MedO/$k$-MeaO, the number of outliers is bounded by a given integer. In $k$-MedP/$k$-MeaP, we do not bound the number of outliers, but each outlier will incur a penalty cost. We develop a new technique to analyze the approximation ratio of local search algorithms for these two problems by introducing an adapted cluster that can capture useful information about outliers in the local and the global optimal solution. For $k$-MeaP, we improve the best known approximation ratio based on local search from $25+\varepsilon$ to $9+\varepsilon$. For $k$-MedP, we obtain the best known approximation ratio. For $k$-MedO/$k$-MeaO, there exists only two bi-criteria approximation algorithms based on local search. One violates the outlier constraint (the constraint on the number of outliers), while the other violates the cardinality constraint (the constraint on the number of clusters). We consider the former algorithm and improve its approximation ratios from $17+\varepsilon$ to $3+\varepsilon$ for $k$-MedO, and from $274+\varepsilon$ to $9+\varepsilon$ for $k$-MeaO.
翻译:在本文中,我们考虑两种坚固的美元-中值/美元-中值/美元-美元-中值问题模式:超值转换(MedO-美元/美元-MeaO)和罚款转换(K美元-MedP/美元-MeaP),在这两种模式中,我们可以将某些点标为出价并丢弃。在美元-MedO/美元-MeaO中,外值数量受给定整数的约束。以美元-MedP/美元-MeaP为单位,我们没有约束离值算数,但每个超值将产生罚款成本。我们开发了一种新的方法来分析当地搜索算法的近似比率,通过引入一个可捕捉到当地和全球最佳解决方案中离值的有用信息的组合。关于美元-MeaP,我们根据当地搜索结果改进了已知的近值比,从25美元-瓦雷普朗-中值-美元-美尔普-美尔-美尔-美尔-美德-美元。在美元上,用美元-美元-基价-美元-美元-美元-美元-美元-比值-美元-美元-美元-美元-最低比值比值比值-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-比值-比值-比值-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-我们,我们-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-比-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-比-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-比-比-美元-美元-美元-美元-美元-美元-美元-美元-比-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-美元-比