This paper presents universal algorithms for clustering problems, including the widely studied $k$-median, $k$-means, and $k$-center objectives. The input is a metric space containing all potential client locations. The algorithm must select $k$ cluster centers such that they are a good solution for any subset of clients that actually realize. Specifically, we aim for low regret, defined as the maximum over all subsets of the difference between the cost of the algorithm's solution and that of an optimal solution. A universal algorithm's solution $SOL$ for a clustering problem is said to be an $(\alpha, \beta)$-approximation if for all subsets of clients $C'$, it satisfies $SOL(C') \leq \alpha \cdot OPT(C') + \beta \cdot MR$, where $OPT(C')$ is the cost of the optimal solution for clients $C'$ and $MR$ is the minimum regret achievable by any solution. Our main results are universal algorithms for the standard clustering objectives of $k$-median, $k$-means, and $k$-center that achieve $(O(1), O(1))$-approximations. These results are obtained via a novel framework for universal algorithms using linear programming (LP) relaxations. These results generalize to other $\ell_p$-objectives and the setting where some subset of the clients are fixed. We also give hardness results showing that $(\alpha, \beta)$-approximation is NP-hard if $\alpha$ or $\beta$ is at most a certain constant, even for the widely studied special case of Euclidean metric spaces. This shows that in some sense, $(O(1), O(1))$-approximation is the strongest type of guarantee obtainable for universal clustering.


翻译:本文展示了集中问题的通用算法, 包括广泛研究的美元- 中位元、 美元- 美元和 美元- 中位元目标。 输入是一个包含所有潜在客户位置的衡量空间。 算法必须选择 $ 群集中心, 以便它们对任何真正实现的客户子集来说是一个很好的解决方案。 具体地说, 我们的目标是低遗憾, 定义为算法解决方案成本和最佳解决方案成本之间差别的所有子集的最大值。 通用算法对于聚集问题( 美元, 美元- 美元, 美元- 美元, 美元- 美元, 美元- 美元, 如果所有客户的子集 $, 美元\ 美元组群集集中心必须选择 美元\ leq\ pha\ ALdopa (C) + betata\ cdot most most mology 。 美元- 美元- 美元- 美元- 美元- 美元- 美元- 美元- 美元- 美元- 美元- 美元- 美元- 美元- 美元- 美元- 美元- 美元- 美元- 美元- 美元- 美元- 美元- 美元- 美元- 美元- 美元- 美元- 美元- 美元- 美元- 美元- 美元- 美元- 美元- 美元- 美元- 美元- 另一种- 标准算算法以 以 美元- 美元- 美元- 以 美元- 以 美元- 以 美元- 美元- 美元- 美元- 美元- 以 以 以 美元- 以 以 美元- 以 以 标准- 以 以 以 以 以 以 以 以 以 以 以 以 以 以 以 以 以 美元- 以 以 以 以 以 以 以 以 以 以 以 以 以 以 以 以 以 以 以 以 以 以 以 以 以 以 以 美元- 以 以 以 以 以 美元- 美元- 美元- 以 美元- 以 以 美元-

0
下载
关闭预览

相关内容

【干货书】分数图论:对图论的一种理性的探讨,167页pdf
专知会员服务
25+阅读 · 2021年4月13日
【干货书】机器学习速查手册,135页pdf
专知会员服务
122+阅读 · 2020年11月20日
强化学习最新教程,17页pdf
专知会员服务
168+阅读 · 2019年10月11日
机器学习入门的经验与建议
专知会员服务
90+阅读 · 2019年10月10日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
52+阅读 · 2019年9月29日
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
深度自进化聚类:Deep Self-Evolution Clustering
我爱读PAMI
14+阅读 · 2019年4月13日
已删除
将门创投
3+阅读 · 2019年1月8日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Coding for Polymer-Based Data Storage
Arxiv
0+阅读 · 2021年6月28日
Arxiv
0+阅读 · 2021年6月26日
On Simple Mechanisms for Dependent Items
Arxiv
0+阅读 · 2021年6月25日
Arxiv
0+阅读 · 2021年6月24日
VIP会员
相关VIP内容
【干货书】分数图论:对图论的一种理性的探讨,167页pdf
专知会员服务
25+阅读 · 2021年4月13日
【干货书】机器学习速查手册,135页pdf
专知会员服务
122+阅读 · 2020年11月20日
强化学习最新教程,17页pdf
专知会员服务
168+阅读 · 2019年10月11日
机器学习入门的经验与建议
专知会员服务
90+阅读 · 2019年10月10日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
52+阅读 · 2019年9月29日
相关资讯
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
深度自进化聚类:Deep Self-Evolution Clustering
我爱读PAMI
14+阅读 · 2019年4月13日
已删除
将门创投
3+阅读 · 2019年1月8日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员