We present an algorithm for computing $\epsilon$-coresets for $(k, \ell)$-median clustering of polygonal curves in $\mathbb{R}^d$ under the Fr\'echet distance. This type of clustering is an adaption of Euclidean $k$-median clustering: we are given a set of $n$ polygonal curves in $\mathbb{R}^d$, each of complexity (number of vertices) at most $m$, and want to compute $k$ median curves such that the sum of distances from the given curves to their closest median curve is minimal. Additionally, we restrict the complexity of the median curves to be at most $\ell$ each, to suppress overfitting, a problem specific for sequential data. Our algorithm has running time linear in $n$, sub-quartic in $m$ and quadratic in $\epsilon^{-1}$. With high probability it returns $\epsilon$-coresets of size quadratic in $\epsilon^{-1}$ and logarithmic in $n$ and $m$. We achieve this result by applying the improved $\epsilon$-coreset framework by Langberg and Feldman to a generalized $k$-median problem over an arbitrary metric space. Later we combine this result with the recent result by Driemel et al. on the VC dimension of metric balls under the Fr\'echet distance. Furthermore, our framework yields $\epsilon$-coresets for any generalized $k$-median problem where the range space induced by the open metric balls of the underlying space has bounded VC dimension, which is of independent interest. Finally, we show that our $\epsilon$-coresets can be used to improve the running time of an existing approximation algorithm for $(1,\ell)$-median clustering.


翻译:我们提出一个计算美元( k,\ ell) 美元( epsilon) 核心值的算法, 计算美元( k,\ ell) 的美元, 中间值的多角曲线集成, 在 Fr\\\ echet 距离下, 美元( r\\\ \\ \ \ d) 中位值 。 这种组合是 Euclidean $( $) 中位数的调整: 我们得到一套美元( mathbb{ { { \ \ \ \ 美元) 的多角值的多角值( 美元) 。 我们的算法以美元运行时间线性曲线, 美元( vertic) 以美元( vertic) 以美元( vertic) 来计算, 以美元( 美元) 中位值( 美元) 中位值( 美元) 直径( 美元) 直径( 美元) 直径( 美元) 直径( 美元) 美元) 直径( 直径) 直径) 直径( 直径) 直径) 直方( 直径) 直方( 直方( 直方( 美元) ) 直方( ) 美元) 直方( ) ) 直方) 直方( ) 直方( ) ) 根) 直方) 根( 直方( 直方) 直方( 平方) 平方( 平方) 平方) 根) 根) 根( 直方( 直方) 直方) 直方) 直方) 直方( 直方( ) ) ) 直方( ) ) 根) 根根根根根根根根根根根根根根根根根( 根根根根根根根根根根根根根根根根根根根根( ) 根根( ) ) 根根根根根根根根根根根根根根根根根根基) 根基) 根基) 基)

0
下载
关闭预览

相关内容

专知会员服务
41+阅读 · 2020年12月18日
专知会员服务
123+阅读 · 2020年9月8日
专知会员服务
17+阅读 · 2020年9月6日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
76+阅读 · 2020年7月26日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
57+阅读 · 2019年10月17日
Transferring Knowledge across Learning Processes
CreateAMind
26+阅读 · 2019年5月18日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
条件GAN重大改进!cGANs with Projection Discriminator
CreateAMind
8+阅读 · 2018年2月7日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Arxiv
0+阅读 · 2022年1月21日
Contrastive Representation Distillation
Arxiv
5+阅读 · 2019年10月23日
VIP会员
相关资讯
Transferring Knowledge across Learning Processes
CreateAMind
26+阅读 · 2019年5月18日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
条件GAN重大改进!cGANs with Projection Discriminator
CreateAMind
8+阅读 · 2018年2月7日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Top
微信扫码咨询专知VIP会员