【KDD2021】可扩展凝聚层次聚类 - 专知VIP

会员服务 ·

0

聚类 · KDD 2021 ·

2021 年 7 月 4 日

【KDD2021】可扩展凝聚层次聚类

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

聚合聚类(用于推断层次和平面聚类)的适用性受到其可扩展性的限制。现有的可扩展层次聚类方法牺牲了质量以提高速度，并且经常导致聚类的过度合并。在本文中，我们提出了一种可扩展的、凝聚的分层聚类方法，不牺牲质量和规模到数十亿数据点。我们进行了详细的理论分析，表明在温和的可分性条件下，我们的算法不仅可以恢复最优的平面分割，而且提供了一个非参数DP-Means目标[32]的双近似。本文介绍了一种新的应用层次聚类作为逼近算法的非参数聚类目标。此外，我们还将我们的算法与经典的层次凝聚聚类方法联系起来。我们在分层和平面聚类设置中进行了大量的经验实验，并表明我们提出的方法在公开可用的聚类基准上取得了最先进的结果。最后，我们将该方法应用于300亿个查询的数据集，从而演示了该方法的可扩展性。人类对已发现的聚类的评估表明，我们的方法发现的聚类质量比当前的技术水平更好。

https://storage.googleapis.com/pub-tools-public-publication-data/pdf/fcbefa25e4d6ad6ea8174449fcff779083ce80ff.pdf

成为VIP会员查看完整内容

15

相关内容

【ICML2021】基于子空间的随机几何图并集的谱方法理论

专知会员服务

15+阅读 · 2021年8月29日

【KDD2021】深度图卷积网络混合归一化的精确和多样化推荐

专知会员服务

22+阅读 · 2021年8月23日

【KDD2021】面向稀疏图的接收感知在线蒸馏

专知会员服务

17+阅读 · 2021年7月31日

【KDD2021】拓扑蒸馏推荐系统

专知会员服务

28+阅读 · 2021年6月18日

【ICML2020】通过神经引导的A*搜索学习逆合成设计

【ICML2020】通过神经引导的A*搜索学习逆合成设计

专知会员服务

18+阅读 · 2020年8月18日

独家 | 如何正确选择聚类算法？

独家 | 如何正确选择聚类算法？

数据派THU

5+阅读 · 2019年10月15日

大规模均衡分割与层次聚类

大规模均衡分割与层次聚类

谷歌开发者

4+阅读 · 2018年7月31日

【Python实战】无监督学习—聚类、层次聚类、t-SNE，DBSCAN

【Python实战】无监督学习—聚类、层次聚类、t-SNE，DBSCAN

专知

13+阅读 · 2018年6月18日

ML：教你聚类并构建学习模型处理数据（附数据集）

ML：教你聚类并构建学习模型处理数据（附数据集）

数据派THU

6+阅读 · 2018年4月5日

一文解读聚类中的两种流行算法

一文解读聚类中的两种流行算法

量子位

6+阅读 · 2017年11月20日

Load Balancing in Heterogeneous Server Clusters: Insights From a Product-Form Queueing Model

Arxiv

0+阅读 · 2021年9月2日

REST: Relational Event-driven Stock Trend Forecasting

Arxiv

15+阅读 · 2021年2月19日

CReST: A Class-Rebalancing Self-Training Framework for Imbalanced Semi-Supervised Learning

Arxiv

11+阅读 · 2021年2月18日

Classification with Fairness Constraints: A Meta-Algorithm with Provable Guarantees

Classification with Fairness Constraints: A Meta-Algorithm with Provable Guarantees

Arxiv

3+阅读 · 2018年8月2日

Learning to Adapt: Meta-Learning for Model-Based Control

Arxiv

9+阅读 · 2018年3月30日

VIP会员

相关主题

相关VIP内容

【ICML2021】基于子空间的随机几何图并集的谱方法理论

专知会员服务

15+阅读 · 2021年8月29日

【KDD2021】深度图卷积网络混合归一化的精确和多样化推荐

专知会员服务

22+阅读 · 2021年8月23日

【KDD2021】面向稀疏图的接收感知在线蒸馏

专知会员服务

17+阅读 · 2021年7月31日

【KDD2021】拓扑蒸馏推荐系统

专知会员服务

28+阅读 · 2021年6月18日

【ICML2020】通过神经引导的A*搜索学习逆合成设计

【ICML2020】通过神经引导的A*搜索学习逆合成设计

专知会员服务

18+阅读 · 2020年8月18日

热门VIP内容

开通专知VIP会员享更多权益服务

《利用人工智能对军事行动进行建模》

《利用人工智能学习、优化与推演美国海军作战部队的战略布局与分散（续文）》

机器人、无人机与实时影像：应对城市爆炸威胁的三大技术方案

《指挥官意图消息中关键概念自动提取》最新47页

相关资讯

独家 | 如何正确选择聚类算法？

独家 | 如何正确选择聚类算法？

数据派THU

5+阅读 · 2019年10月15日

大规模均衡分割与层次聚类

大规模均衡分割与层次聚类

谷歌开发者

4+阅读 · 2018年7月31日

【Python实战】无监督学习—聚类、层次聚类、t-SNE，DBSCAN

【Python实战】无监督学习—聚类、层次聚类、t-SNE，DBSCAN

专知

13+阅读 · 2018年6月18日

ML：教你聚类并构建学习模型处理数据（附数据集）

ML：教你聚类并构建学习模型处理数据（附数据集）

数据派THU

6+阅读 · 2018年4月5日

一文解读聚类中的两种流行算法

一文解读聚类中的两种流行算法

量子位

6+阅读 · 2017年11月20日

相关论文

Load Balancing in Heterogeneous Server Clusters: Insights From a Product-Form Queueing Model

Arxiv

0+阅读 · 2021年9月2日

REST: Relational Event-driven Stock Trend Forecasting

Arxiv

15+阅读 · 2021年2月19日

CReST: A Class-Rebalancing Self-Training Framework for Imbalanced Semi-Supervised Learning

Arxiv

11+阅读 · 2021年2月18日

Classification with Fairness Constraints: A Meta-Algorithm with Provable Guarantees

Classification with Fairness Constraints: A Meta-Algorithm with Provable Guarantees

Arxiv

3+阅读 · 2018年8月2日

Learning to Adapt: Meta-Learning for Model-Based Control

Arxiv

9+阅读 · 2018年3月30日

微信扫码咨询专知VIP会员