题目: Scalable Deep Unsupervised Clustering with Concrete GMVAEs
摘要:
离散随机变量是概率聚类模型的自然组成部分。已经发现了许多具有离散潜变量的VAE变异体。训练这类方法需要将离散的潜在变量边缘化,使得训练时间复杂度在簇数上呈线性。通过在这些方法中对离散变量应用连续松弛,我们可以将训练时间复杂度降低到所使用的集群数量不变。我们证明了在实践中,对于其中一种方法,即高斯混合VAE,使用连续松弛不会对聚类的质量产生负面影响,但会大大减少训练时间,将20个集群的CIFAR-100上的培训时间从47小时减少到不足6小时。
邀请嘉宾:
Hector Urdiales是全球领先的入站营销和销售平台Hubspot的机器学习工程负责人。
Mark Collier就职于Hubspot,研究兴趣是机器学习,深度学习,贝叶斯深度学习,递归神经网络。