In community detection, many methods require the user to specify the number of clusters in advance since an exhaustive search over all possible values is computationally infeasible. While some classical algorithms can infer this number directly from the data, this is typically not the case for graph neural networks (GNNs): even when a desired number of clusters is specified, standard GNN-based methods often fail to return the exact number due to the way they are designed. In this work, we address this limitation by introducing a flexible and principled way to control the number of communities discovered by GNNs. Rather than assuming the true number of clusters is known, we propose a framework that allows the user to specify a plausible range and enforce these bounds during training. However, if the user wants an exact number of clusters, it may also be specified and reliably returned.


翻译:在社区检测中,许多方法要求用户预先指定聚类数量,因为对所有可能值进行穷举搜索在计算上是不可行的。虽然一些经典算法可以直接从数据中推断出该数量,但对于图神经网络(GNNs)而言,这通常并非如此:即使指定了期望的聚类数量,标准的基于GNN的方法也常常无法返回精确数量,这源于其设计方式。在本工作中,我们通过引入一种灵活且原则性的方法来控制GNN发现的社区数量,以解决这一局限性。我们并非假设真实聚类数量已知,而是提出了一个框架,允许用户指定一个合理的范围并在训练过程中强制执行这些边界约束。然而,如果用户需要精确的聚类数量,也可指定并可靠地返回。

0
下载
关闭预览

相关内容

【CVPR2024】掩码自解码器是有效的多任务视觉通用模型
专知会员服务
20+阅读 · 2024年3月16日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员