麦克瑞大学最新「深度学习社区检测」综述论文，28页pdf

社区揭示了不同于网络中其他社区成员的特征和联系。社区检测在网络分析中具有重要意义。除了经典的谱聚类和统计推理方法，我们注意到近年来用于社区检测的深度学习技术在处理高维网络数据方面的优势有了显著的发展。因此，通过深度学习对社区检测的最新进展进行全面概述，对学者和从业者都是及时的。本文设计并提出了一种新的分类方法，包括基于深度神经网络的深度学习模型、深度非负矩阵分解和深度稀疏滤波。主要的类别，即深度神经网络，进一步分为卷积网络，图注意力网络，生成对抗网络和自动编码器。综述还总结了流行的基准数据集、模型评估指标和开源实现，以解决实验设置。然后讨论了社区检测在各个领域的实际应用，并提出了实现方案。最后，通过提出这一快速发展的深度学习领域中具有挑战性的课题，我们概述了未来的发展方向。

https://www.zhuanzhi.ai/paper/eb70a346cb2540dab57be737828445c6

引言

早在20世纪20年代，社会学和社会人类学就对社区进行了研究。然而，直到21世纪之后，研究人员才开始利用强大的数学工具和大规模数据操作来检测社区，以解决具有挑战性的问题[2]。自2002年[3]以来，Girvan和Newman将图划分问题引起了更广泛的关注。在过去的10年里，计算机科学研究者广泛研究了基于网络拓扑结构[5]-[8]和实体语义信息[9]-[11]、静态网络[12]-[14]、小型网络和大型网络[15]-[17]的社区检测问题[4]。越来越多的基于图的方法被开发出来用于检测具有复杂数据结构[18]，[19]环境中的社区。通过社区检测，可以详细分析网络中社区的动态和影响，如谣言传播、病毒爆发、肿瘤进化等。

社区的存在推动了社区检测研究的发展，是一个越来越具有现实意义的研究领域。俗话说，物以类聚，人以群分。根据六度分离理论，世界上任何一个人都可以通过六个熟人认识其他人[21]。事实上，我们的世界是一个由一系列社区组成的巨大网络。例如，通过检测社交网络[22]-[24]中的社区，如图1所示，平台赞助商可以向目标用户推广他们的产品。在引文网络[25]中，社区检测决定了研究主题的重要性、关联性、演化和识别研究趋势。在代谢网络[26]、[27]和蛋白质-蛋白质相互作用(PPI)网络[28]中，社区检测揭示了具有相似生物学功能的代谢和蛋白质。同样，脑网络[19]、[29]中的社区检测反映了脑区域的功能和解剖分离。

许多传统的技术，如谱聚类[30]，[31]和统计推理[32]-[35]，被用于小型网络和简单的场景。然而，由于它们的计算和空间成本巨大，它们无法扩展到大型网络或具有高维特征的网络。现实网络中非线性结构信息丰富，使得传统模型在实际应用中不太适用。因此，需要更强大的具有良好计算性能的技术。目前，深度学习提供了最灵活的解决方案，因为深度学习模型: (1) 学习非线性网络属性，如节点之间的关系，(2) 提供一个低维的网络表示，保持复杂的网络结构，(3) 提高了从各种信息中检测社区的性能。因此，深度学习用于社区检测是一种新的趋势，需要及时全面的调查。

据我们所知，本文是第一次全面调研深度学习在社区检测方面的贡献。以往的研究主要集中在传统的社区检测上，回顾了其在发现网络固有模式和功能[36]、[37]方面的重要影响。这篇论文综述了一些具体的技术，但不限于: 基于随机块模型(sms)的部分检测[38]，标签传播算法(LPAs)[39]，[40]，以及单目标和多目标优化的进化计算[13]，[14]。在网络类型方面，研究人员综述了动态网络[12]、有向网络[41]和多层网络[5]中的社区检测方法。此外，[6]，[7]还回顾了一系列关于不相交和重叠的社区缺陷的概述。围绕应用场景，以往的论文综述了社交网络[9]、[42]中的社区检测技术。

本文旨在帮助研究人员和从业者从以下几个方面了解社区检测领域的过去、现在和未来趋势:

系统性分类和综合评价。我们为此项综述提出了一个新的系统分类(见图3)。对于每个类别，我们回顾、总结和比较代表性的工作。我们还简要介绍了现实世界中的社区检测应用。这些场景为未来的社区检测研究和实践提供了见解。
丰富的资源和高影响力的参考资料。该综述不仅是文献综述，而且是基准数据集、评估指标、开源实现和实际应用的资源集合。我们在最新的高影响力国际会议和高质量同行评审期刊上广泛调查社区检测出版物，涵盖人工智能、机器学习、数据挖掘和数据发现等领域。
未来的发展方向。由于深度学习是一个新的研究趋势，我们讨论了当前的局限性，关键的挑战和开放的问题，为未来的方向。

社区检测在网络分析和数据挖掘中具有重要意义。图4展示了传统学习方法和深度学习方法的发展。传统的方法是在网络结构上探索社区。这七种方法(图3左图)仅以一种简单的方式捕捉浅连接。传统方法的检测结果往往是次优的。我们将在本节简要回顾它们的代表性方法。深度学习方法(图3右图)揭示了深度网络信息，复杂关系，处理高维数据。

本文提出了一种深度社区检测的分类方法。分类法将方法归纳为六类: 卷积网络、图注意力网络(GAT)、生成对抗网络(GAN)、自动编码器(AE)、深度非负矩阵分解(DNMF)和基于深度稀疏滤波(DSF)的深度社区检测方法。卷积网络包括卷积神经网络(CNN)和图卷积网络(GCN)。AE又分为堆叠型AE、稀疏型AE、去噪型AE、图卷积型AE、图关注型AE和变分型AE (VAE)。

成为VIP会员查看完整内容