文 | 孙冰杰
第32届人工智能国际会议(AAAI 2018)将于2018年2月2-7日在美国新奥尔良召开,中国科学院网络数据重点实验室社会计算组孙冰杰博士(导师:程学旗研究员)在大规模网络重叠社区发现方面的研究成果《Towards efficient detection of overlapping communities in massive networks》(作者:孙冰杰、沈华伟、高金华、欧阳文涛、程学旗),被AAAI 2018接收为长文(full paper)。AAAI会议是中国计算机学会(CCF)推荐的顶级学术会议,我实验室连续五年在该会议上发表论文。
重叠社区发现是网络结构分析的重要任务。现有的重叠社区发现算法由于优化过程的复杂性无法应用于真实的大规模网络。重叠社区发现领域中一个经典的方法是泊松模型,因其只考虑网络中有边相连的节点对大大降低了算法的数据空间复杂度。泊松模型优化效果较稳定,但是无法处理大规模网络数据。因此本文对泊松模型的优化过程进行加速,使得该模型可以在保证社区发现效果的前提下处理大规模网络数据。
本文方法的社区发现表现效果
本文算法的时间消耗
本文基于以下两点假设对模型进行了加速:1)由于节点表示的稀疏性,我们在维度优化过程中可以只更新不为零的维度;2)由于泊松模型中一条边的社区归属只与端点的社区归属有关,一旦一条边的两个端点节点表示收敛了这条边就不需要在后续的迭代过程中继续更新。因此,本文提出了一种“维度级-连边级”的两级加速模型。在不影响最终社区发现结果的情况下将模型速度提升了最少10倍,可以处理百万规模节点亿级规模连边的网络。
论文下载地址:
http://www.bigdatalab.ac.cn/~shenhuawei/
想关注更多内容,请关注公众号