Random-walk based network embedding algorithms like node2vec and DeepWalk are widely used to obtain Euclidean representation of the nodes in a network prior to performing down-stream network inference tasks. Nevertheless, despite their impressive empirical performance, there is a lack of theoretical results explaining their behavior. In this paper we studied the node2vec and DeepWalk algorithms through the perspective of matrix factorization. We analyze these algorithms in the setting of community detection for stochastic blockmodel graphs; in particular we established large-sample error bounds and prove consistent community recovery of node2vec/DeepWalk embedding followed by k-means clustering. Our theoretical results indicate a subtle interplay between the sparsity of the observed networks, the window sizes of the random walks, and the convergence rates of the node2vec/DeepWalk embedding toward the embedding of the true but unknown edge probabilities matrix. More specifically, as the network becomes sparser, our results suggest using larger window sizes, or equivalently, taking longer random walks, in order to attain better convergence rate for the resulting embeddings. The paper includes numerical experiments corroborating these observations.


翻译:以随机行道为基础的网络嵌入算法,如 node2vec 和 DeepWalk 被广泛用于获取网络中节点在下游网络推导任务之前的 Euclide 代表。 然而,尽管它们的实验性表现令人印象深刻,但缺乏解释其行为的理论结果。 在本文中,我们从矩阵系数化的角度研究了节点2vec 和 DeepWalk 算法。 我们在为随机区块模型图设定社区检测时分析了这些算法; 特别是,我们建立了大缩放错误界限,并证明在网络中持续恢复了节点2vec/DeepWalk在K- means群集之后的节点。 我们的理论结果显示,观测网络的宽度、随机行走的窗口大小以及Nde2vec/DeepWalk 嵌入真实但未知边缘概率矩阵的聚合率。 更具体地说,当网络变得稀疏时,我们的结果显示,我们使用更大的窗口大小或相当的随机行距进行社区恢复。 为了进行更精确的观测, 从而实现更精确的嵌入。

0
下载
关闭预览

相关内容

网络嵌入旨在学习网络中节点的低维度潜在表示,所学习到的特征表示可以用作基于图的各种任务的特征,例如分类,聚类,链路预测和可视化。
【ACML2020】张量网络机器学习:最近的进展和前沿,109页ppt
专知会员服务
54+阅读 · 2020年12月15日
【干货书】机器学习速查手册,135页pdf
专知会员服务
125+阅读 · 2020年11月20日
最新《高级算法》Advanced Algorithms,176页pdf
专知会员服务
91+阅读 · 2020年10月22日
因果图,Causal Graphs,52页ppt
专知会员服务
247+阅读 · 2020年4月19日
已删除
将门创投
4+阅读 · 2019年11月20日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
Network Embedding 指南
专知
21+阅读 · 2018年8月13日
Arxiv
0+阅读 · 2021年3月12日
Normal Forms for Tensor Rank Decomposition
Arxiv
0+阅读 · 2021年3月12日
Optimization for deep learning: theory and algorithms
Arxiv
105+阅读 · 2019年12月19日
Arxiv
6+阅读 · 2019年9月25日
CoCoNet: A Collaborative Convolutional Network
Arxiv
6+阅读 · 2019年1月28日
Arxiv
4+阅读 · 2019年1月14日
Arxiv
4+阅读 · 2018年2月19日
Arxiv
3+阅读 · 2017年5月14日
VIP会员
相关论文
Arxiv
0+阅读 · 2021年3月12日
Normal Forms for Tensor Rank Decomposition
Arxiv
0+阅读 · 2021年3月12日
Optimization for deep learning: theory and algorithms
Arxiv
105+阅读 · 2019年12月19日
Arxiv
6+阅读 · 2019年9月25日
CoCoNet: A Collaborative Convolutional Network
Arxiv
6+阅读 · 2019年1月28日
Arxiv
4+阅读 · 2019年1月14日
Arxiv
4+阅读 · 2018年2月19日
Arxiv
3+阅读 · 2017年5月14日
Top
微信扫码咨询专知VIP会员