This paper concerns the statistical analysis of a weighted graph through spectral embedding. Under a latent position model in which the expected adjacency matrix has low rank, we prove uniform consistency and a central limit theorem for the embedded nodes, treated as latent position estimates. In the special case of a weighted stochastic block model, this result implies that the embedding follows a Gaussian mixture model with each component representing a community. We exploit this to formally evaluate different weight representations of the graph using Chernoff information. For example, in a network anomaly detection problem where we observe a p-value on each edge, we recommend against directly embedding the matrix of p-values, and instead using threshold or log p-values, depending on network sparsity and signal strength.
翻译:本文涉及通过光谱嵌入对加权图进行统计分析。 在预期的相邻矩阵排名低的潜在位置模型下, 我们证明嵌入节点的一致性和中心限理论是统一的, 被当作潜在位置估计。 在加权随机区块模型的特殊情况下, 这一结果意味着嵌入遵循一个高斯混合模型, 每个组成部分都代表一个社区。 我们利用这个模型正式评估使用 Chernoff 信息对图的不同重量表示。 例如, 在网络异常探测问题中, 我们观察每个边缘的 p值, 我们建议不要直接嵌入 p值矩阵, 而不是使用阈值或日志 p值, 取决于网络的宽度和信号强度 。