Minimum spanning trees (MSTs) are used in a variety of fields, from computer science to geography. Infectious disease researchers have used them to infer the transmission pathway of certain pathogens. However, these are often the MSTs of sample networks, not population networks, and surprisingly little is known about what can be inferred about a population MST from a sample MST. We prove that if $n$ nodes (the sample) are selected uniformly at random from a complete graph with $N$ nodes and unique edge weights (the population), the probability that an edge is in the population graph's MST given that it is in the sample graph's MST is $\frac{n}{N}$. We use simulation to investigate this conditional probability for $G(N,p)$ graphs, Barab\'{a}si-Albert (BA) graphs, graphs whose nodes are distributed in $\mathbb{R}^2$ according to a bivariate standard normal distribution, and an empirical HIV genetic distance network. Broadly, results for the complete, $G(N,p)$, and normal graphs are similar, and results for the BA and empirical HIV graphs are similar. We recommend that researchers use an edge-weighted random walk to sample nodes from the population so that they maximize the probability that an edge is in the population MST given that it is in the sample MST.


翻译:从计算机科学到地理等各个领域都使用最低覆盖树(MSTs),从计算机科学到地理。传染病研究人员利用他们来推断某些病原体的传播途径。然而,这些往往是抽样网络的MSTs,而不是人口网络,令人惊讶的是,对于从抽样MST中可以推断出的人口MST(MST),我们很少知道什么是MST(MST)。我们证明,如果从完整的图表中随机地选择美元(MST)(样本),用美元节点和独特的边缘重量(人口)来计算,那么在人口图的MST(MST)中可能有一个边缘。从抽样图中得出完整的、$G(N){N}N}N}N}N}$的边缘。我们用模拟来调查美元(G)图、Barab\'{a}si-Albert(BA)图的这一有条件的概率,其节点按正比值分布为$mathbethbb{R}2美元,以及一个经验性艾滋病毒基因距离网络。广而言,其结果完整、$G(N,ST(N,p)是用于正常的BA和BAST(BA) 和M(O)的平比值图表中,我们使用的RV)的概率是类似的平比值。

0
下载
关闭预览

相关内容

专知会员服务
19+阅读 · 2020年9月6日
因果图,Causal Graphs,52页ppt
专知会员服务
249+阅读 · 2020年4月19日
机器学习入门的经验与建议
专知会员服务
94+阅读 · 2019年10月10日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
28+阅读 · 2019年5月18日
人工智能 | NIPS 2019等国际会议信息8条
Call4Papers
7+阅读 · 2019年3月21日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
【推荐】决策树/随机森林深入解析
机器学习研究会
5+阅读 · 2017年9月21日
【推荐】RNN/LSTM时序预测
机器学习研究会
25+阅读 · 2017年9月8日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Arxiv
4+阅读 · 2019年1月14日
VIP会员
相关VIP内容
专知会员服务
19+阅读 · 2020年9月6日
因果图,Causal Graphs,52页ppt
专知会员服务
249+阅读 · 2020年4月19日
机器学习入门的经验与建议
专知会员服务
94+阅读 · 2019年10月10日
相关资讯
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
28+阅读 · 2019年5月18日
人工智能 | NIPS 2019等国际会议信息8条
Call4Papers
7+阅读 · 2019年3月21日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
【推荐】决策树/随机森林深入解析
机器学习研究会
5+阅读 · 2017年9月21日
【推荐】RNN/LSTM时序预测
机器学习研究会
25+阅读 · 2017年9月8日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员