## 图机器学习 2.2-2.4 Properties of Networks, Random Graph

2020 年 3 月 28 日 图与推荐

特殊->一般->建立模型

【注意这里考虑的是无向图】我们用G_{np}来表示具有n个节点且每个边(u,v)都是服从概率p的独立同分布的无向图

也就是说图其实是随机过程的一个结果，下图是给定n,p值的一个例子

（1）度分布（degree distribution)

• P(k)：选定了一个节点，于是图中剩下n-1个节点，从剩下的节点中选取k个节点乘以这k个节点有k个边（也就是度为k）的概率
• 有了度分布，可以发现其是 二项式的
• 既然是二项式的我们就能得到其期望和方差

对应了大数定理

（2）聚合系数

（3）expansion

（4）largest connected component（最大连接元）

https://networkx.github.io/documentation/networkx-1.9/examples/drawing/giant_component.htmlnetworkx.github.io

• 之前说过度分布的直方图有利于判断图的结构，MSN和随机图的直方图差距还是很大的；
• 平均路径：MSN和随机图的数据差不多
• 平均聚合系数：差距很大，随机图的非常小
• 最大连接元：很接近

【高聚合系数反映了局部性】简单来说就是：社交网络中，我的朋友们互相也是认识的，如同下图

（1）聚合反应局部性（2）随机性可以使得“捷径“出现

STEP 1：选择高聚合的网络

STEP 2：对每个边，以概率p修改边的终点（引入捷径）

（1）高聚合系数：我的大部分朋友们互相都认识（2）低直径：但是我也有几个朋友在另一个城市，且他们和其他朋友互不认识

比如不同的friendship的建立往往基于相同的文化、相似的爱好等等

会发现得到的图邻近矩阵的结构是很规则的（因为邻近矩阵的元素都是1或者0），类似于具有规则结构的网格一样，这样的当然好（利于我们分析），可是这样的图结构就很难capture真实复杂网络的信息了，那么要怎么办？-----答案是引入随机性！

（1）初始矩阵的每个元素反应的是特定边出现的概率

（2）对初始矩阵进行Kronecker积运算，以获得较大的随机邻接矩阵，在该矩阵中，大型矩阵的每个元素数值再次给出了特定边出现在大图中的概率，这样的随机邻接矩阵定义了所有图的概率分布

