手把手教你将矩阵&概率画成图

2019 年 3 月 27 日 机器之心

选自math3ma

作者:Algebra

机器之心编译

参与:高璇、张倩


要是将每个矩阵和概率都看成对应的「图」会怎么样?本文作者带我们体验了这个简单而有趣的可视化过程。


今天我想分享一个简单的 idea,它既不新颖也不花哨。甚至很多人都有过这个想法。但是无论你有没有这么想过,我都希望你能抽出几分钟和我一起重新感受这个想法。


这个想法是这样的:



想法非常简单,但非常实用。


首先严谨地概括这个想法:每个矩阵对应一个加权二分图。所谓「图」是指顶点(点)和线的集合;「二分」是指点有两种不同的类型/颜色;;「加权」是指每条线都有一个数字标记。


上图对应一个 3×23×2 矩阵 M。右侧我画了三个绿点,分别对应矩阵 M 的三行,两个粉点分别对应矩阵 M 的两列。如果对应矩阵 M 中的值非零,就在绿点和粉点间画一条线连接。



例如,在第二个绿点和第一个粉点间存在一条线,因为 M_21=4,即矩阵 M 第二行第一列的值不为 0。此外,我用非零数字标记了这条线。而第一个绿点和第二个粉点之间没有线连接,因为矩阵的第一行第二列值为零。


更明确的描述如下:


任何矩阵 M 都是 n×m 个数的数组。当然这是常识。但是这样的数组也可以看作函数 M:X×Y→R,其中 X = {x_1,...,x_n},是一组 n 个元素组成的集合;Y = {y_1,...,y_m},是一组 m 个元素组成的集合。实际上,如果要描述矩阵 M,那么需要描述第 ij 项的值。换句话说,对于每对 (i,j),都需要给出一个实数 M_ij。这就是函数的功能啊!函数 M:X×Y→R 关联每对 (x_i,y_j)(如果你愿意,可以去掉字母并将其看作 (i,j)),即实数 M(x_i,y_j)。所以可以将 M(x_i,y_j) 简写为 M_ij。


看,矩阵就是一种函数。



如前所述,我们进一步认为 X 的元素是绿点,而 Y 的元素是粉点。然后矩阵 M 以下图方式与加权二分图相对应:图的顶点有由 X 和 Y 提供的两种不同颜色,并且每个 x_i 和 y_j 之间存在连线,连线由数字 M_ij 标记。但是如果数值为零,那就省略这条边。


 每个矩阵对应一个图。


当我们以这种方式可视化矩阵时,神奇的事就发生了。例如...


矩阵乘法即为沿连线向前运算。


给定两个矩阵(图)M:X×Y→R 和 N:Y×Z→R,我们可以通过将它们的图拼在一起并沿着连线进行乘法运算:MN 的第 ij 项的输入,即连接 x_i 到 z_j 的线的值,是通过将沿 x_i 到 z_j 的各个边相乘并加和得到的。例如:



对称矩阵对应对称图。


如果一个矩阵等于它的转置,即为对称矩阵。这种对称性常通过矩阵对角线映射得到。但现在可以从图中观察到对称性。尤其对于任何矩阵 M 来说,下图直观地解释了,为什么 MM^⊤和 M^⊤M 始终对称!



若矩阵所有项都非零,则对应完全二分图。


如果一个矩阵的所有元素都不为零,那么它对应的图就没有缺失的连线。这意味着 X 中的每个点都与 Y 的每个点相连。这样的二分图称为完全二分图。



N 分块矩阵对应独立的 N 个图。


具体来说,由直和得到的分块矩阵对应断开的图。将两个矩阵做直和运算得到更大的数组(与向量直和运算类似),即一个带有全零块的大型分块矩阵。分块矩阵的图通过将原矩阵的图叠加得到。



关于矩阵和图我们能展开更多的讨论,但我想通过一个不同的角度来探讨。事实证明,概率非常适合我们矩阵-图的讨论。这是通过另一个有趣的小事实来实现的:


例如:



这样的概率分布图可以让我们更好地分析。


联合概率


通过架构图中的连线,可以得到联合概率:(x_i,y_j) 的概率是连接 x,y 两点的线的标签。



边缘概率


边缘概率是通过沿矩阵的行/列求和得到的(与上图等效)。例如,x_1 的概率 p(x_1)=p(x_1,y_1)+p(x_1,y_2)=1/8+0,这是第一行的总和。同样,y_2 的概率是 p(y_2)=p(x_1,y_2)+p(x_2,y_2)+p(x_3,y_2)=0+1/8+1/4,是第二列的和。

图中,x_i 的边缘概率是以 x_i 为顶点的所有连线的和。类似地,y_j 的边缘概率是以 y_j 为顶点的所有连线的和。



条件概率


条件概率是由联合概率除以边缘概率得到的。例如在 y_2 条件下 x_3 的概率 p(x_3|y_2)=p(x_3,y_2)/p(y_2)。从图中可以看出,这是通过将 x_3 和 y_2 的连线除以所有与 y_2 相连的线之和得到的。同样,y_i 下 x_j 的条件概率是两点连线的值除以所有与 x_j 相连的线之和。



这很简单,对吧?


这里边的原理并不复杂,只是有时用新角度看旧想法是很有用的。


关系矩阵


本文的最后是另一个简单而有趣的事实,即:矩阵运算在交换环(communicative ring)上是有意义的。不仅仅是像 R 或 C 等。矩阵相乘甚至不需要负数:矩阵运算在交换半环上是有意义的!(半环是一个没有相反数的环。)


我认为这很好,因为包含两个元素 Z_2 = {0,1} 的集合通过下图的加法和乘法形成一个半环:



为什么会这么好?因为一个矩阵 M:X×Y→Z_2 相当于一个「关系」。「关系」是笛卡尔积 X×Y 的子集 R 的名称。换句话说,每个 Z_2-valued 矩阵定义了一个「关系」,每个关系又定义了一个 Z_2-valued 矩阵:当且仅当 (x_i,y_j) 是 R 子集的元素时,M_ij=1,否则 M_ij=0。



Z_2 中的矩阵图与上面讨论的图完全相同,只是现在所有连线的值都是 0 或 1。如果权重是 0,那和之前一样,我们就不画这条连线了。


(顺便说一句,你现在可以问,「既然每个「关系」对应于 Z_2 中的矩阵,那与「等价关系」相对应的矩阵是什么样的?」我离题了....)


通过将基础(半)环从 R 改为 Z_2,我们改变了解释权重的方式。例如,在上面的概率场景中,我们可以问,「从 x_1 到 y_1 的概率是多少?」答案由对应边的权重而来,在本例中为 12.5%。或者,当矩阵在 Z_2 中取值时,问题变为:「是否可能从 x_1 到 y_1?」如果连线标记为 1,则为「是」,如果标记为 0 则为「否」。(这个想法已经被多次解释了)。


重要的是,「关系」的组合恰好是使用了上面的 Z_2 算法的矩阵乘法。换句话说,给定任意两个关系 R⊂X×Y 和 S⊂Y×Z,存在一个新关系 SR⊂X×Z,包括所有 (x,z),至少存在一个 y∈Y,其中 (x,y)∈R,(y,z)∈S。这种新关系正是表示 R 和 S 的矩阵乘积所指定的。



这个关于矩阵/关系的小事实绝对是我最喜欢的数学事实之一。一个原因是因为有限集的范畴,「关系」很像有限向量空间和线性映射的范畴。实际上,它更像是有限维希尔伯特空间的范畴。这意味着许多看似不相干的想法突然变得密切。这些联系可以更加精准,这是一个在范畴理论界经常被分享的故事。


原文链接:https://www.math3ma.com/blog/matrices-probability-graphs



本文为机器之心编译,转载请联系本公众号获得授权

✄------------------------------------------------

加入机器之心(全职记者 / 实习生):hr@jiqizhixin.com

投稿或寻求报道:content@jiqizhixin.com

广告 & 商务合作:bd@jiqizhixin.com

登录查看更多
0

相关内容

二分图又称作二部图,是图论中的一种特殊模型。 设G=(V,E)是一个无向图,如果顶点V可分割为两个互不相交的子集(A,B),并且图中的每条边(i,j)所关联的两个顶点i和j分别属于这两个不同的顶点集(i in A,j in B),则称图G为一个二分图。
【MIT-ICML2020】图神经网络的泛化与表示的局限
专知会员服务
43+阅读 · 2020年6月23日
最新《自动微分手册》77页pdf
专知会员服务
102+阅读 · 2020年6月6日
【干货书】用于概率、统计和机器学习的Python,288页pdf
专知会员服务
290+阅读 · 2020年6月3日
一份简短《图神经网络GNN》笔记,入门小册
专知会员服务
225+阅读 · 2020年4月11日
【CVPR2020】图神经网络中的几何原理连接
专知会员服务
57+阅读 · 2020年4月8日
【图神经网络(GNN)结构化数据分析】
专知会员服务
116+阅读 · 2020年3月22日
机器学习速查手册,135页pdf
专知会员服务
342+阅读 · 2020年3月15日
手把手解释实现频谱图卷积
AI科技评论
9+阅读 · 2019年9月9日
从张量到自动微分:PyTorch入门教程
论智
9+阅读 · 2018年10月10日
深度学习面试100题(第71-75题)
七月在线实验室
5+阅读 · 2018年8月2日
条件概率和贝叶斯公式 - 图解概率 03
遇见数学
10+阅读 · 2018年6月5日
入门 | 这是一份文科生都能看懂的线性代数简介
机器之心
13+阅读 · 2018年3月31日
傅里叶变换和拉普拉斯变换的物理解释及区别
算法与数学之美
11+阅读 · 2018年2月5日
机器学习(29)之奇异值分解SVD原理与应用详解
机器学习算法与Python学习
5+阅读 · 2017年11月30日
Adaptive Neural Trees
Arxiv
4+阅读 · 2018年12月10日
dynnode2vec: Scalable Dynamic Network Embedding
Arxiv
14+阅读 · 2018年12月6日
Arxiv
7+阅读 · 2018年8月21日
VIP会员
相关VIP内容
【MIT-ICML2020】图神经网络的泛化与表示的局限
专知会员服务
43+阅读 · 2020年6月23日
最新《自动微分手册》77页pdf
专知会员服务
102+阅读 · 2020年6月6日
【干货书】用于概率、统计和机器学习的Python,288页pdf
专知会员服务
290+阅读 · 2020年6月3日
一份简短《图神经网络GNN》笔记,入门小册
专知会员服务
225+阅读 · 2020年4月11日
【CVPR2020】图神经网络中的几何原理连接
专知会员服务
57+阅读 · 2020年4月8日
【图神经网络(GNN)结构化数据分析】
专知会员服务
116+阅读 · 2020年3月22日
机器学习速查手册,135页pdf
专知会员服务
342+阅读 · 2020年3月15日
相关资讯
手把手解释实现频谱图卷积
AI科技评论
9+阅读 · 2019年9月9日
从张量到自动微分:PyTorch入门教程
论智
9+阅读 · 2018年10月10日
深度学习面试100题(第71-75题)
七月在线实验室
5+阅读 · 2018年8月2日
条件概率和贝叶斯公式 - 图解概率 03
遇见数学
10+阅读 · 2018年6月5日
入门 | 这是一份文科生都能看懂的线性代数简介
机器之心
13+阅读 · 2018年3月31日
傅里叶变换和拉普拉斯变换的物理解释及区别
算法与数学之美
11+阅读 · 2018年2月5日
机器学习(29)之奇异值分解SVD原理与应用详解
机器学习算法与Python学习
5+阅读 · 2017年11月30日
Top
微信扫码咨询专知VIP会员