手把手教你将矩阵u0026概率画成图

选自math3ma，作者：Algebra，机器之心编译，参与：高璇、张倩。

本日我想分享一个大略的 idea，它既不新颖也不花哨。
乃至很多人都有过这个想法。
但是无论你有没有这么想过，我都希望你能抽出几分钟和我一起重新感想熏染这个想法。

这个想法是这样的：

想法非常大略，但非常实用。

手把手教你将矩阵u0026概率画成图

首先严谨地概括这个想法：每个矩阵对应一个加权二分图。
所谓「图」是指顶点（点）和线的凑集；「二分」是指示有两种不同的类型/颜色;；「加权」是指每条线都有一个数字标记。

上图对应一个 3×23×2 矩阵 M。
右侧我画了三个绿点，分别对应矩阵 M 的三行，两个粉点分别对应矩阵 M 的两列。
如果对应矩阵 M 中的值非零，就在绿点和粉点间画一条线连接。

例如，在第二个绿点和第一个粉点间存在一条线，由于 M_21=4，即矩阵 M 第二行第一列的值不为 0。
此外，我用非零数字标记了这条线。
而第一个绿点和第二个粉点之间没有线连接，由于矩阵的第一行第二列值为零。

更明确的描述如下：

任何矩阵 M 都是 n×m 个数的数组。
当然这是知识。
但是这样的数组也可以看作函数 M：X×Y→R，个中 X = {x_1，...，x_n}，是一组 n 个元素组成的凑集；Y = {y_1，...，y_m}，是一组 m 个元素组成的凑集。
实际上，如果要描述矩阵 M，那么须要描述第 ij 项的值。
换句话说，对付每对 (i,j)，都须要给出一个实数 M_ij。
这便是函数的功能啊！
函数 M：X×Y→R 关联每对 (x_i,y_j)（如果你乐意，可以去掉字母并将其看作 (i,j)），即实数 M(x_i,y_j)。
以是可以将 M(x_i,y_j) 简写为 M_ij。

看，矩阵便是一种函数。

如前所述，我们进一步认为 X 的元素是绿点，而 Y 的元素是粉点。
然后矩阵 M 以下图办法与加权二分图相对应：图的顶点有由 X 和 Y 供应的两种不同颜色，并且每个 x_i 和 y_j 之间存在连线，连线由数字 M_ij 标记。
但是如果数值为零，那就省略这条边。

每个矩阵对应一个图。

当我们以这种办法可视化矩阵时，神奇的事就发生了。
例如...

矩阵乘法即为沿连线向前运算。

给定两个矩阵（图）M：X×Y→R 和 N：Y×Z→R，我们可以通过将它们的图拼在一起并沿着连线进行乘法运算：MN 的第 ij 项的输入，即连接 x_i 到 z_j 的线的值，是通过将沿 x_i 到 z_j 的各个边相乘并加和得到的。
例如：

对称矩阵对应对称图。

如果一个矩阵即是它的转置，即为对称矩阵。
这种对称性常通过矩阵对角线映射得到。
但现在可以从图中不雅观察到对称性。
尤其对付任何矩阵 M 来说，下图直不雅观地阐明了，为什么 MM^⊤和 M^⊤M 始终对称！

若矩阵所有项都非零，则对应完备二分图。

如果一个矩阵的所有元素都不为零，那么它对应的图就没有缺失落的连线。
这意味着 X 中的每个点都与 Y 的每个点相连。
这样的二分图称为完备二分图。

N 分块矩阵对应独立的 N 个图。

详细来说，由直和得到的分块矩阵对应断开的图。
将两个矩阵做直和运算得到更大的数组（与向量直和运算类似），即一个带有全零块的大型分块矩阵。
分块矩阵的图通过将原矩阵的图叠加得到。

关于矩阵和图我们能展开更多的谈论，但我想通过一个不同的角度来磋商。
事实证明，概率非常适宜我们矩阵-图的谈论。
这是通过另一个有趣的小事实来实现的：‍

例如：

这样的概率分布图可以让我们更好地剖析。

联合概率

通过架构图中的连线，可以得到联合概率：(x_i,y_j) 的概率是连接 x,y 两点的线的标签。

边缘概率

边缘概率是通过沿矩阵的行/列求和得到的（与上图等效）。
例如，x_1 的概率 p(x_1)=p(x_1,y_1)+p(x_1,y_2)=1/8+0，这是第一行的总和。
同样，y_2 的概率是 p(y_2)=p(x_1,y_2)+p(x_2,y_2)+p(x_3,y_2)=0+1/8+1/4，是第二列的和。

图中，x_i 的边缘概率因此 x_i 为顶点的所有连线的和。
类似地，y_j 的边缘概率因此 y_j 为顶点的所有连线的和。

条件概率

条件概率是由联合概率除以边缘概率得到的。
例如在 y_2 条件下 x_3 的概率 p(x_3|y_2)=p(x_3,y_2)/p(y_2)。
从图中可以看出，这是通过将 x_3 和 y_2 的连线除以所有与 y_2 相连的线之和得到的。
同样，y_i 下 x_j 的条件概率是两点连线的值除以所有与 x_j 相连的线之和。

这很大略，对吧？

这里边的事理并不繁芜，只是有时用新角度看旧想法是很有用的。

关系矩阵

本文的末了是另一个大略而有趣的事实，即：矩阵运算在交流环（communicative ring）上是故意义的。
不仅仅是像 R 或 C 等。
矩阵相乘乃至不须要负数：矩阵运算在交流半环上是故意义的！
（半环是一个没有相反数的环。
）

我认为这很好，由于包含两个元素 Z_2 = {0,1} 的凑集通过下图的加法和乘法形成一个半环：

为什么会这么好？由于一个矩阵 M:X×Y→Z_2 相称于一个「关系」。
「关系」是笛卡尔积 X×Y 的子集 R 的名称。
换句话说，每个 Z_2-valued 矩阵定义了一个「关系」，每个关系又定义了一个 Z_2-valued 矩阵：当且仅当 (x_i,y_j) 是 R 子集的元素时，M_ij=1，否则 M_ij=0。

Z_2 中的矩阵图与上面谈论的图完备相同，只是现在所有连线的值都是 0 或 1。
如果权重是 0，那和之前一样，我们就不画这条连线了。

（顺便说一句，你现在可以问，「既然每个「关系」对应于 Z_2 中的矩阵，那与「等价关系」相对应的矩阵是什么样的？」我离题了....）

通过将根本（半）环从 R 改为 Z_2，我们改变理解释权重的办法。
例如，在上面的概率场景中，我们可以问，「从 x_1 到 y_1 的概率是多少？」答案由对应边的权重而来，在本例中为 12.5％。
或者，当矩阵在 Z_2 中取值时，问题变为：「是否可能从 x_1 到 y_1？」如果连线标记为 1，则为「是」，如果标记为 0 则为「否」。
（这个想法已经被多次阐明了）。

主要的是，「关系」的组合恰好是利用了上面的 Z_2 算法的矩阵乘法。
换句话说，给定任意两个关系 R⊂X×Y 和 S⊂Y×Z，存在一个新关系 SR⊂X×Z，包括所有 (x,z)，至少存在一个 y∈Y，个中 (x,y)∈R，(y,z)∈S。
这种新关系正是表示 R 和 S 的矩阵乘积所指定的。

这个关于矩阵/关系的小事实绝对是我最喜好的数学事实之一。
一个缘故原由是由于有限集的范畴，「关系」很像有限向量空间和线性映射的范畴。
实际上，它更像是有限维希尔伯特空间的范畴。
这意味着许多看似不相关的想法溘然变得密切。
这些联系可以更加精准，这是一个在范畴理论界常常被分享的故事。

原文链接：www.math3ma.com/blog/matric…

每期AI知识网

手把手教你将矩阵u0026概率画成图

这台 AI 相机可以将照片转换成小同伙的涂鸭

设计小技巧PS制作生果融化海报设计案例分享

每期AI知识网

手把手教你将矩阵u0026概率画成图

这台 AI 相机可以将照片转换成小同伙的涂鸭

设计小技巧PS制作生果融化海报 设计案例分享

设计小技巧PS制作生果融化海报设计案例分享