2023-11-23发表2026-06-24更新Linear Algebra4 分钟读完 (大约665个字)

向量空间与矩阵乘法背后的空间意义

前记

学习线性代数时，矩阵乘法经常被直接定义成一堆公式。公式当然重要，但如果只记公式，很容易不知道它到底在“改变什么”。

我更想从空间角度理解矩阵乘法：矩阵不仅是一张数字表，它也可以看成一种对空间的变换。

向量是什么

向量可以看成一组有顺序的数字：

1	v = [1, 2, 3]

这组数字可以表示一个点，也可以表示从原点指向这个点的箭头。

在二维空间中：

1	v = [x, y]

表示平面上的一个位置。

在三维空间中：

1	v = [x, y, z]

表示三维空间中的一个位置。

向量空间

向量空间可以理解为由一组向量张成的空间。

例如二维平面可以由两个基向量张成：

1 2	e1 = [1, 0] e2 = [0, 1]

任何二维向量都可以写成：

1	v = xe1 + ye2

也就是：

1	v = [x, y]

矩阵乘法的直观理解

矩阵乘以向量，可以看成对向量做一次空间变换。

例如：

1 2	A = [[2, 0], [0, 1]]

这个矩阵会把 x 方向拉伸 2 倍，而 y 方向保持不变。

如果：

1	v = [1, 3]

那么：

1	A v = [2, 3]

向量的位置发生了变化。

矩阵的列向量视角

矩阵的每一列可以看成基向量变换后的结果。

例如：

1 2	A = [[a, b], [c, d]]

第一列 [a, c] 是原来的 e1 被变换后的方向。

第二列 [b, d] 是原来的 e2 被变换后的方向。

所以矩阵乘法不是随便定义出来的，它描述的是：空间中的基向量如何被重新摆放。

为什么这对机器学习重要

神经网络里有大量线性变换：

1	y = W x + b

这里的 W 就是矩阵，x 是输入向量，b 是偏置。

从空间角度看，模型的每一层都在把输入空间变换到另一个表示空间。

这也是为什么线性代数是机器学习的底层语言。

小结

矩阵乘法可以从两个角度理解：

代数角度：行乘列，得到新的数字。
几何角度：对空间进行拉伸、旋转、压缩或投影。

如果只记公式，会觉得矩阵乘法很机械；如果理解空间意义，就能更自然地理解线性模型、神经网络和表示学习。

向量空间与矩阵乘法背后的空间意义

https://richardf123.github.io/2023/11/23/向量空间/

作者

RichardF

发布于

2023-11-23

更新于

2026-06-24

许可协议

#linear-algebra

向量空间与矩阵乘法背后的空间意义

前记

向量是什么

向量空间

矩阵乘法的直观理解

矩阵的列向量视角

为什么这对机器学习重要

小结

作者

发布于

更新于

许可协议

分类

最新文章

归档

标签