我们从同济课本的一个例题入手:

求解方程组

$\left{\begin{array}{r}{x_{1}+2 x_{2}+2 x_{3}+x_{4}=0} \ {2 x_{1}+x_{2}-2 x_{3}-2 x_{4}=0} \ {x_{1}-x_{2}-4 x_{3}-3 x_{4}=0}\end{array}\right.$

系数矩阵 $A=\left (\begin {array}{rrrr}{1} & {2} & {2} & {1} \ {2} & {1} & {-2} & {-2} \ {1} & {-1} & {-4} & {-3}\ {0} & {0} & {0} & {0}\end {array}\right)$ (当然,最后一行常常不写) 原方程组可以记作 $AX=B$, 此处 $B=O, X=[x\_1\dots x\_4]^T$

我们可以看作对 $A$ 施加一个线性变换 $X$, 使得向量组 $A$ 变换为 0 维向量组 (原点).

也可以看作对向量 $X$ 施加一个线性变换 $A$, 使得向量 $X$ 变换为 0 维向量组 (原点).

不管如何,题目希望我们求出 $X$

对 $A$ 施加初等行变换,使其行最简化,这意味着把 $A$ 中的向量尽可能归入低维度.

按照我们惯用的解法会得到这样的方程组:

$\left{\begin{array}{l}{x_{1}=2 x_{3}+\frac{5}{3} x_{4}} \ {x_{2}=-2 x_{3}-\frac{4}{3} x_{4}}\end{array}\right.$

最后解出 $X = \left [\begin {array}{l}{x_{1}} \ {x_{2}} \ {x_{3}} \ {x_{4}}\end {array}\right]=\left [\begin {array}{c}{2 c_{1}+\frac {5}{3} c_{2}} \ {-2 c_{1}-\frac {4}{3} c_{2}} \ {c_{1}} \ {c_{2}}\end {array}\right]=c_{1}\left (\begin {array}{r}{2} \ {-2} \ {1} \ {0}\end {array}\right)+c_{2}\left (\begin {array}{r}{\frac {5}{3}} \ {-\frac {4}{3}} \ {0} \ {1}\end {array}\right)$

假设解构成的集合 (解空间) 是 $S$

$r (A)=2$, 来源:行最简化后 $A$ 的最高维向量的维度是 2.

$r (S) = 2$ 来源: $n-r (A) = 4-2=2$ 具体来说,我们得到方程组 $\left {\begin {array}{l}{x_{1}=2 x_{3}+\frac {5}{3} x_{4}} \ {x_{2}=-2 x_{3}-\frac {4}{3} x_{4}}\end {array}\right.$ 之后,左边是主元 $x\_1, x\_2$ 右边有自由未知量 $x\_3, x\_4$, 是主元从何而来?来自于行阶梯化后的非零行, 所以非零行有几个,主元就有几个。同时非零行有几个,就是几,所以秩是 $r (A)$, 非零行就有 $r (A)$ 个,主元就有 $r (A)$ 个.

那么,由于 所有未知量只包括主元和自由未知量,根据加减法原理,所有未知量的数目 $r_{max}(X)$, 减去主元数目后剩下的,就是自由未知量的数目。也即 $r_{max}(X) = n - r (A) $, 所以 $r (X) \leq n - r (A) $

这里为什么写 $r\_{max}(X)$ 而不是 $r (X)$ 呢?因为 $X$ 只是代表解空间中的任意向量,它不是解空间也不是一个确定的向量。比如当 $c\_1 =1, c\_2 = 3$ 的时候,$X=\left (\begin {matrix} 7\-6\1\3\end {matrix}\right)$ 这个时候 $X$ 没有非零行,它的维度是 $4$ 所以秩也是 $4$, 当 $c\_1 =0, c_2 = 0$ 的时候,$X=\left (\begin {matrix} 0\0\0\0\end {matrix}\right)$, 它的维度是 $0$, 秩是 $0$. 写 $r_{max}(X)$ 就表示前一种情况,也就是维度最大的情况.

翻开我们的玄学教材,你会看到这样一条性质: $A_{m \times n} B=O \Rightarrow r (A)+r (B) \leq n$. 我们看刚才这个齐次线性方程组,$AX=O$, 根据前面的 $r (X) \leq n - r (A) $, 把 $r (A)$ 移到左边,就有 $r (A) + r (X) \leq n$ 这不就是书上的结论了吗,其实非常简单,只是我们的教科书不说人话,全程因为所以因为所以,我们只能一脸懵逼一脸懵逼.

在玄学教材中,还有这样一个性质: $n-r=R_s$ 其中 $R_s$ 就是解空间的维度,而解空间的维度取决于里面的向量最大能到多少维,里面的向量就是 $X$, 而 $X$ 最大是多少维?自然是 $r_{max}(X)$, 所以解空间的维度 $R_s = r_{max}(X)$. 可见,这两个性质其实是同一个的不同表现形式。现在理解起来也很容易了.

另外,我们常常容易弄混淆的就是行数列数什么的,其实在这里,应有行数就是列数就是所有未知量的数目就是解空间的维度. 为什么我要叫应有行数?对于非方阵的系数矩阵,我们可以在下面补全全为 $0$ 的行构成方阵,这样得到的方阵就是应有行数.

当没有自由未知量的时候呢?这个时候 $r (S) = n - r = 0$ 解空间是 0 维,0 维表示空间中的零向量 $(0,0,\dots,0)$ 所以这个时候只有 0 解. 当不为零的时候,解空间或是直线或是平面,或是其它高维空间,都包含无数个向量,所以说线性方程组如果不是只有零解就一定有无穷个解

由此我们还可以拓展到非其次线性方程组的情况

假设行最简化得到 $\left [\begin {array}{rrrrr}{1} & {-2} & {3} & {-1} & {1} \ {0} & {5} & {-4} & {0} & {-1} \ {0} & {0} & {0} & {0} & {2}\end {array}\right]$

最右边的向量是常数项构成的列向量。书上说 “可见 $R (\boldsymbol {A})=2, R (\boldsymbol {B})=3$ 所以方程组无解”, 我们就把这里的所以展开说说。前面说到,行最简化就是向量尽可能低维度化。一波操作之后,就是要用左边的列向量组 $\left [\begin {array}{llll}{1} & {-2} & {3} & {-1} \ {0} & {5} & {-4} & {0} \ {0} & {0} & {0} & {0}\end {array}\right]$ 中的列向量线性组合得到右边的常数向量 $\left [\begin {array}{r}{1} \ {-1} \ {2}\end {array}\right]$ 显然构成不了,所以说无解。因此有定理:系数矩阵秩小于增广矩阵秩,无解。此为原因.