跳转至

线性映射

研究线性映射是研究线性空间之间的映射。

线性映射可以表示为矩阵的形式,所以在线性映射中矩阵中的大量概念都可以找到对应关系。

线性映射与线性变换

\(V\)\(W\) 是域 \(F\) 上的两个线性空间,\(T\)\(V\)\(W\) 的一个映射。

如果对于 \(W\) 中任意的向量 \(x\)\(y\),域 \(F\) 中任意的标量 \(k\)\(l\),有:

\[ T(kx+ly)=kTx+lTy \]

\(T\)\(V\)\(W\) 的一个线性映射。如果 \(W=V\),则称 \(T\)\(V\) 上的一个线性变换。

例如,恒等变换 \(T_e\) 保持空间不变,零变换 \(T_0\) 将空间映射至零空间。

可以记 \(L(V,W)\) 为所有 \(V\)\(W\) 的线性映射构成的集合。对于全体线性变换 \(L(V,V)\),也记为 \(L(V)\)

性质

  • 线性映射将零向量映射到零向量。
  • 线性映射保持线性运算形式不变,即,线性运算的线性映射,等于线性映射的线性运算。
  • 线性映射保持线性相关性,即,映射前线性相关,映射后也线性相关。

但是线性映射不保持线性无关性。映射前线性无关,映射后不一定线性无关。

线性映射的矩阵表示

\(V\) 的维数是 \(n\)\(V\) 的一组基为 \(\alpha_1,\cdots,\alpha_n\)\(W\) 的维数是 \(m\)\(W\) 的一组基为 \(\beta_1,\cdots,\beta_m\)\(T\)\(V\)\(W\) 的一个线性映射。

将每个 \(\alpha\) 经由 \(T\) 映射后的向量用 \(\beta\) 表示:

\[ T\alpha_j=a_{1j}\beta_1+\cdots+a_{mj}\beta_n \]

采用矩阵记法:

\[ T(\alpha_1,\cdots,\alpha_n)=(T\alpha_1,\cdots,T\alpha_n)=(\beta_1,\cdots,\beta_m)A \]

称矩阵 \(A\) 为线性映射 \(T\) 在这两组基下的矩阵表示。

线性映射的核空间与像空间

这里的核空间与像空间是站在线性映射的视角下叙述的。借助矩阵表示可以看出,线性映射的核空间与像空间与矩阵的核空间与像空间是一致的。

\(T\) 是由空间 \(V\) 到空间 \(W\) 的线性映射,令:

\[ N(T)=\{x\in V|Tx=0\} \]
\[ R(T)=Im(T)=\{y\in W|y=Tx,Vx\in V\} \]

易验证 \(N(T)\)\(V\) 的子空间,\(R(T)\)\(W\) 的子空间,称 \(N(T)\)\(R(T)\)\(V\) 的核空间和像空间,并称 \(N(T)\) 的维数为 \(T\)零度\(R(T)\) 的维数为 \(T\)

定理:设 \(T\) 是由空间 \(V\) 到空间 \(W\) 的线性映射,\(V\) 的维数有限,则 \(N(T)\)\(R(T)\) 均为有限维,且有:

\[ \operatorname{dim} N(T)+\operatorname{dim} R(T)=\operatorname{dim} V \]

\(T\) 的亏加秩等于其定义域 \(V\) 的维数。

线性变换的矩阵表示

\(V\) 的维数是 \(n\)\(V\) 的一组基为 \(\alpha_1,\cdots,\alpha_n\)\(T\)\(V\) 上的一个线性变换,则有:

\[ T\alpha_j=a_{1j}\alpha_1+\cdots+a_{nj}\alpha_n \]

采用矩阵记法:

\[ T(\alpha_1,\cdots,\alpha_n)=(T\alpha_1,\cdots,T\alpha_n)=(\alpha_1,\cdots,\alpha_n)A \]

称矩阵 \(A\) 为线性变换 \(T\) 在这组基下的矩阵表示。

由空间结构和 \(T\) 的线性性质,\(T\)\(T\alpha_1,\cdots,T\alpha_n\) 完全确定,故由 \(T\) 唯一确定一个矩阵 \(A\)

定理:设 \(V\) 的维数是 \(n\)\(\alpha_1,\cdots,\alpha_n\)\(V\) 的一组基,任取 \(n\) 阶方阵 \(A\),有且仅有一个从 \(V\)\(V\) 的线性变换 \(T\),使得 \(T\) 的矩阵恰好为 \(A\)

推论:在 \(L(V,V)\) 和全体 \(n\) 阶方阵之间存在一一对应关系。

例如:零变换对应零矩阵,恒等变换对应单位矩阵。

线性变换构成的空间

定理:\(L(V)\) 也可以构成线性空间,引入 \(L(V)\) 中的运算:对于 \(L(V)\) 中任意的 \(T_1\)\(T_2\)\(V\) 中任意的 \(x\),域 \(F\) 中任意的 \(k\),有:

\[ (T_1+T_2)x=T_1x+T_2x \]
\[ (kT_1)x=k(T_1x) \]

容易验证 \(L(V)\)\(F\) 上的一个线性空间,即线性变换空间。

对于 \(L(V)\) 中的线性变换 \(T_1\)\(T_2\),定义 \(T_1\)\(T_2\) 的乘积 \(T_1T_2\) 为:

\[ (T_1T_2)x=T_2(T_1x) \]

可以验证 \((T_1T_2)\) 也是 \(L(V)\) 中的线性变换,并且线性变换的乘积满足结合律,而不满足交换律,与矩阵的乘积类似。

对于 \(L(V)\) 中的线性变换 \(T_1\),如果 \(L(V)\) 中的线性变换 \(T_2\),使得对于 \(V\) 中任意的向量 \(x\),有:

\[ (T_1T_2)x=T_1(T_2x)=x \]

则称 \(T_2\)\(T_1\) 的逆变换,记作:

\[ T_2=T_1^{-1} \]

且有:

\[ T_1T_2=T_2T_1=T_e \]

定理:设 \(V\) 的维数为 \(n\)\(\alpha_1,\cdots,\alpha_n\)\(V\) 的一组基,在这组基下线性变换 \(T_1\) 的矩阵为 \(A\)\(T_2\) 的矩阵为 \(B\),则:

  • 线性变换 \(T_1+T_2\) 的矩阵为 \(A+B\)
  • 线性变换的数乘 \(kT_1\) 的矩阵为 \(kA\)
  • 线性变换的乘积 \(T_1T_2\) 的矩阵为 \(AB\)
  • 线性变换 \(T_1\) 的逆变换若存在,矩阵为 \(A^{-1}\)

坐标

\(n\) 个向量 \(x\)\(n\) 维空间 \(V\) 的一个基,对于 \(V\) 中任意的向量 \(y\),令 \(y\) 为:

\[ y=a_1x_1+a_2x_2+\cdots+a_nx_n=(x_1,x_2,\cdots,x_n)\begin{pmatrix}a_1\\a_2\\\vdots\\a_n\end{pmatrix} \]

称列向量:

\[ \begin{pmatrix}a_1\\a_2\\\vdots\\a_n\end{pmatrix} \]

为向量 \(y\) 在基 \(x_1,x_2,\cdots,x_n\) 下的 坐标

可见,坐标是由域中的标量构成的列向量,与阿贝尔群中的向量应当进行区分。

坐标变换公式

\(V\) 的维数为 \(n\)\(L(V)\) 中有变换 \(T\)\(T\) 在基 \(\alpha_1,\cdots,\alpha_n\) 下的矩阵为 \(A\)。设:

\[ \xi=(\alpha_1,\cdots,\alpha_n)\begin{pmatrix}x_1\\x_2\\\vdots\\x_n\end{pmatrix} \]

且有:

\[ T\xi=T(\alpha_1,\cdots,\alpha_n)\begin{pmatrix}y_1\\y_2\\\vdots\\y_n\end{pmatrix} \]

则有:

\[ T\xi=T(\alpha_1,\cdots,\alpha_n)\begin{pmatrix}y_1\\y_2\\\vdots\\y_n\end{pmatrix}=(\alpha_1,\cdots,\alpha_n)A\begin{pmatrix}x_1\\x_2\\\vdots\\x_n\end{pmatrix} \]

空间 \(V\) 中的列向量点本质上都是「基乘坐标」的形式。空间 \(V\) 中的列向量点 \(x\),本身用了单位阵 \(I\) 作为基,即 \(x=Ix\)

只有同一个基,基不动的时候,单纯的线性变换 \(T\),就是坐标左乘普通矩阵。

把线性变换 \(T\) 看成对于空间 \(V\) 的一个观测滤镜。线性变换 \(T\) 的作用对象是空间 \(V\),将空间 \(V\) 扭曲了。加了滤镜之后,点本身的位置没有变。

这个定理也说明,对于列向量基的线性变换 \(T\),等价于对于基右乘一个过渡矩阵。

于是,在不同的基之间,坐标关系是左乘过渡矩阵的逆矩阵。

过渡矩阵

\(n\) 个向量 \(x\)\(n\) 个向量 \(y\) 是空间 \(V\) 的两组基。对于 \(1\leq i\leq n\),令每个向量 \(y_i\) 在基 \(x_1,x_2,\cdots,x_n\) 下的坐标为:

\[ y_i=(x_1,x_2,\cdots,x_n)\begin{pmatrix}a_{1i}\\a_{2i}\\\vdots\\a_{ni}\end{pmatrix} \]

于是 \(n\) 个向量 \(y\) 排成等式左边的矩阵,\(n\) 个坐标排成等式右边的矩阵 \(A\)

\[ (y_1,y_2,\cdots,y_n)=(x_1,x_2,\cdots,x_n)A \]

矩阵 \(A\) 称为由基 \(x_1,x_2\cdots,x_n\) 到基 \(y_1,y_2\cdots,y_n\)过渡矩阵,也称为变换矩阵。

显然过渡矩阵可逆。对于上式,由基 \(y_1,y_2\cdots,y_n\) 到基 \(x_1,x_2\cdots,x_n\) 的过渡矩阵为 \(A^{-1}\)

可见,过渡矩阵是由域中的标量构成的矩阵,并非阿贝尔群中的向量排成的矩阵,应当予以区分。

\(n\) 个向量 \(x\)\(n\) 个向量 \(y\) 是空间 \(V\) 的两组基。对于空间 \(V\) 中的同一个向量 \(z\),有:

\[ z=(x_1,x_2,\cdots,x_n)\begin{pmatrix}\xi_1\\\xi_2\\\vdots\\\xi_n\end{pmatrix}=(y_1,y_2\cdots,y_n)\begin{pmatrix}\eta_1\\\eta_2\\\vdots\\\eta_n\end{pmatrix} \]

代入上文的

\[ (y_1,y_2\cdots,y_n)=(x_1,x_2\cdots,x_n)A \]

由唯一性,得到:

\[ \begin{pmatrix}\xi_1\\\xi_2\\\vdots\\\xi_n\end{pmatrix}=A\begin{pmatrix}\eta_1\\\eta_2\\\vdots\\\eta_n\end{pmatrix} \]

或者

\[ \begin{pmatrix}\eta_1\\\eta_2\\\vdots\\\eta_n\end{pmatrix}=A^{-1}\begin{pmatrix}\xi_1\\\xi_2\\\vdots\\\xi_n\end{pmatrix} \]

这是纯粹坐标之间的变换,坐标变换公式均在标量域中。由于前文做了区分,线性空间与阿贝尔群中的向量是「抽象的向量」,而坐标与过渡矩阵的元素均在标量域中,视为「具体的向量」,两种向量应当视为「不同的东西」。

矩阵可以对整个空间,即全体坐标进行变换,列向量 \(x\) 作为坐标遍布整个空间。

单位矩阵 \(I\) 由单位向量构成。矩阵 \(A\) 会将单位矩阵 \(I\) 变换到矩阵 \(A\) 的每个列向量,即将单位向量变换到矩阵 \(A\) 的每个列向量。因此左乘矩阵 \(A\),也可以视为将空间做了这样的变换。

向量左乘矩阵,也可以视为坐标左乘向量组。用坐标的观点看待就是:

\[ Iy=Xa \]

同一个列向量 \(y\),在「正常」的空间,单位矩阵 \(I\) 代表的空间下,坐标为 \(y\),在变换后新的空间里,坐标将记为 \(a\)。这样一来,矩阵 \(X\) 不仅是正常空间下的一组基,也是从向量组 \(I\) 到向量组 \(X\) 的过渡矩阵。

线性变换 \(T\) 会将一个基映射为另一个基,于是坐标也被映射为另一个坐标。

如果将基 \(\alpha\) 映射到 \(\beta\) 对应的线性变换 \(T\) 的过渡矩阵是 \(A\),那么对应的基矩阵就有 \(\beta=\alpha A\)

于是坐标的关系恰好反过来。假设线性变换 \(T\) 映射后的坐标是 \(b\),即加滤镜后观察到坐标 \(b\),于是点在 \(V\) 的表示就是 \(\beta b\)。还原的办法就是用过渡矩阵,把点在 \(V\) 的表示写成 \(\alpha Ab\)。于是坐标变换为左乘过渡矩阵的逆矩阵的看法就明显了。

线性变换与矩阵相似

在空间 \(V\) 中的一个线性变换 \(T\) 对于空间 \(V\) 的基 \(\alpha\) 的关系:

线性变换 \(T\) 作用于基 \(\alpha\),将基 \(\alpha\) 映射到了 \(T(\alpha)\),相当于在基 \(\alpha\) 右乘一个 \(A\),即 \(T(\alpha)=\alpha A\)

矩阵相似考虑的问题是:同一个线性变换 \(T\),在基 \(\beta\) 的空间 \(V\) 中描述为矩阵 \(B\),在基 \(\alpha\) 的空间 \(V\) 中描述为矩阵 \(A\)

如果过渡矩阵为 \(C\),即 \(\beta=\alpha C\),那么两个描述 \(B\)\(A\) 之间有怎样的联系。

由于是同一个变换 \(T\),可以发现一个事实,变换前后的过渡矩阵关系始终成立,即:

\[ T(\beta)=T(\alpha)C=\alpha AC \]

线性变换 \(T\) 在基 \(\beta\) 视角下仍旧为右乘,基 \(\beta\) 转化到基 \(\alpha\) 再右乘一个 \(C\),变换前后保持过渡矩阵 \(C\) 的关系:

\[ T(\beta)=\beta B=\alpha CB \]

于是问题得到解决:

\[ B=C^{-1}AC \]

定理:设 \(L(V)\) 中有变换 \(T\),则 \(T\) 在不同基下的矩阵 相似

对于方阵 \(A\) 和方阵 \(B\),如果存在可逆矩阵 \(C\) 使得 \(B=C^{-1}AC\),则 \(A\)\(B\) 相似。

矩阵相似保持秩不变,因此矩阵相似可以推出矩阵等价。但是,等价的两个矩阵未必相似。

由于矩阵相似与形状密切相关,因此矩阵相似和向量组等价、方程组同解之间没有关系。

回过头来,矩阵相似的解释就是 4 个等式:\(\beta=\alpha C\)\(T(\alpha)=\alpha A\)\(T(\beta)=\beta B\)\(T(\beta)=T(\alpha)C\)

参考资料