线性映射
研究线性映射是研究线性空间之间的映射。
线性映射可以表示为矩阵的形式,所以在线性映射中矩阵中的大量概念都可以找到对应关系。
线性映射与线性变换
设 \(V\) 和 \(W\) 是域 \(F\) 上的两个线性空间,\(T\) 是 \(V\) 到 \(W\) 的一个映射。
如果对于 \(W\) 中任意的向量 \(x\) 和 \(y\),域 \(F\) 中任意的标量 \(k\) 和 \(l\),有:
称 \(T\) 是 \(V\) 到 \(W\) 的一个线性映射。如果 \(W=V\),则称 \(T\) 是 \(V\) 上的一个线性变换。
例如,恒等变换 \(T_e\) 保持空间不变,零变换 \(T_0\) 将空间映射至零空间。
可以记 \(L(V,W)\) 为所有 \(V\) 到 \(W\) 的线性映射构成的集合。对于全体线性变换 \(L(V,V)\),也记为 \(L(V)\)。
性质
- 线性映射将零向量映射到零向量。
- 线性映射保持线性运算形式不变,即,线性运算的线性映射,等于线性映射的线性运算。
- 线性映射保持线性相关性,即,映射前线性相关,映射后也线性相关。
但是线性映射不保持线性无关性。映射前线性无关,映射后不一定线性无关。
线性映射的矩阵表示
设 \(V\) 的维数是 \(n\),\(V\) 的一组基为 \(\alpha_1,\cdots,\alpha_n\),\(W\) 的维数是 \(m\),\(W\) 的一组基为 \(\beta_1,\cdots,\beta_m\),\(T\) 是 \(V\) 到 \(W\) 的一个线性映射。
将每个 \(\alpha\) 经由 \(T\) 映射后的向量用 \(\beta\) 表示:
采用矩阵记法:
称矩阵 \(A\) 为线性映射 \(T\) 在这两组基下的矩阵表示。
线性映射的核空间与像空间
这里的核空间与像空间是站在线性映射的视角下叙述的。借助矩阵表示可以看出,线性映射的核空间与像空间与矩阵的核空间与像空间是一致的。
设 \(T\) 是由空间 \(V\) 到空间 \(W\) 的线性映射,令:
易验证 \(N(T)\) 为 \(V\) 的子空间,\(R(T)\) 为 \(W\) 的子空间,称 \(N(T)\) 及 \(R(T)\) 为 \(V\) 的核空间和像空间,并称 \(N(T)\) 的维数为 \(T\) 的 零度 或 亏,\(R(T)\) 的维数为 \(T\) 的 秩。
定理:设 \(T\) 是由空间 \(V\) 到空间 \(W\) 的线性映射,\(V\) 的维数有限,则 \(N(T)\) 及 \(R(T)\) 均为有限维,且有:
即 \(T\) 的亏加秩等于其定义域 \(V\) 的维数。
线性变换的矩阵表示
设 \(V\) 的维数是 \(n\),\(V\) 的一组基为 \(\alpha_1,\cdots,\alpha_n\),\(T\) 是 \(V\) 上的一个线性变换,则有:
采用矩阵记法:
称矩阵 \(A\) 为线性变换 \(T\) 在这组基下的矩阵表示。
由空间结构和 \(T\) 的线性性质,\(T\) 由 \(T\alpha_1,\cdots,T\alpha_n\) 完全确定,故由 \(T\) 唯一确定一个矩阵 \(A\)。
定理:设 \(V\) 的维数是 \(n\),\(\alpha_1,\cdots,\alpha_n\) 为 \(V\) 的一组基,任取 \(n\) 阶方阵 \(A\),有且仅有一个从 \(V\) 到 \(V\) 的线性变换 \(T\),使得 \(T\) 的矩阵恰好为 \(A\)。
推论:在 \(L(V,V)\) 和全体 \(n\) 阶方阵之间存在一一对应关系。
例如:零变换对应零矩阵,恒等变换对应单位矩阵。
线性变换构成的空间
定理:\(L(V)\) 也可以构成线性空间,引入 \(L(V)\) 中的运算:对于 \(L(V)\) 中任意的 \(T_1\) 与 \(T_2\),\(V\) 中任意的 \(x\),域 \(F\) 中任意的 \(k\),有:
容易验证 \(L(V)\) 是 \(F\) 上的一个线性空间,即线性变换空间。
对于 \(L(V)\) 中的线性变换 \(T_1\) 与 \(T_2\),定义 \(T_1\) 与 \(T_2\) 的乘积 \(T_1T_2\) 为:
可以验证 \((T_1T_2)\) 也是 \(L(V)\) 中的线性变换,并且线性变换的乘积满足结合律,而不满足交换律,与矩阵的乘积类似。
对于 \(L(V)\) 中的线性变换 \(T_1\),如果 \(L(V)\) 中的线性变换 \(T_2\),使得对于 \(V\) 中任意的向量 \(x\),有:
则称 \(T_2\) 是 \(T_1\) 的逆变换,记作:
且有:
定理:设 \(V\) 的维数为 \(n\),\(\alpha_1,\cdots,\alpha_n\) 为 \(V\) 的一组基,在这组基下线性变换 \(T_1\) 的矩阵为 \(A\),\(T_2\) 的矩阵为 \(B\),则:
- 线性变换 \(T_1+T_2\) 的矩阵为 \(A+B\)
- 线性变换的数乘 \(kT_1\) 的矩阵为 \(kA\)
- 线性变换的乘积 \(T_1T_2\) 的矩阵为 \(AB\)
- 线性变换 \(T_1\) 的逆变换若存在,矩阵为 \(A^{-1}\)
坐标
设 \(n\) 个向量 \(x\) 是 \(n\) 维空间 \(V\) 的一个基,对于 \(V\) 中任意的向量 \(y\),令 \(y\) 为:
称列向量:
为向量 \(y\) 在基 \(x_1,x_2,\cdots,x_n\) 下的 坐标。
可见,坐标是由域中的标量构成的列向量,与阿贝尔群中的向量应当进行区分。
坐标变换公式
设 \(V\) 的维数为 \(n\),\(L(V)\) 中有变换 \(T\),\(T\) 在基 \(\alpha_1,\cdots,\alpha_n\) 下的矩阵为 \(A\)。设:
且有:
则有:
空间 \(V\) 中的列向量点本质上都是「基乘坐标」的形式。空间 \(V\) 中的列向量点 \(x\),本身用了单位阵 \(I\) 作为基,即 \(x=Ix\)。
只有同一个基,基不动的时候,单纯的线性变换 \(T\),就是坐标左乘普通矩阵。
把线性变换 \(T\) 看成对于空间 \(V\) 的一个观测滤镜。线性变换 \(T\) 的作用对象是空间 \(V\),将空间 \(V\) 扭曲了。加了滤镜之后,点本身的位置没有变。
这个定理也说明,对于列向量基的线性变换 \(T\),等价于对于基右乘一个过渡矩阵。
于是,在不同的基之间,坐标关系是左乘过渡矩阵的逆矩阵。
过渡矩阵
设 \(n\) 个向量 \(x\) 与 \(n\) 个向量 \(y\) 是空间 \(V\) 的两组基。对于 \(1\leq i\leq n\),令每个向量 \(y_i\) 在基 \(x_1,x_2,\cdots,x_n\) 下的坐标为:
于是 \(n\) 个向量 \(y\) 排成等式左边的矩阵,\(n\) 个坐标排成等式右边的矩阵 \(A\):
矩阵 \(A\) 称为由基 \(x_1,x_2\cdots,x_n\) 到基 \(y_1,y_2\cdots,y_n\) 的 过渡矩阵,也称为变换矩阵。
显然过渡矩阵可逆。对于上式,由基 \(y_1,y_2\cdots,y_n\) 到基 \(x_1,x_2\cdots,x_n\) 的过渡矩阵为 \(A^{-1}\)。
可见,过渡矩阵是由域中的标量构成的矩阵,并非阿贝尔群中的向量排成的矩阵,应当予以区分。
设 \(n\) 个向量 \(x\) 与 \(n\) 个向量 \(y\) 是空间 \(V\) 的两组基。对于空间 \(V\) 中的同一个向量 \(z\),有:
代入上文的
由唯一性,得到:
或者
这是纯粹坐标之间的变换,坐标变换公式均在标量域中。由于前文做了区分,线性空间与阿贝尔群中的向量是「抽象的向量」,而坐标与过渡矩阵的元素均在标量域中,视为「具体的向量」,两种向量应当视为「不同的东西」。
矩阵可以对整个空间,即全体坐标进行变换,列向量 \(x\) 作为坐标遍布整个空间。
单位矩阵 \(I\) 由单位向量构成。矩阵 \(A\) 会将单位矩阵 \(I\) 变换到矩阵 \(A\) 的每个列向量,即将单位向量变换到矩阵 \(A\) 的每个列向量。因此左乘矩阵 \(A\),也可以视为将空间做了这样的变换。
向量左乘矩阵,也可以视为坐标左乘向量组。用坐标的观点看待就是:
同一个列向量 \(y\),在「正常」的空间,单位矩阵 \(I\) 代表的空间下,坐标为 \(y\),在变换后新的空间里,坐标将记为 \(a\)。这样一来,矩阵 \(X\) 不仅是正常空间下的一组基,也是从向量组 \(I\) 到向量组 \(X\) 的过渡矩阵。
线性变换 \(T\) 会将一个基映射为另一个基,于是坐标也被映射为另一个坐标。
如果将基 \(\alpha\) 映射到 \(\beta\) 对应的线性变换 \(T\) 的过渡矩阵是 \(A\),那么对应的基矩阵就有 \(\beta=\alpha A\)。
于是坐标的关系恰好反过来。假设线性变换 \(T\) 映射后的坐标是 \(b\),即加滤镜后观察到坐标 \(b\),于是点在 \(V\) 的表示就是 \(\beta b\)。还原的办法就是用过渡矩阵,把点在 \(V\) 的表示写成 \(\alpha Ab\)。于是坐标变换为左乘过渡矩阵的逆矩阵的看法就明显了。
线性变换与矩阵相似
在空间 \(V\) 中的一个线性变换 \(T\) 对于空间 \(V\) 的基 \(\alpha\) 的关系:
线性变换 \(T\) 作用于基 \(\alpha\),将基 \(\alpha\) 映射到了 \(T(\alpha)\),相当于在基 \(\alpha\) 右乘一个 \(A\),即 \(T(\alpha)=\alpha A\)。
矩阵相似考虑的问题是:同一个线性变换 \(T\),在基 \(\beta\) 的空间 \(V\) 中描述为矩阵 \(B\),在基 \(\alpha\) 的空间 \(V\) 中描述为矩阵 \(A\)。
如果过渡矩阵为 \(C\),即 \(\beta=\alpha C\),那么两个描述 \(B\) 和 \(A\) 之间有怎样的联系。
由于是同一个变换 \(T\),可以发现一个事实,变换前后的过渡矩阵关系始终成立,即:
线性变换 \(T\) 在基 \(\beta\) 视角下仍旧为右乘,基 \(\beta\) 转化到基 \(\alpha\) 再右乘一个 \(C\),变换前后保持过渡矩阵 \(C\) 的关系:
于是问题得到解决:
定理:设 \(L(V)\) 中有变换 \(T\),则 \(T\) 在不同基下的矩阵 相似。
对于方阵 \(A\) 和方阵 \(B\),如果存在可逆矩阵 \(C\) 使得 \(B=C^{-1}AC\),则 \(A\) 和 \(B\) 相似。
矩阵相似保持秩不变,因此矩阵相似可以推出矩阵等价。但是,等价的两个矩阵未必相似。
由于矩阵相似与形状密切相关,因此矩阵相似和向量组等价、方程组同解之间没有关系。
回过头来,矩阵相似的解释就是 4 个等式:\(\beta=\alpha C\)、\(T(\alpha)=\alpha A\)、\(T(\beta)=\beta B\)、\(T(\beta)=T(\alpha)C\)。
参考资料
本页面的全部内容在 小熊老师 - 莆田青少年编程俱乐部 0594codes.cn 协议之条款下提供,附加条款亦可能应用