Jordan标准型
Jordan 分解
设 \(T\) 是 \(n\) 维空间 \(V\) 上的一个线性变换。如果 \(T\) 的最小多项式为:
那么由准素分解可知,空间 \(V\) 可以分解为子空间的直和:
其中 \(V_i=N\left({(A-\lambda_i I)}^{r_i}\right)\),式中 \(A\) 为 \(T\) 对应的矩阵,这些子空间都在 \(T\) 作用下不变。
令变换 \(T_i\) 为 \(V\) 在子空间 \(V_i\) 上的射影,即构造多项式 \(u_i(T)\) 使得:
-
\[ T_i=u_i(T)\frac{m_A(T)}{{(T-\lambda_i T_e)}^{r_i}} \]
-
\[ T_1+T_2+\cdots+T_k=T_e \]
式中 \(T_e\) 表示空间 \(V\) 的恒等变换。于是有性质:
- 变换 \(T_i\) 在空间 \(V_i\) 上的限制 \({T_i|}_{V_i}\) 为空间 \(V_i\) 的恒等变换。
- 如果 \(i\) 与 \(j\) 不相等,变换 \(T_i\) 在空间 \(V_j\) 上的限制 \({T_i|}_{V_j}\) 为空间 \(V_j\) 的零变换。
于是变换 \(T_i\) 将空间 \(V\) 的每一个向量 \(\xi\) 映射为它在空间 \(V_i\) 中的分量 \(\xi_i\)。
构造变换:
由于每一个变换 \(T_i\) 都是变换 \(T\) 的一个多项式,所以变换 \(T_D\) 也是变换 \(T\) 的一个多项式,于是每一个子空间 \(V_i\) 在变换 \(T_D\) 下不变。
由上述等式可知,变换 \(T_D\) 在子空间 \(V_i\) 上的限制 \({T_D|}_{V_i}\) 是子空间 \(V_i\) 的一个位似,位似系数为 \(\lambda_i\)。因此,变换 \(T_D\) 可以对角化。
构造:
于是变换 \(T_N\) 也是变换 \(T\) 的一个多项式,所以每一个子空间 \(V_i\) 在变换 \(T_N\) 下不变。对于子空间 \(V_i\) 中的任意向量 \(\xi_i\),有:
令 \(r\) 为全体 \(r_i\) 的最大值,那么对于空间 \(V\) 中的任意向量 \(\xi\),变换 \(T_N\) 的 \(r\) 次方将向量 \(\xi\) 映射至零向量。因此变换 \(T_N\) 是一个幂零变换。
这样,空间 \(V\) 的每一个变换 \(T\) 都可以写成:
其中 \(T_D\) 可以对角化,而 \(T_N\) 是一个幂零变换。因为 \(T_D\) 和 \(T_N\) 都是变换 \(T\) 的多项式,所以它们的乘积可交换:
定理:设 \(T_1\) 和 \(T_2\) 是空间 \(V\) 的两个可对角化变换,且 \(T_1T_2=T_2T_1\),那么存在一个基,使得 \(T_1\) 和 \(T_2\) 关于这同一个基的矩阵是对角形式。
定理:设 \(T\) 是 \(n\) 维空间 \(V\) 上的一个线性变换,那么存在一个可对角化变换 \(T_D\) 和一个幂零变换 \(T_N\),使得:
-
\[ T=T_D+T_N \]
-
\[ T_DT_N=T_NT_D \]
它们都是变换 \(T\) 的多项式,并且它们由变换 \(T\) 唯一确定。
该定理给出关于变换 \(T\) 的分解,称为 \(T\) 的若尔当(Jordan)分解,\(T_D\) 叫做 \(T\) 的可对角化部分,\(T_N\) 叫做 \(T\) 的幂零部分。
同样地,有矩阵的 Jordan 分解:
定理:设 \(A\) 是一个 \(n\) 阶矩阵,那么存在一个可对角化矩阵 \(D\) 和一个幂零矩阵 \(N\),使得:
-
\[ A=D+N \]
-
\[ DN=ND \]
它们都是矩阵 \(A\) 的多项式,并且它们由矩阵 \(A\) 唯一确定。
该定理给出关于矩阵 \(A\) 的分解,称为 \(A\) 的若尔当(Jordan)分解,\(D\) 叫做 \(A\) 的可对角化部分,\(N\) 叫做 \(A\) 的幂零部分。
lambda 矩阵
接下来引入的部分是含有变元参量 \(\lambda\) 的更广义的矩阵,不仅仅是一个数表。这部分讨论相较单纯由数构成的矩阵而言,更加广泛一些。
对于 \(\lambda\) 矩阵,对应空间相应的域,变为含有一个变元 \(\lambda\) 的有理式域。
以 \(\lambda\) 的多项式为元素的矩阵称为 \(\lambda\) 矩阵,记为 \(A(\lambda)\)。
由于多项式域包含数域,数字矩阵是特殊的 \(\lambda\) 矩阵,数字矩阵 \(A\) 的特征矩阵 \(\lambda I-A\) 是一种 \(\lambda\) 矩阵。
lambda 矩阵的初等变换
对于 \(\lambda\) 矩阵,同样可以定义加减法、乘法、初等变换、秩。对于 \(\lambda\) 方阵,同样可以定义行列式、余子式、代数余子式。
对于 \(\lambda\) 矩阵,初等变换与数阵大多相同,仅将倍加变换改为(这里以行变换为例):
- 用 \(\lambda\) 的多项式 \(\varphi(\lambda)\) 乘某行并加到另一行上。
注意倍乘变换不进行修改。这是因为倍加变换不改变行列式,而倍乘变换改变行列式。为了保持多项式域的秩的性质,行列式只能在数域上进行改变。
相应的初等矩阵也一并进行修改。
易见三种初等阵的行列式均为非零常数,因此均为满秩。所以它们左乘或右乘,不改变 \(\lambda\) 矩阵的秩。
若 \(A(\lambda)\) 经过有限次初等变换变为 \(B(\lambda)\),则称 \(A(\lambda)\) 和 \(B(\lambda)\) 等价。
对于 \(\lambda\) 矩阵,如果等价,则秩相同。反之则不然,这与数字矩阵有区别。
Smith 标准型
定理:设 \(\lambda\) 矩阵的秩是 \(r\),则 \(A(\lambda)\) 一定等价于:
其中:
每一个 \(d_i(\lambda)\) 是一个首 \(1\) 多项式,并且相邻两个多项式有整除关系 \(d_i(\lambda)|d_{i+1}(\lambda)\)。
称此标准型为 Smith 标准型,称 \(d_i(\lambda)\) 为不变因子。
具体求解 Smith 标准型的办法是,从左上角到右下角进行消元,每次左上角的元素是右下方剩余的全体多项式的最大公因式,并借助左上角的元素将该行该列全部消为 \(0\)。
定理:条件 \(A(\lambda)\) 和 \(B(\lambda)\) 等价,等价于条件 \(A(\lambda)\) 和 \(B(\lambda)\) 拥有完全一样的不变因子。
初等因子
由代数基本定理,设 \(A(\lambda)\) 的不变因子 \(d_1(\lambda),d_2(\lambda),\cdots,d_m(\lambda)\) 的分解为:
其中 \(\lambda_1,\cdots,\lambda_S\) 互不相同。由于:
因此指数 \(e_{1j},e_{2j},\cdots,e_{mj}\) 递增,并且最后一项 \(d_m(\lambda)\) 的各项指数均非零。
上式中指数大于零的全部因子,统称为 \(A(\lambda)\) 的初等因子。
注意,初等因子计重数。如果对于某个 \(j\),指数 \(e_{ij}\) 出现了若干次,则对应的初等因子 \({(\lambda-\lambda_j)}^{e_{ij}}\) 也应当出现相应次数。
之前的定理说明,\(A(\lambda)\) 与 \(B(\lambda)\) 等价,等价于他们两个拥有完全一致的不变因子。不变因子完全相同,自然初等因子也完全相同,但是反之则不然。事实上有结论:
定理:\(A(\lambda)\) 与 \(B(\lambda)\) 不变因子完全相同,等价于初等因子和秩均完全相同。
于是「初等因子和秩均完全相同」也成为判断 \(\lambda\) 矩阵等价性的条件。
在初等变换的时候,也可以先将 \(A(\lambda)\) 变换为对角阵,再求出初等因子和秩,再求出不变因子得到标准型。有结论:
定理:设 \(A(\lambda)\) 等价于对角阵:
那么有 \(f_1(\lambda),f_2(\lambda),\cdots,f_r(\lambda)\) 的全体一次因子的幂 \({(\lambda-\lambda_j)}^{e_{ij}}\),构成 \(A(\lambda)\) 的初等因子。
由初等因子和秩构造不变因子的具体方法为:先将初等因子按照因式分类,排成表格,把同类因式进行降幂排列放到同一行,各类因式的最高次幂放到一列,把列数用 \(1\) 补齐至秩 \(r\),那么每一列的乘积构成一个不变因子。
在特征矩阵中的应用
如果 \(A\) 与 \(B\) 是数阵,那么它们的特征矩阵是 \(\lambda\) 矩阵。有结论:
定理:条件数阵 \(A\) 与 \(B\) 相似,等价于条件特征矩阵 \(\lambda I-A\) 和 \(\lambda I-B\) 等价。
由于特征矩阵 \(\lambda I-A\) 只在主对角线含有 \(n\) 个 \(\lambda\),所以秩为 \(n\)。由上述推理,同型的数阵的特征矩阵的秩始终相等,于是有等价性:
数阵 \(A\) 与 \(B\) 相似,等价于特征矩阵 \(\lambda I-A\) 和 \(\lambda I-B\) 有完全相同的初等因子。
对于特征矩阵 \(\lambda I-A\),初等变换保持等价性,所以不改变秩。
观察三种初等变换,由于唯一被改写的倍加变换不改变行列式,事实上三种初等变换仅对行列式的结果多项式改变常数倍,因此不改变行列式的结果多项式的因式分解与次数。
因此特征矩阵 \(\lambda I-A\) 的行列式为 \(n\) 次多项式,初等变换化为 Smith 标准型后,由于秩为 \(n\),行列式就是主对角线全体不变因子的乘积,也等于全体初等因子的乘积。因此,特征矩阵 \(\lambda I-A\) 的全体初等因子的次数之和等于 \(n\)。
Jordan 标准型
矩阵
主对角线上的元素都是 \(\lambda\),紧邻主对角线上方的元素都是 \(1\),其余位置都是 \(0\),叫做属于 \(\lambda\) 的一个 Jordan 矩阵,或称 Jordan 块。
显然,幂零 Jordan 矩阵是 Jordan 矩阵的特例,即 \(\lambda\) 为 \(0\) 的情形。
定理:设 \(T\) 是 \(n\) 维空间 \(V\) 的一个变换,\(\lambda_1,\cdots,\lambda_k\) 是 \(T\) 的一切互不相同的特征值,那么存在一个基,使得 \(T\) 关于这个基的矩阵有形状:
其中
其中 \(J_{i1},\cdots,J_{is_i}\) 都是属于 \(\lambda_i\) 的 Jordan 块。
这是因为,首先根据最小多项式:
有准素分解:
其中:
式中 \(A\) 为 \(T\) 对应的矩阵。
令变换 \(S_i\) 为 \(T\) 在 \(V_i\) 上的限制 \({T|}_{V_i}\),接下来试图对每一个 \(S_i\) 进行 Jordan 分解。
记 \(T_e\) 为 \(V\) 上的恒等变换。与前文的 Jordan 分解不同,记 \(T_i\) 为 \(S_i\) 的 Jordan 分解中的幂零部分:
于是 \(T_i\) 为子空间 \(V_i\) 的一个幂零变换,事实上也是 \(T-\lambda_i T_e\) 在 \(V_i\) 上的限制 \({(T-\lambda_i T_e)|}_{V_i}\)。
子空间 \(V_i\) 可以分解为幂零变换 \(T_i\) 循环子空间的直和:
在每一个循环子空间 \(W_{ij}\) 里,取一个循环基并倒序排列,凑成 \(V_i\) 的一个基,于是 \(T_i\) 关于这个基的矩阵有形状:
全体 \(N_{ij}\) 均为幂零 Jordan 块。于是对于 \(V_i\) 上述选取的基,\(S_i\) 对应的矩阵是:
这里 \(J_{i1},J_{i2},\cdots,J_{is_i}\) 都是属于 \(\lambda_i\) 的 Jordan 块。
对于每一个子空间 \(V_i\),按照以上方式选取一个基,凑起来成为 \(V\) 的基,那么 \(T\) 关于这个基的矩阵即构成定理规定的形式。
形如:
的 \(n\) 阶矩阵,其中每一个 \(J_i\) 都是一个 Jordan 块,叫做一个 Jordan 标准型。
定理:每一个 \(n\) 阶矩阵 \(A\) 都与一个 Jordan 标准型相似。除了各个 Jordan 块排列的次序以外,与 \(A\) 相似的 Jordan 标准型是由 \(A\) 唯一确定的。
注意在上述构造的矩阵 \(B_i\) 中,第一项是一个单位阵的若干倍,自然可以和第二项交换。因此,第一项就是 \(B_i\) 的 Jordan 分解的可对角化部分,第二项就是 \(B_i\) 的 Jordan 分解的幂零部分。
在一个矩阵对应的 Jordan 标准型里面,主对角线上的元素构成的对角阵是这个矩阵对应的 Jordan 标准型的可对角化部分,把主对角线上的元素换成 \(0\) 就得到这个矩阵对应的 Jordan 标准型的幂零部分。
定理:对于矩阵 \(A\) 的 Jordan 标准型中,每一个 Jordan 块:
对应于特征矩阵 \(\lambda I-A\) 的一个初等因子 \({(\lambda-\lambda_i)}^{n_i}\),特征矩阵 \(\lambda I-A\) 的全体初等因子对应于矩阵 \(A\) 的 Jordan 标准型中的全体 Jordan 块。
这是因为,矩阵 \(A\) 相似于它的 Jordan 标准型,因此两者的特征矩阵也等价,将 Jordan 标准型的特征矩阵化为 Smith 标准型即可看出。
由这个定理,借助特征矩阵 \(\lambda I-A\) 的初等因子,可以写出矩阵 \(A\) 的 Jordan 标准型。
一个推论是,矩阵 \(A\) 可对角化,等价于特征矩阵 \(\lambda I-A\) 的初等因子均为一次的。
弗罗贝尼乌斯(Forbenious)定理
上文指出,\(n\) 阶特征矩阵的 Smith 标准形的秩为 \(n\)。
定理:设矩阵 \(A\) 的特征矩阵 \(\lambda I-A\) 的 Smith 标准形为:
则最后一个不变因子 \(d_n(\lambda)\) 恰好为矩阵 \(A\) 的最小多项式 \(m_A(\lambda)\)。
推论:矩阵 \(A\) 可对角化的等价条件为:
- 最小多项式 \(m_A(\lambda)\) 无重根。
- 特征矩阵 \(\lambda I-A\) 的不变因子无重根。
- 特征矩阵 \(\lambda I-A\) 的初等因子均为一次的。
本页面的全部内容在 小熊老师 - 莆田青少年编程俱乐部 0594codes.cn 协议之条款下提供,附加条款亦可能应用