可对角化矩阵
可对角化矩阵是线性代数和矩阵论中重要的一类矩阵。如果一个方块矩阵 A 相似于对角矩阵,也就是说,如果存在一个可逆矩阵 P 使得 P −1AP 是对角矩阵,则它就被称为可对角化的。如果 V 是有限维度的向量空间,则线性映射 T : V → V 被称为可对角化的,如果存在 V 的一个基,T 关于它可被表示为对角矩阵。对角化是找到可对角化矩阵或映射的相应对角矩阵的过程。
可对角化矩阵和映射在线性代数中有重要价值,因为对角矩阵特别容易处理。它们的特征值和特征向量是已知的,且其行列式可通过計算对角元素相乘獲得。
将矩阵对角化相当于是:找到一组基(即特征基),使得该线性变换在这组基下只是坐标轴方向上的伸缩变换(乘以一个标量),不同轴上的伸缩比例不同。所以,矩阵对角化之后,该线性变换的几何意义更容易理解。用对角矩阵表示的差分方程组或者微分方程组比较容易解出,因为每个等式只涉及一个未知函数。
若尔当-谢瓦莱分解表达一个算子为它的对角部分与它的幂零部分的和。
特征化
关于可对角化映射和矩阵的基本事实可表达为如下:
- 在域 F 上的 n × n 矩阵 A 是可对角化的,当且仅当它的特征空间的和的维度等于 n,它为真当且仅当存在由 A 的特征向量组成的 Fn 的基。如果找到了这样的基,可以形成有基向量作为纵列的矩阵 P,而 P -1AP 将是对角矩阵。这个矩阵的对角元素是 A 的特征值。
- 线性映射 T : V → V 是可对角化的,当且仅当它的特征空间的维度等于 dim(V),它为真当且仅当存在由 T 的特征向量组成的 V 的基。T 关于这个基将表示为对角矩阵。这个矩阵的对角元素是 T 的特征值。
另一个特征化: 矩阵或线性映射在域 F 上可对角化的,当且仅当它的极小多项式在 F 上有不同的线性因子。
下列充分(但非必要)条件经常是有用的。
- n × n 矩阵 A 只在域 F 上可对角化的,如果它在 F 中有 n 个不同的特征值,就是说,如果它的特征多项式在 F 中有 n 个不同的根。
- 线性映射 T : V → V 带有 n=dim(V) 是可对角化的,如果它有 n 个不同的特征值,就是说它的特征多项式在 F 中有 n 个不同的根。
作为经验规则,在复数域 C 上几乎所有矩阵都是可对角化的。更精确地说: 在 C 上不可对角化的复数 n × n 矩阵的集合被当作 Cn×n 的子集,它是关于勒贝格测度的零集。也可以说可对角化矩阵形成了关于 扎里斯基拓扑的稠密子集 : 补位于特征多项式的判别式变为零的集合内,後者是超平面。从中得出的还有在平常的(强拓扑)中密度由范数给出。
对于 R 域就不是这样了。随着 n 增长,随机选择的实数矩阵是在 R 上可对角化的可能性越来越小。
例子
可对角化矩阵
应用
对角化可被用来有效的计算矩阵 A 的幂,假如矩阵是可对角化的。比如我们找到了
是对角矩阵,因为矩阵的积是结合的,
而后者容易计算,因为它只涉及对角矩阵的幂。
在找到线性递归序列比如斐波那契数列的项的闭合形式的表达中这是非常有用的。
特定应用
例如,考虑下列矩阵:
计算 M 个各次幂揭示了一个惊人的模式:
上面的现象可以通过对角化 M 来解释。要如此我们需要由 M 的特征向量组成的 R2 的基。一个这样的特征向量基给出自
这里的 ei 指示 Rn 的标准基。 逆的基变更给出自
直接计算证实
所以,a 和 b 是分别是对应于 u 和 v 的特征值。 根据矩阵乘法的线性,我们有
切换回标准基,我们有
前面的关系用矩阵形式表达为
因此解释了上述现象。
外部链接
引用
- Roger A. Horn and Charles R. Johnson, Matrix Analysis, Chapter 1, Cambridge University Press, 1985. ISBN 0-521-30586-1 (hardback), ISBN 0-521-38632-2 (paperback).