上文说了可逆这个话题,理解起来很简单,就是不变的东西。
想象一个池塘,水面很平静。
池塘的水面:可以看作是一个平面(二维空间)。
你向池塘里扔一块石头:这相当于对水面施加了一个线性变换(激起波纹)。
波纹:可以看作是水面上的向量。
有些波纹会特别稳定:
特定的波纹:有些波纹在石头落水后,虽然会变大或变小,但始终保持着原来的形状,只是沿着固定的方向振动。
振动频率:这些波纹的振动频率就是特征值。
振动方向:这些波纹的振动方向就是特征向量。
特征值:表示一个线性变换下,某个向量被拉伸或压缩的倍数。
特征向量:表示一个线性变换下,方向保持不变的向量。
更正式的定义:
对于一个方阵A,如果存在一个非零向量x和一个标量λ,使得:
Ax = λx
那么,λ就称为矩阵A的一个特征值,x称为对应的特征向量。
揭示矩阵的本质: 特征值和特征向量告诉我们,矩阵在进行线性变换时,哪些方向上的向量只发生缩放,而不会改变方向。
矩阵对角化: 通过特征值和特征向量,我们可以将矩阵对角化,这在很多计算中会带来很大的方便。
构造特征方程:
det(A - λI) = 0
其中,I是单位矩阵。
求解特征方程:解这个方程,得到的λ就是矩阵A的特征值。
求解特征向量:对于每一个特征值λ,将λ代入方程(A - λI)x = 0,求解这个方程组,得到的非零解x就是对应的特征向量。
解特征多项式方程,得到的λ就是矩阵A的特征值。构造特征方程: 特征矩阵的行列式就是特征多项式。
特征矩阵是构造特征多项式的基础。
特征多项式的根就是矩阵的特征值。
特征值和特征向量共同描述了矩阵的线性变换性质。
一个计算
特征空间想象成一个房间,特征向量是房间里的家具。代数重数表示这个房间有多大,而几何重数表示这个房间里能摆放多少件不相同的家具。如果房间足够大(代数重数大),而且家具的摆放方式足够多样(几何重数大),那么这个房间就非常“舒适”。
其实这个里面还有概念,有点多:
几何重数:
定义: 对于一个特征值λ,它的几何重数就是对应于λ的线性无关的特征向量的最大数量。换句话说,就是特征空间的维度。
特征空间: 对于一个特征值λ,所有满足Ax=λx的向量x构成的集合称为λ对应的特征空间。
代数重数指的是特征值在特征多项式中出现的次数,也就是特征方程的重根数。它反映了特征值在代数上的重要性。关注的是特征值在方程中的出现次数,是一个代数概念。代数重数反映了特征值的重要性,重数越大,特征值对矩阵的影响就越大。代数重数就像一个人的年龄,它是一个固定的数值,表示一个人存在的时间长度。
几何重数指的是对应于该特征值的线性无关的特征向量的个数。它反映了特征值在几何上的重要性,即特征空间的维度。特征向量在空间中的分布情况,是一个几何概念。几何重数反映了特征空间的维度,即对应于该特征值的特征向量张成的空间的维度。就像一个人在社交圈中的影响力,它反映了这个人有多少个“铁杆粉丝”。一个人的年龄可能会很大,但他的影响力不一定很大。
几何重数总是小于等于代数重数。 也就是说,一个特征值对应的线性无关的特征向量的数量不会超过它的代数重数。
当几何重数等于代数重数时,我们称这个特征值是半简单的。
对角化这个事情,我觉得有必要再写一篇
当几何重数等于代数重数时,特征空间的维度达到了最大,此时矩阵可对角化。
当几何重数小于代数重数时,特征空间的维度小于最大可能值,矩阵不可对角化。
第一种情况:如果λ₁的几何重数也是2,那么说明存在两个线性无关的特征向量对应于λ₁,矩阵A是可对角化的。
第二种情况:如果λ₁的几何重数是1,那么说明只有一个线性无关的特征向量对应于λ₁,矩阵A不可对角化。
假设一个矩阵A有两个特征值λ1=2和λ2=2,且λ1的代数重数为2。
如果λ1的几何重数也是2,那么说明存在两个线性无关的特征向量对应于λ1,矩阵A是可对角化的。
如果λ1的几何重数是1,那么说明只有一个线性无关的特征向量对应于λ1,矩阵A不可对角化。