机器学习数学基础:21.特征值与特征向量
特征值与特征向量
一、引言
在现代科学与工程的众多领域中,线性代数扮演着举足轻重的角色。其中,特征值、特征向量以及相似对角化的概念和方法,不仅是线性代数理论体系的核心部分,更是解决实际问题的有力工具。无论是在物理学中描述系统的振动模式,还是在计算机科学里进行数据降维与图像处理,它们都发挥着关键作用。本教程将深入且全面地对这些内容展开讲解,旨在帮助读者透彻理解并熟练运用相关知识。
二、基础知识准备
(一)对角矩阵的高次幂计算
在开启特征值与特征向量的探索之旅前,我们先来聚焦对角矩阵的高次幂运算。对角矩阵是一种结构特殊的方阵,其显著特点是主对角线以外的所有元素均为零。用数学语言描述,对于一个nnn阶对角矩阵Λ =(λ10⋯00λ2⋯0⋮⋮⋱⋮00⋯λn)\Lambda \ = \begin{pmatrix} \lambda_1 & 0 & \cdots & 0 \\ 0 & \lambda_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \lambda_n \end{pmatrix}Λ = λ10⋮00λ2⋮0⋯⋯⋱⋯00⋮λn ,在计算它的NNN次幂ΛN\Lambda^NΛN时,我们可以遵循一个简洁的规则:直接将主对角线上的各个元素替换为它们各自的NNN次幂。即ΛN =(λ1N0⋯00λ2N⋯0⋮⋮⋱⋮00⋯λnN)\Lambda^N \ = \begin{pmatrix} \lambda_1^N & 0 & \cdots & 0 \\ 0 & \lambda_2^N & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \lambda_n^N \end{pmatrix}ΛN = λ1N0⋮00λ2N⋮0⋯⋯⋱⋯00⋮λnN 。
为了更直观地理解,我们来看几个具体例子。当N =2N \ = 2N =2时,Λ2 =(λ120⋯00λ22⋯0⋮⋮⋱⋮00⋯λn2)\Lambda^2 \ = \begin{pmatrix} \lambda_1^2 & 0 & \cdots & 0 \\ 0 & \lambda_2^2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \lambda_n^2 \end{pmatrix}Λ2 = λ120⋮00λ22⋮0⋯⋯⋱⋯00⋮λn2 ;当N =3N \ = 3N =3时,Λ3 =(λ130⋯00λ23⋯0⋮⋮⋱⋮00⋯λn3)\Lambda^3 \ = \begin{pmatrix} \lambda_1^3 & 0 & \cdots & 0 \\ 0 & \lambda_2^3 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \lambda_n^3 \end{pmatrix}Λ3 = λ130⋮00λ23⋮0⋯⋯⋱⋯00⋮λn3 。这种计算方式的便捷性,源于对角矩阵自身独特的结构,使得高次幂的计算变得相对简单直接。
(二)对角矩阵的乘法
在矩阵乘法的运算体系中,对角矩阵的乘法展现出独特的简便性。假设我们有两个nnn阶对角矩阵Λ1 =(a10⋯00a2⋯0⋮⋮⋱⋮00⋯an)\Lambda_1 \ = \begin{pmatrix} a_1 & 0 & \cdots & 0 \\ 0 & a_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & a_n \end{pmatrix}Λ1 = a10⋮00a2⋮0⋯⋯⋱⋯00⋮an 和Λ2 =(b10⋯00b2⋯0⋮⋮⋱⋮00⋯bn)\Lambda_2 \ = \begin{pmatrix} b_1 & 0 & \cdots & 0 \\ 0 & b_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & b_n \end{pmatrix}Λ2 = b10⋮00b2⋮0⋯⋯⋱⋯00⋮bn 。
它们的乘积Λ1Λ2\Lambda_1\Lambda_2Λ1Λ2的计算过程如下:根据矩阵乘法的定义,对于一般矩阵C =ABC \ = ABC =AB,CCC的元素cij =∑k =1naikbkjc_{ij} \ = \sum_{k \ = 1}^{n}a_{ik}b_{kj}cij =∑k =1naikbkj。但对于对角矩阵Λ1\Lambda_1Λ1和Λ2\Lambda_2Λ2,由于非对角元素均为000,在计算乘积矩阵Λ1Λ2\Lambda_1\Lambda_2Λ1Λ2的元素时,只有i =ji \ = ji =j的位置上的元素不为000。具体来说,(Λ1Λ2)ii =aibi(\Lambda_1\Lambda_2)_{ii} \ = a_ib_i(Λ1Λ2)ii =aibi,而(Λ1Λ2)ij =0(\Lambda_1\Lambda_2)_{ij} \ = 0(Λ1Λ2)ij =0(i≠ji \neq ji=j)。所以Λ1Λ2 =(a1b10⋯00a2b2⋯0⋮⋮⋱⋮00⋯anbn)\Lambda_1\Lambda_2 \ = \begin{pmatrix} a_1b_1 & 0 & \cdots & 0 \\ 0 & a_2b_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & a_nb_n \end{pmatrix}Λ1Λ2 = a1b10⋮00a2b2⋮0⋯⋯⋱⋯00⋮anbn ,即只需将对应位置的元素相乘即可得到乘积矩阵的元素。
三、特征值与特征向量的求解
(一)求解方法概述
对于一个nnn阶方阵AAA,我们通过构建并求解特征方程∣A−λE∣ =0\vert A - \lambda E\vert \ = 0∣A−λE∣ =0来获取其特征值λ\lambdaλ。这里的EEE代表nnn阶单位矩阵,∣A−λE∣\vert A - \lambda E\vert∣A−λE∣是一个关于λ\lambdaλ的nnn次多项式,被称为矩阵AAA的特征多项式。
从行列式的计算角度来看,A−λEA - \lambda EA−λE是将矩阵AAA的主对角线元素分别减去λ\lambdaλ后得到的矩阵,然后计算这个新矩阵的行列式。例如,对于二阶矩阵A =(a11a12a21a22)A \ = \begin{pmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{pmatrix}A =(a11a21a12a22),A−λE =(a11−λa12a21a22−λ)A - \lambda E \ = \begin{pmatrix} a_{11} - \lambda & a_{12} \\ a_{21} & a_{22} - \lambda \end{pmatrix}A−λE =(a11−λa21a12a22−λ),其特征多项式∣A−λE∣ =(a11−λ)(a22−λ)−a12a21\vert A - \lambda E\vert \ = (a_{11} - \lambda)(a_{22} - \lambda) - a_{12}a_{21}∣A−λE∣ =(a11−λ)(a22−λ)−a12a21,这是一个关于λ\lambdaλ的二次多项式。
求解特征方程∣A−λE∣ =0\vert A - \lambda E\vert \ = 0∣A−λE∣ =0,本质上就是求解这个nnn次多项式方程的根。这些根就是矩阵AAA的特征值,在求解过程中,可能会出现重根的情况。例如,对于矩阵A =(2112)A \ = \begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix}A =(2112),其特征多项式为∣A−λE∣ =∣2−λ112−λ∣ =(2−λ)2−1 =λ2−4λ+3\vert A - \lambda E\vert \ = \begin{vmatrix} 2 - \lambda & 1 \\ 1 & 2 - \lambda \end{vmatrix} \ = (2 - \lambda)^2 - 1 \ = \lambda^2 - 4\lambda + 3∣A−λE∣ = 2−λ112−λ =(2−λ)2−1 =λ2−4λ+3。令λ2−4λ+3 =0\lambda^2 - 4\lambda + 3 \ = 0λ2−4λ+3 =0,通过因式分解得到(λ−1)(λ−3) =0(\lambda - 1)(\lambda - 3) \ = 0(λ−1)(λ−3) =0,解得特征值λ1 =1\lambda_1 \ = 1λ1 =1,λ2 =3\lambda_2 \ = 3λ2 =3,这里特征值没有重根。但对于一些特殊矩阵,可能会出现如二重根、三重根等情况。
(二)特征向量的求解
当我们成功求得矩阵AAA的特征值λ\lambdaλ后,接下来要做的是将每个特征值λ\lambdaλ代入齐次线性方程组(A−λE)X =0(A - \lambda E)X \ = 0(A−λE)X =0,以此来求解对应的特征向量XXX。
以矩阵A =(2112)A \ = \begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix}A =(2112)为例,当λ1 =1\lambda_1 \ = 1λ1 =1时,将其代入(A−λ1E)X =0(A - \lambda_1 E)X \ = 0(A−λ1E)X =0,得到(2−1112−1)(x1x2) =(1111)(x1x2) =(00)\begin{pmatrix} 2 - 1 & 1 \\ 1 & 2 - 1 \end{pmatrix}\begin{pmatrix} x_1 \\ x_2 \end{pmatrix} \ = \begin{pmatrix} 1 & 1 \\ 1 & 1 \end{pmatrix}\begin{pmatrix} x_1 \\ x_2 \end{pmatrix} \ = \begin{pmatrix} 0 \\ 0 \end{pmatrix}(2−1112−1)(x1x2) =(1111)(x1x2) =(00)。
为了求解这个齐次线性方程组,我们对系数矩阵(1111)\begin{pmatrix} 1 & 1 \\ 1 & 1 \end{pmatrix}(1111)进行初等行变换。根据初等行变换的规则,将第二行减去第一行,可将系数矩阵化为(1100)\begin{pmatrix} 1 & 1 \\ 0 & 0 \end{pmatrix}(1010)。这意味着原方程组等价于x1+x2 =0x_1 + x_2 \ = 0x1+x2 =0,我们令x2 =tx_2 \ = tx2 =t(ttt为任意非零实数),那么x1 =−tx_1 \ = -tx1 =−t。所以,对应的特征向量可以表示为X1 =t(−11)X_1 \ = t\begin{pmatrix} -1 \\ 1 \end{pmatrix}X1 =t(−11)(t≠0t \neq 0t=0),这里ttt的任意非零取值都对应着一个特征向量,它们构成了属于特征值λ1 =1\lambda_1 \ = 1λ1 =1的特征向量空间。
当λ2 =3\lambda_2 \ = 3λ2 =3时,代入(A−λ2E)X =0(A - \lambda_2 E)X \ = 0(A−λ2E)X =0,即(2−3112−3)(x1x2) =(−111−1)(x1x2) =(00)\begin{pmatrix} 2 - 3 & 1 \\ 1 & 2 - 3 \end{pmatrix}\begin{pmatrix} x_1 \\ x_2 \end{pmatrix} \ = \begin{pmatrix} -1 & 1 \\ 1 & -1 \end{pmatrix}\begin{pmatrix} x_1 \\ x_2 \end{pmatrix} \ = \begin{pmatrix} 0 \\ 0 \end{pmatrix}(2−3112−3)(x1x2) =(−111−1)(x1x2) =(00)。
同样对系数矩阵(−111−1)\begin{pmatrix} -1 & 1 \\ 1 & -1 \end{pmatrix}(−111−1)进行初等行变换,将第一行乘以−1-1−1后加到第二行,可化为(1−100)\begin{pmatrix} 1 & -1 \\ 0 & 0 \end{pmatrix}(10−10)。此时方程组等价于x1−x2 =0x_1 - x_2 \ = 0x1−x2 =0,令x2 =sx_2 \ = sx2 =s(sss为任意非零实数),则x1 =sx_1 \ = sx1 =s。所以对应的特征向量为X2 =s(11)X_2 \ = s\begin{pmatrix} 1 \\ 1 \end{pmatrix}X2 =s(11)(s≠0s \neq 0s=0)。
需要特别强调的是,在求解特征向量时,我们要找出所有的特征向量,而不仅仅是基础解系。基础解系是齐次线性方程组解空间的一组基,它能通过线性组合表示出解空间中的所有向量,但每个基础解系向量乘以非零标量后得到的向量也都是特征向量,我们需要将它们都考虑在内。
四、相似对角化
(一)相似对角化的条件
对于一个nnn阶方阵AAA,若存在一个可逆矩阵PPP和一个对角矩阵Λ\LambdaΛ,使得P−1AP =ΛP^{-1}AP \ = \LambdaP−1AP =Λ成立,则称矩阵AAA可进行相似对角化。
判断矩阵AAA能否相似对角化,是一个关键且严谨的过程,我们需要通过求特征向量和基础解系来得出结论。具体步骤如下:
- 首先,求解特征方程∣A−λE∣ =0\vert A - \lambda E\vert \ = 0∣A−λE∣ =0,从而得到矩阵AAA的所有特征值λi\lambda_iλi(i =1,2,⋯ ,ni \ = 1, 2, \cdots, ni =1,2,⋯,n)。这些特征值是后续分析的基础。
- 对于每一个特征值λi\lambda_iλi,将其代入齐次线性方程组(A−λiE)X =0(A - \lambda_i E)X \ = 0(A−λiE)X =0,然后求解该方程组,得到基础解系ξi1,ξi2,⋯ ,ξiri\xi_{i1}, \xi_{i2}, \cdots, \xi_{ir_i}ξi1,ξi2,⋯,ξiri。这里的rir_iri表示基础解系中向量的个数,它反映了属于特征值λi\lambda_iλi的线性无关特征向量的数量。
- 最后,我们检查所有特征值对应的线性无关特征向量的个数之和是否等于矩阵AAA的阶数nnn,即判断∑i =1nri =n\sum_{i \ = 1}^{n}r_i \ = n∑i =1nri =n是否成立。如果等式成立,那么矩阵AAA可相似对角化;若不成立,则矩阵AAA不可相似对角化。
(二)相似对角化的步骤
- 第一步,全面且准确地求出矩阵AAA的所有特征值λ1,λ2,⋯ ,λn\lambda_1, \lambda_2, \cdots, \lambda_nλ1,λ2,⋯,λn。这一步是相似对角化的起始点,需要我们熟练掌握特征方程的求解方法。
- 第二步,针对每个特征值λi\lambda_iλi,细致地求出对应的所有线性无关的特征向量ξi1,ξi2,⋯ ,ξiri\xi_{i1}, \xi_{i2}, \cdots, \xi_{ir_i}ξi1,ξi2,⋯,ξiri。然后,将这些特征向量按照一定的顺序按列构成可逆矩阵P =(ξ11,⋯ ,ξ1r1,ξ21,⋯ ,ξ2r2,⋯ ,ξn1,⋯ ,ξnrn)P \ = (\xi_{11}, \cdots, \xi_{1r_1}, \xi_{21}, \cdots, \xi_{2r_2}, \cdots, \xi_{n1}, \cdots, \xi_{nr_n})P =(ξ11,⋯,ξ1r1,ξ21,⋯,ξ2r2,⋯,ξn1,⋯,ξnrn)。在构建PPP矩阵时,要确保特征向量的排列顺序与后续对角矩阵Λ\LambdaΛ中特征值的顺序相对应。
- 第三步,构建对角矩阵Λ =(λ1⋱λn)\Lambda \ = \begin{pmatrix} \lambda_1 & & & \\ & \ddots & & \\ & & \lambda_n & \\ \end{pmatrix}Λ = λ1⋱λn 。其中,主对角线上的元素就是矩阵AAA的特征值,并且这些特征值的顺序要与PPP矩阵中特征向量的排列顺序严格对应。
例如,对于前面提到的矩阵A =(2112)A \ = \begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix}A =(2112),特征值λ1 =1\lambda_1 \ = 1λ1 =1对应的特征向量取ξ11 =(−11)\xi_{11} \ = \begin{pmatrix} -1 \\ 1 \end{pmatrix}ξ11 =(−11)(当t =1t \ = 1t =1时),特征值λ2 =3\lambda_2 \ = 3λ2 =3对应的特征向量取ξ21 =(11)\xi_{21} \ = \begin{pmatrix} 1 \\ 1 \end{pmatrix}ξ21 =(11)(当s =1s \ = 1s =1时),则P =(−1111)P \ = \begin{pmatrix} -1 & 1 \\ 1 & 1 \end{pmatrix}P =(−1111),Λ =(1003)\Lambda \ = \begin{pmatrix} 1 & 0 \\ 0 & 3 \end{pmatrix}Λ =(1003)。通过计算P−1APP^{-1}APP−1AP,可以验证P−1AP =ΛP^{-1}AP \ = \LambdaP−1AP =Λ,从而实现了矩阵AAA的相似对角化。
(三)PPP矩阵的可逆性
在相似对角化的过程中,PPP矩阵的可逆性具有举足轻重的地位。从相似对角化的定义P−1AP =ΛP^{-1}AP \ = \LambdaP−1AP =Λ可以看出,如果PPP不可逆,那么P−1P^{-1}P−1就不存在,也就无法满足相似对角化的形式要求,矩阵AAA也就不能进行相似对角化。
深入分析可知,PPP矩阵是由矩阵AAA的特征向量构成的。而PPP矩阵可逆的充要条件是它的列向量线性无关,也就是矩阵AAA的nnn个特征向量线性无关。这进一步说明了nnn阶方阵AAA可相似对角化的充要条件是AAA有nnn个线性无关的特征向量。如果AAA的特征向量线性相关,那么PPP矩阵就不可逆,相似对角化也就无法实现。
五、特征值与相似矩阵的性质
(一)特征值的性质
- 特征值乘积与行列式的关系:特征值的乘积等于矩阵的行列式,即∏i =1nλi =∣A∣\prod_{i \ = 1}^{n}\lambda_i \ = \vert A\vert∏i =1nλi =∣A∣。这一性质揭示了特征值与矩阵行列式之间的内在联系。例如,对于矩阵A =(2112)A \ = \begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix}A =(2112),我们可以通过行列式的计算公式∣A∣ =2×2−1×1 =3\vert A\vert \ = 2\times2 - 1\times1 \ = 3∣A∣ =2×2−1×1 =3来计算其行列式的值。同时,我们已经求得该矩阵的特征值λ1 =1\lambda_1 \ = 1λ1 =1,λ2 =3\lambda_2 \ = 3λ2 =3,λ1λ2 =1×3 =3\lambda_1\lambda_2 \ = 1\times3 \ = 3λ1λ2 =1×3 =3,恰好等于矩阵AAA的行列式∣A∣\vert A\vert∣A∣。这一性质在很多情况下可以帮助我们快速验证计算结果的正确性,或者通过已知的特征值来计算矩阵的行列式。
- 特征值之和与矩阵迹的关系:特征值的和等于矩阵的主对角线元素之和,矩阵的主对角线元素之和也被称为矩阵的迹,记为tr(A)tr(A)tr(A),即∑i =1nλi =∑i =1naii\sum_{i \ = 1}^{n}\lambda_i \ = \sum_{i \ = 1}^{n}a_{ii}∑i =1nλi =∑i =1naii。对于矩阵A =(2112)A \ = \begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix}A =(2112),tr(A) =2+2 =4tr(A)\ =2 + 2 \ = 4tr(A) =2+2 =4,而特征值λ1 =1\lambda_1 \ = 1λ1 =1,λ2 =3\lambda_2 \ = 3λ2 =3,λ1+λ2 =1+3 =4\lambda_1+\lambda_2 \ = 1 + 3 \ = 4λ1+λ2 =1+3 =4,二者相等。这一性质在判断矩阵的一些特性以及简化计算中具有重要作用。比如,当我们知道矩阵的特征值时,能快速得到矩阵的迹;反之,若已知矩阵的迹和部分特征值,也可据此求出其他特征值。
(二)相似矩阵的性质
- 特征值相同:相似矩阵具有相同的特征值。即若矩阵AAA与BBB相似,存在可逆矩阵PPP使得P−1AP =BP^{-1}AP \ = BP−1AP =B,那么AAA和BBB的特征多项式∣A−λE∣\vert A - \lambda E\vert∣A−λE∣与∣B−λE∣\vert B - \lambda E\vert∣B−λE∣是相等的。这是因为∣B−λE∣ =∣P−1AP−λE∣ =∣P−1(A−λE)P∣\vert B - \lambda E\vert \ = \vert P^{-1}AP - \lambda E\vert \ = \vert P^{-1}(A - \lambda E)P\vert∣B−λE∣ =∣P−1AP−λE∣ =∣P−1(A−λE)P∣,根据行列式的性质∣P−1(A−λE)P∣ =∣P−1∣∣A−λE∣∣P∣\vert P^{-1}(A - \lambda E)P\vert \ = \vert P^{-1}\vert\vert A - \lambda E\vert\vert P\vert∣P−1(A−λE)P∣ =∣P−1∣∣A−λE∣∣P∣,又因为∣P−1∣∣P∣ =1\vert P^{-1}\vert\vert P\vert \ = 1∣P−1∣∣P∣ =1,所以∣B−λE∣ =∣A−λE∣\vert B - \lambda E\vert \ = \vert A - \lambda E\vert∣B−λE∣ =∣A−λE∣,进而AAA和BBB有相同的特征值。这一性质在矩阵的变换和分类中非常关键,相似矩阵由于特征值相同,在很多与特征值相关的性质和应用上表现出一致性。
- 行列式相等:相似矩阵的行列式相等。因为∣B∣ =∣P−1AP∣ =∣P−1∣∣A∣∣P∣ =∣A∣\vert B\vert \ = \vert P^{-1}AP\vert \ = \vert P^{-1}\vert\vert A\vert\vert P\vert \ = \vert A\vert∣B∣ =∣P−1AP∣ =∣P−1∣∣A∣∣P∣ =∣A∣(依据行列式的性质∣AB∣ =∣A∣∣B∣\vert AB\vert \ = \vert A\vert\vert B\vert∣AB∣ =∣A∣∣B∣以及∣P−1∣∣P∣ =1\vert P^{-1}\vert\vert P\vert \ = 1∣P−1∣∣P∣ =1)。这意味着相似矩阵在行列式相关的运算和性质上是等价的,例如在判断矩阵是否可逆时,相似矩阵具有相同的可逆性(因为可逆矩阵的行列式不为零,相似矩阵行列式相等,所以要么都可逆,要么都不可逆)。
- 迹相等:相似矩阵的迹相等。由于相似矩阵特征值相同,而特征值的和等于矩阵的迹,所以相似矩阵的迹必然相等。即若AAA与BBB相似,tr(A) =tr(B)tr(A)\ =tr(B)tr(A) =tr(B)。这一性质在一些需要比较矩阵特征的场景中很有用,比如在判断两个矩阵是否可能相似时,迹是否相等可以作为一个初步的判断条件。
六、伴随矩阵与转置矩阵的特征值
(一)伴随矩阵的特征值
对于矩阵AAA,当AAA可逆时,其伴随矩阵A∗A^*A∗满足A∗ =∣A∣A−1A^* \ = \vert A\vert A^{-1}A∗ =∣A∣A−1。假设λ\lambdaλ是AAA的特征值,ξ\xiξ是对应的特征向量,即Aξ =λξA\xi \ = \lambda\xiAξ =λξ(ξ≠0\xi\neq0ξ=0)。两边同时左乘A∗A^*A∗,得到A∗Aξ =A∗λξA^*A\xi \ = A^*\lambda\xiA∗Aξ =A∗λξ。又因为A∗A =∣A∣EA^*A \ = \vert A\vert EA∗A =∣A∣E,所以∣A∣ξ =λA∗ξ\vert A\vert\xi \ = \lambda A^*\xi∣A∣ξ =λA∗ξ,则A∗ξ =∣A∣λξA^*\xi \ = \frac{\vert A\vert}{\lambda}\xiA∗ξ =λ∣A∣ξ(λ≠0\lambda\neq0λ=0)。这表明当λ\lambdaλ是可逆矩阵AAA的非零特征值时,∣A∣λ\frac{\vert A\vert}{\lambda}λ∣A∣是A∗A^*A∗的特征值。例如,若AAA是一个333阶可逆矩阵,∣A∣ =6\vert A\vert \ = 6∣A∣ =6,AAA的一个特征值为222,那么A∗A^*A∗对应有一个特征值为62 =3\frac{6}{2}\ =326 =3。
当λ =0\lambda \ = 0λ =0时,情况较为特殊。若000是AAA的特征值,则AAA不可逆(因为可逆矩阵的特征值都不为000),此时需要根据AAA的秩等信息进一步分析A∗A^*A∗的特征值情况。若r(A)<n−1r(A)<n - 1r(A)<n−1(nnn为矩阵AAA的阶数),则A∗A^*A∗的所有元素都为000,即A∗ =0A^* \ = 0A∗ =0,000是A∗A^*A∗的nnn重特征值;若r(A) =n−1r(A)\ =n - 1r(A) =n−1,A∗A^*A∗的秩为111,000是A∗A^*A∗的n−1n - 1n−1重特征值,另一个非零特征值可通过其他方法计算。
(二)伴随矩阵与转置矩阵特征值的关系
AAA的伴随矩阵A∗A^*A∗和AAA的转置矩阵ATA^TAT的特征值相同。这是因为∣AT−λE∣ =∣(A−λE)T∣\vert A^T - \lambda E\vert \ = \vert (A - \lambda E)^T\vert∣AT−λE∣ =∣(A−λE)T∣,根据行列式的性质∣AT∣ =∣A∣\vert A^T\vert \ = \vert A\vert∣AT∣ =∣A∣,可得∣(A−λE)T∣ =∣A−λE∣\vert (A - \lambda E)^T\vert \ = \vert A - \lambda E\vert∣(A−λE)T∣ =∣A−λE∣,所以AAA和ATA^TAT有相同的特征多项式,进而有相同的特征值。而A∗A^*A∗与AAA的特征值存在上述关系,所以在一定条件下,A∗A^*A∗和ATA^TAT的特征值相同。这一关系在研究矩阵的各种变换和性质时提供了更多的思路和联系,例如在某些涉及伴随矩阵和转置矩阵的计算和证明中,可以利用它们特征值相同这一性质进行推导和简化。
七、矩阵AAA及其相关矩阵的特征值与特征向量性质推导
(一)aA+bEaA + bEaA+bE(aaa、bbb为常数 )的特征值与特征向量
已知λ\lambdaλ是矩阵AAA的特征值,ξ\xiξ是对应的特征向量,即Aξ =λξA\xi \ = \lambda\xiAξ =λξ。
对于矩阵aA+bEaA + bEaA+bE,计算(aA+bE)ξ(aA + bE)\xi(aA+bE)ξ:
(aA+bE)ξ =aAξ+bEξ =aλξ+bξ =(aλ+b)ξ \begin{align*} (aA + bE)\xi&\ =aA\xi + bE\xi\\ &\ =a\lambda\xi + b\xi\\ &\ =(a\lambda + b)\xi \end{align*} (aA+bE)ξ =aAξ+bEξ =aλξ+bξ =(aλ+b)ξ
根据特征值与特征向量的定义,满足(aA+bE)ξ =μξ(aA + bE)\xi \ = \mu\xi(aA+bE)ξ =μξ(μ\muμ为特征值,ξ\xiξ为特征向量)的μ\muμ就是aA+bEaA + bEaA+bE的特征值,所以aA+bEaA + bEaA+bE的特征值为aλ+ba\lambda + baλ+b,且特征向量与AAA相同,为ξ\xiξ。这表明对矩阵AAA进行aaa倍缩放并加上bbb倍单位矩阵的变换后,其特征值也相应地进行aaa倍缩放再加上bbb的变换,而特征向量保持不变。
(二)AnA^nAn(nnn为正整数 )的特征值与特征向量
已知Aξ =λξA\xi \ = \lambda\xiAξ =λξ,当n =2n \ = 2n =2时:
A2ξ =A(Aξ) =A(λξ) =λAξ =λ2ξ \begin{align*} A^2\xi&\ =A(A\xi)\\ &\ =A(\lambda\xi)\\ &\ =\lambda A\xi\\ &\ =\lambda^2\xi \end{align*} A2ξ =A(Aξ) =A(λξ) =λAξ =λ2ξ
假设当n =kn \ = kn =k(kkk为正整数)时,Akξ =λkξA^k\xi \ = \lambda^k\xiAkξ =λkξ成立。
当n =k+1n \ = k + 1n =k+1时:
Ak+1ξ =A(Akξ) =A(λkξ) =λkAξ =λk+1ξ \begin{align*} A^{k + 1}\xi&\ =A(A^k\xi)\\ &\ =A(\lambda^k\xi)\\ &\ =\lambda^k A\xi\\ &\ =\lambda^{k + 1}\xi \end{align*} Ak+1ξ =A(Akξ) =A(λkξ) =λkAξ =λk+1ξ
由数学归纳法可知,对于任意正整数nnn,Anξ =λnξA^n\xi \ = \lambda^n\xiAnξ =λnξ。所以AnA^nAn的特征值为λn\lambda^nλn,特征向量为ξ\xiξ。这体现了矩阵幂次运算与特征值、特征向量之间的规律,矩阵AAA的nnn次幂的特征值是其原特征值的nnn次幂,且特征向量在幂次变换下保持稳定。
(三)A−1A^{-1}A−1(AAA可逆 )的特征值与特征向量
因为AAA可逆,且Aξ =λξA\xi \ = \lambda\xiAξ =λξ(ξ≠0\xi\neq0ξ=0),两边同时左乘A−1A^{-1}A−1:
A−1Aξ =A−1λξξ =λA−1ξ \begin{align*} A^{-1}A\xi&\ =A^{-1}\lambda\xi\\ \xi&\ =\lambda A^{-1}\xi \end{align*} A−1Aξξ =A−1λξ =λA−1ξ
由于λ≠0\lambda\neq0λ=0(可逆矩阵的特征值不为000),等式两边同时除以λ\lambdaλ,得到A−1ξ =1λξA^{-1}\xi \ = \frac{1}{\lambda}\xiA−1ξ =λ1ξ。所以A−1A^{-1}A−1的特征值为1λ\frac{1}{\lambda}λ1,特征向量为ξ\xiξ。这表明可逆矩阵AAA的逆矩阵的特征值是AAA特征值的倒数,且矩阵AAA与其逆矩阵A−1A^{-1}A−1具有相同的特征向量,反映了可逆矩阵与其逆矩阵在特征向量性质上的紧密联系。
(四)ATA^TAT(AAA的转置矩阵 )的特征值
已知AAA和ATA^TAT的特征多项式分别为∣A−λE∣\vert A - \lambda E\vert∣A−λE∣和∣AT−λE∣\vert A^T - \lambda E\vert∣AT−λE∣。
根据行列式的性质:对于任意矩阵MMM,∣MT∣ =∣M∣\vert M^T\vert \ = \vert M\vert∣MT∣ =∣M∣。
对于M =A−λEM \ = A - \lambda EM =A−λE,有∣AT−λE∣ =∣(A−λE)T∣ =∣A−λE∣\vert A^T - \lambda E\vert \ = \vert (A - \lambda E)^T\vert \ = \vert A - \lambda E\vert∣AT−λE∣ =∣(A−λE)T∣ =∣A−λE∣。
因为特征多项式相等,所以AAA和ATA^TAT有相同的特征值。但需要注意的是,虽然AAA和ATA^TAT特征值相同,它们的特征向量一般不同。这是因为矩阵转置后,其对向量的变换方式在空间中的表现有所不同,导致满足特征向量定义的向量集合通常不一致。
八、总结
本教程全面且深入地讲解了线性代数中特征值与特征向量的求解方法,包括从特征方程出发求特征值,以及通过代入方程组细致求解特征向量的过程,同时强调了求解特征向量时要涵盖所有情况。对于相似对角化,我们详细阐述了其基础概念、判断条件、具体步骤以及PPP矩阵可逆性的重要意义。此外,还深入探讨了特征值与相似矩阵的诸多性质,以及伴随矩阵与转置矩阵特征值的特点和关系,并对矩阵AAA及其相关矩阵的特征值与特征向量性质进行了详细推导。
特征值、特征向量以及相似对角化作为线性代数的核心内容,不仅在理论体系中占据关键地位,而且在实际应用中有着广泛的用途。希望读者通过本教程能够深入理解这些知识,熟练掌握相关的计算和判断方法,为后续在数学、物理、工程、计算机科学等多个领域的学习和研究打下坚实的基础。在学习过程中,建议读者多做练习题,通过实际操作加深对这些概念和方法的理解和运用能力。
更多推荐
所有评论(0)