为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

矩阵理论_上海交大\Chapter3

2018-09-09 30页 pdf 492KB 27阅读

用户头像

is_444196

暂无简介

举报
矩阵理论_上海交大\Chapter3第第第三三三章章章特特特征征征值值值与与与矩矩矩阵阵阵的的的Jordan标标标准准准形形形除特别说明,本章讨论的矩阵都是复数矩阵.引引引言言言如如如何何何计计计算算算矩矩矩阵阵阵的的的高高高次次次幂幂幂Am?在第二章第六节公式(2.6.4)(差分方程与线性滤波器)中,我们看到计算方阵A的任意次幂Am是矩阵理论的基本问题.我们知道,如果A可以(相似)对角化,即存在可逆矩阵P使得P−1AP=D为对角矩阵,则可以方便地计算Am=PDmP−1.但并不是任何方阵都可以对角化,因此寻找P−1AP的最简单形式仍是一个需要解决的问题.早在18...
矩阵理论_上海交大\Chapter3
第第第三三三章章章特特特征征征值值值与与与矩矩矩阵阵阵的的的Jordan标标标准准准形形形除特别说明,本章讨论的矩阵都是复数矩阵.引引引言言言如如如何何何计计计算算算矩矩矩阵阵阵的的的高高高次次次幂幂幂Am?在第二章第六节公式(2.6.4)(差分方程与线性滤波器)中,我们看到计算方阵A的任意次幂Am是矩阵理论的基本问题.我们知道,如果A可以(相似)对角化,即存在可逆矩阵P使得P−1AP=D为对角矩阵,则可以方便地计算Am=PDmP−1.但并不是任何方阵都可以对角化,因此寻找P−1AP的最简单形式仍是一个需要解决的问题.早在1837年,Jacobi即已证明了任何复矩阵均可以(相似)三角化,一般称此结果为(矩阵的)Jacobi定定定理理理.本章我们首先证明一个更强的结论,即任何复矩阵都可以酉三角化,此即著名的Schur24三角化定理.以此为基础我们证明Cayley-Hamilton25定理,进而利用最小多项式给出矩阵可以对角化的一个刻画.利用最小多项式,可以得到计算高次幂Am的一个降幂方法.利用更精细的分块Schur三角化定理即可证明任何矩阵的Jordan26标准形的存在性与唯一性.第第第一一一节节节Schur三三三角角角化化化定定定理理理:化化化简简简矩矩矩阵阵阵的的的基基基础础础定定定理理理3.1.1(Schur(酉)三角化定理)设A∈Cn×n,则存在酉矩阵U使U∗AU=B,(3.1.1)其中B为一个上三角矩阵.证证证对矩阵A的阶数n施行数学归纳法.当n=1时,结论显然成立.假设结论对阶数小于n的矩阵都成立,下证结论对n阶矩阵也成立.设λ1∈C为A的一个特征值,相应的单位特征向量为α1,由第二章的讨论可知,α1可以n扩充成C的一组标准正交基α1,α2,···,αn,因而U1=(α1,α2,···,αn)是一个酉阵.因为向量组Aα1=λα1,Aα2,···,Aαn为基α1,α2,···,αn的线性组合,所以λ1c12c13···c1n0c22c23···c2nAU1=A(α1,α2,···,αn)=(α1,α2,···,αn).....,......0cn2cn3···cnn其中c为一些复数.令ijc22c23···c2n....C1=......cn2cn3···cnn24IssaiSchur(1875-1941),著名德国数学家,Frobenius的学生.25ArthurCayley(1821-1895),著名英国数学家,英国现代数学的奠基人.WilliamHamilton(1805-1865),著名爱尔兰物理学家,天文学家和数学家,以其名字命名的Hamilton力学是牛顿力学的革新,数学上以发现四元数(Quaternions)而闻名.26MarieEnnemondCamilleJordan(1838-1922),法国著名数学家,数学上还有著名的JordanCurveTheorem.第25593号小行星camillejordan即以其名字命名.74则λ1c12c13···c1n0AU1=U1...C10由于C1为n−1阶矩阵,由归纳假设,存在n−1阶酉矩阵U2使b22b23···b2n···∗b33b3nU2C1U2=B1=.....bnn为上三角矩阵.令µ¶1U=U1,U2则µ¶µ¶∗1∗1UAU=∗U1AU1U2U2λ1c12c13···c1nµ¶µ¶101=∗.U2.C1U20λ1d12d13···d1nb22b23···b2n···=b33b3n......bnn定理得证.¤公式(3.1.1)可变形为A=UBU∗(3.1.2)一般称公式(3.1.2)为矩阵A的Schur分分分解解解.Schur三角化定理是矩阵理论中最重要的结果之一(实际上在许多领域均是如此),众多深刻的结论均由其导出,也是矩阵快速计算的基础,值得深入研究.由Schur三角化定理,总可以使P−1AP为上三角矩阵.进一步,可以使P−1AP为分块对角矩阵,且每个对角块是对角元素均相同的上三角矩阵.为此只需证明下述引理(此时F不必是复数域).引引引理理理3.1.1设A=(aij)是F上的任意上三角矩阵,1≤p分析
B与C的结构可知,它们的一个差22别是B=60而C=0.因此严格上三角矩阵的幂零指数对其标准形有重要意义.下面列出Jn的一些性质(证明见习题16).T⊕T⊕命命命题题题3.2.1(1)JnJn=(0)In−1,JnJn=In−1(0);(2)Jnei=ei−1,其中ei是标准向量,约定e0是0向量;∈Cn−TT(3)对任意x,(InJnJn)x=(xe1)e1.现在可以证明严格上三角矩阵的Jordan标准形定理了.82定定定理理理3.2.1(幂零矩阵的Jordan标准形定理28)设A是n阶严格上三角复矩阵.则存在可逆矩阵P和正整数n1≥n2≥···≥nm,n1+n2+···+nm=n,使得−1⊕⊕···⊕PAP=Jn1Jn2Jnm.(3.2.1)上式右端的矩阵称为幂幂幂零零零Jordan矩矩矩阵阵阵,它是矩阵A的Jordan标准形,一般记为J.如果不计诸nj的次序与大小,则A的Jordan标准形是唯一的.证证证首先我们指出,任意调整公式(3.2.1)右端的每个直和因子的顺序,得到的矩阵均是相似的,因此条件n1≥n2≥···≥nm,n1+n2+···+nm=n总是可以满足的,故只需证明公式(3.2.1)及唯一性.对A的阶数n作归纳.当n=1时,A=(0),定理显然成立.假设对阶数m1,m16˜m1⊕···⊕⊕···⊕则J=0而J=0,矛盾!现由第二章,推论2.5.3,知Jn2Jns与Jm2Jmt相似,由归纳假设,它们具有相同的Jordan标准形,因此s=t且n2=m2,···,ns=ms.¤由此定理即可得到判断两个幂零矩阵相似的下述准则(证明见习题16):推推推论论论3.2.1设M与N是两个n阶幂零矩阵.则M与N相似⇐⇒r(Mk)=r(Nk),∀k≥1.定定定义义义3.2.1矩阵λIn+Jn称为n阶λ-Jordan块,记为Jn(λ).由分块Schur三角化定理以及幂零矩阵的Jordan标准形定理可得一般矩阵的Jordan标准形定理.定定定理理理3.2.2(Jordan标准形定理)设A是n阶复矩阵,则存在可逆矩阵P和正整数n1≥n2≥···≥nm,n1+n2+···+nm=n,使得−1⊕⊕···⊕PAP=Jn1(λ1)Jn2(λ2)Jnm(λm).(3.2.5)上式右端的矩阵称为Jordan矩矩矩阵阵阵,它是矩阵A的Jordan标准形.如果不计诸nj的次序与大小,则A的Jordan标准形是唯一的.84注注注1.公式(3.2.5)中的诸特征值λi可能相同.注注注2.定理3.2.2仅对复数域上的矩阵成立,见本节思考题1与习题33.推推推论论论3.2.2方阵A可以对角化⇐⇒A的Jordan标准形是对角矩阵.一般而言,确定矩阵的Jordan标准形是极为困难的问题,因为基本上不可能求出高阶矩阵的全部特征值.另外,即使是幂零矩阵,定理3.2.1的证明中给出的算法也是不能付诸实践的,因为该算法是不稳定的.参考下面的例子.µ¶µ¶t1t0例例例3.2.3设A=.则当t=60时,其Jordan标准形为对角矩阵D=.t0000但当t=0时,其Jordan标准形为A=J2.因此在t→0的极限过程中,At的Jordan标准形并不收敛于其极限的Jordan标准形.上面的例子表明,矩阵的Jordan标准形不具有稳定的数值方法(这是因为Jordan标准形不是矩阵的各个元素的连续函数),但它在理论上仍是极其重要的,因为一个矩阵的Jordan标准形不仅具有非常简单的形式,而且包含了该矩阵的几乎所有信息,比如秩,特征值,线性无关的特征向量的个数,特征子空间的维数等等.思考题−11.设A∈Mn(Q).是否存在可逆矩阵P∈Mn(Q)使得PAP为Jordan标准形?将Q换成R又如何?AB2.分块矩阵„«的Jordan标准形与A,B的Jordan标准形有何关系?特征值有何联系?特别讨BA论A=0与A=B的情形.3.仿照幂零矩阵相似的判别准则(即推论3.2.1)给出两个同阶矩阵相似的判别准则.是否能够判断该准则与幂零矩阵相似的判别准则哪个更有意义?第第第三三三节节节Jordan标标标准准准形形形的的的计计计算算算定理3.2.1与定理3.2.2虽然给出了矩阵的Jordan标准形的存在性与唯一性,但是都没有给出Jordan标准形的具体数据,比如一共有多少个对角块?各阶对角块有几个?等等.下面的命题给出了幂零矩阵的Jordan标准形的最大块的阶数.命命命题题题3.3.1(最大Jordan块)设A是严格上三角矩阵,则其Jordan标准形的Jordan块的阶数的最大值等于其幂零指数.证证证设A的幂零指数为e,其Jordan标准形为J,J的Jordan块的阶数的最大值为f.则因Ae=0知Je=0,从而f≤e.同理,由Jf=0可知Af=0,故e≤f.¤例例例3.3.1试证下列矩阵为幂零矩阵,并求其Jordan标准形:11010−1−1−1A=.1101−1010解解解直接计算便知A2=0.因此A为幂零矩阵,且幂零指数为2.故由命题3.3.1可知,A的Jordan标准形J的最大Jordan块为2阶的.由于r(A)=2,故A的零度为2,即有2个块,所以J=J2⊕J2.85上面的例子说明,对阶数较小的幂零矩阵可以通过其幂零指数和秩来确定其Jordan标准形.但对高阶矩阵,则需要更为精细的方法,我们将其列为下面的定理,证明见习题20.定定定理理理3.3.1设n阶严格上三角矩阵A的Jordan标准形J同公式(3.2.1),其幂零指数为e.则(1)e=max{ni|1≤i≤m};(2)J中Jordan块的个数m等于A的零度;k(3)记J中k阶Jordan块的个数为`k,A的零度为ηk,0≤k≤m.则`k=2ηk−ηk−1−ηk+1,1≤k≤m.(3.3.1)注注注1.计数公式(3.3.1)来源于数列η0=0,η1,η2,···,ηk−1,ηk,ηk+1,···的二阶差分,即`k=(ηk−ηk−1)−(ηk+1−ηk).注注注2.上面定理中的(2)等价于说J中Jordan块的个数等于A的线性无关的特征向量的个数.这是因为每个Jordan块的秩恰好比其阶数小1,即零度为1,因此对应于1个线性无关的特征向量.例例例3.3.2试证下列矩阵为幂零矩阵,并求其Jordan标准形:265004061320020300000000−1−1−20−1−40−1A=.25400405−1−3−200−20−301000100−1−3−200−20−3解解解直接计算可知A3=0.因此A为幂零矩阵,且幂零指数为3.再计算可得r(A)=5.故由定理3.3.1可知,A的Jordan标准形J共有3块,且最大Jordan块为3阶的.因此其它两块必为一个3阶块和一个2阶块,故知J=J3⊕J3⊕J2.例例例3.3.3设A是例3.3.1中的矩阵,求可逆矩阵P,使得P−1AP=J.解解解设P=(α1,α2,α3,α4),可得A(α1,α2,α3,α4)=(α1,α2,α3,α4)(J2⊕J2)=(0,α1,0,α3).由此可得P的各个列向量应满足的方程组分别为Aα1=0,Aα2=α1,Aα3=0,Aα4=α3.(3.3.2)注意到四个方程组的系数矩阵都相同,可以采用下面的方式统一求解:.−.1101.b11010.b1+b20−1−1−1b0111−b.2→.21101.b0000.−b+b.3.13−1010.b40000.b1+b2+b486T由此可知要使方程组Ax=β有解,向量β=(b1,b2,b3,b4)要满足b1=b3,b1+b2+b4=0.解方程组½x1−x3=0,x2+x3+x4=0,TT得α1=(1,−1,1,0),α3=(0,1,0,−1).这两个向量都满足Ax=β的相容性条件.解Ax=α1,即½x1−x3=0,x2+x3+x4=1,T得α2=(1,0,1,0).解Ax=α3,即½x1−x3=1,x2+x3+x4=−1,得α=(1,0,0,−1)T.因此,41101−1010P=.110000−1−1方程(3.3.2)中的向量α1与α3显然是属于特征值0的特征向量,而向量α2与α4不是特征向量,它们实际上满足方程(请验证!)A2x=0.(3.3.3)一般地,设λ是n阶矩阵A的特征值,则将方程(A−λI)kx=0(k是任意正整数)的非零解称为A的(属于特征值λ的)广广广义义义特特特征征征向向向量量量,可以证明(见习题21-24)广义特征向量和零向量(即所有方程(A−λI)kx=0的解空间的并集)构成Cn的一个子空间,称为A的(属于特征值的广广广义义义特特特征征征子子子空空空间间间或根根根子子子空空空间间间记为证明矩阵的标准形的存在性的另λ)P,Eλ.Jordann一个途径即是利用C=⊕Eλ.习题21-24是这种途径的具体实现,有兴趣的读者可以尝λ∈σ(A)试完成之.证明矩阵的Jordan标准形的存在性的第三条途径是使用λ-矩阵的Smith29标准形,我们在习题56-60中介绍了这个方法.结合Schur分块三角化定理,即可由定理3.3.1得到一般矩阵的Jordan标准形的结构.定定定理理理3.3.2设n阶矩阵A的Jordan标准形J同公式(3.2.5).设µ为A的一个特征值,k记(A−µI)的零度为ηk,J中对角线元素为µ的k阶Jordan块的个数为`k,则(1)η1等于J中对角线元素为µ的Jordan块的个数;(2)`1=2η1−η2,`k=2ηk−ηk−1−ηk+1,k≥2.注意,与幂零矩阵的相应结果(定理3.3.1)对照,上面的定理没有太大实用价值(对照上一节的思考题3).因为n阶矩阵A可以通过(计算机)验证An=0来判断其幂零性后再使用定理3.3.1,但非幂零矩阵在使用定理3.3.2前需要先求出A的所有特征值,而正如先前指出的,这个工作的难度几乎是不能克服的.29HenryJohnStephenSmith(1826-1883),爱尔兰-英国数学家.87例例例3.3.4求下列矩阵的Jordan标准形J,并求变换矩阵P,使P−1AP=J:3100−4−100A=.3121−3−1−10解解解易知|λI−A|=(λ−1)4,故A的Jordan标准形J的对角元素均为1.再计算A−I的幂零度为3,故最大子块是3阶的,因此J=J3(1)⊕(1).−1设PAP=J.令P=(α1,α2,α3,α4),则由AP=PJ得A(α1,α2,α3,α4)=(α1,α2,α3,α4)(J3(1)⊕(1))=(α1,α1+α2,α2+α3,α4).于是得到四个方程组:Aα1=α1,Aα2=α1+α2,Aα3=α2+α3,Aα4=α4,即(I−A)α1=0,(I−A)α2=−α1,(I−A)α3=−α2,(I−A)α4=0.TTTT解之得α1=(0,0,1,−1),α2=(1,−2,0,0),α3=(−1,3,0,0),α4=(−1,2,1,0).01−1−10−232P=.1001−1000当然,P不是唯一的(为什么?).例例例3.3.5求下列矩阵的Jordan标准形:3−10000005−3−100000−87300000802−11000A=.5−11−6001004850−1−2006138−4−1−42114−12−4−3−1102解解解容易看出A是一个分块下三角矩阵.因此A的特征多项式为¯¯¯¯¯λ−310¯¯λ+1−10¯¯¯¯¯¯¯¯λ−2−1¯|λI−A|=¯−5λ+31¯·¯0λ−1¯·¯¯¯¯¯¯¯0λ−2¯¯8−7λ−3¯¯01λ+2¯=(λ−1)3(λ+1)3(λ−2)2.88注意3重特征值1均来自左上角的主子矩阵A1(前三行前三列),3重特征值-1均来自第4-6行与列构成的主子矩阵A2,而两重特征值2则来自后两行两列构成的主子矩阵A3.因此由分块Schur三角化定理知存在严格上三角矩阵Ni使得A相似于分块对角矩阵B=(I3+N1)⊕(−I3+N2)⊕(2I2+N3),其中Ni相似于Ai−λiI.由于A1−I的零度为1,故N1相似于J3,即对角元素为1的Jordan块只有1块.类似地,−A−I与A−2I的零度都为1.故N2与N3分别相似于J3与J2.因此A的Jordan标准形为J=J3(1)⊕J3(−1)⊕J2(2).变换矩阵的求解见习题26.例例例3.3.6试求秩为1的n阶方阵A的Jordan标准形.解解解设r(A)=1.则A的Jordan标准形只有一个位置不为零.所以A至少有n−1个特征值都是0,而另一个特征值必为trA.因此A的Jordan标准形为:(1)diag(trA,0,···,0)(若trA=60),或010(2).(若trA=0,此时A幂零,且幂零指数为2)...0思考题1.两个矩阵的和与积的Jordan标准形是否等于它们的Jordan标准形的和与积?2.如果P与Q均为Jordan标准形中的变换矩阵,它们之间有何关系?第第第四四四节节节盖盖盖尔尔尔圆圆圆定定定理理理:特特特征征征值值值的的的估估估计计计对高阶矩阵来说,精确计算矩阵的特征值一般是做不到的(1825年左右,Abel30与Galois31等人证明了5次及5次以上的代数方程无公式解).幸运的是,工程实践中的众多问题常常只需要确定特征值是否满足一定精度,比如线性系统的稳定性仅需要其所有特征值的实部小于0,即P∞i所有特征值均位于左半平面,而在第五章中我们将看到矩阵级数aiA的敛散性也只需了i=0解A的特征值的模是否均小于1.因此更为合理的办法是对特征值的范围作出估计.复数域上n阶矩阵的特征值可以用复平面上的点来表示,因此对这些点的位置的估计就是对特征值的估计.设A=(aij)是n阶复数矩阵.在复平面上,称集合XDi(A)={x∈C||x−aii|≤|aij|}(i=1,2,···,n)j=6iP||为矩阵A的第i个圆盘.将j=6iaij记为Ri(A),称为A的去心绝对行和,则矩阵A的第i个圆盘又可写成Di(A)={x∈C||x−aii|≤Ri(A)}.30NielsHenrik(1802-1829),著名挪威数学家,月球上有以其名字命名的火山,以其名字命名的AbelPrize是世界上奖金(约一百万美元)最高的数学奖.31Evariste´Galois(1811-1832),天才的法国数学家,群论及有限域的创始人.89∪n32一般地,称A的所有圆盘的并形成的区域i=1Di(A)为A的(关于行的)Gerschgorin区区区域域域,记为G(A),而将G(A)中的每一个圆盘称为Gerschgorin圆圆圆盘盘盘或盖盖盖尔尔尔圆圆圆盘盘盘,这些圆盘的边界称为Gerschgorin圆或盖尔圆.例例例3.4.1求A的圆盘,其中01−1A=120.i12i解解解D1(A)={x||x|≤2},D2(A)={x||x−2|≤1},D3(A)={x||x−2i|≤2}.例例例3.4.2由于盖尔圆盘只涉及矩阵元素的模或绝对值,因此如果矩阵A=(aij)的对角元素均为非负实数,则A与其绝对值矩阵|A|=(|aij|)具有完全相同的盖尔圆盘和盖尔区域.定定定理理理3.4.1(盖尔圆盘定理33)设A是n阶矩阵,则它的特征值λ至少满足下列不等式之一:Xn|λ−aii|≤|aij|,i=1,2,···,n.j=6i等价地,σ(A)⊆G(A),即A的每个特征值都落在A的某个圆盘之内.T证证证设λ是A的一个特征值,α=(x1,···,xn)是它的一个特征向量.则Aα=λα,即a11x1+a12x2+···+a1nxn=λx1,a21x1+a22x2+···+a2nxn=λx2,..∗.()an1x1+an2x2+···+annxn=λxn.令max{|x1|,···,|xn|}=|xm|,则由x=60知xm=60.将方程组(*)中的第m个方程改写为X(λ−amm)xm=amjxj.j=6m两边取模得XX|λ−amm||xm|≤|amj||xj|≤|xm||amj|,j=6mj=6m所以X|λ−amm|≤|amj|.j=6m即特征值λ落在第m个圆盘内.¤注注注对AT应用圆盘定理,可以得到A的关于列的相应结果.32SemyonAranovichGershgorin(1901-1933),前苏联(现白俄罗斯)数学家.33Gerschgorin于1931年证明了此定理.90例例例3.4.3求A的圆盘并估计其特征值,其中1012353012A=.103−105231−40解解解矩阵A的圆盘为|λ−10|≤1+2+3=6,|λ−30|≤1+5+2=8,|λ+10|≤10+3+5=18,|λ+40|≤2+3+1=6.如下面的示意图:6'$••••-−40−101030&%图3.4.1因此,四个特征值均落在四个圆盘之中.例例例3.4.4设n阶矩阵A满足对角强优条件(亦称“严格对角占优”条件)X|aii|>|aij|,i=1,2,···,n,j=6i证明:|A|6=0.证证证只需证明A的特征值全部不为0.设Pλ是A的一个特征值,则由圆盘定理P,它必然落|−|≤||||≤||在某个圆盘之内,即存在k,使得λakkj=6kakj.如果λ=0,则有akkj=6kakj,矛盾!故A不可能有零特征值,从而A的行列式不等于0.¤请注意,圆盘定理只是说明,每个特征值必然落在一个圆盘内,但并未指明落在哪个圆盘内.因此,有些圆盘可能不含特征值,而另一些则可能包含多个特征值.例例例3.4.5求A的圆盘,其中µ¶10−8A=.5091解解解直接计算可知,矩阵A的特征值为√√λ1=5+15i,λ2=5−15i.而A的圆盘为|λ−10|≤8,|λ|≤5.如下图:6'$•λ1-•&%λ2图3.4.2因此,两个特征值全部落在圆盘|λ−10|≤8内,而在圆盘|λ|≤5之外!实际上有下述一般性的结论:命命命题题题3.4.1(精细圆盘定理)设C是盖尔区域的一个由k个圆盘组成的连通分支,则C恰好含有k个特征值.证证证盖尔区域本身可以是不连通的,所谓连通分支是指其最大的连通部分.我们以下给出的证明基于一个基本事实,即复系数多项式的根是其系数的连续函数.记A=(aij)的对角元素构成的对角矩阵为D,令B=A−D.考察矩阵A(ε)=D+εB,其中0≤ε≤1.显然A(0)=D,A(1)=A.注意A(ε)的特征多项式是ε的多项式,因此A(ε)的特征值是ε的连续函数.由圆盘定理,对任意ε,矩阵A(ε)的特征值均位于以aii为圆心,半径为εRi(A)的圆盘之内.当ε从0连续地变到1时,特征值也连续地变化.不妨设C由前k个圆盘组成,由于C是一个连通分支,故它与A的其它n−k个圆盘是分离的.因此对于每个ε∈[0,1],矩阵A(ε)的盖尔区域也具有相同的性质.但当ε=0时,特征值是a11,a22,···,ann,它们之中的前k个落在相应于前k个圆盘的区域中,而其余的n−k个特征值则落在该区域之外,因此,对所有的ε∈[0,1],该结论依然成立.特别,当ε=1时,结论也成立.¤比如在例3.4.3中,A的圆盘共有4个,它们共构成3个连通部分(见例3.4.3的图):(1)|λ+40|≤6;(2)|λ+10|≤18;|λ−10|≤6;(3)|λ−30|≤8.因此可以断言第二个连通部分含有两个特征值,而在第一、三个由单个圆盘组成的连通部分各含有一个特征值.进一步,由于A是实数矩阵,其特征多项式的复数根两两共轭,而第一、三个圆盘是自共轭的(即属于该圆盘的复数的共轭仍属于该圆盘),因此它们所包含的唯一的特征值必然是实特征值.即有下述推推推论论论3.4.1设n阶矩阵A的主对角线元素均为实数,A的特征多项式是实系数多项式.若A的每个圆盘均与其余圆盘分离,则A的特征值均为实数.92一般来说,直接使用圆盘定理得到的特征值估计往往较为粗糙.比如矩阵µ¶14A=02的两个盖尔圆盘分别为|x−1|≤4与x=2,利用圆盘定理只能知道A的两个特征值都落在圆盘|x−1|≤4中,这个估计当然太差了.为了得到更为有效的估计,往往希望每个圆盘只包含A的一个特征值,这就需要将每个圆盘的半径适当缩小.由于σ(A)=σ(P−1AP)(相似矩阵的特征值相同),故可以考虑对矩阵A施行相似变换后,再应用圆盘定理.为了便于应用,一般选择对角矩阵作相似变换,即令P=D=diag(d1,d2,···,dn),其中di>0.于是B=D−1AD=(adj).显然B的对角元素与A的对角元素完全相同,因此这样的相似变ijdi换(称为对角相似变换)只改变盖尔圆盘的半径而不改变它们的中心.(dj的选取原则是:欲使第j个圆盘缩小,可取dj>1,而其余的dk取为1,此时B的其余圆盘相对放大;反之,欲使第j个圆盘放大,可取dj<1,而其余的dk取为1,此时B的其余圆盘相对缩小.)利用这个技巧,再研究前面的矩阵A,则得到µ¶µ¶µ¶µ¶−14d2d1014d101dB=−1=1,0d2020d202因此B的两个盖尔圆盘分别为|x−1|≤4d2与x=2,由于可以将数4d2取为任意正实数,因d1d1此两个特征值必然为1与2.例例例3.4.6估计矩阵A的特征值,其中0.90.010.11A=0.010.80.12.0.010.020.4解解解由圆盘定理可知A的特征值在下列圆盘之中:|λ−0.9|≤0.12;|λ−0.8|≤0.13;|λ−0.4|≤0.03.所以第一、二个圆盘构成一个连通部分,而第三个圆盘单独构成一个连通部分.这样,有两个特征值不能分离.但若作相似变换,D−1AD=B,其中D是对角矩阵diag(1,1,1),则100.90.010.011B=0.010.80.012.0.10.20.4故B的圆盘为|λ−0.9|≤0.021;|λ−0.8|≤0.022;|λ−0.4|≤0.3.从而B的三个圆盘都是孤立的,因而每个圆盘中都有一个特征值.由于A与B相似,从而有相同的特征值,故A的特征值分别在上述三个圆盘中,且按推论3.4.1,它们都是实数.例例例3.4.7证明矩阵A至少有两个实特征值,其中712−10811A=.−1050100193证证证A的四个圆盘为D1=|λ−7|≤4;D2=|λ−8|≤2;D3=|λ−5|≤1;D4=|λ−1|≤1.SS直接计算可知,四个圆盘构成两个连通部分,分别为G1=D1D2D3与G2=D4.因此G2包含唯一的特征值,该特征值只能与自己共轭,故为实数.因此,含在G1中的三个特征值必有一个是实数.从而A至少有两个实特征值.利用圆盘定理可以得到矩阵谱半径的如下估计.Pn||命命命题题题3.4.2设A=(aij)是n阶复数矩阵.令ν=maxj=1akj(此即矩阵行的元1≤k≤n素的绝对值之和的最大者),则ρ(A)≤ν.证证证设是的一个特征值由圆盘定理可知一定存在使得|−|≤Pλ0A,P,Pkλ0akkn||||≤||n||n||≤j=1,j=6kakj成立.所以λ0akk+j=1,j=6kakj=j=1akjν.因此,任何特征值的模都不超过ν,所以ρ(A)≤ν.¤T00注P意A与A有相同的特征值,若记矩阵A的列的绝对值之和的最大值为ν,即ν=nTmax|akj|,对A使用上述命题可得1≤j≤nk=1命命命题题题3.4.3ρ(A)≤min{ν,ν0}.盖尔圆盘定理是最简便的特征值估计方法,自1931年发表以来,有众多新的拓展方法,以下介绍其中两种,证明见习题50与51.类似于去心绝对行和,定义矩阵A=(aij)的去心绝对列和如下:XCi(A)=|aji|,1≤i≤n.j=6i定定定理理理3.4.2(Ostrowski34圆盘定理)设λ是n阶矩阵A的一个特征值,0≤α≤1是实数.则存在1≤i≤n使得α1−α|λ−aii|≤Ri(A)Ci(A).可以将上述定理中的圆盘称为第i个Ostrowski圆盘.注意对Ostrowski圆盘定理,类似于盖尔圆盘定理的精细圆盘定理也成立,这依然因为特征值是矩阵各元素的连续函数.µ¶14例例例3.4.8设A=.则A的两个盖尔圆盘分别为|x−1|≤4与|x−6|≤1.由于161这两个圆相切,故由盖尔圆盘定理不能得出很好的估计.但取α=2,则可得两个Ostrowski圆盘分别为|x−1|≤2与|x−6|≤2,这是两个分离的圆盘.因此可以断言这两个圆盘各包含A的一个特征值.实际上,将二者结合使用可知,一个实特征值位于|x−1|≤2,而另一个实特征值介于-1与7之间.34AlexanderMarkowich(1893-1986),俄裔德国瑞士数学家,对众多数学分支有重要贡献.94定定定理理理3.4.3(Brauer35定理)设λ是n阶矩阵A的一个特征值,则存在1≤i=6j≤n使得|λ−aii||λ−ajj|≤Ri(A)Rj(A).(上式表达的几何图形称为Cassini36卵形.)从纯粹的代数角度看,定理3.4.3只不过是两个盖尔圆盘的方程相乘的结果,但有趣的是,这个结果不能推广到三个或更多盖尔圆盘的方程相乘的情形,请读者验证习题52.思考题1.用盖尔圆盘定理如何估计酉矩阵与正交矩阵的特征值?第第第五五五节节节应应应用用用:主主主元元元分分分析析析法法法,商商商品品品定定定价价价本章讨论的矩阵的特征值、特征向量与Jordan标准形是矩阵理论的根本,因为矩阵计算的实质是特征值的计算,而矩阵的Jordan标准形则从理论上提供了理解矩阵性质、计算矩阵函数、研究矩阵微积分的一种简便方法(尽管Jordan标准形不是矩阵计算的实用方法).Schur三角化定理有众多应用,比如我们将在第四章学习的正规矩阵及其谱分解.矩阵的Jordan标准形以及盖尔圆盘定理也都具有广泛的应用,本节我们仅介绍特征值与特征向量的两个应用,即主主主元元元分分分析析析法法法与商商商品品品定定定价价价.一一一.主主主元元元分分分析析析法法法主元分析法也称为主分量分析法,英文缩写为PCA.其主要思想如下:假设有n个统计相关的随机变(向)量{x1,···,xn}.现在希望通过某
/
本文档为【矩阵理论_上海交大\Chapter3】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索