为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

多元正态分布

2017-09-26 21页 doc 81KB 95阅读

用户头像

is_601191

暂无简介

举报
多元正态分布多元正态分布 第二章 多元正态分布 多元统计分析涉及到的都是随机向量或多个随机向量放在一起组成的随机矩阵,在介绍正态分布之前,先论述有关随机向量的基本概念。为了便于理解概念和性质,借助复习一元统计分析中有关概念和性质,自然推广给出多元统计分析中相应的概念和性质。 ?2.1 基本概念 1 随机向量的概率分布 对许多社会经济现象进行认识和研究时,往往涉及多个随机变量。一般说来,这些随机变量之间又有某种联系,因而需要把这些随机变量作为一个整体(即向量)来研究。 定义1 将p个随机变量的整体称为p维随机向量,记为。 X,(...
多元正态分布
多元正态分布 第二章 多元正态分布 多元统计分析涉及到的都是随机向量或多个随机向量放在一起组成的随机矩阵,在介绍正态分布之前,先论述有关随机向量的基本概念。为了便于理解概念和性质,借助复习一元统计分析中有关概念和性质,自然推广给出多元统计分析中相应的概念和性质。 ?2.1 基本概念 1 随机向量的概率分布 对许多社会经济现象进行认识和研究时,往往涉及多个随机变量。一般说来,这些随机变量之间又有某种联系,因而需要把这些随机变量作为一个整体(即向量)来研究。 定义1 将p个随机变量的整体称为p维随机向量,记为。 X,(X,X,?,X)X,X,?,X12p12p 在多元统计分析中,仍然将所研究对象的全体称为总体,它是由许多(有限或无限)的个体构成的集合,如果构成总体的个体是具有p个需要观测指标的个体,我们称这样的总体为p维总体(或p元总体)。由于从p维总体中随机抽取一个个体,其p个指标观测值是不能事先精确知道的,它依赖于被抽到的个体,因此p维总体可用一个p维随机向量来表示。这种表示便于人们用数学方法去研究p维总体的特性。这里“维”(或“元”)的概念,表示共有几个分量,例如要研究某类企业的三项经济效益指标,则所有这类企业的三项经济效益指标就构成一个三元总体。如果三项指标分别用表示,则三X,X,X123 '元总体就用三维随机向量来表示,对随机向量的研究仍然限于讨论离散型和连续型X,(X,X,X)123 两类随机向量。 先回顾一下一元统计中分布函数和密度函数定义。 设X是一个随机变量,称为X的概率分布函数或简称为分布函数,记为F(x),P(X,x) 。 X~F(x) p,1,若随机变量在有限或可列个值上取值,记,且则称X{x}P(X,x),p(k,1,2,?),kkkkk为离散型随机变量,并称为X的概率分布。 P(X,x),p(k,1,2,?)kk 设,若存在一个非负函数,使得对一切实数x有: X~F(x)f(x) x F(x),f(t)dt,,, 则称X为连续型随机变量,称为X的分布密度函数,简称为密度函数。一个函数能作为某f(x)f(x)个随机变量X的分布密度函数的重要条件是: (1),对一切实数x; f(x),0 ,,(2)。 f(x)dx,1,,, ,定义2 设X(X,X,?,X)是维随机向量,它的多元分布函数定义为: ,p12p F(x),F(x,x,?,x),P(X,x,X,x,?,X,x)记为,其中X~F(x)12p1122pp pp,Rx,(x,x,?,x),R,表示p维欧氏空间。 12p 多维随机向量的统计特性可用它的分布函数来完整地描述。 ,定义3 设X,(X,X,?,X)是p维随机向量,若存在有限个或可列个p维数向量记x,x,?,12p12 且满足,则称X为离散型随机向量,称P(X,x),p(k,1,2,?)p,p,?,1kk12 为X概率分布。 P(X,x),p(k,1,2,?)kk 设,若存在一个非负函数,使得对一切X~F(x),F(x,x,?,x)f(x,x,?,x)12p12p p,有 ,Rx,(x,x,?,x)12p xx1p F(x),F(x,x,?,x),?f(t,?,t)dt?dt1211ppp,,,,,, 则称X为连续型随机向量,称为分布密度函数,简称为密度函数或分布密度。 f(x,x,?,x)12p p一个p元函数能作为中某个随机向量的密度函数的主要条件是: Rf(x,x,?,x)12p p,(1); f(x,x,?,x),0, ,(x,x,?,x),Rpp1212 ,,,,(2)。 ?f(x,x,?,x)dxdx?dx,112p12p,,,,,, 离散型随机向量的统计性质可由它的概率分布完全确定,连续型随机向量的统计性质可由它的分布 密度完全确定。 例1 试证函数: (),x,x12,, x0, x0,,e,12 (,),fxx,12,0, 其它, ,为随机向量的密度函数。 (,)X,XX12 证:只要验证满足密度函数两个条件即可: (1)显然,有 f(x,x),012,,,,,,,,()xx,,12(2) f(x,x)dxdx,edxdx121212,,,,00,,,, ,,,,,,()xx,,12 ,edxdx,,12,,,,00,, ,,x,2 ,edx2,0 ,x,,2,,e,1 0 ,定义4 设是维随机向量,称由它的个分量组成的子向量pq(,p)X,(X,X,?,X)12P(i),的分布为X的边缘(或边际)分布,相对地把X的分布称为联合分布。通过交X,(X,X,?,X)ii2iq1 (1)(2)换X中各分量的次序,总可假定正好是X的前q个分量,其余个分量为,即 XXp,q q(1)(1),,,,XxX,相应的取值也可分为两部分。 x,,,,,,(2)(2)Xx,,,,,pq (1)当X的分布函数是F(x,x,?,x)时,X的分布函数即边缘分布函数为: 12p F(x,x,?,x),P(X,x,?,X,x) 12q11qq ,P(X,x,?,X,x,X,,,?,X,,)11qqq,1p ,F(x,x,?,x,,,?,,) 12q (1)X当X有分布密度时(亦称联合分布密度函数),则也有分布密度,即边缘密度f(x,x,?,x)12p 函数为: ,,,, f(x,x,?,x),?f(x,?,x)dx?dx112p1pq1p,,,,,,, ,例2 对例1中的求边缘密度函数。 X,(X,X)12 ,, 解: f(x),f(x,x)dx1122,,, ,,,()xxx,,,121, 0,,edxex,21, ,,0,0, 其它, ,x2,,0,ex,2同理 (),fx,2,0,其它, 定义5 若p个随机变量的联合分布等于各自的边缘分布的乘积,则称是相互X,?,XX,?,X1p1p 独立的。 例3 问例2中的与是否相互独立, XX12 (),x,x12,,,,0,0exx12,(,) 解:?fxx,120,其它, ,x1,,,0ex,1 (),fx,1x1,0,其它, ,x2,,0,ex,1 (),fx,2x2,0,其它, ,故与相互独立。 ?f(x,x),f(x),f(x)XX1212x1x212 需要注意的是:由相互独立,可推知任何与独立,但反之不真。 XX,?,XX(i,j)1pji2 随机向量的数字特征 ,定义6 设,若存在且有限,则称X(X,X,?,X)EX(i,1,?,p),12Pi ,为X的均值(向量)或数学期望,有时也把和分别记为和,E(X)(EX,EX,?,EX)E(X),,EX,12Pii ,即,容易推得均值(向量)具有以下性质: ,,(,,,,?,,)12p (1) E(AX),AE(X) (2) E(AXB),AE(X)B (3) E(AX,BY),AE(X),BE(Y) 其中X、Y为随机向量,A、B为大小适合运算的常数矩阵。 ,,,定义7 设X(X,?X),Y(Y,?Y),称D(X),E(X,EX)(X,EX) ,,1p1p Cov(X,X)Cov(X,X)?Cov(X,X),,11121p,,(,)(,)(,)CovXXCovXX?CovXX21222p,, ,,,?? ? ,,Cov(X,X)Cov(X,X)?Cov(X,X),,P1p2pp,, ,为X的方差或协差阵,有时把简记为,Cov(X,X)简记为,从而有;称随,,,(,)D(X)ijijijp,p 机向量X和Y的协差阵为: ,Cov(X,Y),E(X,EX)(Y,EY) Cov(X,Y)Cov(X,Y)?Cov(X,Y),,11121q,,(,)(,)(,)CovXYCovXY?CovXY21222q,,, ,, ??? ,,Cov(X,Y)Cov(X,X)?Cov(X,Y),,P1p2pp,,当X=Y时,即为D(X)。 ,若的协差阵存在,且每个分量的方差大于零,则称随机向量X的相关阵为X,(X,?,X)1p ,其中 R,(r)ijp,p ,CovXX(,)ijijr ,, i,j,1,?,pijVarXVarX,,()()ijiijj 为相关系数。 ,,,0111,,2设标准离差阵 ,V?,, ,,0,pp,, 则有 1111,1,12222 即 R,(V),(V),,VRV 1 2这说明从,可得到R,也可从和R得到,,且由,可知 ,,0R,0V 例4 设 ,,,412,,,,111213,,,,,,,,,,19,1 212223,,,, ,,,,,,,2,116313233,,,,则可得 ,,,00200,,111,,,,2, ,00,030V22,,,,,,,,00,00433,,,, 1,,00,,21,,1,12,,V(),00 3,,1,,00,,4,, 从而可得相关阵为: 11,1,122 R,(V),(V) 11,,,,0000,,,,22412,,,,,,11,,,,,,,0019,100 ,,33,,,,,,2,11611,,,,,,0000,,,,44,,,, 11,,1,,64,,11,,,1, 612,,11,,,1,,412,, 若Cov(X,Y),0,则称X和Y不相关,由X和Y相互独立易推得Cov(X,Y),0,即X和Y不相 关,但反过来,当X和Y不相关时,一般不能推知它们独立。 容易推得协差阵有以下性质: (1),即X的协差阵是非负定阵。 D(X),0 (2)对于常数向量a,有。 D(X,a),D(X) ,(3)设A为常数矩阵,则。 D(AX),AD(X)A ,(4)。 Cov(AX,BY),ACov(X,Y)B 其中a,A,B为大小适合运算的常数向量和矩阵。 ?2.2 多元正态分布的定义及基本性质 多元正态分布在多元统计分析中所占的重要地位,如同一元统计分析中一元正态分布所占的重要地位一样,多元统计分析中的许多重要理论和方法都是直接或间接建立在正态分布的基础上,多元正态分布是多元统计分析的基础。此外,在实用中遇到的随机向量常常是服从正态分布或近似正态分布。因此现实世界中许多实际问题的解决办法都是以总体服从正态分布或近似正态分布为前提的。 1 多元正态分布的定义 多元正态分布有多种定义方法,下面给出常用的三种等价定义(另两种定义在附注中给出)。 ,定义8 若p维随机向量的密度函数为: X,(X,?,X)1p 11,,,1,,,,,, f(x,?,x)exp(x,)(x,),,p112p2,,(2),, ,,其中,是p维向量,是p阶正定阵,则称X服从p元正态分布,也称X为px(x,?,x),,1p 维正态随机向量,简记为,显然当时,即为一元正态分布密度函数。 X~N(,,,)p,1p 可以证明为X的均值(向量),,为X的协差阵。 , ,1顺便指出,当时,不存在,X也就不存在通常意义下的密度,这也是如今人们不大采用,,,0 密度函数来定义多元正态分布的原因。当时也有正态分布的定义,下面在附注中给出另外两种正,,0 态分布的定义。 附注: 定义8.1 独立标准正态变量的有限线性组合 X,?,X1p YX,,,,11,,,,YA ,?,?,,,,,,m,pm,1,,,,YXmm,,,, ,,,,AA,,AA称为m维正态随机向量,记为,其中,这里需要注意的是的分解Y~N(,,,)m 一般不是唯一的。 易见这里是用多个正态变量的任意线性组合给出多元正态随机向量的定义,其优点之一是多元正态的有些性质,可用一元正态性质得到。 1,,,,,(t),expit,t,t,定义8.2 若X的特征函数为,其中t为实向量,则称X服从p元正态分,,2,, 布,显然用特征函数定义,可以包括情况。 ,,0 例 当p,2时利用参数和E(X),,,E(X),,,D(X),,,D(X),,1122111222 可将二元正态分布密度函数写成形式:,,,,,12121122 2,,,,,,11x,11,,, ,,(,)expfxx,122,,2,2(1,,),,,2,,(1,)12,11,,112212,, 2,,,,,,,,,,,,,,xxx,221122,,,,,,,, ,,2,12,,,,,,,,,,221122,,,,,,,,, ,,,,1112这是因为协差阵 ,,,,,,2122,, 所以 ,,,,,12212,1,, ,,2,,,,,,,,,,,1211112212 ,,,,,,1,22121122 ,,,2,,,,(1),,,,,12112211221211,, 22 ,,,,,,,,,(1,,)112212112212 而 ,122, (x,,),(x,,),,,(x,,),,(x,,)22111221 ,2,,,(x,,)12112211 2 ,,(x,,),,(1,,)2211121222,,,,,,,,,xx11122,,,,, ,,2,,,,,1,,,,121122,,,,, ,,,,,,,,xx1122,,,,, ,212,,,,,,1122,,,, ,1,1,将上述代到元正态密度函数中便可得到二元正态密度函数关于,,,,(x,,),(x,,)p, 和的表达式: ,,,,,,,,12112212 ,11(,),exp, fxx,12222(1,),2(1,),,,,,12112212 22,,,,,,,,,xx1122,,,,, ,,,,,,,,1122,,,,, ,,,,,,,,,,xx,1122,,,,,,, 2,12,,,,,,,,1122,,,,,, 下面给出二元正态分布的图形。 图1 图2 ,,,,4,,,0112212 图3 ,,,,1,,,0112212 图4 ,,,,1,,,0.75112212 从图1可以看出,该图形最高点的坐标为它的均值(),如果用一个固定高度去切割二元正,,,12 态密度函数曲面,其截口是一个椭圆,称为概率密度等高线。用不同高度去截,可得一族椭圆。类似地,在p元正态分布中,概率密度的等高面是一族椭球。 图2和图3给出不同方差大小的正态圆形,对应较大的方差,的取值分散较大,密度函数(x,x)12曲面较平缓;对应较小的方差,的取值集中在均值附近或者从图4看出,当和有较高的相(x,x)xx1212 关性时,密度函数曲面较陡立。 2 多元正态变量的基本性质 在讨论多元统计分析的理论和方法时,经常用到多元正态变量的某些性质,利用这些性质可使得正 态分布的处理变得容易一些。 ,(1)若是对角阵,则相互独立。 X,(X,?,X)~N(,,,),,X,?,X1pp1p (2)若为阶常数阵,d为s维常数向量,则 X~N(,,,),As,pp , AX,d~N(A,,d,A,A)s即正态随机向量的线性函数还是正态的。 (3)若,将作如下剖分: X,,,,X~N(,,,)p qq(1)(1),,,,,X, X,, ,,,,(2)(2)X,,,,,,,pqpq q,,,,1112 ,,,,,,2122,,p,q (1)(1)(2)(2)则。 X~N(,,,),X~N(,,,)q11p,q22值得指出的是:(1)多元正态分布的任何边缘分布为正态分布,但反之不真。(2)由于 (1)(2)(1)(1)(2),故表示和不相关,因此可知,对于多元正态变量而言,XXX,,,,CovX,X,,01212(2)和的不相关与独立是等价的。 X ,例5 若 ,,X,X,X,X~N(,,,)1233 其中 ,,,,,,,,1111213,,,,,,,,,,,, 2212223,,,, ,,,,,,,,3132333,,,, 100,,,,,设 a,(0,0,1)A,,,00,1,,则 (1) X,,1,,,,, aX,(0,0,1)X,X~N(a,,a,a)23,, ,,X3,, 其中 ,,,1,,, a,,(0,0,1),,,23,, ,,,3,, ,,,0,,,,111213,,,,,(0,0,1)0 aa,,,,,,,21222333,,,, ,,,,1,,,313233,,,,(2) X,,1,,X100,,,,1,,, ,,AX,X,~N(A,,A,A),,2,,,,00,1,X3,,,,,,X3,, 其中 ,,,1,,,100,,,,1,,,,,, A,,,,2,,,,001,,,3,,,,,,,3,, ,,,10,,,,111213100,,,,,,,,,,,, ,,00AA212223,,,,,,00,1,,,,,,,,,0,1313233,,,, ,,,,,1113 ,,,,,,3133,, (3) ,X,,,,11(1)(1),,,,,X,,,,,X,,,,22,,,,,记 X,,,,,, ,,,,,,,,,,(2)(2),,,,X,,,,,,,,,X,33,,,, ,,,?,,111213,,?,,1112,,,,,?,,212223 ,,,?????,,,,???????,,,,?,,2122,,,,,?,,313233,, 则 X,,1(1)(1) X,~N(,,,)211,,X2,, 其中 ,,,,,,,11112(1), ,,, 11,,,,,,,21222,,,, 顺便指出,多元分析中的很多统计方法,大都假定数据来自多元正态总体。但是要判断已有的一批数据是否来自多元正态总体,并不是一件简易的事。可是反过来要肯定数据不是来自多元正态总体,倒 ,,,是有一些简易方法,其依据是:如果服从p元正态分布,则它的每个分量必服从一元XX,?,X,1p 正态分布,因此把某个分量的n个样品值作成直方图,如果断定不呈正态分布,则就可以断定随机向量 ,也不可能服从p元正态分布。 X,(X,?,X)1p 附注: 若一批多元数据不满足正态性时,一般要对数据进行变换,使变为“接近正态”数据。对非正态数 ,据如何作近似正态化变换,在许多情况下常采用以下一些幂变换族(这里限定多元数据必为正值,x 111,10442如有某些负值,可把每个观测值都加上同一个常数使其为正):?,x,,x,lnx,x,x,x,xx 23或。前部分可使x的大值缩小,后部分可使x的大值增大,经过变换后的数据,接近正态性往往x,x 有所改进。但不管选用哪种幂变换,正态性改进多大,提醒读者,还应该对变换后数据的正态性作验证(如用Q-Q图或其它方法)一直到对变换后数据满足正态性为止,有关这方面的正态理论分析这里不做进一步叙述,详细内容可查看后面的参考书。 ?2.3 多元正态分布的参数估计 和协差阵通常是未知的,需由样本来估计,而参数的在实际应用中,多元正态分布中均值向量,, 估计方法很多,这里用最常见的最大似然估计法给出其估计量,并借助一元统计中学过的估计量性质指出这里给出的估计量也满足通常要求的性质。 1 多元样本的概念及表示法 多元分析研究的总体是多元总体,从多元总体中随机抽取n个个体:,若X,X,?,X(1)(2)(n) 相互独立且与总体同分布,则称为该总体的一个多元随机样本,X,X,?,XX,X,?,X(1)(2)(n)(1)(2)(n) ,简称为简单样本。每个称为一个样品,其中为第a个样X,(X,X,?,X)(,,1,2,?,n)X(a)a1a2apaj品对第j个指标的观测值,显然每个样品都是p维向量,将n个样品对p项指标进行观测,将全部观测结果用一个n×p阶矩阵X表示: X,,XX?X,,(1)11121p,,,,XX?XX21222p(2),,,,X,, ,,,,????,,,,XX?XX,,,,n1n2np,,(n),, ,由于每个样品对个指标的观测值是不能事先确定的,所以把每个样品X,(X,X,?,X)p(a)a1a2ap 看成随机向量,因此X就是一个随机矩阵,称X为观测矩阵或样本资料阵,一旦观测值取定就是X(a) 一个数据矩阵,多元分析的很多方法都是运用各种手段从观测矩阵出发去提取有关信息。 除上述简单随机样本之外,还有其它样本,特别是在社会经济领域中,有些样本资料的来源就不一定总满足随机性的要求。还有一种情况是,所观测的对象就是所研究的全体对象,例如考察全国30个省市自治区所有大型国营企业的p项经济指标,以便对企业的经济效益进行评估或排序,对于这样一些情况,需要采用有别于一般概率方法的其它处理方法,这些方法将在以后的有关章节中看到,但本章中所用的多元样本特别是涉及到有关定理和性质的数学证明都是指简单随机样本。 值得注意的是:1. 多元样本中的每个样品,对p个指标的观测值往往是有相关关系的,但不同样品之间的观测值一定是相互独立的。2. 多元分析处理的多元样本观测数据一般都属于横截面数据,即在同一时间横截面上的数据,比如某一年的人口普查数据、工业普查数据,对某一年份,横向比较30个省市自治区工业的经济效益指标,或者分析某年城镇居民的消费结构等等,对这类指标的观测数据都属于横截面数据,它不考虑时间因素,即这些数据不是按时间顺序排列的。如果考虑的多元样本观测数据是按时间顺序排列的数据,如建国以来历年的国民生产总值、运输业国民收入、钢产量、粮食产量等,都是每年有一个对应的数据,这些数据是按时间顺序排列的,也就是说这些指标的观测值是随时间变化的,对这类数据的研究属于多元时间序列分析的范畴,不属于本书介绍的范围。 2 多元样本的数字特征 ,定义 设为来自p元总体的样本,其中X(X,?,X),a,1,2,?,n。 X,?,X,(a)a1ap(1)(n) (1) 样本均值向量定义为: n1,X,X,(X,X,?,X) 12p,()an,1a ,,XXX,,,,,,1n2111,,,,,,,,nXXX,,,,11,,22n212,,?X(a),,,?, ,,,,,,,,,???nn,1a,,,,,,,,,,,,,,XXX,,2pnp1,P,,,,,,, XX?X,,,,,1121n1,,XX?X,,,,,11222n2 ,,,?n,,,,XX?X,,,1p2pnp,, ,,X1,, ,,X2, ,,?,, ,,Xp,, (2)样本离差阵定义为: n , S,(X,X)(X,X),(s)p,p,()()aaij,pp,1an , ?(XX)(XX),,,()()aa,,1 ,,,,XX,1a1,,,,n,,XX,,,2a2,,XX,XX,?,XX,,,, ,,p12,aaap12,, ?,,1,,,,,,,,XX,pap,,,, ___,,2(X,X)(X,X)(X,X)?(X,X)(X,X)p111,aaaap11221,,n2,,(X,X)(X,X)(X,X)?(X,X)(X,X)p2122aaaaap2122, ,,,a,1??,,2,,(X,X)(X,X)(X,X)(X,X)?(X,X)ppp12apaapaap12,, ?sss,,11121p,,?sss21222p,, ,,(s)ijp,p,,??? ,,?sss,,12pppp,, (3)样本协差阵定义为 n11,V,,(X,X)(X,X),(v) ,(a)(a)ijp,pp,pnna,1n11,?S,(X,X)(X,X) ,()()aann,1a n,,1 ,,,(XX)(XX)ij,aiaj,,na,1,,p,p ,, ,vijp,p (4)样本相关阵定义为: R,(r)ijp,pp,p 其中 vsijij r,,ijvvssiijjiijj样本均值向量和离差阵也可用样本资料阵X直接表示如下: 1,, X,X1 其中1,(1,1,?,1)nn,p1n 1, ?X,X1nn XXX?,,1,,1121n1,,,,XXX?1,,11222n2,, ,,,,,???n?,,,,,,,,XXX?11p2pnp,,,, ,,XX?XX,,,1,,n11211,,,,,,XX?X,,,,,X12n12222,, ,,,,? n?,,,,,,,,,,,XX?Xppnp12Xp,,,, 10,,1,,,,,(,11) I, SXIX其中?nnnn,,n,,01,, n , ?S,(X,X)(X,X) ,()()aa,1a ,, ,XX,nXX 1,,, XXXX,,11nnn 1,,= X(I,11)Xnnnn ,3 和的最大似然估计及基本性质 , 通过样本来估计总体的参数叫做参数估计,参数估计的原则和方法是很多的,这里用最常见的且具 有很多优良性质的最大似然法给出μ和?的估计量。 设X,X,?,X来自正态总体容量为n的样本,每个样品N(,,,)(1)(2)(n)p XX?X,,111213,,XX?X212223,,,,,样本资料阵为 X(X,X,?,X)a,1,?,nX,,(a)a1a2ap,,??? ,,XX?X313233,, ,则用最大似然法求出和的估计量分别为: , ˆ ,,X 1ˆ ,,Sn ,和的估计量有如下基本性质: , (1),即是的无偏估计; X,E(X),, 1n,11,,即不是的无偏估计, ,ES,,,S,,nnn,, 11,,而是的无偏估计; ,ES,,,S,,n,1n,1,, 1(2)分别是的有效估计; ,,,X,Sn,1 11,,(3)分别是的一致估计(相合估计)。 X,S或S,,,,,nn,1,, 样本均值向量和样本离差阵在多元统计推断中具有十分重要的作用,并有如下结论: 定理 设和S分别是正态总体的样本均值向量和离差阵,则 XN(,,,)p 1,,(1); XN,,~,,,pn,, (2)离差阵S可以写为: n,1 , S,ZZ,aaa,1 其中,独立同分布于; Z,?,ZN(0,,)1n,1p (3)与S相互独立; X (4)S为正定阵的充要条件是。 n,p 4 Wishart分布 1ˆ,在实际应用中,常采用X和来估计和,前面已指出,均值向量X的分布仍为正态,,S,n,1 2分布,而离差阵S的分布又是什么呢,为此给出维希特(Wishart)分布,并指出它是一元分布的推, 广,也是构成其它重要分布的基础。 Wishart分布是Wishart在1928年推导出来的,为了纪念这位多元分析的先驱者而命名为Wishart 分布。 ,定义 设且相互独立,则由组成的随机矩X,(X,?,X)~N(,,,),,,1,2,?,nX(a)a1appa(a) 阵: N ,W,XX ,()()aa,PP,1a n ,Z,,,的分布称为非中心Wishart分布,记为W(n,,,z),其中,非中心参数定义为,paa,1a ,;当时称为中心Wishart分布,记为,当n,p,,有(,,?,,),,0W(n,,)W(n,,),,0a0ppa1an 11np(,,1),,12,,trexp{,},,2,pn/2,f(),密度存在,其表达式为:ni , ,,1,nppp/2(,1)/4,2,(),,,2i,1,0,其它, 222 显然,当时,就是的分布密度,此时有p,1,,,f(,),,(n), nnn1'2222W,XX,X(,)X(有,因此,Wishart分布是分布在p维正态,(n),,,,,,()(),()2,,,1,,1,1, 情况下的推广( 这里要说明一下什么是随机矩阵的分布。随机矩阵的分布有不同的定义,此处是利用已知向量分布 的定义给出矩阵分布的定义。 设随机矩阵 XX?X,,11121P,,XX?X21222P,, X,,,??? ,,XX?Xn1n2nP,,将该矩阵的列向量(或行向量)一个接一个地连接起来,组成一个长的向量,即拉直向量: 的分布定义为该阵的分布。若X为对(X,X,?,X,X,X,?,X,?,X,X,?,X)1121n11222n21p2pnp 称阵时,由于,故只取其下三角部分组成的一个长向量,即X,X,p,nijji 。 (X,X,?,X,X,?,X,?,X)1121n122n2np 基本性质: (1)若且相互独立,则样本离差阵X(a)~N(,,,),a,1,?,np nn1,,其中。 S,(X,X)(X,X)~W(n,1,,)X,X,,()(a)(a)pan,,1a1a(2)若,且相互独立, S~W(n,,),i,1,?,kipi 则 S,S,S,?,S~W(n,?,n,,)12kp1k ,,(3)若为非奇异阵,则 C,C~W(n,c,c)X~W(n,,),Cpp,pp,p 习 题 ,2.1 设随机向量的密度函数: X,(X,X)12 2, o,,,1当xx,21(,), fxx,120, 其它 , 试求:(1) F(x,x);12 (2) f(x),f(x);12 (3)与相互独立。 XX12 2.2 设随机变量和有如下概率分布: XX12 X,101X0112 P(X)0.30.30.4P(X)0.80.2112 X,,1,,问 E(X),E,?,,X2,, ,,2.3 设随机向量,,具有均值向量协差阵 ,(,,,)XX,X,,1212 ,,Z,X,XZ,,,,,11211112,,,,。写出线性组合 ,,或 Z,,,,,,,,,Z,X,XZ21222122,,,,,11X,,,,,1,,,,的均值向量和协差阵。 ,CX,,,,11X2,,,, ,,2.4 设随机向量具有均值向量和协差阵: (,,,,),,(2,4,,1,3,0)X,XXXXX12345 11,,4,1,0,,22,,,131,10,,1,,161,1,, 2,,1,,,,1140,,2,,00,102,,将X划分成: X,,1,,(1),,XX2,,,,,,X,?,? ,,,,(2),,XX3,,,,,,X4,, 1,1111,,,,,,,,设A,, B, ,,,,1111-2,,,, (1)(2)试求:(1) (2) E(AX)E(BX) (1)(1) (3) (4) Cov(X)Cov(AX) (2)(5) Cov(BX) X,,1,,.5 设随机向量2和独立,且,问服从什么分X~N(,,,),X~N(,,,)XXX?,,,1p1112q22212,,X2,, 布,均值向量和协差阵是什么, 410,, ,,,2.6 设,其中,问与是否独立,(,)和,,130X,(X,X,X)~N(,,,)XXXXX123312123,, ,,002,, 是否独立,为什么,
/
本文档为【多元正态分布】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
热门搜索

历史搜索

    清空历史搜索