为了正常的体验网站,请在浏览器设置里面开启Javascript功能!
首页 > 结晶学ch4

结晶学ch4

2017-04-13 43页 pdf 510KB 143阅读

用户头像

is_959510

暂无简介

举报
结晶学ch41第四章多维正态分布及其统计推断1多维随机向量及其数字特征一多维随机向量及其分布函数多元统计分析是研究多个随机变量即多维随机向量)的统计规律的由p个随机变量pXXX,,,21构成的p维列向量1212(,,,)ppXXXXXXX称为p维随机向量下面的一些基本概念是一维随机变量的相应概念的直接推广1)P元函数11122(,,),,,pppFxxPXxXxXx称为随机向量),,,(21pXXXX的分布函数,或X1,X2,Xp的联合分布函数分布函数的性质:②分布函数),,(...
结晶学ch4
1第四章多维正态分布及其统计推断1多维随机向量及其数字特征一多维随机向量及其分布函数多元统计分析是研究多个随机变量即多维随机向量)的统计规律的由p个随机变量pXXX,,,21构成的p维列向量1212(,,,)ppXXXXXXX称为p维随机向量下面的一些基本概念是一维随机变量的相应概念的直接推广1)P元函数11122(,,),,,pppFxxPXxXxXx称为随机向量),,,(21pXXXX的分布函数,或X1,X2,Xp的联合分布函数分布函数的性质:②分布函数),,(1pxxF是每个变量的非降右连续函数;③④若iiab(i=1,p),有1[,]111(,,){}{,,}0bapabpppFaaPXIPaXbaXb1),,,(021pxxxF(,,,)1F2(,,,)pFxx12(,,,)0Fxx2由加法公式及数学归纳法可以证明11121211111(,,)(,,)(1)(1)(,,)kkbappiinkpiiipiiinFaaFbbFFFaa式中12111(,,),,kkkiiipiiiijjFFxxxaxaxb是中,其余的值二两个常用的离散多元分布如果随机向量的每个分量都是离散型的随机变量,则该随机向量称为是离散型的多项分布则称服从多项分布,当m=2时,为二项分布②多元超几何分布12(,,,)mXXXX若有如下分布11122112(,,,)mkkmmmmnPXkXkXkppkkk01ip其中,mi,,2,1nkkkm21121mppp12(,,,)mXXXX111122(,,,)mmmmNNkkPXkXkXkNnmi,,2,1),min(,1,0iiNnknkkkm21NNNNm2112(,,,)mXXXX若有如下分布3则称服从多元超几何分布当m=2时,为超几何分布三.多元概率密度如果存在非负的p元函数fx1,,xp),使得),,(1pxxF1211(,,)pxxxppfyydydy则称p维随机向量X是连续型的,而fx1,,xp)称为X的概率密度函数,或X1,X2,,Xp的联合概率密度函数类似于一维的情形,分布密度函数有以下性质1)0),,,(21pxxxf;2);1),,(11ppdxdxxxf3)11(,,)ppBPXBfxxdxdx其中B是p维欧氏空间Rp中任一Borl集)4)在fx1,,xp)的连续点有121212(,,,)(,,,)ppppFxxxfxxxxxx四边缘分布函数与独立性从p维随机向量X任取k个分量1(,,)iikXX,(1)kp得到一个k维随机子向量,其分布函数称为X的k维)边缘分布函数如求(1)12(,,,)kXXXX的边际分布函数(1)11122(,,),,,kkkFxxPXxXxXx12(,,,)mXXXX4=1(,,,,,)kFxx以()(1,2,,)iiFxip记X的各分量iX的分布函数,如果有111(,,)()()pppFxxFxFx则称X的各分量pXX,1是相互独立的X的两个子向量(1)(2)11()()kkpXX,,XXX,,X和称为相互独立的,如果有(1)(2)111(,,)(,,)(,,)pkkpFxxFxxFxx其中),,(1)1(kxxF和),,(1)2(pkxxF分别是)2()1(XX和的分布函数特别地,当X是连续型时,pXX,1是相互独立)()(),,(111pppxfxfxxf其中(),1,,,iiifxipX是的分布密度函数(1)(2)XX与相互独立(1)(2)111(,,)(,,)(,,)pkkpfxxfxxfxx例1设X=(X1,X2,X3)'有概率密度函数试证X1,X2,X3相互独立证明:所以X1,X2,X3相互独立其它00,0,0),,(321)(321321xxxxxxfxxx13213200)(11)(xxxxdxdxxf1232()221300()xxxxfxdxdx1233()331200()xxxxfxdxdx123112233(,,)()()()fxxxfxfxfx5五.条件分布设1(,,)'pXXX是p维连续型随机向量,在给定(2)(2)1(,,)'(()0)qpXXXfx的条件下,(1)1,(,)'qXXX的条件概率密度函数定义为(2)1111,(,)(,,,)()pqqpqpfxxfxxxxfxx,,,或表示为(1)(2)(2)(2)()()()fxfxxfx因此(2)1111,(,)(,,,)()pqqpqpfxxfxxxxfxx,,,即(1)(2)(2)(2)()()()fxfxxfx另外(1)(2)XX与相互独立(1)(2)(1)()()fxxfx六随机向量函数的分布设随机向量1(,,)pXXX的分布密度函数为pxxfp),,,(1个实值函数pixxyypii,,1),,,(1是X空间到Y空间的一一变换,逆变换piyyxxpii,,1),,,(1具有连续的各个一阶偏导数),,1(pjyxii,随机向量),,(1pYYY定义为piXXyYpii,,1),,,(1则Y的分布密度函数是Jyyxyyxfyygpppp),,(,),,,(),,(1111(1)其中J是变换的Jacobi行列式6),,(),,(11ppyyxxJppppyxyxyxyx1111(2)例2设X=(X1,X2)'有概率密度函数11221211()()22YXXYXX,求Y=(Y1,Y2)'的概率密度函数解:变换11221211()()22yxxyxx是一一变换,逆变换112212xyyxyy变换的Jacobi行列式1212(,)(,)xxJyy11211Y=(Y1,Y2)'的概率密度函数七矩定义1随机向量),,1(,,),,,(21piEXXXXXiip若存在,X的均值向量为22122121(,)2xxfxx2222121212()()221211(,)22yyyyyygyy71212(,,,)ppEXEXEXEXEXEXEXp213)对于qp随机变量ijZ构成的随机矩阵Z(),1,,,1,,ijZipjqZ的数学期望为(),1,,,1,,ijpqEZEZipjq设随机向量12(,,,),pXXXX12(,,,)qYYYY,则XY和的协方差矩阵简称协差阵)定义为Co(,)()()XYEXEXYEY1111Co(,)Co(,)Co(,)Co(,)qppqXYXYXYXY当Co(,)0XY时,称XY与不相关当XY时,Co(,)XX称为X的协方差矩阵,记为))(()(EXXEXXEXV对于12(,,,),pXXXX若各iX有有限的方差,记jiXX和的协方差为(,)(),,1,,ijiijjijCoXXEXEXXEXijp以ij为元素的pp方阵8ppppppXV212222111211)(4)是X的协方差矩阵显然,jiij协方差阵的对角元素即是iX的方差)(iXV,也记作2i定义2jiXX与的相关系数为Co(,)()()ijijijXXVXVXpjijiij,1,,5)其中)()(jiXVXV与不为零,由相关系数组成的矩阵)(ijR称为X的相关矩阵定理任意p维随机向量X的协方差阵和相关矩阵R是非负定矩阵证明对称性是显然的,而对任意p维向量t=(t1,,tp)',有pipjjiijtttt1111()()ppijiijjijttEXEXXEX0)(21piiiiEXXtE故是非负定的而11(1,,1)(1,1)ppRdiagdiag根据线性代数的知识可知,R也是非负定矩阵证毕设A、B、C为常数阵,11(,,),(,,)ppXXXYYY为随机向9量,qjpiXZij,,1,,,1),(为随机矩阵,则有以下运算规则性质1()()()EXYEXEY6)性质2)()(EZAAZE7)性质3CBEZACAZBE)()(8)性质4()()VAXbAVXA,b为常数向量9)性质5Co(,)Co(,)AXBYAXYB(10)性质6若k1,k2,,kn是n个常数,X1,X2,,Xn是n个相互独立的p维随机向量,则以上性质由定义直接验证即得,下面以性质4为例验证如下()[()()][()()]VAXbEAXbEAXbAXbEAXb[()()]()EAXEXXEXAAVXA例3设12XXX是具有均值向量12X和协方差矩阵11122122X的随机向量,求121111XZCXX的均值和协方差矩阵解()()ZEZECX1122121111XC2221122()()()nnkVXkVXkVX1122()nnVkXkXkX101112212211122211221122111222Co()1111111122ZXCXCC当1122,有1212Co(,)0XXXX,即方差相等的两个随机变量的和与差是不相关的112多元正态分布一多元正态分布的定义多元正态分布在多元分析中占有重要的地位,许多多元分析是在母体服从多元正态分布的前提下导出的为了给出多元正态分布的定义,先来看一个特殊的例子因为标准正态分布N0,1)的分布密度是21212x,p个相互独立的标准正态变量pXXX,,,21所构成的随机向量X的密度函数是2211()2211(2)xp2(2)ppxxpxx其中12(,,,)pxxxx,则12(,,,)pXXXX的均值向量是001pEXEXEX协方差矩阵100010001)(pIXV一般地,考虑X1,,Xp的p个线性函数1pYYAXY其中A是p×p的非奇异阵,),,(1p是常向量,如以C记1A,12则变换YAX的逆变换是()XCY,由本章1可知,变换的Jacobi行列式是ACyyxxJpp1),(),,(11因此Y的分布密度是)()(21xp)2(12yCCyAp而Y的均值向量与协方差阵分别是()(),()()()()()()EYEAXAEXEVYEYEYYEYEAXAXAVXAAA如果记AAYV)(,则有1121,CCA则Y的分布密度有如下形式)()(21xp)2(1212yyp定义1如果随机向量),,(1pXXX的分布密度函数有如下形式)()(21xp)2()(),,(12121xxxfxxfpp11)其中),,(,),,(11ppxxx为常量,pp为的正定矩阵,则称X服从p元正态分布,记为(,)pXN13可知X的均值向量EX=和协方差阵()VX对于任意常数0c,X的分布密度在曲面cxx)()(1上是常数,称为X的等密度曲面,这是在Rp空间中以为中心的超椭圆特别是,当p=2时,若记1111222122,22212121这时22212(1),212122222121211(1)122222111211221222221222111122222221122()1()2()()()(1)()()()()121xxxxxxxxxx所以二维正态分布的密度函数是2222221221121211222121)())((2)()1(21xp121),(xxxxxxf12)定理:(,)pXN对任何p维向量paR,有1(,)aXNaaa14二多元正态分布的几个重要性质性质1线性变换)设(,)pXN,YCXb,其中C是一非奇异阵,b为p维常数向量,则证明YCXb的逆变换是1()XCYb,变换的Jacobi行列式的绝对值是12121211,JCCCCCCC而指数部分中的二次型变换成为11111111111()()[())][())]()()()()()[()]()[()]xxCybCybCyCbCyCbyCbCCyCbyCbCCyCb于是Y的分布密度成为12211(2)xp[()]()[()2pCCyCbCCyCb容易看出(,)pYNCbCC性质2独立性)设(,)pXN如将X分成两个子向量11(1)(2),qqPXXXXXX(,)pYNCbCC15与也相应地分块成为(1)1112(2)2122,则)1(X与)2(X相互独立的充要条件是:01221证明先证充分性如果221100,则122111100而指数中的二次型有1()()Qxx1(1)(1)11(1)(1)(2)(2)1(2)(2)220(),()0xxxx(1)(1)1(1)(1)(2)(2)1(2)(2)112212()()()()xxxxQQ注意到2211,于是X的密度可写成12122211212222()21122(1)(2)11(,)(2)(2)(2)(,)(,,)pQpQQqpqqqpfxxfxxfxx,,右边两项分别是(1)11(,)qN)和(2)22(,)pqN,因此)1(X和)2(X的边缘分布密度分别是(1)(2)11(,)(,,)qqpfxxfxx,与,即X的密度是)1(X与)2(X的边缘密度的乘积,可知随机向量)1(X与)2(X相互独立.再证必要性.如果),,(),,(),,(12111pqqpxxfxxfxxf16则对任一个第一组中的随机变量iX与第二组中的变量jX,显然有111112112112()()()()(,,)()(,,)()(,,)00ijiijjiijjppiiqqjjqpqpEXXxxfxxdxdxxfxxdxdxxfxxdxdx由于,ijjiij,故0ij即等价于0ij由上述性质可知,在正态分布中,不相关性与独立性是等价的性质3边际分布)设(,),pXN则X的任意的分量子集仍服从正态分布证明不妨设(必要时可将X的分量重新排列)(1)(1)(2)(2),,qpqXXX22211211只需证X(1)(1)11,qNX(2)(2)22,pqN这里X1)与X2)不一定是独立的,作以下非奇异的线性变换,令(1)(1)1(2)1222(2)(2)YXXYX即作变换1(1)(1)1222(2)(2)0IYXYCXYXI17因变换阵C是非奇异的,由性质1,Y服从正态分布且(1)(2)EYEYEY112220II(1)(2)(1)1(2)1222(2)()VYCC注意到2211,是对称的,2112,有11222()0IVYI11121222121220II1111222212200所以Y1)与Y2)相互独立,由性质2,X2)=Y2)的分布是(2)22,pqN多元正态分布的低维边缘分布仍是正态的性质4可加性)设,相互独立,则对任意个不全为零常数,有在性质1中限制矩阵C是一个p×p的非奇异阵,这一限制是可以取消的,有下面的性质5性质5设,pXN,D是一个q×p矩阵,秩D)=q≤p,随机向量Z=DX+b,则,qZNDbDD12,,,nXXX(,)ipiiXNni,,2,12i111(,)nnnipiiiiiiikXNkknnkk,,118证明:首先可以找到一个pq)×p的矩阵E,使DE是非奇异的,则ZDXYE是正态分布,从而Z与Y都是正态分布的,且由性质可知Z的均值与协方差阵分别是D和DD多元正态分布在线性变换下仍是多元正态的性质6条件分布)设(,),0pXN,将,,X作如下剖分:(1)(1)(2)(2)11122122,XkkkXpkpkpkXppk则给定(2)X时(1)X的条件分布为(1)(2)12112(,)kXXN其中(1)(2)1(2)121222111211122221()x称21为条件数学期望或条件均值,211为偏条件)协方差矩阵证明由性质3的证明过程得出(1)(1)1(2)1222(2)(2)YXXYX(1)Y与(2)Y相互独立,于是(1)X可分解为两个独立正态向量之和(1)(1)1(2)1(2)12221222()XXXX19而且(1)(1)1(2)1(2)12221222112(,)kXXN得(1)(1)1(2)(2)1(2)12221222112(,)kXXXN所以(1)(2)(1)(2)1(2)1222112((),)kXXNx多元正态分布的条件分布仍是正态的三抽样分布1维沙特分布Wishart1928年)定义2:设(),pXN,=1,,n)相互独立,记称随机阵服从自由度为n的非中心维沙特分布,记为W,pWn,当0为维沙特分布,记为,pWWn定理1:若W,pWn,且0np,则W的分布密度为特别,当p=1和pI时,W服从自由度为n的2分布,维沙特分11121(1)21222(2)12()ppnnnpnnpXXXXXXXXXXXXX()()1nWXXXXn(1)41(1)122211||xp[()]2,01()2||()20ppnpnpnpiWtrWWWnifW正定)其它20布是一元统计中的2分布的推广注:W为正定阵的充要条件是n>pWishart分布有如下的性质:1)可加性:若W1和W2独立,其分布分别是,则W1+W22)p阶随机阵,C为m×p阶的常数矩阵,则证明因()()1(,)npWZZWn,其中()(0,)pZN1,n)相互独立,令()()YCZ则()(0,)mYNCC,故()()()()11(,)nnmYYCZZCCWCWnCC设X1),X2),,Xn)是来自多元正态总体Np(,)n>p,0)的简单随机样本X(a),α=1,,n,相互独立,且X(a),pN),则得到n个p维的观测向量如下12(),1,,aaapxxXnx整个样本数据可以用一个n×p的矩阵表示如下),(1nWp),(2nWp),(21nnWp(,)pWWn(,CC)mCWCWn21记(1)(2)()pxxXx(1)(),nxx111212122212ppnnnpxxxxxxxxx称12()11naapxxXXnx()()1()naaaAXXXX为样本均值向量和离差阵,而11SAn或1SAn称为样本协方差阵在实际计算中,常用下面的便于计算的公式1,1,,naiajijaAxxnxxijp定理2设X和A分别为样本均值向量和离差阵,则1)1,pXNn;2)X和A相互独立;3)证明以下()X简记X)(1,)pAWn12111ijnnnnnn设为一正交矩阵22由于(1,2,)iXin,独立服从相同的正态分布,所以因为又而所以X和A相互独立又11nZZ独立同分布于0,pN,则定理3设独立且都服从,pN分布,则统计量服从自由度为p的2分布11nniin1(,)[(())(())]0[()()]ijiijjnitjtttijtCoEEEijEXXij10najnjjn11najjnn1najj1()()(1,2,3,,1)njjjEEn11(,)npXNnni1(XX)(XX)niiAi1XXXXniini1XXniinnnn11njjj11(1,)njjpjAWn121()()TXXn1()()nXXi(1,2,,)Xin1212()nnZZZXXX令121nnjjjp也是维正态随机向量,且11()()nniiEEnn(Z)ΣnVar23证:由于样本均值因此2霍特林分布Hotlling)定义3:设随机矩阵(,)pWWn和(,)pUN相互独立,其中0>np,,记称T2服从参数为p和n的非中心霍特林分布当时,服从自由度为n的中心霍特林分布,记为定理4设(,)pWWn和(,)pXN相互独立,则定理5设是来自多元正态总体的简单随机样本,有1(,)pXNn12()nX令12()[()]0EEnX12()[()]pVarVarnX12()(0,I)pnXN2222212)pZZZp所以212(,,)nUWUTpn021nUWU212()()(,)nXWXTpn12n,,,XXX(,)pN111121(,,,)pXXXX221222(,,,)pXXXX12(,,,)nnnnpXXXX212(,)nUWUTpn24则其中性质:T2与F分布的关系:设则证略)定理6:设是来自多元正态总体的简单随机样本,又设是来自多元正态总体的简单随机样本,则其中)1,(12pnpFTnppn11niinni1()()iiAXXXX212(1)()()(,1)nnXAXTpn112,,,nXXX1(,)pN111121(,,,)pXXXX221222(,,,)pXXXX111112(,,,)nnnnpXXXX212,,,nYYY),(2pN),,,(11211pYYYY1),,,(222212pYYYY12若1122121212(1)(1)22pnSnSAASnnnn),,,(222221pnnnnYYYY22(,)TTpn212121212()()(,2)pnnTXYSXYTpnnnn253基于Wishart分布的统计量在一元方差分析中,常常遇到基于独立的分布随机变量比值的统计量在多元统计分析中,起到相同作用的是Λ统计量1)WilksΛ分布定义4:设,且相互独立,,)则称为Λ统计量,其分布叫做WilksΛ分布,记当p=1时,Λ统计量的分布是一元统计中参数为12,22nn的分布12,22nn2)两个重要结论结论1若12(,,)pnn,则存在12,22knpknB(1,,)kn相互独立,使得12kBBB结论2若2np,则12212(,,)(,,)pnnnpnnp这个结论是一元统计中1(,)(,)FnmFmn的推广2F),(1nWp),(2nWp,pn1pn2||||0),,(21nnp263多元正态分布的参数估计多元正态分布由两组参数,即它的均值向量和协方差阵所完全确定在实际问题中,总体的参数常常是未知的,我们要根据多个随机变量的若干次观测也就是要由来自总体的一个随机样本)来估计这些参数的值设总体服从p元正态分布,pN,对这p个变量的每次观测,得到一个p维的观测向量,如果进行了n次观测,则得到n个p维的观测向量如下12(),1,,aaapxxXnx整个的样本数据可以用一个n×p的矩阵表示如下111212122212ppnnnpxxxxxxXxxx如同在单变量统计学中那样,可以有不同的参数估计的方法,其中最大似然法是一种常用的方法一,的最大似然估计设()(1,,)iXin是来自,pN0的容量为n(n>p)的简单随机样本,以下用最大似然法来求参数,的最大似然估计1似然函数L(,)27把随机数据阵X按行拉直后形成的np维长向量的联合密度函数看成未知参数,的函数,并称为样本()(1,,)iXin的似然函数,记为L(,):112211221122112212211L(,)=2211221122112212niipiniinnpiniinnpiniinnpinnpxpxxxpxxxptrxxxptrxxx111221121122niiindfiinnpiptrxxtrxx其中111nniiiiiiniiixxxxxxxxxxxxnxxAnxx由于lnx是x单调函数,L(,)与lnL(,)有相同的最大值点以下只须讨论lnL(,)的最大值问题282迹的有关性质下面的一条引理给出与迹有关的进一步性质引理设B为p阶正定矩阵,则lntrB|B|p且等号的成立的充分必要条件是pBI证明因为B>0,所以B的全部特征值10p,,且1=pB利用不等式ln110xxx,可得111lnlnln111pppiiiiiiBtrBp所以lntrB|B|p因不等式ln1xx中的等号仅当x=0时成立,故引理给出的不等式仅当101ii,p时成立,即pBI反之,当pBI时,ln0p|I|,trBp,故引理给出不等式中的等号成立3讨论lnL,的最大值点经直接运算,有11111111lnln2ln2221212212niiinpnL,trxxCtrAnxxnCtrAxxCtrA29以上不等式仅当x时等号成立即对于固定的0,有lnlnLX,maxL,进一步地可利用迹的有关性质及引理来证明,当取1ˆAn时0lnlnX,ˆLX,maxLX,:11lnln2ln222npnLx,trA1ln22ln2npnAtrn1212121111112ln2ln2lnlln2n2nACtrnnAC||AnAAtr||nnnACnpA||||||nnn若取1212ABn是正定矩阵,由引理,以上不等式的等号仅当1212pABIn,即An时成立所以0lnln1ln2ln22x,ALx,maxLx,nnpnA||n因而似然函数的最大值为2212npnnLx,AAn30定理设()(1,,)Xn是来自,pN0的容量为n(n>p)的简单随机样本,则均值向量和协方差阵的最大似然估计量分别是12()11ˆnaapxxXXnx1ˆiˆjAn=()()11()()naaaXXXXn11(),1,,naiiajjaxxxxijpn二最大似然估计量的性质可以证明1)ˆEEX2)11ˆnEEAnn3)X和11An是、的“最小方差”无偏估计量,即X和11An是、的有效估计量4)当n时,X,ˆ是、的强相合估计量即{lim}1nPXˆ{lim}1nP31在实用中,当n不是很大时,常用11SAn来估计三参数函数的最大似然估计设参数向量的变化范围是kR,L是似然函数设g是到上的Borl可测映射(是kR的子集)定理若是的最大似然估计,则ˆg是g最大似然估计根据这个定理,因为多元正态分布pN,的参数和有最大似然估计量1ˆˆX,An,所以函数g,的最大似然估计为1gX,An例:设p维正态随机向量1pijXX,X,X,X的相关系数为ijijijiijjijCoX,XVarXVarX其中ij是协方差阵的第i行第j列的元素试求ij的最大似然估计量ijr解给定样本1X,,n,则的最大似然估计为111nXXXXAnn的元素ij的最大似然估计11nijiijjˆxxxxn所以相关系数ij的最大似然估计ijr为3212211()()ˆˆˆ()ˆnaiiajjijanniijjaiiajjaaxxxxijijxxxxri,j=1,,pijr称为样本相关系数334均值向量的假设检验在一元统计中,曾经讨论过正态总体参数的假设检验问题当总体服从多元正态分布时,参数的假设检验是一元正态总体均值检验的推广一单个总体均值向量的推断设1(),1,,iiipxXinx是来自总体),(pN的容量为n的样本,其中是正定阵1协方差阵已知时,对均值向量的检验检验假设:00H10:H检验统计量)()(01020XXnT在0H为真时,220()Tp对于给定的显著性水平,当220()aTp时,则拒绝0H,其中2()ap是2()p的上分位点满足22{()()}appp的常数)由此得到置信水平为1的置信域为超椭球12001{:()()()}aDnxxp2、协方差阵未知时,对均值向量的检验检验假设:00H10:H用的无偏估计))((11)(1)(XXXXnSinii来替代,利用Hotlling的2T统计量)()(0102XSXnT34当0H为真时,),()1(2pnpFTpnpn如显著性水平取为,求出),()1(20pnpFpnpnTa其中),(pnpFa是满足(,)(,)PFpnpFpnp的常数,当按样本计算所得的202TT时拒绝0H由此得到置信水平为1的置信域为超椭球1001(){:()()(,)}(1)annpDxSxFpnpnp例1为了检验化验员的化学分析测试是否有系统误差,今取四个等级的铁矿石让他做化学分析已知标准数据是0=2275,3275,5150,6150)´,他重复测试了21次数据从略),由观测值计算得出x=2282,3279,5145,6138)T00351002710009200127003560011400129001970017300403S检验假设:00H10:H为了计算)()(0102XSXnT,令YXS)(01则)(0XSY,解出Y=35005,01157,09888,36928)T于是)()(010XSX=YX)(0=07422统计量2100()()TnXSX=2107422=155862352)1(TpnpnF=33121取显著性水平=005,查表F005(4,17)=296,F=33121>F005(4,17)=296故拒绝原假设,认为化验员的分析测试是有系统误差若取显著性水平取=001,查表F001(4,17)=467,F=33121<F001(4,17)=467故接受原假设,认为化验员的分析测试没有系统误差如果对每个样本分量的测试数据做一元的T检验,可得T1=1712,T2=0972,T3=1632,T4=2739在显著性水平=005,查表t005(20)=2068,只有)20(4tt,故认为系统误差主要来自第四个样本分量3单个总体均值分量间结构关系的检验设,是取自该总体的样本检验假设:与上面的假设等价的是,寻找常数矩阵(,)pXN1,2(,,)p12n,,,XXX01:pH1:ijH至少有一对110010101001C36注:矩阵C不是唯一的,一般地检验假设:其中C为一已知的k×p阶矩阵,k<p,rank(C)=k,φ为已知的k维向量根据多元正态分布的性质可知,构造检验统计量当成立时,2(,1)TTkn故可以将霍特林分布的统计量换算成F统计量对给定的显著性水平,检验的规则12(1)()(1)()TnnCXnCSCnCX1()()nCXCSCCX0:0HC1:0HC110001100001C0:HC1:HC(1)(1,)knCSCWnCC2(,),(1)nkTFknkkn当拒绝原假设1(,)kCXNCCCn2(,)(1)nkFTFknkkn0:HC2(,),(1)nkTFknkkn当接受原假设37上述规则等价于22,TT当接受原假设其中例2:某地区农村男婴的体格测量数据如下检验三个指标的均值是否有关系假定人类的体形有这样一个一般规律的身高、胸围和上臂围平均尺寸比例为6:4:1,检验比例是否符合这一规律检验假设:编号身高cm)胸围cm)上臂围cm)1786061652765811253926321454815901405816081556845951401231164112311:,,64H至少有两个不等012311:64H22,TT当拒绝原假设2(1)(,)knTFknknk38假设表示为计算得:16640Cx00094660566605646858CCS46858660566605600094)63642285()CCS(11故T0012=001(1)(,)knFknknk=45<T2所以拒绝原假设二多个总体均值向量的推断1、两个独立样本的情形下面来考虑检验两个正态总体的均值能否认为相等设是来自的样本(1,2)1)协方差阵已知且相等检验假设(1)(2)0:H(1)(2)1:H检验统计量2(1)(2)1(1)(2)12012()()nnTXXXXnn当0H为真时,)(220pT230106C令0:0HC1:0HC12()()507TnCXCSCCX()()()12,,,nXXX()(,)pN39对于给定的显著性水平,当220()aTp时,则拒绝0H由此得到(1)(2)0置信水平为1的置信域为超椭球(1)(2)1(1)(2)212112{:()()()}annDxxxxpnn(2)协方差阵未知但相等检验假设(1)(2)0:H(1)(2)1:H取))(())((21)2()2()()2(1)2()(1)1()1()()1()1()(2121XXXXXXXXnnSanaaaaan])1()1[(21221121SnSnnn12121()2AAnn构造检验统计量)()()2()1(1)2()1(21212XXSXXnnnnT或2(1)(2)1(1)(2)12121212(2)()()()nnnnTXXAAXXnn当0H为真时,)1,()2(12122121pnnpFTpnnpnn对显著性水平,求出40)1,(1)2(21212120pnnpFpnnpnnTa当由样本计算所得的202TT时,拒绝0H,或利用T2统计量与F统计量的关系,转化为F统计量由此得到(1)(2)0置信水平为1的置信域为超椭球(1)(2)1(1)(2)12121211212(2){:()()()(,1)}annnnDxxAAxxFpnnpnn例3:两个总体均值的检验2成对试验的T2统计量前面讨论的是两个独立样本的检验问题,但是不少的实际问题中,两个样本的数据是成对出现的,例如当讨论男女职工的工资收入是否存在差异;一种新药的疗效等思考:两独立样本和成对样本的观测值有何不同)设总体1(,)pXN,2(,)pYN,且(Xi,Yi),(i=1,2,3,,n)为成对的试验数据,检验假设或检验的统计量为12,(,),iiiipddXYdN令则012112:,:HH01:0,:0HH21dTndSd41其中当原假设为真时所以3多个独立样本的情形多元方差分析)设k个总体,它们服从,分别抽出如下的样本:k,,1)检验假设)()2()1(0:kH()()1:ijHij至少存在使记则kaann1()()()12,,,nXXX()111ankaiaiXXn()()11anaaiiaXXnkGG,,1()(,)pNdXY11()()1ndiiiSddddn2(,)(1)npFTFpnppn2(,),(1)npTFpnppn拒绝原假设2(,),(1)npTFpnppn接受原假设()()()()12(,,,)nXXXX()()11()()ankiiaiWXXXX42()()11()()ankiiaiWXXXX()()()()()()11()()ankaaaaaaiiaiXXXXXXXX()()()()()()111()()()()ankkaaaaaaiiaaiaXXXXnXXXX()()()()()1111()()()()aannkkaaaaaiiiaiaiXXXXXXXX+由于交叉乘积项为零)()()()()ii11()()ankaiXXXX()()ii1()()kanXXXX得W=E+B总离差阵=组内离差阵+组间离差阵)其中()()()()ii11()()ankaiEXXXX()()ii1()()kaBnXXXX当0H为真时,(1,)pWWn(,)pEWnk(1,)pBWk43计算统计量Λ(p,nk,k1)对给定的显著性水平,检验规则为:拒绝原假设;接受原假设一般书上查不到Λ分布表,下表给出了Λ与F的关系Λp,n1,n2)分布与F分布的关系n1>p)pn2统计量FF的自由度任意1ppn)1)(1(1(p,n1p+1)任意2ppn)1)((1[2p,2(n1p)]1任意21)1(nn(n2,n1)2任意21)1)(1(nn[2n2,2(n11)]当p,n2不属于上表的情形时,可以计算统计量)()21(222212pnLnnpnn近似0H为真时)例4:多个总体均值的检验pptEEEBW,,1,,1,pnkkpnkk,,1,,1,pnkkpnkk
/
本文档为【结晶学ch4】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索