为了正常的体验网站,请在浏览器设置里面开启Javascript功能!
首页 > 多元统计分析课后习题解答_

多元统计分析课后习题解答_

2021-10-30 6页 doc 286KB 164阅读

用户头像 个人认证

陨辰

暂无简介

举报
多元统计分析课后习题解答_第四章判别分析4.1简述欧几里得距离与马氏距离的区别和联系。答:设p维欧几里得空间Rp中的两点x=和Y=则欧几里得距离为O欧几里得距离的局限有①在多元数据分析中,其度量不合理。②会受到实际问题中量纲的影响。协方差设X,Y是来自均值向量为IEMBEDEquation.3if,的总体G中的p维样本。则马氏距离为D(X,Y)=即单位阵时,D(X,Y)=即欧几里得距离。因此,在一定程度上,欧几里得距离是马氏距离的特殊情况,马氏距离是欧几里得距离的推广。4.2试述判别分析的实质。答:判别分析就是希望利用已经测得的变量数据,找出一种判别函...
多元统计分析课后习题解答_
第四章判别分析4.1简述欧几里得距离与马氏距离的区别和联系。答:设p维欧几里得空间Rp中的两点x=和Y=则欧几里得距离为O欧几里得距离的局限有①在多元数据分析中,其度量不合理。②会受到实际问题中量纲的影响。协方差设X,Y是来自均值向量为IEMBEDEquation.3if,的总体G中的p维样本。则马氏距离为D(X,Y)=即单位阵时,D(X,Y)=即欧几里得距离。因此,在一定程度上,欧几里得距离是马氏距离的特殊情况,马氏距离是欧几里得距离的推广。4.2试述判别分析的实质。答:判别分析就是希望利用已经测得的变量数据,找出一种判别函数,使得这一函数具有某种最优性质,能把属于不同类别的样本点尽可能地区别开来。设R1,R2,,,Rk是p维空间Rp的k个子集,如果它们互不相交,且它们的和集为,则称为Rp的一个划分。判别分析问题实质上就是在某种意义上,以最优的性质对p维空间Rp构造一个“划分”,这个“划分”就构成了一个判别规则。4.3简述距离判别法的基本思想和方法。答:距离判别问题分为①两个总体的距离判别问题和②多个总体的判别问题。其基本思想都是分别计算样本与各个总体的距离(马氏距离),将距离近的判别为一类。两个总体的距离判别问题设有协方差矩阵习相等的两个总体G和G,其均值分别是叫和R2,对于一个新的样品X,要判断它来自哪个总体。计算新样品X到两个总体的马氏距离D2(X,G)和D2(X,G),则X,D2(X,G)ID2(X,G)2,一、2,_X,D(X,G)>D(X,G,具体分析,D2(X,G)-D2(X,G)=(X—山)2(X—岗)一(X—四2)2(X—(12)=X‘2‘X—2X室-\+山‘24■山一(XWx—2X‘2-1险+话刀^妇—2X2((x2—山)+山2四一(x22(x2=2X‘271(&一向)+(向+&)'〉」(博一&)(“+“〈,=—2.X-―2/(出一段)I2J=-2(X-。a=—2a(X—。则判别规则为,W(X),W(X)<0多个总体的判别问题。设有k个总体G〔,G2,…,Gk,其均值和协方差矩阵分别是且Z=Z2=涅=Z。计算样本到每个总体的马氏距离,于哪个总体。具体分析,D2(X,GQ=(X-心/」(X-s)=Xn」X_2e」X+效=Xn」X-2(1#+CQl11.1取\a=2"腿=—必ZS,«=1,2,…,k。可以取线性判别函数为W^X)=l;X+C_,二=1,2,…,k相应的判别规则为XwGi若Wi(XHmax(CQ4.4简述贝叶斯判别法的基本思想和方法。到哪个总体的距离最小就属fi(x),f2(x),…,fk(x),假设k个总体各自出现的概率分别为qi,q2,,qk,qi芝0,£qi=1。设将本来属于Gj总体的样品基本思想:设k个总体G[,G2,…,Gk,其各自的分布密度函数i=1错判到总体Gj时造成的损失为C(j|i),i,j=1,2,…,k。设k个总体G,G2,…,Gk相应的p维样本空间为R=(R,,R2,…,Rk)。在规则R下,将属于Gj的样品错判为Gj的概率为P(j|i,R)=Rfi(x)dxi,j=1,2;,ki=j则这种判别规则下样品错判后所造成的平均损失为kr(i|R)八[C(j|i)P(j|i,R)]i=1,2,,kj日则用规则R来进行判别所造成的总平均损失为kg(R)八qir(i,R)i4kkqLC(j|i)P(j|i,R)i4j4贝叶斯判别法则,就是要选择一种划分Ri,R2,…,Rk,使总平均损失g(R)达到极小。kk基本方法:g(R)='q'C(j|i)P(j|i,R)i4j4kkqLC(j|i)Rfi(x)dxTOC\o"1-5"\h\zi4j4jkk='、r('qiC(j|i)fi(x))dxj」Rji4kk令ZqQ(j|i)fi(x)=hj(x),则g(R)=WRhj(x)dxidjWjk若有另一划分R*=(R*,R;,…,R;),g(R*)=EL*hj(x)dxj日j则在两种划分下的总平均损失之差为kkg(R)-g(R*)5(x)-hj(x)]dxqjm5因为在Ri上hi(x)苴hj(x)对一切j成立,故上式小于或等于零,是贝叶斯判别的解。R」RRR\R={x|hi(x)=m.inhj(x)}从而得到的划分R—(Rl,R2,,Rk)为1如』1—1,2,,k4.5简述费希尔判别法的基本思想和方法。答:基本思想:从k个总体中抽取具有p个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数U(X)=u1X1u2X2npXp=uX系数u=(Ui,U2,…,Up)'可使得总体之间区别最大,而使每个总体内部的离差最小。将新样品的p个指标值代入线性判别函数式中求出U(X)值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。4.6试析距离判别法、贝叶斯判别法和费希尔判别法的异同。答:①费希尔判别与距离判别对判别变量的分布类型无要求。二者只是要求有各类母体的两阶矩存在。而贝叶斯判别必须知道判别变量的分布类型。因此前两者相对来说较为简单。②当k=2时,若^=12=1则费希尔判别与距离判别等价。当判别变量服从正态分布时,二者与贝叶斯判别也等价。当时,费希尔判别用+£2作为共同协差阵,实际看成等协差阵,此与距离判别、贝叶斯判别不同。距离判别可以看为贝叶斯判别的特殊情形。贝叶斯判别的判别规则是XIG]IInd,W(X)IG?X,W(X)
是这十种品牌饮料的销售价格(元)和顾客对各种饮料的口味评分、信任度评分的平均数。销售情况产品序号销售价格口味评分信任度评分12.258畅销22.56733.03943.28652.876平销63.58774.89881.734滞销92.242102.743⑴根据数据建立贝叶斯判别函数,并根据此判别函数对原样本进行回判。⑵现有一新品牌的饮料在该超市试销,其销售价格为3.0,顾客对其口味的评分平均为8,信任评分平均为5,试预测该饮料的销售情况。解:增加group变量,令畅销、平销、滞销分别为groupl、2、3;销售价格为X1,口味评分为X2,信任度评分为X3,用spss解题的步骤如下:在SPSS®口中选择AnalyzesClassi於Discriminate},调出判别分析主界面,将左边的变量列表中的“group”变量选入分组变量中,将Xi、X2、X3变量选入自变量中,并选择Enterindependentstogether单选按钮,即使用所有自变量进行判别分析。点击DefineRange按钮,定义分组变量的取值范围。本例中分类变量的范围为1到3,所以在最小值和最大值中分别输入1和3。单击Continue按钮,返回主界面。如图4.1图4.1判别分析主界面3.单击Statistics按钮,指定输出的描述统计量和判别函数系数。选中FunctionCoefficients栏中的Fisher:'给出Bayes判别函数的系数。(注意:这个选项不是要给出Fisher判别函数的系数。这个复选框的名字之所以为Fisher',s是因为按判别函数值最大的一组进行归类这种思想是由Fisher提出来的。这里极易混淆,请读者注意辨别。)如图4.2。单击Continue按钮,返回主界面。图4.2statistics子对话框4.单击Classify按钮,弹出classification子对话框,选中Display选项栏中的Summarytable复选框,即要求输出错判矩阵,以便实现题中对原样本进行回判的要求。如图4.3。图4.3classification对话框5.返回判别分析主界面,单击OK按钮,运行判别分析过程。1)根据判别分析的结果建立Bayes判别函数:Bayes判别函数的系数见表4.1。表中每一列表示样本判入相应类的Bayes判别函数系数。由此可建立判别函数如下:Groupl:Y1=-81.843-11.689X112.297X216.761X3Group2:Y2--94.536-10.707X113.361X217.086X3Group3:Y3--17.4492.19*14.960C26.447X3将各样品的自变量值代入上述三个Bayes判别函数,得到三个函数值。比较这三个函数值,哪个函数值比较大就可以判断该样品判入哪一类。ClassificationFunctionCoefficientsgroup123x1-11.689-10.707-2.194x212.29713.3614.960x316.76117.0866.447(Constant)-81.843-94.536-17.449Fisher'slineardiscriminantfunctions表4.1BayesRJ别函数系数根据此判别函数对样本进行回判,结果如表4.2。从中可以看出在4种畅销饮料中,有3种被正确地判定,有1种被错误地判定为平销饮料,正确率为75%。在3种平销饮料中,有2种被正确判定,有1种被错误地判定为畅销饮料,正确率为66.7%。3种滞销饮料均正确判定。整体的正确率为80.0%。〜…,aClassificationResultsgroupPredictedGroupMembershipTotal123OriginalCount131042120330033%175.025.0.0100.0233.366.7.0100.03.0.0100.0100.0a.80.0%oforiginalgroupedcasescorrectlyclassified.表4.2错判矩阵2)该新饮料的X1=3.0,X2=8,X3=5,将这3个自变量代入上一小题得到的Bayes判别函数,Y2的值最大,该饮料预计平销。也可通过在原样本中增加这一新样本,重复上述的判别过程,并在classification对话框中同时要求输出casewiseresults运行判别过程,得到相同的结果。4.9银行的贷款部门需要判别每个客户的信用好坏(是否未履行还贷责任),以决定是否给予贷款。可以根据贷款申请人的年龄(X1)、受教育程度(X2)、现在所从事工作的年数(X3)、未变更住址的年数(X4)、收入(X5)、负债收入比例(X6)、信用卡债务(X7)、其它债务(X8)等来判断其信用情况。下表是从某银行的客户资料中抽取的部分数据,⑴根据样本资料分别用距离判别法、Bayes判别法和Fisher判别法建立判别函数和判别规则。⑵某客户的如上情况资料为(53,1,9,18,50,11.20,2.02,3.58),对其进行信用好坏的判别。目前信用好坏客户序号X1X2X3X4X5X6X7X8123172316.600.341.71已履行还2341173598.001.812.913422723414.600.94.941-L*43911954813.101.934.36535191345.000.401.306371132415.101.801.82未履行还7291131427.401.461.6583221167523.307.769.721-L*928223236.400.191.2910261432710.502.47.36解:令已履行还贷责任为group。,未履行还贷责任为group1。令(53,1,9,18,50,11.20,2.02,3.58)客户序号为11,group未知。用spss解题步骤如下:在SPS驹口中选择AnalyzeClassi防Discriminate,调出判别分析主界面,将左边的变量列表中的“group”变量选入分组变量中,将X1-X6变量选入自变量中,并选择Enterindependentstogether单选按钮,即使用所有自变量进行判别分析。点击DefineRange按钮,定义分组变量的取值范围。本例中分类变量的范围为0到1,所以在最小值和最大值中分别输入0和1。单击Continue按钮,返回主界面。单击Statistics按钮,指定输出的描述统计量和判别函数系数。选中FunctionCoefficients栏中的Fisher'祖Unstandardized。单击Continue按钮,返回主界面。单击Classify按钮,定义判别分组参数和选择输出结果。选择Display栏中的Casewiseresults,以输出一个判别结果表。其余的均保留系统默认选项。单击Continue按钮。返回判别分析主界面,单击OK按钮,运行判别分析过程。1)用费希尔判别法建立判别函数和判别规则:未化的典型判别函数系数由于可以将实测的样品观测值直接代入求出判别得分,所以该系数使用起来比标准化的系数要方便一些。具体见表4.3。LanmicaiLUscrkTimaiitIuncflianCdeiTictciiitsFunction1'•1临-•环.173.HD表4.3未标准化的典型判别函数系数由此表可知,Fisher判别函数为:Y--10.794-0.32X16.687X20.173X30.357X40.024X50.710X60.792X7-2.383X8用Y计算出各观测值的具体坐标位置后,再比较它们与各类重心的距离,就可以得知分类,如若与group0的重心距离较近则属于group。,反之亦然。各类重心在空间中的坐标位置如表4.4所示。FunctionsatGroupCentroidsFunctcng『Qii010-243712437Unstandardizedcanonicaldiscriminanrtfunctionse'^lualec)atgroupmeans表4.4各类重心处的费希尔判别函数值用bayes判别法建立判别函数与判别规则,由于此题中假设各类出现的先验概率相等且误判造成的损失也相等,所以距离判别法与bayes判别完全一致。如表4.5所示,group栏中的每一列表示样品判入相应列的Bayes判别函数系数。由此可得,各类的Bayes判别函数如下:G0-418.6930.340X194.070X21.033X3-4.943X42.969X513.723X6-10.994X7-37.504X8G1--171.2960.184X1126.660X21.874X3-6.681X43.086X517.182X6-7.133X7-49.116X8□aswMlcmjiiiFhirhiTtinriCnelTiclHrtcgnupj1.340.1Edx294.070125,560nJ\Q7Ax4■4.043■6681城52.Q6SJ.08613.72217.1政IQ9047133ma■37.50449116118.633职Fishersin?ardisrnminanlfunctcns表4.5Bayes判别函数系数将各样品的自变量值代入上述两个Bayes判别函数,得到两个函数值。比较这两个函数值,哪个函数值比较大就可以判断该样品该判入哪一类。2)在判别结果的CasewiseStastics表中容易查到该客户属于group0,信用好。4.10从胃癌患者、萎缩性胃炎患者和非胃炎患者中分别抽取五个病人进行四项生化指标的化验:血清铜蛋白(X1卜蓝色反应(X2)、尿呵噪乙酸(X3)和中性硫化物(X4),数据见下表。试用距离判别法建立判别函数,并根据此判别函数对原样本进行回判。号27j人病34胃癌患者70胃炎患者萎缩性67891C心5O023121071516非胃炎患者12345111110008052687111115^3011173055130122874011112010127207671055626101943122解:令骨癌患者、萎缩性胃炎患者和非胃炎患者分别为groupl、group2、group3,由于此题中假设各类出现的先验概率相等且误判造成的损失也相等,所以距离判别法与bayes判别完全一致。用spss的解题步骤如下:1.在SPS驹口中选择AnalyzesClassifyDiscriminate,调出判别分析主界面,将左边的变量列表中的"group”变量选入分组变量中,将Xi、X2、X3X4变量选入自变量中,并选择Enterindependentstogether单选按钮,即使用所有自变量进行判别分析。点击DefineRange按钮,定义分组变量的取值范围。本例中分类变量的范围为1到3,所以在最小值和最大值中分别输入1和3。单击Continue按钮,返回主界面。单击Statistics按钮,指定输出的描述统计量和判别函数系数。选中FunctionCoefficients栏中的Fisher:绐出Bayes判别函数的系数。单击Classify按钮,弹出classification子对话框,选中Display选项栏中的Summarytable复选框,即要求输出错判矩阵,以便实现题中对原样本进行回判的要求。返回判别分析主界面,单击OK按钮,运行判别分析过程。根据判别分析的结果建立Bayes判别函数:Bayes判别函数的系数见表4.6。表中每一列表示样本判入相应类的Bayes判别函数系数。由此可建立判别函数如下:Groupi:Y1=—79.21)0.164(1+0.75X2十0.77X3+0.073(4Group2:Y2=T6.721十0.130X1十0.595X2+0.317X3十0.012X4Group3:Y3=工9.598+0.13成1十0.637(2+0.100(3—0.05*4将各样品的自变量值代入上述三个Bayes判别函数,得到三个函数值。比较这三个函数值,哪个函数值比较大就可以判断该样品判入哪一类。u^ssiricaiiDnFuncrioncoeniciRimsgroup171BJ1扑IMj595.637妇31T1IIIJ012-.053-7321?-45.771Fithcr'clin«»rdfunctione表4.6Bayes判别函数系数根据此判别函数对样本进行回判,结果如表4.7。从中可以看出在5个胃癌患者中,有4个被正确地判定,有1个被错误地判定为非胃炎患者,正确率为80%。在5个萎缩性胃炎患者中,有4个被正确判定,有1个被错误地判定为非胃炎患者,正确率为80%。在5个非胃炎患者中,有4个被正确判定,有1个被错误地判为萎缩性胃炎患者。整体的正确率为80.0%oClaftsmrannngrou口FrodictcdGroupTctoi123OriginalDouni14015204153D15%1eo.o,Q20.0100.02.0OQ.D2001Q0.D3.D20.0DOO1Q0.0aBDjO%ofoiiginalgroupsdcaesstonsd^clBBsllal表4.7错判矩阵
/
本文档为【多元统计分析课后习题解答_】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索