为了正常的体验网站,请在浏览器设置里面开启Javascript功能!
首页 > 多元统计分析方法与应用练习册

多元统计分析方法与应用练习册

2020-09-18 6页 doc 74KB 77阅读

用户头像

is_270070

暂无简介

举报
多元统计分析方法与应用练习册练习册多元统计分析方法与应用南京财经大学PAGE\*MERGEFORMAT#第一章绪论一、填空题多元分析研究的是统计总体。多元统计中常用的统计量有:?>和。协方差和相关系数仅仅是变量间的一种度量,并不能刻画变量间可能存在的o二、简答题简述多元统计分析的作用。简述矩阵A的特征根与特征向量的求法。第二章多元线性回归一、填空题1.人们通过各种实践,发现变量之间的相互关系可以分成日W种类型。总离差平方和可以分解为和个部分,各自的自由度为和,其中总离差平方和中所占比重越大,则线性回归效果越显著。回归方程显著性检验时通常采用的统计量...
多元统计分析方法与应用练习册
练习册多元统计分析方法与应用南京财经大学PAGE\*MERGEFORMAT#第一章绪论一、填空题多元分析研究的是统计总体。多元统计中常用的统计量有:?>和。协方差和相关系数仅仅是变量间的一种度量,并不能刻画变量间可能存在的o二、简答题简述多元统计分析的作用。简述矩阵A的特征根与特征向量的求法。第二章多元线性回归一、填空题1.人们通过各种实践,发现变量之间的相互关系可以分成日W种类型。总离差平方和可以分解为和个部分,各自的自由度为和,其中总离差平方和中所占比重越大,则线性回归效果越显著。回归方程显著性检验时通常采用的统计量是偏相关系数是指多元回归分析中,的相关系数。最优回归方程是勺回归方程。偏回归平方和是指值。7.Spss中回归方程的建模方法有>、二、简答题简述复相关系数与偏相关系数。简述逐步回归分析方法的具体实施步骤。二、计算题现收集了92组合金钢中的碳含量x及强度y,且求得:x=0.1255,y=45.7989Lxx=0.3019Lxy=26.5126Lyy=2941.03求y关于X的一元线性回归方程;⑵求y与x的相关系数;列出对方程作显著性检验的方差分析表在x=0.1时,求?的点估计及置信度为0.95的置信区间在x=0.1时,求y的概率为0.95的精确预测区间与近似预测区间。四、SPSS操作题下面列出在不同重量下弹簧的长度:重量x(克)51015202530长度y(cm)7.258.128.959.9010.9011.80在直角坐标系下作散点图,并判断Y关于X的相关关系是否线性;求出Y关于X的一元线性回归方程;对所求得的回归方程作显著性检验,列出方差分析表;求出Y与X间的相关系数;在X=16时,求Y的概率为0.95的预测区间。在某化工产品的生产中,影响产品收率y主要变量是反应时间x1的反应温度x2,为提高收率希望找出y关于x1,x2的回归方程,现通过试验获得如下数据:序号X1X2y13015039.323016040.034015040.944016041.553515540.363515540.573515540.783515540.293515540.6(1)求Y关于XI、X2的线性回归方程;对所求得的方程作显著性检验,在0=0.05时你的结论是什么?对各回归系数作显著性检验。(a=0.05)对回归方程的残差进行正态性、独立性、随机性及奇异值检验。回归方程的回归平方和、残差平方和各为多少。求回归方程的复相关系数,并对拟合优度进行检验,若消除白变量个数及样本个数对回归方程的影响,拟合优度宜采用哪个指标,其值为多少。在排除其它因素的影响后,白变量X1与因变量Y之间的相关程度是多少。当排除其它因素对X2的影响后,X2进入回归方程,R2增加了多少?XI、X2与Y的简单相关系数分别是多少?某服装厂发现本厂的服装销售额与该厂所在城市的服装销售总额及人均衣着用品的支出额关系密切。现有26期的原始数据如下:X1179.6226.2327.4463.4620.2935.41175658.1468.5539.3697.1894.91050.9X212.5716.4821.421.531.1440.0540.7621.5226.0930.9938.7146.1955.13y0.192.072.162.924.857.1412.066.62「7.739.0110.7813.2216.84X1740.2687.1956.4[1223.31441.3]1561.31683.51466.5[1621.71465.81632.52207.62498.6X247.4534.0354.5971.2382.8986.2292.7273.6481.1373.5081.9399.63113.63y18.93]12.3318.34P23.5228.7728.6528.5621.40「22.1321.6121.4630.0136.60以服装厂所在城市服装销售总额为白变量X1,以人均衣着用品支出额为白变量X2,该厂服装销售额为因变量Y建立二元线性回归方程。若了解到明年本城市服装销售总额X1为2700万元,X2将是128元,试求明年该厂服装销售额的预测值及预测区间(a=0.05)对回归方程的显著性作检验;对每一个回归系数的显著性作检验;求出回归方程的复相关系数;对回归方程的残差作奇异值检验在经济流通领域中,某公司的年销售额Y与个人可支配收入X1,价格X2,研究与发展费X3,广告费X4等项有关。(数据见光盘中“习题数据库”中204.sav文件)试根据资料用逐步回归的方法建立线性回归方程。(引入变量、剔除变量的临界值为1.5)变量进入回归模型的顺序是什么,哪些变量未进入方程。最终方程的拟合优度如何,请评价之。5.某地区大春粮食产量y和大春粮食播种面积x1、化肥用量x2、肥猪发展头数x3、水稻抽穗扬花期降雨量x4的数据见光盘中“习题库数据”205.sav文件,试用逐步回归分析,寻求大春粮食产量的预报模型(选取引入和剔除检验临界值为2.5)。6.某种水泥在凝固时放出的热量y(卡/克)与水泥中四中化学成分有关,现测得13组数据,见光盘中“习题库数据”206.sav文件,用逐步回归法建立线性回归方程(检验临界值为4)对白变量X4的状态进行说明。第三章主成分分析一、填空题主成分分析是通过适当的变量替换,使新变量成为原变量的并寻求种方法。主成分分析的基本思想是主成分的协方差矩阵为!阵。主成分表达式的系数向量是特征向量。5.原始变量协方差矩阵的特征根的统计含义是原始数据经过化处理,转化为均值为,方差为—的标准值,且其I阵与相关系数矩阵相等。因子载荷量的统计含义是样本主成分的总方差等于?变量按相关程度为,在度下,主成分分析的效果较好。在经济指标综合评价中,应用主成分分析法,则评价函数中的权数为°SPSS中主成分分析采用令过程。二、简答题简述主成分的概念及几何意义。简述量纲对主成分分析的影响及消除方法。列举样本主成分的性质。提取样本主成分的原则。简述主成分分析的适用范围及基本步骤。思考主成分分析法的应用。二、计算题设三个变量(x1,x2,x3)的样本协方差矩阵为:s计算前三个主成分各白的贡献率和累积贡献率s2r0222srssr.220srs试求主成分及每个主成分的方差贡献率。2.在一项研究中,测量了376只鸡的骨骼,并利用相关系数矩阵进行主成分分析,见下表:Y1Y2Y3Y4Y5Y6头长x10.350.530.76-0.05-0.040.00头宽x20.330.70-0.640.000.00-0.04肱骨x30.44-0.19-0.050.530.190.59尺骨x40.44-0.25-0.020.48-0.15-0.63股骨x50.43-0.28-0.06-0.51-0.670.48胫骨x60.44-0.22-0.05-0.48-0.700.15特征值4.570.710.410.170.080.06解释6个主成分的实际意义。对于y4,y5,y6的方差很小这一点,你怎样对实际情况作出推断。在一项对杨树的性状的研究中,测定了20株杨树树叶,每个叶片测定了四个变量:叶长(x1),2/3处宽(x2),1/3处宽(x3),1/2处宽(x4)。这四个变量的相关系数矩阵的特征根和标准正交特征向量分别为:=2.920U「=(0.1485,-0.5735,-0.5577,-0.5814)=1.024U2=(0.9544,-0.0984,0.2695,0.0824)=0.049U3=(0.251^0.7733,-0.5589,-0.1624)■4=0.007U4=(-0.0612,0.2519,0.5513,-0.7930)写出四个主成分,计算它们的贡献率。计算四个变量在前两个主成分上的载荷,由因子载荷矩阵,你认为这两个主成分应该如何解释?你能给它们分别起个名字吗?根据原始数据和(1)中的结果,可以计算出20株杨树叶的第一、二主成分得分,试以这两个主成分y1和y2为坐标,在(y1,y2)平面上按因子得分为坐标描出这20个样本点。对纽约股票市场上的五种股票的周回升率x1,x2,x3,x4,x5进行了主成分分析,其中x1,x2,x3分别表示三个化学工业公司的股票回升率,x4,x5表示两个石油公司的股票回升率,主成分分析是从相关系数矩阵出发进行的,前两个特征根和对应的标准正交特征向量为:=2.857U1=(0.464,0.457,0.470,0.421,0.421)=0.809U2=(0.240,0.509,0.260,-0.526,-0.582)计算这两个主成分的方差贡献率。能否对这两个主成分的意义作一个合理的解释,并给两个主成分命名。四、SPSS操作题下面是8个学生两门课程的成绩表:12345678英语x110090707085555545数学x26585709085455565求出两个特征根及其对应的单位特征向量;求出主成分,并写出表达式;求出主成分的贡献率,并解释主成分的实际意义;求出两个主成分的样本协方差矩阵;第1个样本主成分与第2个变量样本之间的相关系数为多少求出8个学生第一主成分得分并进行排序某中学十二名女生的身高x1,体重x2的数据如下:123456789101112身高155153157154158152160156158157159161体重484648454946484551474850两个变量的协方差矩阵与相关系数阵;两个特征根及其对应的单位特征向量;主成分的表达式并解释各贡献率的大小意义和主成分的实际意义;如果舍弃主成分y2,则哪一个原变量的信息损失量最大;画出全部样本的主成分散点图。根据下列某地区11年数据X1(总产值)X2(存储量)X3(总消费)y(进口额)1149.34.2108.115.92161.24.1114.816.43171.53.1123.219.04175.53.1126.919.15180.81.1132.118.86190.72.2137.720.47202.12.1146.022.78212.45.6154.126.59226.15.0162.328.110231.95.1164.327.611239.00.7167.626.3计算地区总产值、存储量和总消费的相关系数矩阵。求特征根及其对应的特征向量。求出主成分及每个主成分的方差贡献率;利用主成分方法建立y与x1,x2,x3的回归方程(取两个主成分)第四章因子分析一、填空题1.因子分析是把每个原始变量分解为两部分因素,一部分是另_部分为?变量共同度是指因子载荷矩阵中3.公共因子方差与特殊因子方差之和为。二、简答题比较因子分析和主成分分析模型的关系,说明它们的相似和不同之处。能否将因子旋转的技术用于主成分分析,使主成分有更鲜明的实际背景。二、计算题已知x=(x1,x2,x3,x4,x5)'的样本相关系数矩阵R为0.8101R=0.4510.642110.9340.9020.8860.720:0.7250.5220.882试用主对角线外每一行的最大值来估计约化相关系数矩阵R*的主对角线上的相应元素,并近似地计算出因子载荷矩阵A的第一列元素2.设变量x1,x2和x3已标准化,其样本相关系数矩阵为:TOC\o"1-5"\h\z10.630.45R=0.6310.350.450.351-对变量进行因子分析。取q=2进行正交因子旋转。为了考察学生的知识水平,常用学生的考试成绩来评定,某校对33个学生的3门功课进行分析,得相关系数矩阵:1英语2数学3音乐1.000.640.51R=0.641.000.510.510.511.00-取两个公因子计算约化相关系数矩阵计算因子载荷矩阵计算各变量的公共因子方差和特殊因子方差写出因子模型四、SPSS操作题1.10名初中男生身高、胸围、体重的数据资料如下:身高x1(cm)胸围x2(cm)体重x3(kg)149.569.538.5162.577.055.5162.778.550.8162.287.565.5156.574.549.0156.174.545.5172.076.551.0173.281.559.5159.574.543.5157.779.053.5利用因子法、方差最大旋转法计算因子载荷阵A分别计算各变量的公共因子方差和特殊因子方差,判断哪个因子能概括原始信息的大部分,为什么写出方差最大正交旋转因子模型,并分析各因子的实际含义计算各个样本点的因子得分第五章聚类分析一、填空题1.聚类分析是建立一种分类方法,它将一批样哂或变量按照它们在性质上的行科学的分类。Q型聚类法是按行聚类,R型聚类法是按进行聚类。Q型聚类统计量是,而R型聚类统计量通常采用在聚类分析中需要对原始数据进行无量纲化处理,以消除不同量纲或数量级的影响,达到数据间可同度量的目的。常用的无量纲化方法有以下几种:>>5.六种Q型聚类方法分别为??>>O6.快速聚类在SPSS中由程实现。二、简答题简述系统聚类法的基本思想及主要步骤简述最长聚类法的聚类步骤。简述快速聚类的基本思想及主要步骤。二、计算题2.从20个工厂抽了同类产品,每个产品测了两个指标,欲将各厂的质量进行分类,测得的数据如下(已作了适当变换)1234567891011121314151617181920X10022445667-4-2-3-3-5100-1-1X26553431210322021-1-2-1-3试用欧氏距离,将每个样本与其距离最近的凝聚眯进行初始归类(用密度法取聚点)。四、SPSS操作题某校从高中二年级女生中随机抽取16名,测得身高和体重数据如卜表:序号身高(cm)体重(kg)序号身高(cm)体重(kg)1160499160452159461016044316041111574341694912163505162501316151616548141584571655215159488154431616148试分别利用最短距离法、最长距离法、重心法、类平均法、中间距离法将它们聚类(分类统计量采用绝对距离),并画出聚类图2.从不同地区采集了七块花岗岩,测其部分化学成分如下:1234567SiO275.2075.1572.1972.3572.7473.2973.72TQ20.140.160.130.130.100.0330.033FeO1.862.111.521.371.411.070.77CaO0.910.740.690.830.720.170.28K2O5.214.934.654.874.993.152.78试作如下分析:样本间用欧氏距离,并用系统聚类的诸方法对样本进行聚类。将数据标准化后,仍用欧氏距离,然后用系统聚类的诸方法对样本进行聚类对五个变量进行聚类第六章判别分析一、填空题1.判别分析是要解决在研究对象已^情况下,确定新的观测数据属于已知类别中哪一类的多元统计方法。用判别分析方法处理问题时,通常以^为衡量新样本点与各已知组别接近程度的指标。进行判别分析时,通常指定一种判别规则,用来判定新样本的归TOC\o"1-5"\h\z属,常见的判别准则有??在p维空间Rp中,点与点之间的接近和疏远尺度用来衡量,最简单的就是或类内样本点接近,类间样本点疏远的性质,可以通过与大小差异表现出来,而两者的比值能把不同的类区别开来。这个比值越大,说明类与类间的差异越,分类效果越。Fisher判别法就是要找一个由p个变量组成的,使得各白组内点的尽可能接近,而不同组间点的尽可能疏远。二、简答题判别分析的分类。判别的基本思想简述两个类别的判别及判别准则。简述Fisher判别规则及具体判别步骤。简述逐步判别基本原理。三、计算题某地区将农村经济类型分为三类:G1一较富裕类型,G2一中等类型,G3—较贫困类型。每种类型以五个指标为依据:x1=±地生产率=农村社会总产值/总土地面积(百元/每亩),x2=劳动生产率=农村社会总产值/农村劳动力(百元/每个劳动力),x3=A均收入=农村经济纯收入/农业人口(百元/每人),x4=费用水平=总费用/总收入,x5=农村工业比重=农村工业产值/农村社会总产值。每种类型分别有容量为ni=5,n2=8,n3=4的样本(每个个体以县为单位),其数据如下:12345678G1(较X13.853.514.125.013.67富裕)X26.755.734.454.685.84X34.794.013.683.644.27X40.850.810.890.780.87X50.590.600.480.530.64G2(中X13.613.654.112.983.212.873.354.00等)X24.053.744.133.693.553.783.814.27X32.652.863.152.903.132.602.712.97X40.900.910.930.890.880.940.950.90X50.450.430.410.410.480.390.380.44G3(较X13.233.032.542.11贫困)X24.083.213.502.98X31.852.031.511.07X40.960.940.970.99X50.380.250.340.21(1)试作费歇尔判别(2)试以x3,x5为变量,建立三个类别的直线判别函数试以x1,x2,x3,x4,x5为变量,建立马氏距离判别函数进行逐步判别分析设两个二维总体有公共协方差,从二总体中分别抽取了容量为9和8的样本,其数据如下:123456789G1X1X220.214.228.58.424.614.826.515.229.011.936.79.636.018.027.69.525.016.0G2X1X221.67.523.24.517.89.214.47.211.05.518.96.315.48.016.17.8建立直线判别函数,并判定点(23.1,9.2)归属于哪类?采用费歇尔判别来确定(23.1,9.2)的归属⑶采用马氏距离判别法则确定点(23.1,9.2)属于哪一类。四、SPSS操作题1.一个城市的居民家庭,按其有无割草机分为两组,有割草机的一组记为G1,另一组记为G2。割草机工厂欲判断一些家庭是否习割草机,从G1和G2分别随机抽取12个样本单位,调查两项指标:x1=家庭收入,x2=房前房后土地面积。资料如下表,试用Fisher判别法建立判别函数。G1有割草机家庭G2无割草机家庭X1(千美兀)X2(平方千英尺)X1(千美兀)X2(平方千英尺)20.09.225.09.828.58.417.610.421.610.821.68.620.510.414.410.229.011.828.08.836.79.616.48.836.08.819.88.027.611.222.09.223.010.015.88.231.010.411.09.417.011.017.07.027.010.021.07.4胜利油田某地段三条地震测线提供构造指标x1,x2,及速度变量x3,x4,x5共5个指标。表中给出的有油气显示的5个指标数据(共10组数据)设为G1类,表中给出的无油气显示的5个指标数据(共11组数据)设为G2类。已知G1类与G2类的协方差阵桢,试判别给定的三组数据归属哪一类。G1类一有油气显示的数据表构造指标速度指标X1X2X3X4X5120214242202142432024424420274245203041462030421715442248324712492744411103644225G2类一无油气显示的数据表构造指标速度指标X1X2X3X4X5120181752203617733217414432178005325341462021177732324148154442492030176103211800112144441待判样本数据表构造指标速度指标X1X2X3X4X5120551632321480031544214
/
本文档为【多元统计分析方法与应用练习册】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索