为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

多元统计分析案例分析

2021-11-11 7页 doc 111KB 3阅读

用户头像 个人认证

流星

暂无简介

举报
多元统计分析案例分析Lastrevisionon21December2020多元统计分析案例分析一、对我国30个省市自治区农村居民生活水平作聚类分析1、指标选择及数据:为了全面分析我国农村居民的生活状况,主要考虑从收入、消费、就业等几个方面对农村居民的生活状况进行考察。因此选取以下指标:农村产品价格指数、农村住宅投资、农村居民消费水平、农村居民消费支出、农村居民家庭人均纯收入、耕地面积及农村就业人数。现从2010年的调查资料中抽取30个样本,指标数据如下:地区农产品价格指数(上年=100)农村住宅投资(亿元)农村居民消费水平(元)农村居民...
多元统计分析案例分析
Lastrevisionon21December2020多元统计案例分析一、对我国30个省市自治区农村居民生活水平作聚类分析1、指标选择及数据:为了全面分析我国农村居民的生活状况,主要考虑从收入、消费、就业等几个方面对农村居民的生活状况进行考察。因此选取以下指标:农村产品价格指数、农村住宅投资、农村居民消费水平、农村居民消费支出、农村居民家庭人均纯收入、耕地面积及农村就业人数。现从2010年的调查资料中抽取30个样本,指标数据如下:地区农产品价格指数(上年=100)农村住宅投资(亿元)农村居民消费水平(元)农村居民生活消费支出合计(元)农村居民家庭人均纯收入(元)耕地面积2008(万公顷)农村私营企业就业人数(万人)北京1288613262天津781410075河北38675958山西45004736内蒙古44865530辽宁57396908吉林46636237黑龙江45366211上海1360913978江苏81969118浙江987811303安徽44475285福建68797427江西43975789山东57336990河南40615524湖北47585832湖南45135622广东58807890广西35614543海南38465275重庆36525277四川47485087贵州29263472云南36033952陕西36834105甘肃29753425青海36843863宁夏38944675新疆35904643数据来源:《中国统计年鉴2010》.2、将数据进行化变换:地区农产品价格指数(上年=100)农村住宅投资(亿元)农村居民消费水平(元)农村居民生活消费支出合计(元)农村居民家庭人均纯收入(元)耕地面积2008(万公顷)农村私营企业就业人数(万人)北京天津河北山西内蒙古辽宁吉林黑龙江上海江苏浙江安徽福建江西山东河南湖北湖南广东广西海南重庆四川贵州云南陕西甘肃青海宁夏新疆3、用K-均值聚类法对样本进行分类如下:聚类成员案例号地区聚类距离1北京12天津23河北34山西45内蒙古36辽宁27吉林38黑龙江39上海110江苏211浙江112安徽313福建214江西415山东316河南317湖北318湖南419广东220广西421海南422重庆423四川324贵州425云南326陕西427甘肃428青海429宁夏430新疆4分四类的情况下,最终分类结果如下:第一类:北京、上海、浙江。第二类:天津、、辽宁、、福建、甘肃、江苏、广东。第三类:浙江、河北、内蒙古、吉林、黑龙江、安徽、山东、河南、湖北、四川、云南。第四类:山西、青海、宁夏、新疆、重庆、贵州、陕西、湖南、广西、江西、。从分类结果上看,根据2010年的调查数据,第一类地区的农民生活水平较高,第二类属于中等水平,第三类、第四类属于较低水平。二、判别分析针对以上分类结果进行判别分析。其中将新疆作作为待判样本。判别结果如下:案例数目实际组预测组p1112223334445336227338339111022111112331322144415331633173318441922204421442244233324442534**26442744284429443044**.错误分类的案例从上可知,只有一个地区判别组和原组不同,回代率为96%。下面对新疆进行判别:已知判别函数系数和组质心处函数如下:标准化的典型判别式函数系数函数123农产品价格指数农村住宅投资农村居民价格水平生活消费支出人均纯收入耕地面积就业人数组质心处的函数函数组号1231234判别函数分别为:Y1=++++Y2=++++Y3=+++将西藏的指标数据代入函数得:Y1=Y2=Y3=计算Y值与不同类别均值之间的距离分别为:D1=D2=D3=D4=经过判别,D4最小,所以新疆应归于第四类,这与实际情况也比较相符。三,因子分析:分析数据在上的基础上去掉两个耕地面积和农村固定资产投资两个指标。经spss软件分析结果如下:(1)各指标的相关系数阵:从中可以看出,大部分指标的相关系数都比较高,各变量之间的线性关系较明确,能够从中提取公共因子,适合因子分子。(2)检验:由上表可知:巴特利特球度检验统计量的观测值为.相应的概率p接近为0.如果显着性水平a为,由于显着性水平小于,拒绝零假设,认为相关系数矩阵与单位阵有显着差异,同时,KOM值为,根据Kaiser给出的度量标准可知原有变量适合进行因子分析(3)各指标的贡献率如下表:从中可以看出,各个指标的贡献率都在百分之五十之上比较高。从上表中可以看出,第一个因子的特征根为.解释原有五个变量总方差的68%,累积方差贡献率为%。第二个因子的特征根为,解释原有变量总方差%,累计方差贡献率为%。(4)碎石图:(5)因子载荷阵如下:由上表可知,各指标在第一个因子上的载荷比较高,说明第一个因子很重要;第二个因子与原有变量的相关性较小,它对原有变量的解释作用不显着。为便于对各因子进行命名,对因子载荷阵实施正交旋转。旋转之后的因子载荷阵:(6)从上表可见,每个因子只有几个指标的因子载荷较大,因此可根据上表进行分类。将五个指标按高载荷分成两类:四,主成分分析:(1)各指标间的相关系数矩阵如下表所示:可以看到有些指标之间的相关性较强,如果直接进行综合分析会造成信息重叠,所以用主成分分析将多个指标化成几个不相关的综合指标。(2)求相关矩阵的特征值和特征向量:从上表可知,前两个特征值累计贡献率已达%。说明前两个主成分基本包含了全部指标具有的信息。因此,取前两个特征值,并计算相应的特征向量:(3)由上述因子分子的因子载荷阵计算主成分的特征向量阵为:所以,前两个主成分为:第一个主成分:F1=X1++++第二个主成分:F2=在第一主成分中第二、三、四个指标的系数较大,这三个指标起主要作用,刻划了农居民的收入支出状况的综合指标。在第二主成分中,第一个指标系数较大,是农产品价格水平指标。(4)因子得分:根据上表写出以下因子得分函数:F1=农产品价格指数+农村居民消费+消费支出+家庭人均纯收入+就业人数F2=农产品价格指数+农村居民消费消费支出+家庭人均纯收入就业人数(5)综合:以两个因子的方差贡献率为权数,综合评价模型为:Z=+(旋转之后的方差贡献率)F1=X1++++F2=将各地区指标值代入上式得到各地区农村生活水平的综合值及排名:(6)对结果进行分析:从中可以看出,各地区的农村居民生活水平存在差异。其中,北京、上海、浙江、江苏地区的综合评价值排名前列,说明这几个城市农村居民的生活水平比较高。主要表现在农民收入水平和消费水平两个方面。这几个城市属于沿海地区,经济比较发达,工农业发展遥遥领先于其他地区。其次,天津、山东、福建、辽宁、广东综合评价值相对较低。不过也处于全国前十的地位。青海、贵州、广西、重庆、新疆、甘肃、陕西、云南等几个地区农村居民生活水平发展比较落后。原因是这些地区大多位于中国中西部,地理位置不佳,交通不便,经济发展水平不高,进而影响到农村经济的发展。农村居民收入水平和消费水平均比较低。因此,要提高这些地区农民的生活水平,政府应该加大这些地区的基础设施建设,提高这些地区农村居民的收入水平。
/
本文档为【多元统计分析案例分析】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索