为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

面板数据的因子分析

2017-10-01 9页 doc 26KB 67阅读

用户头像

is_482581

暂无简介

举报
面板数据的因子分析面板数据的因子分析 第26卷第6期 2009年l2月 贵州大学(自然科学版) JournalofGuizhouUniversity(NaturalSciences) Vol_26No.6 Dee.20o9 文章编号1000—5269(2009)06—0010—04 面板数据的因子分析 王培,王焱鑫,崔巍 (贵州大学理学院,贵州贵阳550025) 摘要:主要应用多元数理统计中的因子分析方法,对多指标面板数据进行了分析, 并应用综合 评分法对各地区的工业企业生产效率进行了分类.结果表明,应用因子分析的结果 与现...
面板数据的因子分析
面板数据的因子分析 第26卷第6期 2009年l2月 贵州大学(自然科学版) JournalofGuizhouUniversity(NaturalSciences) Vol_26No.6 Dee.20o9 文章编号1000—5269(2009)06—0010—04 面板数据的因子分析 王培,王焱鑫,崔巍 (贵州大学理学院,贵州贵阳550025) 摘要:主要应用多元数理统计中的因子分析方法,对多指标面板数据进行了分析, 并应用综合 评分法对各地区的工业企业生产效率进行了分类.结果表明,应用因子分析的结果 与现实基本 相符. 关键词:面板数据;因子分析 中图分类号:0212文献标识码:A 因子分析是主成分分析的推广和发展,也是多 元统计分析中降维的一种方法.因子分析是研究 相关阵或协方差阵的内部依赖关系,它将多个变量 综合为少数几个因子,以再现原始变量与因子之间 的相关关系].面板数据是同一截面单元数据集 上对不同时间段上的重复观测值,是时间序列和截 面数据的混合数据. 面板数据的独特优点,使之在理论及应用领域 都得到了长足的发展.然而,很少有学者考虑面板 数据在多元统计中的分析.从BonzeD.C和Her— mosillaA.Y开创性的将多元统计的方法引入到面 板数据的分析中来,并用概率连接函数和遗传算法 改进了聚类分析的算法,此后,国外对相关问题的 研究一直停滞不前;国内学者朱建平,郑兵云分别 对单指标面板数据及多指标面板数据的聚类分析 进行了一定的研究,并做了实证分析j.本文将 因子分析与面板数据结合,利用实例解释面板数据 的因子分析的结果. 1因子分析的基本原理 1.1正交因子模型 设x=(X一,)是观测的随机向量, E(X)=,D(X)=?,且设F=(,…,F), (m<p)是不可观测的随机向量,(F)=0, D(,)=.又设 : (占一,)与F互不相关,且 E()=0,D(占)=diag(;,…,:)=D 假定随机向量满足以下模型: 1一allF1+口12+…+altoF+1 一 a21F1+n22+…+a2mF+2 L一 =aplF1+口p2F2+…+0pmFm+p 以上模型(1)称为正交因子模型,用矩阵表示 如下 =+AF+s(2) 其中,…,F称为的公共因子;一,. 称为的特殊因子.公共因子一般对的每一个 分量都有作用,而只对置起作用?'4j. 1.2模型的参数主成分估计方法 1)由样本数据阵计算样本均值,样本协 差阵|s,样本相关阵R. 2)求相关阵的特征值和化特征向量. 记A.?A:?…?A?0为R的特征值,其相应 的单位正交特征向量为2,z:,…f. 3)求因子的载荷矩阵A I确定公因子的个数m(如m=2). ?令ni=?Af(i:1,2,…,n),贝0A=(口, … ,a)为因子的载荷矩阵. 4)估计特殊因子方差和共同度h,其中h = ?a;(=1,2,…p). 5)对公共因子做解释. 以上是因子分析的基本原理,关于因子分析的 收稿日期:2009—08—25 基金项目:贵州省自然科学基金项目(700121);贵州省教育厅基金项目(2008043) 作者简介:王培(1987一),女,江苏淮安人,硕士研究生,研究方向:应用数理统 计,Email:peiwangl129@163.com 通讯作者:王培,gmail:peiwang1129@163.tom. 第6期王培等:面板数据的因子分析 其他请参阅参考文献[1][4]. 2面板数据的因子分析 2.1面板数据的数据结构 多指标面板数据的数据结构相对于单指标面 板数据要复杂的多,不同于单指标面板数据的二维 表格而言,多指标面板数据除了具有截面维度和时 间维度外,还增加了指标维度,因此多指标面板数 据实际上是一张三维表格.在平面上的表示如表 1J .设总体由?个体组成,每个个体的特征含有 P项指标,时间长度为T,则X(t),=1,2,…凡; : 1,2,…P;t=1,2,…表示第i个个体第个指 标在时刻t的数值. 表1多指标面板数据的数据结构 面板数据的因子分析相对于多元统计中的总 体及样本的因子分析要复杂很多,目前没有现成的 软件可供使用,本文试图寻求一种途径将多指标面 板数据的结构转换为现有软件能够处理的数据类 型.这是一种"降维"的思想,即当我们多研究问 题的要求不是非常严格时,我们可以通过取均值的 方法将多指标面板数据的三维表格降为二维表格. 具体的做法如下,对每一个指标在时间维度上取均 值,抽象为某一个特定时刻的情形,从而消去时问 维度的影响,退化成截面数据.显然地,这种"降 维"的处理方法主要存在两个缺陷.第一,信息损 失,均值只能描述平均动态,不能反映其他统计特 征,如方差等;第二,这样的方法存在一种潜在的假 设,即各个体在每一相同指标在时间维度上的变化 方向相同,否则会出现错误3J.本文将利用Eviews 软件对以上分析进行验证. 2.2实例应用 国有及规模以上的非国有企业在工业经济中 占有绝对比重,国家每年都对这类企业进行详细的 调查.本文仍将选取这类企业作为研究对象;选取 全员劳动生产率,固定资本占有率,流动资本占有 率三个指标考察国有及规模以上非国有企业的生 产效率.本文使用的数据来自中国统计年鉴 (2001年—2006年). 通过对2000至2005年31个地区的三个指标 的面板数据观测,能够看出这六年来工业全员劳动 生产率不断提高,但固定资本及流动资本的占有率 却呈降低趋势.文献[3]用聚类分析的方法对各 地区工业生产效率的层次及类型进行了粗略的判 别.本文采用因子分析的方法给出各地区工业生 产效率的综合得分,从而指出造成文献[3]中分类 结果的根本原因. 1)应用KMO和球形Bartlett检验数据因子分 析适应性.结果如表2所示. 由检验结果可以看出,应拒绝各变量独立的假 设,因子分析的方法值得尝试. 2)应用碎石图判断各因子的特征根大小及因 子的重要程度.由图1可以很明显的看出结果. 表2KMO和球形Bartlett检验结果 相关矩阵 取样足够度的Kaiser—Meyer—OLkin度量.520 2.0 特1.5 征1.0 值0.5 0.0 图1各因子的碎石图 贵州大学(自然科学版)第26卷 3)计算因子载荷矩阵及因子空间载荷图,如 表3及图2所示. 表3因子载荷矩阵 成份矩阵 提取方法:主成分分析法.(a)已提取了3个成份. 旋转成份矩阵 提取方法:主成分分析法.旋转法:具有Kaiser标准化的正 交旋转法.a.旋转在此次迭代后收敛. 图2因子空间载荷图 4)因子得分及因子表达式,如表4所示. 表4因子得分矩阵 成份得分系数矩阵 提取方法:主成分分析法.旋转法:具有Kaiser标准化的正 交旋转法.构成得分. 成份得分协方差矩阵 提取方法:主成分分析法.旋转法:具有Kaiser标准化的正 交旋转法.构成得分. 利用表4中的因子得分系数矩阵可以写出各 公因子表达式如下: F1=0.102x1+0.536x2+0.504x3 F2=1.015x1+0.044X2+0.055x3 F3=0.054x1—2.302x2+2.321x3 5)结合表3,4可以看出以上三个因子分别从 不同方面反映了我国工业企业生产效率水平.单 独使用某一个指标不能对工业企业的生产效率做 出正确的评价,这里我们按各公因子的对应方差贡 献率为权重计算综合评价统计量: F老Ft+老+Al+A2+A3A1+A2+A3 _?(3)A1+A2+A3 6)利用公式对我国31个地区的工业企业生 产效率进行综合评分排名,并按评分结果进行分 类,见表5. 表5各地区工业生产效率分类 从分类结果可以看出,首先,工业企业的生产 效率具有较强的地区差异.经济较发达地区生产 效率一般较高,这是因为经济发达地区一般拥有丰 富及高水平的人力物力,在第一类中我们可以看出 山东,江苏一浙江在这方面的优势.其次经济开放 程度对工业生产效率也有一定的正面影响,经济开 放程度越高,特别是外资的流入,一定程度上提高 了经济效益及生产效率.在分类中可以看出广东, 上海,天津等地合理的利用开放带来的优势,提高 了生产效率.最后,经济欠发达地区也有一些例 外,如云南,新疆,贵州等地的工业企业生产效率表 现优于山西,陕西,这是因为云南的烟草加工,新疆 的食品加工,贵州的军工企业在我们选取的各指标 上一直表现良好,并且在各地的整个企业中所占份 额较大. 第6期王培等:面板数据的因子分析?13? 3结论与展望 从以上的分析我们看出,由于我们选取的三个 指标:全员劳动生产率,固定资本占有率及流动资 本占有率在因子中的得分不同,为我们进行分类提 供了依据.这也是文献[3]中分类结果的主要原 因.多指标面板数据的因子分析只是面板数据在 多元统计分析中的一个方面,本文就平衡面板数据 的因子分析做了一些基础性的工作,相关的内容还 有很多,如非平衡面板数据,缺省面板数据等研究 内容更加复杂,有待进一步的探讨! 参考文献: [1]高惠璇.应用多元统计分析[M].北京:北京大学出版社,2006: 291—307. [2]朱建平,陈民肯.面板数据的聚类分析及其应用[J].统计研 究,2007(4):11—14. [3]郑云兵.多指标面板数据的聚类分析及其应用[J].数理统计 与管理,2008,27(2):265—27O. [4]RichardAJohnson,DeanWWithem.AppliedMuhivariateStatisti? calAnalysis[M].Beijing:ChinaStatisticsPress,2000:477-424. FactorAnalysisofPanelData WANGPei,WAGYan—xin,CUIWei (CollegeoftheScience,GuizhouUniversity,Guiyang550025,China) Abstract:Inthispaper,thefactoranalysisofmultivariatestatisticswasutilizedtoresearchonp aneldata.And theGeneralScoremethodwasusedtoclassifyenterprisesfromdifferentregionsofChinabypr oductivity.There— suhshowsthatfactoranalysiscangetasatis~ingresultinlinewithreality. Keywords:paneldata;factoranalysis (上接第6页) [7]刘大瑾,周海林,袁东锦.AXB+CXD=F的中心对称解及其 最佳逼近的迭代算法[J].扬州大学,2008,11(3):9—13. [8]AlvaroRDePierro,WeiMu—sheng.Somenewpropertiesofthe eaualityconstrainedandweightedleastsquaresproblem[J].Linear Algebraanditsapplications,2000,320:145—165. [9]YamadaI.Thehybridsteepestdescentmethodforthevariational inequalityproblemovertheintersectionoffixedpointsetsofnonex- pansivemappings[C]//ButnariuD,CensorY,ReichS,eds.In— herontlyParallelAlgorithmforFeasibilityandOptimizationandTheir Applications.London:Elsevier.2001:473—504. [10]SunHe,ming,HiroshiHasegawa,IsaoYamada.Amuhidimen- sionalassociativememo~neuralnetworktorecallnearestpattem fromInput[C]//NonlinearSignalandImageProcessing,Sappo— ro,Japan:No~inearSignalandImageProcessing,2005. [11]YamadaI,OguraN,Shirakawa,N.Anumericallyrobusthybrid steepestdescentme~odfortheconvexlyconstrainedgeneralizedin— verseproblems[C]//NashedZ,SeherzerO,eds.InverseProb— lems,ImageAnalysis,andMedicalImaging.ContemporaryMathe— matics.2002.313:269—3O. AlgorithmfortheOptimalApproximation SolutionoftheMatrixEquation HUShan—shan,SUNHe—ming,ZHONGQing (CollegeofScience,HohaiUniversity,N蚰jing210098,China) Abstract:Thispapergivesaniterativealgorithmtoobtainthesymmetricoptimalapproximationsolutionofmatrix equationAXB+CYD=EwithweightedFrobeniusnorlnbyapplyingthehybridsteepestdescentmethod.Inthe absenceofroundoffeITors,foranyinitialmatrixX0,Y0,theoptimalapproximationsolutioncanbeobtained withinfiniteiterationsteps.Inthispaper,thenumericalexampleverifiesthefeasibilityofthealgorithm. Keywords:hybridsteepestdescentmethod;optimalapproximation;matrixequation;least—nOrlTlsolution;sym metricsolution?
/
本文档为【面板数据的因子分析】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索