为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

面板数据的因子分析

2011-03-01 4页 pdf 225KB 145阅读

用户头像

is_550068

暂无简介

举报
面板数据的因子分析 第 26卷 第 6期 贵州大学学报 (自然科学版 ) Vol. 26 No. 6 2009年  12月 Journal of Guizhou University (Natural Sciences) Dec. 2009 文章编号  1000 - 5269 (2009) 06 - 0010 - 04 面板数据的因子分析 3 王 培 3 ,王焱鑫 ,崔 巍 (贵州大学理学院 ,贵州 贵阳 550025) 摘  要 :主要应用多元数理统计中的因子分析方法 ,对多指标面板数据进行了分析 ,并应用综合 评分法对各地区的工业企...
面板数据的因子分析
第 26卷 第 6期 贵州大学学报 (自然科学版 ) Vol. 26 No. 6 2009年  12月 Journal of Guizhou University (Natural Sciences) Dec. 2009 文章编号  1000 - 5269 (2009) 06 - 0010 - 04 面板数据的因子 3 王 培 3 ,王焱鑫 ,崔 巍 (贵州大学理学院 ,贵州 贵阳 550025) 摘  要 :主要应用多元数理统计中的因子分析方法 ,对多指标面板数据进行了分析 ,并应用综合 评分法对各地区的工业企业生产效率进行了分类。结果表明 ,应用因子分析的结果与现实基本 相符。 关键词 :面板数据 ;因子分析 中图分类号 : O212  文献标识码 : A   因子分析是主成分分析的推广和发展 ,也是多 元统计分析中降维的一种方法。因子分析是研究 相关阵或协方差阵的内部依赖关系 ,它将多个变量 综合为少数几个因子 ,以再现原始变量与因子之间 的相关关系 [ 1 ]。面板数据是同一截面单元数据集 上对不同时间段上的重复观测值 ,是时间序列和截 面数据的混合数据。 面板数据的独特优点 ,使之在理论及应用领域 都得到了长足的发展。然而 ,很少有学者考虑面板 数据在多元统计中的分析。从 Bonze D. C和 Her2 mosilla A. Y开创性的将多元统计的方法引入到面 板数据的分析中来 ,并用概率连接函数和遗传算法 改进了聚类分析的算法 ,此后 ,国外对相关问题的 研究一直停滞不前 ;国内学者朱建平、郑兵云分别 对单指标面板数据及多指标面板数据的聚类分析 进行了一定的研究 ,并做了实证分析 [ 2, 3 ]。本文将 因子分析与面板数据结合 ,利用实例解释面板数据 的因子分析的结果。 1 因子分析的基本原理 1. 1 正交因子模型 设 X = (X1 , ⋯, Xp ) ′是观测的随机向量 , E (X ) =μ, D (X ) = ∑ ,且设 F = ( F1 , ⋯, Fm ) ′, (m < p) 是不可观测的随机向量 , E ( F) = 0, D ( F) = Im . 又设 ε = (ε1 , ⋯,εp ) ′与 F互不相关 ,且 E (ε) = 0, D (ε) = d iag (σ21 , ⋯,σ2p ) ≡D 假定随机向量 X满足以下模型 : X1 - μ = a11 F1 + a12 F2 + ⋯ + a1m Fm +ε1 X2 - μ = a21 F1 + a22 F2 + ⋯ + a2m Fm +ε2 ⋯ ⋯ ⋯ ⋯ ⋯   ⋯ ⋯ Xp - μ = ap1 F1 + ap2 F2 + ⋯ + apm Fm +εp (1) 以上模型 (1)称为正交因子模型 ,用矩阵表示 如下      X =μ + A F +ε (2) 其中 F1 , ⋯, Fm 称为 X的公共因子 ; ε1 , ⋯,εp 称为 X的特殊因子。公共因子一般对 X的每一个 分量 X i 都有作用 ,而εi 只对 X i 起作用 [ 1, 4 ]。 1. 2 模型的参数主成分估计方法 1)由样本数据阵 X 计算样本均值 X _ 、样本协 差阵 S 、样本相关阵 R. 2)求相关阵 R 的特征值和化特征向量。 记λ1 ≥λ2 ≥⋯≥λp ≥ 0为 R的特征值 ,其相应 的单位正交特征向量为 l1 , l2 , ⋯lp. 3)求因子的载荷矩阵 A Ⅰ确定公因子的个数 m (如 m = 2 ). Ⅱ令 ai = λi li ( i = 1, 2, ⋯m ) ,则 A = ( a1 , ⋯, am ) 为因子的载荷矩阵。 4)估计特殊因子方差σi^ 和共同度 h2i ,其中 h2i = ∑ m j =1 a 2 ij ( i = 1, 2, ⋯p) . 5)对公共因子做解释。 以上是因子分析的基本原理 ,关于因子分析的3 收稿日期 : 2009 - 08 - 25 基金项目 : 贵州省自然科学基金项目 (700121) ;贵州省教育厅基金项目 (2008043) 作者简介 : 王 培 (1987 - ) ,女 ,江苏淮安人 ,硕士研究生 ,研究方向 :应用数理统计 , Email: peiwang1129@163. com.3 通讯作者 : 王 培 , Email: peiwang1129@163. com. 其他内容请参阅参考文献 [ 1 ] [ 4 ]. 2 面板数据的因子分析 2. 1 面板数据的数据结构 多指标面板数据的数据结构相对于单指标面 板数据要复杂的多 ,不同于单指标面板数据的二维 表格而言 ,多指标面板数据除了具有截面维度和时 间维度外 ,还增加了指标维度 ,因此多指标面板数 据实际上是一张三维表格。在平面上的表示如表 1 [ 3 ]。设总体由 N 个体组成 ,每个个体的特征含有 p项指标 ,时间长度为 T ,则 X ij ( t) , i = 1, 2, ⋯n; j = 1, 2, ⋯p; t = 1, 2, ⋯T表示第 i个个体第 j个指 标在时刻 t的数值。 表 1 多指标面板数据的数据结构   样本编号 测量时间与各指标测量值 1 ⋯ t ⋯ T X1 ⋯X j⋯Xp ⋯ X1 ⋯X j⋯Xp ⋯ X1 ⋯X j⋯Xp 1 X11 (1) ⋯X1 j (1) ⋯X1p (1) ⋯ X11 ( t) ⋯X1 j ( t) ⋯X1p ( t) ⋯ X11 ( T) ⋯X1 j ( T) ⋯X1p ( T) ⋯⋯   ⋯ ⋯ ⋯  ⋯ ⋯ ⋯ ⋯ ⋯ ⋯  ⋯ ⋯ ⋯ ⋯ ⋯ ⋯  ⋯ ⋯ i X i1 (1) ⋯X ij (1) ⋯X ip (1) ⋯ X i1 ( t) ⋯X ij ( t) ⋯X ip ( t) ⋯ X i1 ( T) ⋯X ij ( T) ⋯X ip ( T) ⋯⋯ ⋯ ⋯ ⋯  ⋯ ⋯ ⋯ ⋯ ⋯ ⋯  ⋯ ⋯ ⋯ ⋯ ⋯ ⋯  ⋯ ⋯ n Xn1 (1) ⋯Xnj (1) ⋯Xnp (1) ⋯ Xn1 ( t) ⋯Xnj ( t) ⋯Xnp ( t) ⋯ Xn1 ( T) ⋯Xnj ( T) ⋯Xnp ( T)   面板数据的因子分析相对于多元统计中的总 体及样本的因子分析要复杂很多 ,目前没有现成的 软件可供使用 ,本文试图寻求一种途径将多指标面 板数据的结构转换为现有软件能够处理的数据类 型。这是一种“降维 ”的思想 ,即当我们多研究问 题的要求不是非常严格时 ,我们可以通过取均值的 方法将多指标面板数据的三维表格降为二维表格。 具体的做法如下 ,对每一个指标在时间维度上取均 值 ,抽象为某一个特定时刻的情形 ,从而消去时间 维度的影响 ,退化成截面数据。显然地 ,这种“降 维 ”的处理方法主要存在两个缺陷。第一 ,信息损 失 ,均值只能描述平均动态 ,不能反映其他统计特 征 ,如方差等 ;第二 ,这样的方法存在一种潜在的假 设 ,即各个体在每一相同指标在时间维度上的变化 方向相同 ,否则会出现错误 [ 3 ]。本文将利用 Eviews 软件对以上分析进行验证。 2. 2 实例应用 国有及规模以上的非国有企业在工业经济中 占有绝对比重 ,国家每年都对这类企业进行详细的 调查。本文仍将选取这类企业作为研究对象 ;选取 全员劳动生产率、固定资本占有率、流动资本占有 率三个指标考察国有及规模以上非国有企业的生 产效率。本文使用的数据来自中国统计年鉴 (2001年 —2006年 )。 通过对 2000至 2005年 31个地区的三个指标 的面板数据观测 ,能够看出这六年来工业全员劳动 生产率不断提高 ,但固定资本及流动资本的占有率 却呈降低趋势。文献 [ 3 ]用聚类分析的方法对各 地区工业生产效率的层次及类型进行了粗略的判 别。本文采用因子分析的方法给出各地区工业生 产效率的综合得分 ,从而指出造成文献 [ 3 ]中分类 结果的根本原因。 1) 应用 KMO和球形 Bartlett检验数据因子分 析适应性。结果如表 2所示。 由检验结果可以看出 ,应拒绝各变量独立的假 设 ,因子分析的方法值得尝试。 2) 应用碎石图判断各因子的特征根大小及因 子的重要程度。由图 1可以很明显的看出结果。 表 2 KMO和球形 Bartlett检验结果 相关矩阵    全员劳动生产率 固定资本占有率 流动资本 占有率 相关  全员劳动生产率 1. 000 - . 179 - . 202    固定资本占有率 - . 179 1. 000 . 906    流动资本占有率 - . 202 . 906 1. 000 KMO和 Bartlett的检验 取样足够度的 Kaiser - Meyer - OLkin度量 . 520 Bartlett的球形度检验  近似卡方 49. 653         df 3         Sig . 000 图 1 各因子的碎石图 ·11·第 6期 王  培 等 : 面板数据的因子分析   3)计算因子载荷矩阵及因子空间载荷图 ,如 表 3及图 2所示。 表 3 因子载荷矩阵 成份矩阵 a 成份 1 2 3 全员劳动生产率 - . 373 . 928 . 006 固定资本占有率 . 957 . 194 - . 216 流动资本占有率 . 962 . 168 . 217 提取方法 :主成分分析法。 ( a)已提取了 3个成份。 旋转成份矩阵 a 成份 1 2 3 全员劳动生产率 - . 096 . 995 . 003 固定资本占有率 . 974 - . 087 - . 209 流动资本占有率 . 969 . 110 . 223 提取方法 :主成分分析法。旋转法 :具有 Kaiser标准化的正 交旋转法。a.旋转在此次迭代后收敛。 图 2 因子空间载荷图   4)因子得分及因子表达式 ,如表 4所示。 表 4 因子得分矩阵 成份得分系数矩阵 成份 1 2 3 全员劳动生产率 . 102 1. 015 . 054 固定资本占有率 . 536 . 044 - 2. 302 流动资本占有率 . 504 . 056 2. 321 提取方法 :主成分分析法。旋转法 :具有 Kaiser标准化的正 交旋转法。构成得分。 成份得分协方差矩阵 成份 1 2 3 1 1. 000 . 000 . 000 2 . 000 1. 000 . 000 3 . 000 . 000 1. 000 提取方法 :主成分分析法。旋转法 :具有 Kaiser标准化的正 交旋转法。构成得分。   利用表 4中的因子得分系数矩阵可以写出各 公因子表达式如下 : F1 = 0. 102x1 + 0. 536x2 + 0. 504x3 F2 = 1. 015x1 + 0. 044x2 + 0. 055x3 F3 = 0. 054x1 - 2. 302x2 + 2. 321x3 5) 结合表 3、4可以看出以上三个因子分别从 不同方面反映了我国工业企业生产效率水平。单 独使用某一个指标不能对工业企业的生产效率做 出正确的评价 ,这里我们按各公因子的对应方差贡 献率为权重计算综合评价统计量 : F = λ1 λ1 +λ2 +λ3 F1 + λ2 λ1 +λ2 +λ3 F2 + λ3 λ1 +λ2 +λ3 F3 (3) 6) 利用公式对我国 31个地区的工业企业生 产效率进行综合评分排名 ,并按评分结果进行分 类 ,见表 5. 表 5 各地区工业生产效率分类 第一类 第二类 第三类 地区 排名 地区 排名 地区 排名 山东 1 安徽 11 甘肃 22 江苏 2 北京 12 内蒙古 23 广东 3 江西 13 云南 24 浙江 4 吉林 14 新疆 25 福建 5 广西 15 山西 26 河北 6 重庆 16 贵州 27 河南 7 辽宁 17 陕西 28 天津 8 湖北 18 宁夏 29 上海 9 黑龙江 19 青海 30 湖南 10 海南 20 西藏 31 四川 21   从分类结果可以看出 ,首先 ,工业企业的生产 效率具有较强的地区差异。经济较发达地区生产 效率一般较高 ,这是因为经济发达地区一般拥有丰 富及高水平的人力物力 ,在第一类中我们可以看出 山东、江苏、、浙江在这方面的优势。其次经济开放 程度对工业生产效率也有一定的正面影响 ,经济开 放程度越高 ,特别是外资的流入 ,一定程度上提高 了经济效益及生产效率。在分类中可以看出广东、 上海、天津等地合理的利用开放带来的优势 ,提高 了生产效率。最后 ,经济欠发达地区也有一些例 外 ,如云南、新疆、贵州等地的工业企业生产效率表 现优于山西、陕西 ,这是因为云南的烟草加工、新疆 的食品加工、贵州的军工企业在我们选取的各指标 上一直表现良好 ,并且在各地的整个企业中所占份 额较大。 ·21· 贵州大学学报 (自然科学版 ) 第 26卷 3 结论与展望 从以上的分析我们看出 ,由于我们选取的三个 指标 :全员劳动生产率、固定资本占有率及流动资 本占有率在因子中的得分不同 ,为我们进行分类提 供了依据。这也是文献 [ 3 ]中分类结果的主要原 因。多指标面板数据的因子分析只是面板数据在 多元统计分析中的一个方面 ,本文就平衡面板数据 的因子分析做了一些基础性的工作 ,相关的内容还 有很多 ,如非平衡面板数据 ,缺省面板数据等研究 内容更加复杂 ,有待进一步的探讨 ! 参考文献 : [ 1 ]高惠璇. 应用多元统计分析 [M ]. 北京 :北京大学出版社 , 2006: 291 - 307. [ 2 ]朱建平 ,陈民肯. 面板数据的聚类分析及其应用 [ J ]. 统计研 究 , 2007 (4) : 11 - 14. [ 3 ]郑云兵. 多指标面板数据的聚类分析及其应用 [ J ]. 数理统计 与管理 , 2008, 27 (2) : 265 - 270. [ 4 ] R ichard A Johnson, Dean W W ithem. App lied Multivariate Statisti2 cal Analysis[M ]. Beijing: China Statistics Press, 2000: 477 - 424. Factor Analysis of Panel Data WANG Pei,WANG Yan2xin, CU IW ei (College of the Science, Guizhou University, Guiyang 550025, China ) Abstract: In this paper, the factor analysis of multivariate statistics was utilized to research on panel data. And the General Score method was used to classify enterp rises from different regions of China by p roductivity. The re2 sult shows that factor analysis can get a satisfying result in line with reality. Key words: panel data; factor analysis (上接第 6页 ) [ 7 ]刘大瑾 , 周海林 , 袁东锦. AXB + CXD = F的中心对称解及其 最佳逼近的迭代算法 [ J ]. 扬州大学学报 , 2008, 11 (3) : 9 - 13. [ 8 ] A lvaro R De Pierro, W ei Mu - sheng. Some new p roperties of the eauality constrained and weighted least squares p roblem [ J ]. L inear A lgebra and its app lications, 2000, 320 : 145 - 165. [ 9 ] Yamada I. The hybrid steepest descent method for the variational inequality p roblem over the intersection of fixed point sets of nonex2 pansive mapp ings[ C ] / / Butnariu D, Censor Y, Reich S, eds. In2 herently ParallelA lgorithm for Feasibility and Op tim ization and Their App lications. London: Elsevier, 2001: 473 - 504. [ 10 ] Sun He - m ing, H iroshi Hasegawa, Isao Yamada. A multidimen2 sional associative memory neural network to recall nearest pattern from Input[ C ] / / Nonlinear Signal and Image Processing, Sappo2 ro, Japan: Nonlinear Signal and Image Processing, 2005. [ 11 ] Yamada I, Ogura N, Shirakawa, N. A numerically robust hybrid steepest descentmethod for the convexly constrained generalized in2 verse p roblem s[ C ] / / Nashed Z, Scherzer O, eds. Inverse Prob2 lem s, Image Analysis, andMedical Imaging. ContemporaryMathe2 matics , 2002, 313: 269 - 30. Algor ithm for the Optimal Approximation Solution of the Matr ix Equation HU Shan2shan, SUN He2m ing, ZHONG Q ing (College of Science, Hohai University, Nanjing 210098, China) Abstract: This paper gives an iterative algorithm to obtain the symmetric op timal app roximation solution of matrix equation AXB + CYD = E with weighted Frobenius norm by app lying the hybrid steepest descent method . In the absence of round off errors, for any initial matrix X0、Y0, the op timal app roximation solution can be obtained within finite iteration step s. In this paper, the numerical examp le verifies the feasibility of the algorithm. Key words: hybrid steepest descent method; op timal app roximation; matrix equation; least2norm solution; sym2 metric solution ·31·第 6期 王  培 等 : 面板数据的因子分析
/
本文档为【面板数据的因子分析】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索