例子(中学生身体四项指标的主成分分析)
在某中学随机抽取某年级30名学生,测量起身高(X1),体重(X2),胸围(X3)和坐高(X4),数据如下
。试对这30名中学生身体四项指标数据做主成分分析。
__ __C_5~n X1 X2 X3 X4 __ X1 X2 X3 X4
1 148 41 72 78 16 152 35 73 79 2 139 34 71 76 17 149 47 82 79 3 160 49 77 86 18 145 35 70 77 4 149 36 67 79 19 160 47 74 87 5 159 45 80 86 20 156 44 78 85 6 142 31 66 76 21 151 42 73 82 7 153 43 76 83 22 147 38 73 78 8 150 43 77 79 23 157 39 68 80 9 151 42 77 80 24 147 30 65 75 10 139 31 68 74 25 157 48 80 88 11 140 29 64 74 26 151 36 74 80 12 161 47 78 84 27 144 36 68 76 13 158 49 78 83 28 141 30 67 76 14 140 33 67 77 29 139 32 68 73 15 137 31 66 73 30 148 38 70 78
对数据的相关阵作主成分分析,有
Importance of components:
Comp.1 Comp.2 Comp.3 Comp.4
Standard deviation 1.8817805 0.55980636 0.28179594 0.25711844
Proportion of Variance 0.8852745 0.07834579 0.01985224 0.01652747
Cumulative Proportion 0.8852745 0.96362029 0.98347253 1.00000000
Loadings:
Comp.1 Comp.2 Comp.3 Comp.4
X1 -0.497 0.543 -0.450 0.506
X2 -0.515 -0.210 -0.462 -0.691
X3 -0.481 -0.725 0.175 0.461
X4 -0.507 0.368 0.744 -0.232
其中Standard deviation为主成分的标准差,即方差的开方,也就是相应的特征值的开方。Proportion of Variane表示方差的贡献率,而Cumulative Proportion表示方差的累计贡献率。 Loadings=FALSE或缺省就不列出loadings。
分析:从主成分分析结果可看出前两个主成分的累计贡献率高达96%,选择两个主成分。 *****ZXXXX,,,,,0.4970.5150.4810.50711234 *****ZXXXX,,,,0.5430.2100.7250.36821234
第一个主成分对应系数的符号都相同,其值在0.5左右,反映了中学生身材的魁梧程度,身材高
大的学生,他的四个部分的尺寸都比较大,因此第一主成分的值就较小。 而身材矮小的同学他
的四部分都比较小,第一主成分的值较大。 第一主成分为大小因子。
第二主成分是高度和围度之差,比较大表明该学生细高,比较小为“矮胖”,
称第二因子为形体因子。
看一下各样本的主成份值
Comp.1 Comp.2 Comp.3 Comp.4
[1,] 0.06990950 -0.23813701 -0.35509248 -0.266120139
[2,] 1.59526340 -0.71847399 0.32813232 -0.118056646
[3,] -2.84793151 0.38956679 -0.09731731 -0.279482487
[4,] 0.75996988 0.80604335 -0.04945722 -0.162949298
[5,] -2.73966777 0.01718087 0.36012615 0.358653044
[6,] 2.10583168 0.32284393 0.18600422 -0.036456084
[7,] -1.42105591 -0.06053165 0.21093321 -0.044223092
[8,] -0.82583977 -0.78102576 -0.27557798 0.057288572
[9,] -0.93464402 -0.58469242 -0.08814136 0.181037746 [10,] 2.36463820 -0.36532199 0.08840476 0.045520127 [11,] 2.83741916 0.34875841 0.03310423 -0.031146930 [12,] -2.60851224 0.21278728 -0.33398037 0.210157574 [13,] -2.44253342 -0.16769496 -0.46918095 -0.162987830 [14,] 1.86630669 0.05021384 0.37720280 -0.358821916 [15,] 2.81347421 -0.31790107 -0.03291329 -0.222035112 [16,] 0.06392983 0.20718448 0.04334340 0.703533624 [17,] -1.55561022 -1.70439674 -0.33126406 0.007551879 [18,] 1.07392251 -0.06763418 0.02283648 0.048606680 [19,] -2.52174212 0.97274301 0.12164633 -0.390667991 [20,] -2.14072377 0.02217881 0.37410972 0.129548960 [21,] -0.79624422 0.16307887 0.12781270 -0.294140762 [22,] 0.28708321 -0.35744666 -0.03962116 0.080991989 [23,] -0.25151075 1.25555188 -0.55617325 0.109068939 [24,] 2.05706032 0.78894494 -0.26552109 0.388088643 [25,] -3.08596855 -0.05775318 0.62110421 -0.218939612 [26,] -0.16367555 0.04317932 0.24481850 0.560248997 [27,] 1.37265053 0.02220972 -0.23378320 -0.257399715 [28,] 2.16097778 0.13733233 0.35589739 0.093123683 [29,] 2.40434827 -0.48613137 -0.16154441 -0.007914021 [30,] 0.50287468 0.14734317 -0.20590831 -0.122078819
画第一个主成分的散点图,可看出10, 11,15,29值较大,说明学生比较瘦小,而3,5,25值较小,说
明学生比较高大.
再画第二主成份的散点图,可看出较大的几个值为23,19,4,属于高瘦型, 较小的几个值为2,8,17,属于矮胖型.
第二主成份
也可画出第一主成份和第二主成份的散点图
从这个图很容易看出,那些学生属于高大魁梧型,比如25号学生,3,5号学生,那些学生属于高瘦型
比如23,19,4.等等.