SPSS典型相关分析
SPSS数据统计分析与实践
主讲:周涛 副教授
北京师范大学资源学院
教学网站:http://www.ires.cn/Courses/SPSS
第二十二章:典型相关分析
(Canonical Correlation)
典型相关分析(Canonical Correlation)
本章内容:
一、典型相关分析的基本思想
二、典型相关分析的数学描述
三、SPSS实例
四、小节
典型相关分析的基本思想
z 典型相关分析是研究两组变量之间相关关系的一种多
元统计方法。
z 简单相关系数;复相关系数;典型相关系数...
SPSS数据统计分析与实践
主讲:周涛 副教授
北京师范大学资源学院
教学网站:http://www.ires.cn/Courses/SPSS
第二十二章:典型相关分析
(Canonical Correlation)
典型相关分析(Canonical Correlation)
本章内容:
一、典型相关分析的基本思想
二、典型相关分析的数学描述
三、SPSS实例
四、小节
典型相关分析的基本思想
z 典型相关分析是研究两组变量之间相关关系的一种多
元统计方法。
z 简单相关系数;复相关系数;典型相关系数
z 典型相关分析首先在每组变量中找出变量的线性组合,使其
具有最大相关性;
z 然后再在每组变量中找出第二对线性组合,使其与第一对线
性组合不相关,而第二对本身具有最大相关性;
z 如此继续下去,直到两组变量之间的相关性被提取完毕为
止;
z 这些综合变量被称为典型变量(canonical
variates);第I对典型变量间的相关系数则被称为第I
典型相关系数(一般来说,只需提取1~2对典型变
量即可较为充分的概括样本信息)。
典型相关分析的目的
T
q
T
p
YYYY
XXXX
),,,(
),,,(
21
21
K
K
=
=设两组分别为p与q维
(p≤q)的变量X,Y:
设 p + q 维随机向量 协方差阵 ,⎟⎟⎠
⎞
⎜⎜⎝
⎛=
Y
X
Z ⎟⎟⎠
⎞
⎜⎜⎝
⎛
ΣΣ
ΣΣ=Σ
2221
1211
其中Σ11是X的协方差阵,Σ22是Y的协方差阵,Σ12=ΣT21是X,Y的协
方差阵
典型相关分析用X和Y的线性组合U=aTX, V=bTY之间的相关
来研究X和Y之间的相关性。其目的就是希望找到向量a和
b,使ρ(U,V)最大,从而找到替代原始变量的典型变
量U和V。
典型相关分析的数学描述
z 典型相关系数的数学定义为:
bbaa
ba
VVarUVar
VUCovVU
TT
T
2211
12
)()(
),(),( ΣΣ
Σ==ρ
由于随机变量乘以常数不改变其相关系数,为防止不必要的结果重复出
现,最好在其中附加如下的约束条件:
1)(
1)(
22
11
=Σ=
=Σ=
bbVVar
aaUVar
T
T
记 , ,则有2112212111 ΣΣΣΣ= −−A 1211121122 ΣΣΣΣ= −−B bBbaAa 22 , λλ ==
其中 既是A又是B的特征根,a和b就是对应于A和B的特征
向量。
2λ
SPSS实例
为研究运动员体力与运动能力的关系,对某
高一年级男生38人进行体力测试(共7项指
标)及运动能力测试(共5项指标)。
运动能力测试指标:
Y1 50米跑(秒)
Y2跳远(cm)
Y3投球(m)
Y4引体向上(次)
Y5耐力跑(s)
体力测试指标:
X1反复横向跳(次)
X2纵跳(cm)
X3背力(kg)
X4握力(kg)
X5台阶试验(指数)
X6立定体前屈(cm)
X7俯卧上体后仰
(cm)
SPSS实例
SPSS操作
z SPSS采用’Canonical correlation.sps’宏程序
来实现。
输出结果解释-两组变量间的相关系数
SPSS在三个方框中分别输出的是体力测试指标内部的
相关系数、运动能力测试指标内部的相关系数,以及
两组指标间的相关系数
由体力测试指标内部相关系数看,各指标间相关系数较小,即指标间没有多
大的重复。如果两个指标相关系数很大,可能这两个指标反映的是同一个方
面,可以考虑合并。
输出结果解释-两组变量间的相关系数
SPSS在三个方框中分别输出的是体力测试指标内部的
相关系数、运动能力测试指标内部的相关系数,以及
两组指标间的相关系数
运动能力测试指标间的相关系数也比较类似(各指标间的相关系数较小),
不过y2(跳远)和y4(引体向上)之间的相关系数较大,达到0.6067
输出结果解释-两组变量间的相关系数
SPSS在三个方框中分别输出的是体力测试指标内部的
相关系数、运动能力测试指标内部的相关系数,以及
两组指标间的相关系数
上表输出的是体力与运动能力之间的相关系数,从二者直接相关系数看,
只有X2(纵跳)和y2(跳远)之间关联程度较大(R=0.5584),而其他体
力指标和运动能力指标间的直接关联不大,更多的可能是综合影响。
由于变量间的交互作用,因此,这个简单相关系数矩阵只能作为参考,不
能真正反映两组变量间的实质联系。
典型相关系数及显著性检验
第一典型相关系数为0.763,第二典型相关系数为0.706,第
三典型相关系数为0.607,它们均比体力指标和运动能力指标
两组间的任一个相关系数大,即综合的典型相关分析效果要
好于简单相关分析。
典型相关系数及显著性检验
由于此处的典型相关系数是从样本数据算得的,和简单
相关系数一样,有必要进行总体系数是否为0的假设检
验。此处采用的是Bartlett的χ2检验,零假设为对应的典
型相关系数为0。
上面的输出结果表明:在α=0.05的情况下,第一与第
二典型相关系数是显著的。
典型变量的系数-体力变量
原始变量(Raw Canonical
Coefficients)的典型相关变量
的换算系数
标准化变量(Standardized
Canonical Coefficients)的典型
相关变量的换算系数
e.g. 来自体力指标的第一典型变
量的
为:
U1=0.314X1 + 0.628X2 +
0.295X3 + 0.309X4 + 0.335X5
+ 0.033X6 + 0.077X7
典型变量的系数-运动能力变量
来自运动能力指标的第一典型变
量的计算公式为:
V1= -0.578y1 + 0.299y2 +
0.199y3 + 0.228y4 + 0.033y5
在第一对典型变量中,大部分变
量的系数都比较均匀,无论是体
力变量还是运动能力指标的系数
都表明,其测试结果越好,泽表
明其综合运动能力越强,可以解
释为全面能力程度。
典型变量的系数-运动能力变量
来自于体力指标的第二典型变量为:
U2 = 0.171X1-0.463X2 + 0.005X3 + 0.155X4
+0.841X5 + 0.146X6 - 0.390X7
来自于运动能力指标的第二典型变量为:
V2 = -0.753y1 – 1.087y2 -0.267y3
+ 0.038y4 – 0.882y5
在对二对典型变量中,在体力指标中X2(纵跳)和X5
(台阶试验)的系数较大,在运动能力指标中y1(50
米跑)、y2(跳远)和y5(耐力跑)的系数较大,所
以第二对典型变量可以解释为腿部能力的关系,表示
跑和跳的能力。
本文档为【SPSS典型相关分析】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑,
图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。