方差分析中离差平方和的简化计算
?
652?中国卫生统计2008年l2月第25卷第6期 方差分析中离差平方和的简化计算
南方医科大学公共卫生与热带医学学院生物统计学系(51O515)庄严陈平雁?
方差分析(ANOVA)是数据处理中应用极为广泛 的统计方法,也是医学统计学教学的重点和难点.依 据现有国内外教材,讲授方差分析时,通常会根据不同 设计模型介绍方差分析的计算过程,而且每种模型都 会给出相应的方差分析计算
,于是就有了方差分析 的计算公式众多,计算过程复杂,而且不同教科书的计 算公式符号也不尽相同的印象,由此产生了方差分析 难学的心理,同时由于计算问题的困扰影响了学生对 方差分析核心内容的根本把握.针对上述问题,我们 提出一种适合于各种设计模型的方差分析中计算离差 平方和的简化公式.
简化方法
所有设计模型的方差分析计算结果可用以下四个 公式求得.
总变异:总变异的离差平方和及自由度按式(1)计 算,
SS丁=?X一C,丁=N一1(1)
式中,?X为所有观察值平方的和,C为校正数,N 为样本量.
C:(?x)/N(2)
式中,(?x)为所有观察值和的平方.
组间变异:某因素y的离差平方和,自由度及均
方均可按式(3)计算,可视为方差分析计算的通式. ssy:?一c
vy=一1
MSr=SSy/Vy(3)
式中,?X表示某因素Y的第i个水平的合计,表 示某因素y的第i个水平的样本量,表示某因素y的 水平数.
误差变异:误差变异的离差平方和,自由度及均方 按式(4)计算,
SSE=SST一?SSy
__,
VEVT—2.5Vy
MSE=SSs/VE(4)
A通讯作者:陈平雁
式中,?SSy与?y分别为所有因素组合的离差平 方和与自由度之和.
举例
下面列举完全随机设计,随机区组设计,析因设 计,重复测量设计的实际数据各一,主要说明离差平方 和的计算过程.与方差分析有关的其他计算(如自由 度,均方和F值),因篇幅所限在此略去.
1.完全随机设计
【例1】在某一大肠湿热证模型研制中,测得4种 模型大鼠的血清白细胞介素一2(IL一2)浓度见表1, 试比较不同大鼠模型的IL一2浓度有无差异. 表1不同大鼠模型血清IL一2浓度(ng/m1)的比较 0.15
0.00
0.40
0.0O
离差平方和可分解为:SST=SSy+SSE.依据式 (1),式(4)求得:
C:(?/=
=
69.2057
SST=?X一C=91.1016—69.206 =
21.8956
ssy:?一c
—Q!211.02.2.1488.2.2652=一..
4--,+一,一
48'8'8
69.2057
=17.1719
SSE=SST一?SSy=2250.02—1433.95 =816.07
2.随机区组设计
【例2】为研究不同卡环对牙齿的固定效果,以6 颗取自新鲜尸体的牙齿为试验对象.每颗牙齿同时随 机在不同部位固定三种卡环,测试抗拉强度.结果见 卯?卯
22222122
B?
12222222
卯?
0l10O11l
Chinese]ournaloIHealthStatistics,Dec2008,o1.21
表2,试比较三种卡环的抗拉强度有无差异.
表2三种不同卡环的抗拉强度(牛顿)
离差平方和可分解为:
asT:SSv(~N)+SSy(配伍)+SSE.
依据式(1),式(4)求得:
c:(?x)./=1342=997,56 SST=?x一C=1052.32—997.56
=
54.76
ssy处理:?一c
:
譬++一997.56一.719956971—+T+下一?' ssy配伍:?一c
:十…+一997.56:40.59
SSE=SST一(SSy(~N)+SSy(配伍))
=54.76一f9.71十40.59)=4.46 3.析因设计
【例3】为研究药物治疗附加磁场对人体内磁性物 质分布的影响,安排两个药物组:实验组为"丝裂霉素 +高分子物质+磁性物质+磁场",对照组为"丝裂霉 素+高分子物质+磁性物质".每组分别于给药后15 分钟和60分钟处死实验动物小鼠,检测小鼠肝脏组织 的磁性物质浓度,即铁浓度(mg/g).采用2×2平衡 设计,一个因素为药物(A),有2个水平,即实验组 (A1)和对照组(A2);另一个因素为给药后时间(B),亦 有2个水平,即15min(B1)和60min(B2).两个因素有 4种组合,每种组合重复例数为6.实验结果见表3, 试分析之.
表3小鼠肝脏组织的铁浓度(mg)检测结果 试验组(AI)对照组(A2)
15min(B1)60min(B2)15rain(BI)60min(132)
?
653?
表4例3
各因素和水平组合的合计 离差平方和司分解为:
SST=SSy(A)+SSy(B)+SSy(AxB)+SSe
依据式(1),式(4)求得:
c=(?/==10-454
SS丁=?x一C=12.213—10.454 =1.759
SSy(A)=
SSy(A)=
10.2225.
12'
?(?xj)
一
C
-10.454883
一
C
:+.454-0.727—+———一u?44u? SSy(A×B)=SSytaB)一SSy(A)一SSy(B)
=
?l'J
(?x,
ni.
j
—
C—SSy(A)一SSy(B)
3.72526.4972.1063.512————一
一—,一一一一
6
一
C—SSy(a)一SSy(m=0.078
SSE=SST一(SSy(A)+SSy(m+SSy(A+B))
=1.759一(0.883+0.727+0.078) =0.071
4.重复测量设计
【例4】将12只杂种犬随机分为两组,一组用海水 灌注右肺(A组),另一组用海水灌注全肺(B组),每组 6只.每只动物分别于海水灌注前以及灌注后5min, 30rain,60rain,120rain检测氧分压Pa02(kPa),结果见 表5,试分析之.
离差平方和可分解为:
SST=SSy(个体间)+SSy(个体内)
依据式(1),式(4)求得:
C=(?x)/N=3607.42/60=216888.9127
SS丁=X2一C
=237206.64—216888.9127=20317.7273
SSy&t~)
SSy(个体内)
=-
{-(348+336+…+244)一C
=
3958.5473(12个个体,每个个体有
5个观察值)
=
SST—SSy(个体间)
:237206.64,3958.5473=
16359.1800
?
654?中国卫生统计2008年12月第25卷第6期 表5海水灌注前后两组杂种犬的Pa02(kPa)测定结果 对于ssy(个体间),进一步分解为处理间与相应的误差 项(E1),即
SSy(个体间)=SSy(处理)+SSEa
SSy(=20382
+一c
:3659.7660
SSE1=SSy(+t~N)一SSy(处理)
=
3958.5473—3659.7660=298.7813 对于ssy(个体内),进一步分解为重复因素间,处理与重 复因素的交互项与相应的误差项(E2),即
SSy(个体内)=SSy(重复)+SSy(~×处理)+SSE2 ssy(重复)=~(1O77+732.1+618+ 559.2+621.12)一C=14468.859(5 个重复水平,每个水平12个观察值)
SSyc~t×处理1=~-(538+428+L+250.12)
一
C—SSy(处理)一SSy(重复)
944.239(10种交互组合,每种组合
6例)
SSE2=sSy(个体内)一(SSy(重复)+SSy(重复×处理)) =16359.1800一(14468.859+944.239)= 946.082
方差分析的完整结果见表6和表7
表6例4重复测量方差分析表(1)
重复测量14468.85904
交互效应944.23904
误差946.082040
总和16359.180048
1.907
1.907
19.068
152.93
9.98
结语
由以上实例见,只要将计算离差平方和的通式 SSy=?(?x)一
c交代清楚,方差分析的计算
就变得相当简单了.于是,方差分析的讲授可围绕方 差分析的基本思想,将重点放在变异(及自由度)的分 解上,而变异的计算通过简化的公式实现,将有助于学 生对方差分析内容全面和灵活的掌握,达到融汇贯通 的效果.
姗