null第十一章 非参数检验第十一章 非参数检验区别:区别:参数检验方法:前面学习过的t检验和方差
等,都是在假定总体为正态分布的基础上推导出来的,称为参数检验方法(parametric test).
如果总体严重偏离正态性,或还不了解其分布,即任意分布(distribution free),这时应该采用非参数检验方法 (nonparametric test).null例如要比较两个班级同学的身高,可以先让两班同学站在一起,按高矮排队后连续报数(秩),然后将两班同学分开,每个班分别将自己班上同学所报数的数字相加(秩和),再除以班级人数(平均秩),可以想象,如果两班身高相近,则排队时他们会比较均匀地交错地排在队伍中,其结果是两班所报数字的平均数(平均秩)应该是接近的.如果两班的平均秩相差很大,则有理由相信其中一个班同学的身高比另一个班高.第一节 两组配对设计的
计量资料的比较第一节 两组配对设计的
计量资料的比较假设检验方法:
符号检验
Wilcoxon符号秩检验(Wilcoxon Sign-rank Test)null例11-1. 第五章的例5-3是一个配对设计的计量资料,如果服从正态分布,则可以采用配对t检验(属于参数检验).现在假定该资料的分布类型未明,这时可以用非参数检验方法进行比较.原始数据见教材134页表11-1,原始数据在表的左边2-3列,右边的5列是假设检验用的.
注意改错:第6列|d|的排序以及第7列秩次:第1及第3行都改为10.5.
nullnullnullWilcoxon符号秩检验步骤:
1.提出检验假设
Ho:先出生与后出生体重的总体分布相同.
H1:两个总体分布不同.
检验水准alpha=双侧0.05
2.计算检验统计量(小于等于30的小样本检验统计量为R,大于30 的样本按照正态近似法其检验统计量为u)
(1)计算各对子测量值之差d=x1-x2.null(2)去掉d=0的对子后,用绝对值|d|编稚次,如果出现绝对值|d|相等时(这种现象称为结ties),则将它们的平均稚次作为稚次.
(3)把差值的正负符号标在稚次上,d>0的稚次写为+, d<0的稚次写为-.
(4)分别计算正负稚次的和R+及 R-,小样本以R为检验统计量, R=n(n+1)/4.
3.确定概率P,并作出统计学推断
在Ho成立时,即两个总体有相同的分布时,null理论上R=n(n+1)/4.当n比较小(n<30)时可以查附表11:Wilcoxon符号稚检验临界值表,得到无效假设成立的概率P值,然后作出推断.本例题R+=97.5, R-=22.5, n=15, R=n(n+1)/4=15(15+1)/4=60.
用查表法确定概率P值
查临界值:Ralpha/2(n)= R0.05/2(15)=(25,95),两端都未包括R+=97.5及 R-=22.5,或者说R+=97.5及 R-=22.5两端都在临界值之外,所以P
1.96,所以按照alpha=0.05的检验水准,拒绝无效假设,接受备择假设:两个总体分布不同.
专业推断:根据样本数据,先出生者体重大于后出生者.
注:本例题的样本量只有15对,应该用查表法,不应该用正态近似法.
第二节 两样本成组比较第二节 两样本成组比较中位数检验
Wilcoxon秩和检验(Wilcoxon Rank-sum Test)
Menn-whitney检验null在理论上检验假设H0应为两个总体分布相同,即两个样本来自同一总体。但由于秩和检验对于两个总体分布的形状差别不敏感,对于位置相同、形状不同但类似的两个总体,如均数相等、方差不等的两个正态分布,推断不出两个总体分布(形状)有差别,只能推断其两个总体分布位置是否相同。故无效假设H0可写作两个总体分布位置相同,对立的备择假设H1不能为两个总体分布不同,而只能为两个总体分布位置不同(对单侧检验可写作某个总体分布位置比另一个总体分布位置要右或要左一些)。 例11-2例11-2某医生观察中药与西药对照治疗慢性阻塞性肺疾病(COPD)的临床疗效,将22例患者随机分配到中药组和西药组,用ELISA法测得10例中药组患者和12例西药组患者的外周血中白细胞介素-8(IL-8)的疗效(治疗前后的差值),资料如下。试检验两组患者的IL-8的疗效是否有差别? 表11-2 10例中药组与12例西药组COPD患者疗后的IL-8疗效值比较 表11-2 10例中药组与12例西药组COPD患者疗后的IL-8疗效值比较 解题分析解题分析 本例属于两个随机样本的比较,经方差齐性检验,推断得两总体方差不等(F=5.11,P=0.0351<0.05),所以不能用参数检验(成组t检验),
而用非参数检验(选用Wilcoxon秩和检验)。 解题步骤: 解题步骤: 1.建立检验假设、确定检验水准α=0.05
H0:中药组与西药组COPD患者的IL-8疗效值总体分布位置相同
H1:中药组与西药组COPD患者的IL-8疗效值总体分布位置不同
2.计算u统计量(样本量小于等于10例可以用查表法;附表12)
(1)编秩:把两样本数据混合从小到大编秩。遇数据相等者分两种情况处理:①相同数据在同一组内,可不编平均秩次,如中药组有两个0.111,其秩次按位置顺序编为1、2即可;②相同数据分在两组里,则应编平均秩次,如中药组与西药组各有一个0.236,其位置顺序为9和10,故取平均秩次为(9+10)/2=9.5;
(2)求秩和:以样本例数小者为n1,其秩和(T1)为统计量T,若两样本例数相等,可任取一样本的秩和(T1或T2)为T,本例T=62.5; null(3)计算u统计量
式中(j=1,2,…),tj为第j个相同秩的个数。同组有节因未编平均稚,可不算节. 本例中 本例中 null统计学推断:
因为|u|>1.96,所以拒绝无效假设,接受备择假设,两组总体疗效值分布位置不同.
专业推断:根据样本数据,西药组的平均稚次(190.5/12)较大, COPD患者的IL-8疗效较好.第三节 多个样本之间的比较第三节 多个样本之间的比较在完全随机分组设计中,如果从多个不同的总体中分别获得随机样本,它们不滿足正态分布或虽满足正态分布,但方差不齐,可用Kruskal-Walls 法的H检验(Kruskal-Walls H test)以推断它们的总体分布位置是否存在差异。
Kruskal-Walls H 检验用于推断计量资料或等级资料的多个独立样本所来自的多个总体分布是否有差别。在理论上无效假设H0应为多个总体分布相同,即多个样本来自同一总体。由于H检验对多个总体分布的形状差别不敏感,故在实际应用中无效假设H0为多个总体分布位置相同,对立的备择假设H1为多个总体分布位置不同或不全相同。 例11-3例11-330只大鼠进行抑郁造模,造模成功后,随机分配到三个组中去。每组10只,一组给予逍遥散治疗,一组给予西药治疗,一组为空白对照。治疗前三组鼠的进水进食量假定相同.三周后测得其1小时糖水进食量,资料如下,试检验三组大鼠治疗后的糖水进食量是否有差别? 表11-3 三组大鼠糖水进食量(g)比较 表11-3 三组大鼠糖水进食量(g)比较 解题分析 解题分析 本例属于多个随机样本的比较,经方差齐性检验,推断得三个总体方差不等(F=4.08,P=0.0284<0.05),宜用非参数统计,现用Kruskal-Walls H 检验。 解题步骤:解题步骤:1.建立假设、确定检验水准α=0.05
H0:三组大鼠糖水进食量总体分布位置相同
H1:三组大鼠糖水进食量总体分布位置不同或不全相同
2.计算H 统计量
(1)编秩:把三个样本数据混合从小到大编秩。遇数据相等者分两种情况处理:①相同数据在同一组内,可不编平均秩次,如空白对照组有两个16.9,其秩次按位置顺序编为16和17即可;②相同数据分在两组里,则应编平均秩次,如西药组与空白对照组各有一个14.6,其位置顺序为5和6,故取平均秩次为(5+6)/2=5.5;
(2)求秩和:设各样本例数为ni(∑ni =N)、秩和为Ri 计算H统计量 计算H统计量 本例中 本例中 null3.确定P值
查卡方界值表卡方0.05(2)=5.99,
Hc=8.6>5.99,所以P<0.05,统计学推断:三组大鼠糖水进食量总体分布位置不同或不全相同.
根据样本数据可以做专业推断.
第三节续:多个组间的多重比较 第三节续:多个组间的多重比较 多个独立样本比较的Kruskal-Walls H检验只能总的判断各组是否来自同一总体。在H检验拒绝H0,接受H1,认为多个总体分布位置不全相同时,若要进一步推断是哪两个总体分布位置不同,可用推广了的t 检验,各组例数相等或不相等均适用。
注意:此时若采用本章第二节介绍的两个样本比较的秩和检验进行两两比较,将会加大犯Ⅰ类错误(即假阳性错误,即把本无差别的两个总体分布位置判为有差别,其概率为检验水准alpha设为0.05,做k次假设检 验,其alpha就变为1-(0.95)k ,不断增大.例11-4 对例11-3资料作三个样本间的两两比较 例11-4 对例11-3资料作三个样本间的两两比较 解题步骤:
1.建立假设、确定检验水准α=0.05
H0:任意两组大鼠糖水进食量总体分布位置相同
H1:任意两组大鼠糖水进食量总体分布位置不同
2.计算t 统计量 null(1)计算各组的平均秩次:
(2)列出两两比较的计算表:见表11-7中第(5)栏为按上述公式计算的t 值。如本例N=30,k=处理组数=3,求得校正的统计量Hc=8.6,故1与2比较时的t 值为: 表11-7 三个样本间两两比较 表11-7 三个样本间两两比较 null查t界值表,设alpha=0.05,v=N-k=30-3=27,
t0.05(27)=2.052 .
(1)与(2)比较:P>0.05
(1)与(3)比较: P<0.01
(2)与(3)比较: P<0.05
统计学推断:按alpha=0.05的检验水准拒绝无效假设,接受备择假设:
专业推断:参照样本数据做出。
第四节 Ridit分析第四节 Ridit分析Ridit 分析是Relative to identified distribution unit 的缩写,用于处理有序分类资料的一种统计分析方法。
比较所学习过的多分类资料统计分析方法:
1.行*列表资料的卡方检验:适用于双向无序多分类资料的差异性检验。null2.列联表资料的卡方检验:适用于双向有序多分类资料的相关性检验。
3. Ridit分析:适用于单向有序多分类资料的差异性检验。
SAS统计分析软件用cmh卡方检验,可以得到3项统计量,分别适用于上述3种分析结果:
1.General Association统计量;
2.Nonezero Correlation统计量。
3.Row Mean Scores Differ统计量;null
Ridit分析的用途有三:
一、样本与总体比较;
二、两组平均Ridit值比较;
三、多组平均Ridit值比较。
教材的正文只介绍了两组平均Ridit值比较,而书末要求做多组平均Ridit值比较;因此本讲义对二和三都讲. 两组平均Ridit值比较 两组平均Ridit值比较例题1. 表1是研究慢性支气管炎疗效与病程长短的关系的资料,已将病程年份分组。
表1慢支病程长短与疗效的关系
nullnull步骤:
建立检验假设,确定检验水准
无效假设:不同病程的疗效无显著差别
备择假设:不同病程的疗效有显著差别
Alpha=0.05
计算检验统计量、P值和统计学推断。
null1.将对比两组的频数合并,作为标准频数分布,计算各等级的Ridit值。
表2.表1资料各等级Ridit值计算
nullnull2.以各等级Ridit值作标准,分别计算显效组及无效组的平均Ridit值。
平均R显效=(7*0.0600+21*0.2700+25*0.5467
+29*0.8367)/ 82 =0.5368;
平均R无效=(11*0.0600+24*0.2700+13*0.5467
+20*0.8367)/ 68 =0.4556.
null3.用下方公式作各病程的疗效差别的统计学意义检验
为简化手工运算,可用近似法公式:
U=(平均R1 - 平均R2) /
[(1/12)(n1+n2)/(n1*n2)]0.5 ;代入: U=(0.5368-0.4556)/
[(1/12)(82+68)/(82*68)]0.5
=1.71
null4.统计学推断:
因为u=1.71<1.96,所以无效假设成立的概率P值>0.05,按alpha=0.05的检验水准不拒绝无效假设:各病程的疗效差别无统计学意义。
多组平均Ridit值得比较 多组平均Ridit值得比较例2.是表3资料。
表3.石苇冲剂治疗慢支病型与疗效的关系
nullnull步骤
1.建立检验假设,确定检验水准alpha=0.05;
无效假设:各病型组的总体平均Ridit值相同;
备择假设:各病型组的总体平均Ridit值不完全相同。
null2.将各组病例数按等级合并求得合计数,如65+77+42+94=278等(见表2最后一列数字)。
3.以此合计数作为标准,计算各等级Ridit
值,计算结果见表4.
表4.各等级Ridit值的计算nullnull4.计算标准组的平均Ridit值,核对计算有无错误。
标准组的R平均值=(278*0.256+51*0.559+136*0.731
+78*0.928)/ 543
=271.477/543=0.500
标准组的R平均值=0.5,说明计算无误。
null5.计算各组的平均Ridit值
平均R1=(65*0.256+18*0.559+30*0.731
+13*0.928)/126=0.482;
平均R2=
(77*0.256+16*0.559+36*0.731
+18*0.928)/147=0.488;
null平均R3=
(42*0.256+6*0.559+23*0.731
+11*0.928)/82=0.502;
平均R4=
(94*0.256+11*0.559+47*0.731
+36*0.928)/188=0.521 .
null6.作卡方检验
据数理统计学研究结果,
Χ2k-1=12∑ni(平均Ri-0.5)2 近似服从自由度为k-1的Χ2分布,这里K为组数。
本例, Χ2k-1=12[126(0.482-0.5)2
+147(0.488-0.5)2 +82(0.502-0.5)2
+188(0.521-0.5)2 =1.742736
null本例为4组,k=4,自由度=4-1=3,查Χ2界值表: Χ20.05(3)=7.815,
7.求P值并做统计学和专业推断:
因为Χ2k-1=1.74 < Χ20.05(3)=7.815,
所以无效假设成立的概率P值>0.05,
四组病型的疗效差别无统计学意义。