非参数统计期末九道题(手算 机算)非参数统计
—期末九题汇总
目录
1.单样本Wilcoxon符号秩检验(SAS)……………………2
2.Wald-Wolfowitz游程检验法………………………………4
3.两样本的Kolmogorov-Smirnov检验………………………5
4.两个独立样本的M-W-W检验(SAS)………………………6
5.k个样本的
检验……………………………………………9
6.k个独立样本的Kruskal-Wallis检验(R)…………………10
7.k个相关样本的Friedman检验(R)………………………11
8.k个相关样本的...
非参数统计
—期末九题汇总
目录
1.单样本Wilcoxon符号秩检验(SAS)……………………2
2.Wald-Wolfowitz游程检验法………………………………4
3.两样本的Kolmogorov-Smirnov检验………………………5
4.两个独立样本的M-W-W检验(SAS)………………………6
5.k个样本的
检验……………………………………………9
6.k个独立样本的Kruskal-Wallis检验(R)…………………10
7.k个相关样本的Friedman检验(R)………………………11
8.k个相关样本的Cochran Q检验……………………………12
9.完全秩评定的Kendall协和系数(R)……………………14
1.单样本Wilcoxon符号秩检验(SAS)
设
是对称的连续型分布的中位数,现随机抽查了10名普通男子的血压如下:
98 160 136 128 130 114 123 134 129 107
试用Wilcoxon符号检验法检验假设
:
=130,
:
130,显著性水平为
=0.05。
解
手算:
i)秩次和计算
编号
血压(x)
D=x-130
的秩
D的符号
1
98
-32
32
9
-
2
160
30
30
8
+
3
136
6
6
4
+
4
128
-2
2
2
-
5
130
0
0
6
114
-16
16
6
-
7
123
-7
7
5
-
8
134
4
4
3
+
9
129
-1
1
1
-
10
107
-23
23
7
-
ii)根据表中D的符号和
的秩,可以计算得到
=9+2+6+5+1+7=30
=8+4+3=15
根据n=9,
=15,
=30,查表得
的右尾概率为0.213,P=0.213
2=0.426,P值相对于显著性水平
=0.05已足够大,因此抽查数据不拒绝
,即认为
=130。
机算:SPSS
输出结果
表1 Ranks
N
Mean Rank
Sum of Ranks
y - x
Negative Ranks
6a
5.00
30.00
Positive Ranks
3b
5.00
15.00
Ties
1c
Total
10
表2 Test Statisticsb
y – x
Z
-.889a
Asymp. Sig. (2-tailed)
.374
Exact Sig. (2-tailed)
.426
Exact Sig. (1-tailed)
.213
Point Probability
.033
a. Based on positive ranks.
b. Wilcoxon Signed Ranks Test
表1显示:y-x的负秩即满足y
3的为3,同分的既满足x=y的为1,总共10。并且负秩和30,正秩和15。
表2显示:Z=-0.889,是以负秩为基础计算的结果,其相应的双侧渐进显著性概率为0.426>0.05,因此在
=0.05的显著性水平下没有理由拒绝原假设,即认为
=130。
SAS:
程序:
data work.wilcoxon ;
input m1 m2;
d=m1-m2;
cards;
98 130
160 130
136 130
128 130
130 130
114 130
123 130
134 130
129 130
107 130
;
proc univariate data=work.wilcoxon normal;
var d;
run;
结果:
机算结果与手算结果一致。
2. Wald-Wolfowitz游程检验法
有低蛋白和高蛋白两种料喂养大白鼠,以比较它们对大白鼠体重的增加是否有显著不同的影响,为此对m=10,n=10只大白鼠分别喂养低蛋白和高蛋白两种饲料,得增重量X,Y(单位:g)的表如下:
饲料
增重量
低蛋白X
64
71
72
75
82
83
84
90
91
96
高蛋白Y
42
52
61
65
69
75
78
78
78
81
给定显著性水平
=0.05,试用游程检验法检验两种饲料的影响有无显著差异。
解
手算:
设喂养低蛋白、高蛋白的大白鼠体重增加量为X,Y,其分布函数为F(x),G(x),若饲料对增加重量无影响,即F(x)与G(x)应一致,故
i)提出假设
:F(x)=G(x),
: F(x)
G(x);
ii)
=0.05,m=10,n=10;
iii)将X,Y的数据按从小到大混合排列,得X,Y的混合样本序列:
Y Y Y X Y Y X X X Y Y Y Y Y X X X X X X
故得游程总数U=3+3=6,查表,m=10,n=10,U=6的概率为0.019,这对于显著性水平0.025(给定显著性水平
=0.05,该问题为双侧检验,故取
=0.025比较)已足够大,因此数据不拒绝
,认为两种饲料的影响无显著差异。
机算:
:
1)选项为Analyze-Nonparametric Tests-2 Independent Samples。
2)把变量(x)选入Test Variable List;再把用1和2分类的变量y输入到Grouping Variable,在Define Groups输入1和2。
3)在Test Type选中Wald-Wolfowitz runs。
在点Exact时打开的对话框中可以选择ASYMTOTIC ONLY,最后OK即可。
输出结果:
Frequencies
y
N
x
1
10
2
10
Total
20
Test Statisticsb,c
Number of Runs
Z
Exact Sig. (1-tailed)
x
Minimum Possible
6a
-2.068
.019
Maximum Possible
8a
-1.149
.128
a. There are 1 inter-group ties involving 2 cases.
b. Wald-Wolfowitz Test
c. Grouping Variable: y
机算得出的P值与手算结果一致。
3.两样本的Kolmogorov-Smirnov检验
甲乙两台机床加工相同规格的主轴,从这两台机床所加工的主轴中分别随机的抽取7个,然后测量他们的外径(单位:mm)得数据如下:
机床
主轴外径尺寸
甲(X)
20.5
19.8
19.7
20.4
20.1
20.0
19.0
乙(Y)
19.7
20.8
20.5
19.8
19.4
20.6
19.2
试用Kolmogorov-Smirnov检验法来判断两台机床加工的主轴外径是否有显著差异。
解
手算:
假设组为:
:F(x)=G(x),
:F(x)
G(x),F(x),G(x)分别为甲,乙两台机床加工的主轴外径尺寸X与Y的分布函数。
检验统计量D的计算表
机床分组(x)
绝对频数
累积频数
经验分布函数
19
1
0
1
0
1/7
0
1/7
19.2
0
1
1
1
1/7
1/7
0
19.4
0
1
1
2
1/7
2/7
1/7
19.7
1
1
2
2
2/7
2/7
0
19.8
1
1
3
4
3/7
4/7
1/7
20
1
0
4
4
4/7
4/7
0
20.1
1
0
5
4
5/7
4/7
1/7
20.4
1
0
6
4
6/7
4/7
2/7
20.5
1
1
7
5
1
5/7
2/7
20.6
0
1
7
6
1
6/7
1/7
20.8
0
1
7
7
1
1
0
检验统计量D=max
。m=7,n=7,
的拒绝域为D>
=
=0.7269,由表知D=2/7=0.286<0.7269,所以不拒绝
,认为两台机床加工的主轴外径无显著差异。
机算:
步骤:
1)选项为Analyze-Nonparametric Tests-2 Independent Samples。
2)把变量(x)选入Test Variable List;再把用1和2分类的变量y输入到Grouping Variable,在Define Groups输入1和2。
3)在Test Type选中Kolmogorov-Smirnov。
在点Exact时打开的对话框中可以选择精确(Exact),Monte Carlo抽样方法(Monte Carlo)或用于大样本的渐近方法(Asymptotic only)。最后OK即可。
输出结果:
Frequencies
Y
N
x
1
7
2
7
Total
14
Test Statisticsa
x
Most Extreme Differences
Absolute
.286
Positive
.286
Negative
-.143
Kolmogorov-Smirnov Z
.535
Asymp. Sig. (2-tailed)
.938
Exact Sig. (2-tailed)
.916
Point Probability
.388
a. Grouping Variable: y
机算结果与手算结果一致。
4.两个独立样本的M-W-W检验(SAS)
某航空公司的CEO注意到飞离亚特兰大的飞机放弃预定座位的旅客人数在增加,他特别有兴趣想知道,是否从亚特兰大起飞的飞机比从芝加哥起飞的飞机有更多的放弃预定座位的旅客。获得一个从亚特兰大起飞的9次航班和从芝加哥起飞的8次航班上放弃预定座位的旅客人数样本,见表中的第2列和第4列所示。(
=0.05)
次数
放弃人数
秩
放弃人数
秩
1
51
13
40
4
2
42
6
47
11
3
45
9
36
1
4
48
12
39
3
5
52
14
37
2
6
44
8
46
10
7
58
16
43
7
8
41
5
55
15
9
61
17
秩和
100
53
解
手算
如果假定放弃预定座位旅客人数的总体是正态分布且有相等的方差,我们可以采用两样本比较的t检验。但航空公司的CEO认为这两个假设条件不能满足,因此采用非参数的Wilcoxon秩和检验。
:两组放弃预定座位旅客人数的分布是相同的。
m=8,n=9,
=53,
=100;查表知P=0.037
给定显著性水平
=0.05,由于是双边检验,P=0.037>
=0.025,所以不能拒绝原假设。
机算(SPSS):
Ranks
y
N
Mean Rank
Sum of Ranks
x
1
9
11.11
100.00
2
8
6.62
53.00
Total
17
Test Statisticsb
x
Mann-Whitney U
17.000
Wilcoxon W
53.000
Z
-1.828
Asymp. Sig. (2-tailed)
.068
Exact Sig. [2*(1-tailed Sig.)]
.074a
Exact Sig. (2-tailed)
.074
Exact Sig. (1-tailed)
.037
Point Probability
.008
a. Not corrected for ties.
b. Grouping Variable: y
机算结果与手算一致。
(SAS):
data temp;
do group=1 to 2;
input n;
do i=1 to n;
input x @@;
output;
end;
end;
cards;
9
51 42 45 48 52 44 58 41 61
8
40 47 36 39 37 46 43 55
;
proc npar1way data=temp wilcoxon;
class group;
var x;
run;
程序说明:建立输入数据集temp,先输入本组数据的总数,然后输入组中每个数据。分组变量为group,共有两组取值为1和2。输入变量为x,存放每组中的数据。过程步调用npar1way过程,后面用选择项wilcoxon要求进行wilcoxon秩和检验。如果两组样本是配对样本,应该使用配对t检验或wilcoxon符号检验,因为使用wilcoxon秩和方法,将损失配对信息。class语句后给出分组变量名group,var语句后给出要分析的变量x。主要结果见下表。
用npar1way过程进行Wilcoxon秩和检验的输出结果
结果说明: Wilcoxon两样本秩和统计量(较小的秩和)S=53.0000,正态近似检验统计量Z=-1.7802(连续性修正因子为0.5,加在分子上),正态分布的单尾p值之和为0.0375,不能拒绝原假设。
5.k个样本的
检验
观察三种药物A,B,C治疗心绞痛的效果,得下表数据:
例
疗
显效
有效
无效
合计
数
效
药
剂
A
15(12.4)
37(36.6)
7(10.0)
59
B
11(15.1)
48(44.6)
13(12.2)
72
C
16(14.5)
39(42.8)
14(11.7)
69
合计(
)
42
124
34
200
0.21
0.62
0.17
1
试根据所得资料说明三种药物的疗效有无显著差异?(给定显著性水平
=0.05)
解
手算:
i)提出假设
:三种药物疗效相同,
: 至少有两种药物疗效显著不同;
ii)
=0.05,r=3,k=3,;
iii)
的拒绝域:
>
=9.488;
iv)先求出数据相应的理论期望函数,
,标记在上表()中,如
=
=59*42/200=12.4,同理可得
……
则Q=3.813<
=9.488
故不拒绝
,即从已有资料看不出三种药物的疗效有显著差异。
机算:
输出结果
Case Processing Summary
Cases
Valid
Missing
Total
N
Percent
N
Percent
N
Percent
x * y
200
100.0%
0
.0%
200
100.0%
x * y Crosstabulation
Count
y
Total
1
2
3
x
1
15
37
7
59
2
11
48
13
72
3
16
39
14
69
Total
42
124
34
200
Chi-Square Tests
Value
df
Asymp. Sig. (2-sided)
Pearson Chi-Square
3.823a
4
.430
Likelihood Ratio
3.988
4
.408
Linear-by-Linear Association
.845
1
.358
N of Valid Cases
200
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 10.03.
6.k个独立样本的Kruskal-Wallis检验(R)
有3个不同的减肥饮食疗法(A,B,C),人们希望知道这三种方法之间有没有效果上的区别。为此,把7个人分成3组,每组试一种方法。一个疗程后减去的重量列在下表中。
A
B
C
10
6
4
3
15
5
20
解
手算:
减去的重量的等级
A
B
C
5
4
2
1
6
3
7
合计(
)
6
17
5
建立的假设组为
:
,
:
中至少有两个不等;
显著性水平
=0.05,df=k-1=2,临界值
=5.99,显然H=3.179<
=5.99,数据在5%的显著性水平上不能拒绝
,表明3种减肥疗法没有显著差异。
机算:
Ranks
plan
N
Mean Rank
loseweight
A
2
3.00
B
3
5.67
C
2
2.50
Total
7
Test Statisticsa,b
loseweight
Chi-Square
3.179
df
2
Asymp. Sig.
.204
a. Kruskal Wallis Test
b. Grouping Variable: plan
结果表明,Kruskal-Wallis H统计量的渐进分布
=3.179,相应的p值大于给定的显著性水平0.05,没有理由拒绝零假设,与手算结果一致。
R:
x=c(10,3,6,15,20,4,5)
y=c(1,1,2,2,2,3,3)
kruskal.test(x,y)
输出结果:
机算结果与手算结果一致。
7.K个相关样本的Friedman检验(R)
下表是美国三大汽车公司(A:通用,B:福特,C:克莱斯勒,作为三个处理)的五种不同尺寸的车(I:超小型,II:小型,III:中型,IV:大型,V:运动型,作为五个区组)某年产品的油耗及在相应区组中的秩(括号中)为
I
II
III
IV
V
合计(
)
A
20.3(1)
21.2(1)
18.2(1)
18.6(1)
18.5(1)
5
B
25.6(3)
24.7(3)
19.3(2)
19.3(2)
20.7(2)
12
C
24.0(2)
23.1(2)
20.6(3)
19.8(3)
21.4(3)
13
检测三个公司的汽车油耗是否有显著差异。
解
手算:
假设组为
:
,
:
中至少有两个不等;
给定显著性水平0.05,自由度df=3-1=2,查表得临界值
=5.99。显然
=7.6>
=5.99,因此拒绝
,三个公司产的汽车油耗有显著差异。
机算:
Ranks
Mean Rank
A
1.00
B
2.40
C
2.60
Test Statisticsa
N
5
Chi-Square
7.600
df
2
Asymp. Sig.
.022
a. Friedman Test
机算结果与手算结果一致。
SAS:
d=read.table("C:/R/Friedman.txt")
friedman.test(as.matrix(d))
输出结果:
8.K个相关样本的Cochran Q检验
在一个防水试验中,有四个处理方法(A,B,C,D)及六种纤维(I,II,III,IV,V,VI)作为区组,结果只有满意(用0表示)及不满意(用1表示)两种,列于下表中
处理
区组
合计(
)
I
II
III
IV
V
VI
A
1
1
1
1
1
1
6
B
1
1
0
1
1
1
5
C
0
0
0
1
0
0
1
D
0
1
0
0
1
1
3
合计(
)
2
3
1
3
3
3
15
检验六种纤维的防水性是否有显著差异。
解
手算:
假设组为
:
,
:
中至少有两个不等;
给定显著性水平为0.05,df=6-1=5,
=11.07,显然,Q=5.526<
=11.07,因而不能拒绝
,即六种纤维的防水性没有显著差异。
机算:
Frequencies
Value
0
1
I
2
2
II
1
3
III
3
1
IV
1
3
V
1
3
VI
1
3
Test Statistics
N
4
Cochran's Q
5.526a
df
5
Asymp. Sig.
.355
a. 1 is treated as a success.
机算结果与手算结果一致。
9.完全秩评定的Kendall协和系数
有人在研究某种病的病人的社会能力和其智力的关系时,了如下的数据
人
1
2
3
4
5
6
智力
45
26
20
40
36
23
社会能力
63.7
0.1
15.6
101.2
25.4
1.8
试问这两者相关吗?
解:
手算:
病人的社会能力和其智力评定的秩
人
1
2
3
4
5
6
智力
6
3
1
5
4
2
社会能力
5
1
3
6
4
2
秩和(
)
11
4
4
11
8
4
W值比较大,表明病人的社会能力和智商的相关程度比较高。
机算:
Ranks
Mean Rank
ill1
5.50
ill2
2.00
ill3
2.00
ill4
5.50
ill5
4.00
ill6
2.00
Test Statistics
N
2
Kendall's Wa
.857
Chi-Square
8.571
df
5
Asymp. Sig.
.127
a. Kendall's Coefficient of Concordance
机算结果与手算结果一致。
R:
d=read.table("C:/R/Kendall.txt")
R=apply(d,2,sum)
m=nrow(d)
n=ncol(d)
S=sum((R-m*(n+1)/2)^2)
W=12*S/m^2/(n^3-n)
W
输出结果:
[1] 0.8572
机算结果与手算结果一致。
本文档为【非参数统计期末九道题(手算 机算)】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑,
图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。