Spass16.0与统计数据分析
实验报告
实验课程:专业统计软件运用
上课时间: 2012 学年 上 学期 16 周 ( 2012 年 06 月 04 日 —07日)
姓名: 花满楼
学号: 2010201101
班级: 0301008班
学院: 经济管理学院
上课地点: 经管实验室五楼
指导教师: 刘 进
第六章实验
一 实验1及目的
1. 某农场为了比较4种不同品种的小麦产量的差异,选择土壤条件基本相同的土地,分成16块,将每一个品种在4块试验田上试种,测得小表亩产量(kg)的数据如表6.17所示(数据文件为data6-4.sav),试问不同品种的小麦的平均产量在显著性水平0.05和0.01下有无显著性差异。(数据来源:《SPSS实用统计分析》 郝黎仁,中国水利水电出版社)
表6.17 小麦产量的实测数据
品种
A1
A2
A3
A4
产量
277.5
244.2
249.2
273
276.4
249.5
244.2
240.9
271
236.8
252.8
257.4
272.4
239
251.4
266.5
二 实验内容
解决问
1的原理:单因素方差分析
实验步骤:1.打开数据文件data6-4.sav
2.选择analyze—compare means—one-way ANOVA
3.dependent list 框里为产量,factor为品种
4.在options中选择homogeneity of variance test和exclude cases analysis by analysis
5.在post hoc按钮里选择LSD
,改变相关系数为0.05和0.01
6.得出结果
三 结果分析
1.实验结果图如下
Test of Homogeneity of Variances
产量
Levene Statistic
df1
df2
Sig.
3.593
3
12
.046
ANOVA
产量
Sum of Squares
df
Mean Square
F
Sig.
Between Groups
2263.482
3
754.494
12.158
.001
Within Groups
744.715
12
62.060
Total
3008.197
15
2.数据分析:在0.05和0.01显著性水平下,H0假设都是:方差相等,从上表中可以看出Sig.=0.046,小于0.05大于0.01,所以在0.05的显著性水平下不接受H0假设,即有显著性差异,但是在0.01的显著性水平下接受H0假设,即无显著性差异。
一 实验2及目的
2. 某公司希望检测四种类型的轮胎A,B,C,D的寿命(由行驶的里程数决定),见表6.18(单位:千英里)(数据文件为data6-5.sav),其中每种轮胎应用在随机选择的6辆汽车上。在显著性水平0.05下判断不同类型轮胎的寿命间是否存在显著性差异?(数据来源:《统计学(第三版)》,M.R.斯皮格尔,科学出版社)
表6.18 四种轮胎的寿命数据
A
33
38
36
40
31
35
B
32
40
42
38
30
34
C
31
37
35
33
34
30
D
29
34
32
30
33
31
二 实验内容
解决问题2的原理:单因素方差分析
实验步骤:1.打开数据文件data6-5.sav
2.选择analyze—compare means—one-way ANOVA
3.方差相等的齐性检查。将“历程”、“轮胎”分别移入Dependent List以及Factor。点击Options按钮,选中Homogeneity of variance test(方差齐性检验),而后运行
4.多重分析比较。在One-way NOVA中单击Post Hoc…按钮,选择LSD方法,显著性水平取0.05,单击 Options按钮,选中Descripive和Means plot,对数据进行整体描绘
5.得出结果。
三 结果分析
1.数据截图
Test of Homogeneity of Variances
里程
Levene Statistic
df1
df2
Sig.
3.088
3
20
.050
ANOVA
里程
Sum of Squares
df
Mean Square
F
Sig.
Between Groups
77.500
3
25.833
2.388
.099
Within Groups
216.333
20
10.817
Total
293.833
23
2:数据分析:在0.05显著性水平下,H0假设是:方差相等,从上表中可以看出Sig.=0.050,等于于0.05,所以在0.05的显著性水平下接受H0假设,说明没有显著性差异。
一 实验3及目的
3. 某超市将同一种商品做3种不同的包装(A)并摆放在3个不同的货架区(B)进行销售试验,随机抽取3天的销售量作为
,具体资料见表6.20。要求检验:在显著性水平0.05下商品包装、摆放位置及其搭配对销售情况是否有显著性影响。(数据来源:《应用统计学》 耿修林,科学出版社;数据文件:data6-7.sav)
表6.20 销售样本资料
B1
B2
B3
A1
5,6,4
6,8,7
4,3,5
A2
7,8,8
5,5,6
3,6,4
A3
3,2,4
6,6,5
8,9,6
二 实验内容
解决问题3的原理:多因素方差分析原理
实验步骤:1.分析,需要研究不同包装的产品A和不同货架区对销售量的影响。这是一个多因素方差分析问题。
2.数据组织,按表6.20的变量名组织成4列数据。
3.变量设置,按Analyze→General LinearModel→Univeariate的步骤打开 Univariate对话框。并将“销售量”变量移入Dependent Variable框中作为观测变量,将“包装(A)”、“货架区(B)”移入Fixed Factor(s)中作为控制变量。
4.设置方差齐性检验,单击Options按钮,由于方差分析要求不同组别数据方差相等,故应进行方差齐性检验,选中“Homogeneity tests
5.得出结果。
三 结果分析
1.数据截图
Between-Subjects Factors
Value Label
N
包装
1
A1
9
2
A2
9
3
A3
9
摆放位置
1
B1
9
2
B2
9
Levene's Test of Equality of Error Variancesa
Dependent Variable:销量
F
df1
df2
Sig.
.754
8
18
.646
Tests the null hypothesis that the error variance of the dependent variable is equal across groups.
a. Design: Intercept + casing + place + casing * place
Tests of Between-Subjects Effects
Dependent Variable:销量
Source
Type III Sum of Squares
df
Mean Square
F
Sig.
Corrected Model
65.407a
8
8.176
7.612
.000
Intercept
822.259
1
822.259
765.552
.000
casing
.963
2
.481
.448
.646
place
3.185
2
1.593
1.483
.253
casing * place
61.259
4
15.315
14.259
.000
Error
19.333
18
1.074
Total
907.000
27
Corrected Total
84.741
26
a. R Squared = .772 (Adjusted R Squared = .670)
Multiple Comparisons
Dependent Variable:销量
(I) 包装
(J) 包装
Mean Difference (I-J)
Std. Error
Sig.
95% Confidence Interval
Lower Bound
Upper Bound
LSD
A1
A2
-.44
.489
.375
-1.47
.58
A3
-.11
.489
.823
-1.14
.92
A2
A1
.44
.489
.375
-.58
1.47
A3
.33
.489
.504
-.69
1.36
A3
A1
.11
.489
.823
-.92
1.14
A2
-.33
.489
.504
-1.36
.69
Tamhane
A1
A2
-.44
.778
.924
-2.52
1.63
A3
-.11
.915
.999
-2.58
2.36
A2
A1
.44
.778
.924
-1.63
2.52
A3
.33
.941
.980
-2.19
2.86
A3
A1
.11
.915
.999
-2.36
2.58
A2
-.33
.941
.980
-2.86
2.19
Based on observed means.
The error term is Mean Square(Error) = 1.074.
2.数据分析:从上图可以看出,所有的LSD方法的结果中,三组相伴概率Sig.均大于显著性性水平0.05,所以不能拒绝原假设,结果没有显著性影响。
一 实验4及目的
4. 研究杨树一年生长量与施用氮肥和钾肥的关系。为了研究这种关系,一共进行了18个样地的栽培实验,测定杨树苗的一年生长量、初始高度、全部实验条件(包括氮肥量和钾肥量)及实验结果(杨树苗的生长量)数据如表6.21,请在显著水平0.05下检验氮肥量、钾肥量及树苗初始高度中哪些对杨树的生长有显著性影响。(数据来源:《生物数学模型的统计学基础》李勇,科学出版社;数据文件:data6-8.sav)
表6.21 杨树栽培试验数据
序号
氮肥量
钾肥量
树苗初高
生长量
序号
氮肥量
钾肥量
树苗初高
生长量
1
少
0
4.5
1.85
10
多
0
6.5
2.15
2
少
0
6
2
11
多
0
6
1.99
3
少
0
4
1.6
12
多
0
6.5
2.06
4
少
12.5
6.5
2
13
多
12.5
4
1.93
5
少
12.5
7
2.04
14
多
12.5
6
2.1
6
少
12.5
5
1.91
15
多
12.5
5.5
2.15
7
少
25
7
2.4
16
多
25
5
4.2
8
少
25
5
4.25
17
多
25
6
2.3
9
少
25
5
2.1
18
多
25
5.5
4.25
二 实验内容
解决问题4的原理:多因素方差分析原理
实验步骤:1.打开数据源文件data6-8.sav
2.变量设置,按Analyze→General LinearModel→Univeariate的步骤打开Univariate对话框。并将“生长量”变量移入Dependent Variable框中作为观测变量,将“氮肥量”、“钾肥量”、“树苗初高”移入Fixed Factor(s)中作为控制变量。
3.设置方差齐性检验,单击Options按钮,由于方差分析要求不同组别数据方差相等,故应进行方差齐性检验,选中“Homogeneity tests
4.得出结果
三 结果分析
1.数据截图
Tests of Between-Subjects Effects
Dependent Variable:生长量
Source
Type III Sum of Squares
df
Mean Square
F
Sig.
Corrected Model
.574a
15
.038
5.006
.179
Intercept
69.453
1
69.453
9078.823
.000
N
6.429E-5
1
6.429E-5
.008
.935
K
.143
2
.072
9.378
.096
height
.144
6
.024
3.143
.261
N * K
.000
0
.
.
.
N * height
.000
0
.
.
.
K * height
.005
2
.003
.332
.751
N * K * height
.000
0
.
.
.
Error
.015
2
.008
Total
77.801
18
Corrected Total
.590
17
a. R Squared = .974 (Adjusted R Squared = .779)
2.数据分析:从表格中可以看出,“氮肥量”、“钾肥量”、“树苗初高”的相伴概率Sig.均大于0.05,所以他们对杨树的生长无显著性影响。