为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

4T检验与非参数检验

2012-06-18 50页 ppt 4MB 22阅读

用户头像

is_960269

暂无简介

举报
4T检验与非参数检验null4. T检验与非参数检验4. T检验与非参数检验4.1常用统计概念简介 4.1常用统计概念简介 4.1.1 常用统计概念 4.1.2概率、概率分布4.1.2概率、概率分布nullnull4.1.3 二项分布4.1.3 二项分布4.1.4 泊松分布4.1.4 泊松分布4.1.5 正态分布4.1.5 正态分布null正态概率分布有以下重要特征:(见图4-2) (1)正态分布是对称分布,对称轴是x=μ。 (2)当x=μ时,正态概率密度最大。 (3)正态分布的图形由μ和σ决定。 (4)当σ为定值时,μ的变化引起正态概率密度...
4T检验与非参数检验
null4. T检验与非参数检验4. T检验与非参数检验4.1常用统计概念简介 4.1常用统计概念简介 4.1.1 常用统计概念 4.1.2概率、概率分布4.1.2概率、概率分布nullnull4.1.3 二项分布4.1.3 二项分布4.1.4 泊松分布4.1.4 泊松分布4.1.5 正态分布4.1.5 正态分布null正态概率分布有以下重要特征:(见图4-2) (1)正态分布是对称分布,对称轴是x=μ。 (2)当x=μ时,正态概率密度最大。 (3)正态分布的图形由μ和σ决定。 (4)当σ为定值时,μ的变化引起正态概率密度曲线在横轴上平行移动。 (5)当μ为定值时,σ的变化将引起正态概率密度曲线的形状变得尖峭或偏平。null注:正态曲线1的μ=2.4,σ=0.8; 正态曲线2的μ=3.4,σ=0.8; 正态曲线3的μ=3.4,σ=1.2。null正态分布与二项分布的主要区别: 正态分布是连续的,而二项分布是离散的。象所有连续随机变量一样,正态随机变量任意一个确定值的概率为0,非0概率只有在确定区间内才能得到。 二项分布与正态分布存在渐近关系。二项分布的参数是n和p。则概率P(a设计
的,对成对数据,可用MEANS过程或 UNIVERATE过程检验成对数据的差值是否 为零,以判断成对数据均值是否相等。nullnull proc ttest < options > ; class variable ; Paired variables ; by variables ; var variables ; freq variable ; weight variable ; No statement can be used more than once. There is no restriction on the order of the statements after the PROC statement. nullALPHA=p specifies that confidence intervals are to be 100(1-p)% confidence intervals, where 0 |t| Weight 18 0.01 0.9960nulltitle 'One-Mean Comparison Using FREQ Statement‘; data read; input score count @@; datalines; 40 2 47 2 52 2 26 1 19 2 25 2 35 4 39 1 26 1 48 1 14 2 22 1 42 1 34 2 33 2 18 1 15 1 29 1 41 2 44 1 51 1 43 1 27 2 46 2 28 1 49 1 31 1 28 1 54 1 45 1 ; run; proc ttest data=read h0=30; var score; freq count; run; null One-Mean Comparison Using FREQ Statement 4 15:07 Monday, April 26, 2008 The TTEST Procedure Frequency: count Statistics Lower CL Upper CL Lower CL Upper CL Variable N Mean Mean Mean Std Dev Std Dev Std Dev Std Err score 44 31.449 34.864 38.278 9.2788 11.23 14.229 1.693 T-Tests Variable DF t Value Pr > |t| score 43 2.87 0.0063nullComparing Group Means title 'Comparing Group Means'; data scores; input Gender $ Score @@; datalines; f 75 f 76 f 80 f 77 f 80 f 77 f 73 m 82 m 80 m 85 m 85 m 78 m 87 m 82 ; run; proc ttest cochran ci=equal umpu; class Gender; var Score; run; nulldata ttest4_1; infile 'i:\ttst4_1'; input sex body carcass; run; proc ttest data=ttest4_1; class sex; var body carcass; title 'sas ttest for test'; run;nullproc ttest data=sashelp.ttest4_1; class sex; var body carcass; title 'sas ttest for test'; run;SAS程序 Ttest4_1.sasSAS程序 Ttest4_1.sasnull t检验时SAS系统输出是按照①②③顺序,进行 结论分析应按照③②①倒序查看。先看③,判断数 据是否来自同一方差总体,如果Pr>F的值于.05, 说明来自同一方差总体,可以使用t检验方法进行分 析,否则应采用非参数检验。然后看②中的Equal 一行,判断两组均值是否相等,如果不等且Pr>F值 小于0.05,说明两组均值有显著差异,否则无差异。 然后查看①中Mean列,根据专业知识及两组均值的 大小,判断是大的好还是小的好。查看t检验输出结果和方法:nullnull 例4.2 将20个样本随机分为两组,分别用两种 培养基进行培养试验,测得有效成份如下,问两组 的平均值有无差别。 treat1:a培养基(11)10,20,40,40,40,80,80,160,160,160,320 treat2:b培养基(9人)10,10,10,20,20,20,20,40,40 Ho: 两组均值相等μ1=μ2 ,Ha: 两组均值不等μ1≠μ2 ,显著水平α=0.05 。 由于数据有倍数关系,所以先将两组数据分别 取对数,以对数作为新变量进行比较。 用变换后的数据再代入以上公式计算t值。 SAS程序Ttest4_2.sasnulldata s41; input treat1 treat2@@; lg10tr=log10(treat2); cards; 1 10 1 20 1 40 1 40 1 40 1 80 1 80 1 160 1 160 1 160 1 320 2 10 2 10 2 10 2 20 2 20 2 20 2 20 2 40 2 40 ; proc ttest; class treat1; var lg10tr treat2; run;nulldata npar1way4_7 (drop=i n ); input siliao $ n; do i=1 to n ; input addw @@; output; end; cards; a 6 6.65 6.35 7.05 7.90 8.04 4.45 b 6 5.34 7.00 7.89 7.05 6.74 7.28 ; run; proc ttest data=npar1way4_7; class siliao; var addw; run; 4.2.3 双尾检验与单尾检验4.2.3 双尾检验与单尾检验nulldata l; retain n 40; retain e 0.01; do x=-3.5 to -1.99 by e*2, -2 to 2 by e, 2.001 to 3.5 by e*2 ; y=probt(x,n,0)-probt(x-e,n,0); output; end; run; proc gplot data=l; plot y*x/href=-1.96 0 1.96; symbol i=join c=red; axis1 label=(‘probability’); axis2 label=('t value')order=(-3.5 to 3.5 by 0.5); title 't distribution(df=40,nc=0)'; title2 'two-sided test‘; run;nullnullnulldata kl; retain e 0.01; do x=-3.5 to -1.99 by e*2, -2 to 2 by e, 2.001 to 3.5 by e*2 ; y=probnorm(x)-probnorm(x-e); output; end; run; proc gplot data=kl; plot y*x/href=-1.96 0 1.96; symbol i=join c=red; axis1 label=('probability') ; axis2 label=('t value')order=(-3.5 to 3.5 by 0.5); title 'normal distribution'; title2 'two-sided test'; run;null4.2.4 非参数检验4.2.4 非参数检验1. 检验 2.符号检验 3.秩和检验法nullSatterthwaite's Approximation The formula for Satterthwaite's (1946) approximation for the degrees of freedom for the approximate t statistic is: df = [( (w1+w2)2 )/( ( [(w12)/(n1-1)] +[(w22)/(n2-1)] ) )] where w1 = [ /n1],     w2 = [ /n2] Refer to Steel and Torrie (1980) or Freund, Littell, and Spector (1986) for more information. nullThe Cochran and Cox Approximation The Cochran and Cox (1950) approximation of the probability level of the approximate t statistic is the value of p such that t' = [(w1t1+w2t2)/(w1+w2)] where t1 and t2 are the critical values of the t distribution corresponding to a significance level of p and sample sizes of n1 and n2, respectively. The number of degrees of freedom is undefined when .In general, the Cochran and Cox test tends to be conservative (Lee and Gurland 1975). 4.3.2 TTEST过程举例说明4.3.2 TTEST过程举例说明 例4.3 为了解某乡粮田土壤肥力的变化情 况,1998年和1999年连续两年对9个监测点进 行取土样化验有机质含量。y1代1998年化 验结果,该年土壤有机质平均含量为.21%, y2代表1999年化验结果,分析两年间土壤有 机质变化情况。 SAS程序Ttest4_3.sasnulldata ttest4_3; input orgenic $ x @@; cards; y1 1.64 y1 1.04 y1 1.46 y1 0.88 y1 1.30 y1 0.84 y1 1.39 y1 0.99 y1 1.43 y2 1.60 y2 0.62 y2 1.49 y2 0.74 y2 1.24 y2 0.65 y2 1.51 y2 0.84 y2 1.50 ; proc ttest; class orgenic ; var x; run;null输出结果简介: For H0: Variances are equal, F' = 2.08 DF = (8,8) Prob>F' = 0.3203 从输出的最下方可知,两组变量来自同一方差总体。 T-Tests Variable Method Variances DF t Value Pr > |t| x Pooled Equal 16 0.52 0.6127 x Satterthwaite Unequal 14.2 0.52 0.6136 在方差相等的前提下,两组均值相等的概率为0.6127,所 以1998年和1999年间该乡土壤有机质含量没有大的变化,即 土壤肥力差异不明显。null例4.4 此试验的目的是看看与单纯繁殖相比,杂交能否显著提高肉鸡的生长速度。实验数据是在8周龄测得的体重(单位:克)。 SAS程序Ttest4_4.sasnulldata Ttest4_4; input gender $ recorder @@; cards; ac 1309 ac 1275 ac 1089 ac 982 ac 1084 ac 1463 ac 1086 ac 1026 ac 1658 ac 842 ac 1452 ac 917 ac 1003 ac 1070 ac 1062 ac 1031 ac 1459 ac 1167 ac 901 ac 1197 ac 1204 ac 1260 ac 1046 ac 1223 ac 1510 ac 868 ac 1032 ac 1100 ac 1297 ac 1156 ac 1158 ac 1261 ac 1446 ac 1264 ac 1170 ac 942 ac 1017 ac 1668 ac 1308 ac 934 ac 1284 ac 1577 ac 1307 ac 1493 ac 939 ac 1365 ac 990 ac 953 aa 1545 aa 1124 aa 630 aa 867 aa 839 aa 880 aa 815 aa 811 aa 954 aa 1184 aa 1090 aa 1231 aa 1195 aa 995 aa 862 aa 1369 aa 1312 aa 1172 aa 1210 aa 1049 aa 1341 aa 1254 aa 1608 aa 962 aa 1077 aa 895 aa 1134 aa 1226 aa 1132 aa 1219 aa 1117 aa 1092 aa 1004 aa 941 aa 1026 aa 1012 aa 928 aa 1176 aa 796 aa 985 aa 1087 aa 903 aa 950 aa 1058 aa 914 aa 901 aa 1488 aa 1296 aa 976 aa 1111 aa 1548 aa 1260 aa 1316 aa 1310 aa 1012 aa 1023 ; proc ttest; class gender; var recorder; run;null例4.5 研究皱纹盘鲍卵受精时间对受精率及孵化率的影响,其中a、b代表不同的受精时间,a:受精时间0.5小时;b:受精时间1.0小时;每组有8个试验组,则数据集有16个观测,观测值均为百分数,请分析在不同的受精时间下,对海产单壳经济水产品皱纹盘鲍卵的孵化率是否有显著差异,以确定人工繁殖时的受精时间,提高孵化率。 SAS程序Ttest4_5.sasnulldata Ttest4_5 ; input time $ fuhualv @@ ; cards ; a 73 a 65 a 72 a 65 a 64 a 77 a 71 a 66 b 59 b 64 b 61 b 63 b 64 b 61 b 62 b 58 ; proc ttest ; class time ; var fuhualv ; title 'fuhualv ' ; run ;null例4.5结果说明: 从t检验输出结果可以看出:方差相等的假设是不合理的,方差相等假设成立的概率仅为0.0594。双边检验F值(大方差除以小方差)为4.67,所以应该使用方差不相等的检验。从而采用Unequel一行的t值、DF和概率。 通过t检验结果得出,受精时间为0.5h和受精时间为1.0h的两个试验组在孵化率上有显著的差异,概率水平为0.0022。受精时间为0.5h的皱纹盘鲍卵的孵化率显著高于受精时间为1.0h的皱纹盘鲍卵的孵化率。 但对于两组变量,当方差不等,且样本数小于30时,应采用非参数检验,否则可能得出错误的结论。建议使用后面讲到的Npar1way过程进行非参数检验。4.4 NPAR1WAY过程(非参数检验过程)4.4 NPAR1WAY过程(非参数检验过程)1.NPAR1WAY过程简介 NPAR1WAY过程是基于经验分布函数(EDF)和跨过单向分类的因变量的秩得分,计算出几个统计量,用以检验变量的分布在跨过不同组时有相同的位置参数。秩得分包括Wilcoxon得分,中位数得分,Savage得分和Van der Waerden得分。关于这些得分的说明请参考有关非参数检验的统计。 NPAR1WAY过程语句 PROC NPAR1WAY 选择项 ; CLASS 变量列表 ; BY 变量列表 ; VAR 变量列表 ; RUN ;nullnull4.4.2 NPAR1WAY过程举例说明4.4.2 NPAR1WAY过程举例说明例4.6 将例4.5用NPAR1WAY过程进行非参数检验。SAS程序——Npar1way4_6.sas data npar1way4_6 ; input time $ fuhualv @@ ; cards ; a 73 a 65 a 72 a 65 a 64 a 77 a 71 a 66 b 59 b 64 b 61 b 63 b 64 b 61 b 62 b 58 ; proc npar1way ; class time ; var fuhualv ; title 'fuhualv ' ; run ;null结果说明:通过多种方法的比较与检验,两组数据都存在显著差异,即受精时间为0.5h和受精时间为1.0h的两个试验组在孵化率上有显著的差异。受精时间为0.5h的皱纹盘鲍卵的孵化率显著高于受精时间为1.0h的皱纹盘鲍卵的孵化率。 虽然与t检验在方差不等的前提下得到的结论相同,但通过进行多种非参数检验,结论更有说服力,且显著水平也明显高于t检验的结果。Kruskal Wallis卡方检验的显著水平为0.0011, Van der Waerden法的显著水平为0.0017。均高于0.0022,说明对于这种数据,采用非参数检验,统计结果更精确。因此根据数据特点选择合适的方法进行统计分析,有助于我们得到科学而准确的结论。null例4.7数据来源:中国农大昌平试验站用a、b两种饲料对香猪进行饲养试验。每组6头香猪,两组共有12个观测值。数据是6周时每头香猪的增重结果,单位:Kg。分析这两种饲料对香猪的增重有无差异。增重数据如下: a种饲料:6.65 6.35 7.05 7.90 8.04 4.45 b种饲料:5.34 7.00 7.89 7.05 6.74 7.28 由于试验样本小,应采用非参数检验方法进行检验。 SAS程序Npar1way4_7.sasnulldata npar1way4_7 (drop=i n ); input siliao $ n; do i=1 to n ; input addw @@; output; end; cards; a 6 6.65 6.35 7.05 7.90 8.04 4.45 b 6 5.34 7.00 7.89 7.05 6.74 7.28 ; run; proc npar1way data=npar1way4_7; class siliao; var addw; run;null结果说明: 其中Chi-Square 是卡方2统计量,Kruskal-Wallis 检验的Chi-Square=0.0064,Prob > Chi-Square=0.9361,大于0.05,卡方检验不显著,即用a、b两种饲料饲喟香猪对香猪的增重效果没有差异,两种饲料的增重效果一样。 这个试验数据计算出的概率值为1.0,有些特殊,通常我们处理的数据不会这样。 如果使用TTEST过程对这组数据进行检验,也得到两种饲料对香猪的增重效果无差异的结论。但是对于小样本的试验数据应选择非参数检验方法进行统计分析,否则得到的结论的可信度会受到质疑。4.5 综合应用4.5 综合应用4.5.1 配对数据的统计分析 配对试验设计 进行单因素2水平试验设计时,对同一个指标观测2个数据,这2个数据来自同1个受试对象或来自非常相同(对重要的非处理因素而言)的2个受试对象,故把这2个数据看作一对。这种设计称为配对设计。 根据每对数据所对应的具体条件,可将配对设计分为以下3种: 自身配对设计:每对数据测量来自同一个受试对象。 同源配对设计:每对数据测量来自同一窝(或胎)的2个受试对象。 条件相近者配对设计:每对数据测量来自条件(指最重要的非处理因素)相近的2个受试对象。nullnulldata ttest4_8; input baci1 baci2 @@; diff=baci1-baci2; cards; 33.0 23.3 35.8 21.7 28.8 19.4 31.4 26.8 42.6 32.0 25.8 23.1 31.6 25.3 29.0 23.7 22.4 21.8 30.2 17.6 ; proc univariate normal plot; var diff; run;null结果说明: 第1部分是对差量算出的各种简单样本统计量的值。如均数=7.59,标准差=4.38。第2部分是有关统计检验的结果。先看差量是否服从正态分布,零假设是差量服从正态分布,备择假设是差量不服从正态分布。W=0.970391,P=0.8944,大于0.05,接受零假设。应该用关于差量的总体均数为零的t检验的结果:t=5.47,P=0.0004,拒绝Ho:差量均数为零的假设。结论为:服这种亲朋药前后对病人体内的Baci含量有显著影响,这种药对治疗腹泻有较好的效果。 (提示:如果差量不服从正态分布,则应该用符号秩(Sgn Rank)检验的结果,即参照Sign M Pr>=|M| 一行的结论。)null 编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 初产 1.03 0.97 0.96 1.06 1.27 1.17 1.04 1.07 1.08 1.43 1.37 1.30 0.95 1.04 经产 1.32 1.34 1.33 1.48 1.38 1.32 1.53 1.44 1.65 1.16 1.48 1.01 1.46 1.45例4.9 某养猪场14头大白猪的初产与经产仔猪平均 初生重资料如下(单位:kg),分析大白猪的初 产与经产仔猪平均初生重是否有显著差异.nulldata data_prg.ttest4_9 ; input w1 w2 @@; diff=w2-w1; cards; 1.03 1.32 0.97 1.34 0.96 1.33 1.06 1.48 1.27 1.38 1.17 1.32 1.04 1.53 1.07 1.44 1.08 1.65 1.43 1.16 1.37 1.48 1.30 1.01 0.95 1.46 1.04 1.45 proc univariate normal plot data=data_prg.ttest4_9; var diff; run;nulldata data_prg.npar1way4_9 ; input group $ n; do i=1 to n; input weight @@; output; end; cards; a1 14 1.03 0.97 0.96 1.06 1.27 1.17 1.04 1.07 1.08 1.43 1.37 1.30 0.95 1.04 a2 14 1.32 1.34 1.33 1.48 1.38 1.32 1.53 1.44 1.65 1.16 1.48 1.01 1.46 1.45 ; proc npar1way data=data_prg.npar1way4_9 ; class group; var weight; run;4.5.2 成组试验数据的统计分析4.5.2 成组试验数据的统计分析单因素双水平随机试验设计 2. 检验方法的前提条件   对成组设计的试验数据进行检验分析之前,要先判断试验数据是否满足以下2个前提条件: 1)正态性:各组数据应独立,且来自同一正态总体。 2)方差齐性:2组数据的总体方差应该相等。null例4.10 某植物营养实验室进行肥料对草坪颜色质量的研究,选择两种肥料进行试验,数据是两种肥料对草坪颜色的分数。分析两种肥料对草坪颜色质量的影响是否有差异。 由于样本量小,应采用非参数检验。 SAS程序npar1way4_10.sasnullDATA F; input f $ n; do i=1 to n ; input x @@; output; end; datalines; F1 6 7.9 7.8 7.8 7.8 7.8 7.9 F2 6 7.7 7.8 7.7 7.8 7.7 7.8 ; proc sort ; by f; proc univariate normal; var x; by f; run; PROC npar1way wilcoxon; CLASS f; RUN; PROC ttest; CLASS f; var x; RUN;null以上是NPAR1WAY过程的非参数秩和检验结果。Kruskal-Wallis卡方检验得:Chi-Square=4.6933,p=0.303,,两组秩和相等的概率小于0.05 ,即两组秩和不等,两种肥料对草平颜色质量的影响有显著的差异。由秩和得分知:f1肥料显著好于f2肥料,在维护草平时建议推广使用f1肥料。 由于样本量小,且数据不服从正态分布,故不能采用t检验,应采用非参数的秩和检验。如果采用近似t检验,由输出的双尾检验结果得p=0.0621,大小0.05,两种肥料对草平颜色质量的
/
本文档为【4T检验与非参数检验】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索