为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

第七讲 方差分析一

2019-10-29 59页 ppt 670KB 26阅读

用户头像 个人认证

精品文库

一线资深教师,拥有丰富的教学经验!

举报
第七讲 方差分析一多个样本均数比较的方差分析第一节方差分析的基本思想及其应用条件目的:推断多个总体均数是否有差别。也可用于两个方法:方差分析,即多个样本均数比较的F检验。基本思想:根据资料设计的类型及研究目的,可将总变异分解为两个或多个部分,每个部分的变异可由某因素的作用来解释。通过比较可能由某因素所至的变异与随机误差,即可了解该因素对测定结果有无影响。应用条件:总体——正态且方差相等设计类型:完全随机设计资料的方差分析随机区组设计资料的方差分析完全随机设计资料的方差分析的基本思想合计NS:第i个处理组第j个观察结果表1...
第七讲 方差分析一
多个样本均数比较的方差第一节方差分析的基本思想及其应用条件目的:推断多个总体均数是否有差别。也可用于两个方法:方差分析,即多个样本均数比较的F检验。基本思想:根据资料的类型及研究目的,可将总变异分解为两个或多个部分,每个部分的变异可由某因素的作用来解释。通过比较可能由某因素所至的变异与随机误差,即可了解该因素对测定结果有无影响。应用条件:总体——正态且方差相等设计类型:完全随机设计资料的方差分析随机区组设计资料的方差分析完全随机设计资料的方差分析的基本思想合计NS:第i个处理组第j个观察结果1g个处理组的试验结果 处理分组 测量值 统计量 1水平 X11 X12 … X1j … n1 S1 2水平 X21 X22 … X2j … n2 S2 … … … … … … … … … … g水平 Xg1 Xg2 … Xgj … ng Sg_1079000386.unknown_1079000523.unknown_1079000524.unknown_1079423100.unknown_1079000522.unknown_1079000367.unknown记总均数为,各处理组均 数为,总例数为N= nl+n2+…+ng,g为处理组数。 1.总变异:全部测量值大小不同,这种变异称为总变异。 总变异的大小可以用离均差平方和(sumofsquaresofdeviationsfrommean,SS)表示,即各测量值Xij与总均数差值的平方和,记为SS总。 总变异SS总反映了所有测量值之间总的变异程度。计算公式为其中: 2.组间变异:各处理组由于接受处理的水平不同,各组的样本均数(i=1,2,…,g)也大小不等,这种变异称为组间变异。 其大小可用各组均数与总均数的离均差平方和表示,记为SS组间。计算公式为 3.组内变异:在同一处理组中,虽然每个受试对象接受的处理相同,但测量值仍各不相同,这种变异称为组内变异(误差)。组内变异可用组内各测量值Xij与其所在组的均数的差值的平方和表示,记为SS组内,表示随机误差的影响。 三种变异的关系:均方差,均方(meansquare,MS)。检验统计量:如果,则应十分接近,两者有差别的原因可解释为随机误差,F值应接近于1。如果不全相等,(MS组间除随机误差外,又增加了干预因素作用)F值将明显大于1。用F界值确定P值。第二节完全随机设计资料的方差分析一、完全随机设计(completelyrandomdesign)是采用完全随机化的分组方法,将全部试验对象分配到g个处理组(水平组),各组分别接受不同的处理,试验结束后比较各组均数之间的差别有无统计学意义,推论处理因素的效应。 例1某医生为了研究一种降血脂新药的临床疗效,按统一纳入选择120名患者,采用完全随机设计方法将患者等分为4组进行双盲试验。问如何进行分组?(1)完全随机分组方法:1.编号:120名高血脂患者从1开始到120;2.取随机数字:从附表1中的任一行任一列开始,如第5行第7列开始,依次读取三位数作为一个随机数录于编号下,见表4-2第2行;3.编序号:将全部随机数字从小到大(附表1中的任一行任一列开始,如第5行第7列开始,依次读取三位数作为一个随机数录于编号下,)编序号(数据相同则按先后顺序),见表2第3行。表2完全随机设计分组结果 编号 1 2 3 4 5 6 7 8 9 10 … 119 120 随机数 260 873 373 204 056 930 160 905 886 958 … 220 634 序号 24 106 39 15 3 114 13 109 108 117 … 16 75 分组结果 甲 丁 乙 甲 甲 丁 甲 丁 丁 丁 … 甲 丙4.事先:序号1-30为甲组,序号31-60为乙组,序号61-90为丙组,序号91-120为丁组,见表4-2第四行。(2)统计分析方法选择:1.对于正态分布且方差齐同的资料,常采用完全随机设计的单因素方差分析(one-wayANOVA)或成组资料的t检验(g=2);2.对于非正态分布或方差不齐的资料,可进行数据变换或采用Wilcoxon秩和检验。例2某医生为了研究一种降血脂新药的临床疗效,按统一纳入标准选择120名高血脂患者,采用完全随机设计方法将患者等分为4组(具体分组方法见例1),进行双盲试验。6周后测得低密度脂蛋白作为试验结果,见表3。问4个处理组患者的低密度脂蛋白含量总体均数有无差别?表34个处理组低密度脂蛋白测量值(mmol/L) 分组 测量值 统计量 n 安慰剂组 3.53 4.59 4.34 2.66 3.59 3.13 2.64 2.56 3.50 3.25 30 3.43 102.91 367.85 3.30 4.04 3.53 3.56 3.85 4.07 3.52 3.93 4.19 2.96 1.37 3.93 2.33 2.98 4.00 3.55 2.96 4.3 4.16 2.59 降血脂新药 30 2.72 81.46 233.00 2.4g组 2.42 3.36 4.32 2.34 2.68 2.95 1.56 3.11 1.81 1.77 1.98 2.63 2.86 2.93 2.17 2.72 2.65 2.22 2.90 2.97 2.36 2.56 2.52 2.27 2.98 3.72 2.80 3.57 4.02 2.31 4.8g组 2.86 2.28 2.39 2.28 2.48 2.28 3.21 2.23 2.32 2.68 30 2.70 80.94 225.54 2.66 2.32 2.61 3.64 2.58 3.65 2.66 3.68 2.65 3.02 3.48 2.42 2.41 2.66 3.29 2.70 3.04 2.81 1.97 1.68 7.2g组 0.89 1.06 1.08 1.27 1.63 1.89 1.19 2.17 2.28 1.72 30 1.97 58.99 132.13 1.98 1.74 2.16 3.37 2.97 1.69 0.94 2.11 2.81 2.52 1.31 2.51 1.88 1.41 3.19 1.92 2.47 1.02 2.10 3.71 _1127737208.unknown_1127737217.unknown_1127737119.unknown三、分析步骤H0:即4个试验组总体均数相等H1:4个试验组总体均数不全相等2.计算检验统计量:1.建立检验假设,确定检验水准:H0:,即4个试验组的总体均数相等H1:4个试验组的总体均数不全相等按表4-4中的公式计算各离均差平方和SS、自由度、均方MS和F值。_1076913336.unknown_1095063758.unknown_1095063790.unknown_1095063829.unknown_1076914240.unknown_1076870423.unknown,=120-1=119,,,_1079180803.unknown_1080390649.unknown_1080390729.unknown_1080390759.unknown_1080390774.unknown_1080390709.unknown_1080390518.unknown_1080390636.unknown_1080390152.unknown_1079034329.unknown_1079034369.unknown_1079034241.unknown表4完全随机设计方差分析表列方差分析表 变异来源 自由度 SS MS F P 总变异 119 82.10 组间 3 32.16 10.72 24.93 <0.01 组内 116 49.94 0.43 3.确定P值,作出推断结论:按水准,拒绝H0,接受H1,认为4个试验组ldl-c总体均数不相等,即不同剂量药物对血脂中ldl-c降低影响有差别。注意:方差分析的结果拒绝H0,接受H1,不能说明各组总体均数间两两都有差别。如果要分析哪些两组间有差别,可进行多个均数间的多重比较。当g=2时,完全随机设计方差分析与成组设计资料的t检验等价,有。三、随机区组设计——配伍组设计(randomizedblockdesign) 随机区组设计(randomizedblockdesign)又称为配伍组设计,是配对设计的扩展。具体做法是:先按影响试验结果的非处理因素(如性别、体重、年龄、职业、病情、病程等)将受试对象配成区组(block),再分别将各区组内的受试对象随机分配到各处理或对照组。 (1)随机分组方法:(2)随机区组设计的特点随机分配的次数要重复多次,每次随机分配都对同一个区组内的受试对象进行,且各个处理组受试对象数量相同。区组内均衡。在进行统计分析时,将区组变异离均差平方和从完全随机设计的组内离均差平和中分离出来,从而减小组内离均差平方和(误差平方和),提高了统计检验效率。预选对象受试对象按配伍条件区组14个水平区组2随机分组随机分组4个水平区组2随机分组4个水平。。。。区组n随机分组4个水平例4如何按随机区组设计,分配5个区组的15只小白鼠接受甲、乙、丙三种抗癌药物?分组方法:先将小白鼠按体重编号,体重相近的3只小白鼠配成一个区组,见下表。在随机数字表中任选一行一列开始的2位数作为1个随机数,如从第8行第3列开始纪录;在每个区组内将随机数按大小排序;各区组中内序号为1的接受甲药、序号为2的接受乙药、序号为3的接受丙药,分配结果见下表。表45个区组小白鼠按随机区组设计分配结果 区组号 1 2 3 4 5 小白鼠 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 随机数 68 35 26 00 99 53 93 61 28 52 70 05 48 34 56 序号 3 2 1 1 3 2 3 2 1 2 3 1 2 1 3 分配结果 丙 乙 甲 甲 丙 乙 丙 乙 甲 乙 丙 甲 乙 甲 丙(3)统计方法选择:1.正态分布且方差齐同的资料,应采用两因素(处理、配伍)方差分析(two-wayANOVA)或配对t检验(g=2);2.当不满足方差分析和t检验条件时,可对数据进行变换或采用随机区组设计资料的FriedmanM检验。表5随机区组设计的试验结果 区组编号 处理因素(g个水平) 1 2 3 … g 1 X11 X21 X31 … Xg1 2 X12 X22 X32 … Xg2 … … … … … … j X1j X2j X3j … Xgj … … … … … … n … _1079113820.unknown_1079113832.unknown_1079113845.unknown_1079113802.unknown二、变异分解(1)总变异:反映所有观察值之间的变异,记为SS总。(2)处理间变异:由处理因素的不同水平作用和随机误差产生的变异,记为SS处理。(3)区组间变异:由不同区组作用和随机误差产生的变异,记为SS区组.(4)误差变异:完全由随机误差产生的变异,记为SS误差。对总离均差平方和及其自由度的分解,有:三、分析步骤例5某研究者采用随机区组设计进行实验,比较三种抗癌药物对小白鼠肉瘤抑瘤效果,先将15只染有肉瘤小白鼠按体重大小配成5个区组,每个区组内3只小白鼠随机接受三种抗癌药物(具体分配方法见例4),以肉瘤的重量为指标,试验结果见表4。问三种不同的药物的抑瘤效果有无差别?表7不同药物作用后小白鼠肉瘤重量(g) 区组 A药 B药 C药 1 0.82 0.65 0.51 1.98 2 0.73 0.54 0.23 1.50 3 0.43 0.34 0.28 1.05 4 0.41 0.21 0.31 0.93 5 0.68 0.43 0.24 1.35 3.07 2.17 1.57 6.81 0.614 0.434 0.314 0.454 2.0207 1.0587 0.5451 3.6245 _1080750594.unknown_1080750869.unknown_1094491806.unknown_1094491845.unknown_1080751295.unknown_1080750678.unknown_1080392402.unknownH0:,即三种不同药物作用后小白鼠肉瘤重量的总体均数相等H1:三种不同药物作用后小白鼠肉瘤重量的总体均数不全相等表8例5的方差分析表 变异来源 自由度 SS MS F P 总变异 14 0.5328 处理间 2 0.2280 0.1140 11.88 <0.01 区组间 4 0.2284 0.0571 5.95 <0.05 误差 8 0.0764 0.0096 据1=2、2=8查附表的F界值表,得在α=0.05的水准上,拒绝H0,接受H1,认为三种不同药物作用后小白鼠肉瘤重量的总体均数不全相等,即不同药物的抑瘤效果有差别。注意:方差分析的结果拒绝H0,接受H1,不能说明各组总体均数间两两都有差别。如果要分析哪些两组间有差别,可进行多个均数间的多重比较(见本章第五节)。当g=2时,随机区组设计方差分析与配对设计资料的t检验等价,有。随机区组设计确定区组因素应是对试验结果有影响的非处理因素。区组内各试验对象应均衡,区组之间试验对象具有较大的差异为好,这样利用区组控制非处理因素的影响,并在方差分析时将区组间的变异从组内变异中分解出来。因此,当区组间差别有统计学意义时,这种设计的误差比完全随机设计小,试验效率得以提高。    多个样本均数间的多重比较(multiplecomparison)多重比较不能用两样本均数比较的t检验!若用两样本均数比较的t检验进行多重比较,将会加大犯Ⅰ类错误(把本无差别的两个总体均数判为有差别)的概率。例如,有4个样本均数,两两组合数为,若用t检验做6次比较,且每次比较的检验水准定为α=0.05,则每次比较不犯Ⅰ类错误的概率为(1-0.05),6次均不犯Ⅰ类错误的概率为,这时,总的检验水准变为,远比0.05大。因此,样本均数间的多重比较不能用两样本均数比较的t检验。适用条件:当方差分析的结果为拒绝H0,接受H1时,只说明g个总体均数不全相等。若想进一步了解哪些两个总体均数不等,需进行多个样本均数间的两两比较或称多重比较。一、LSD-t检验(leastsignificantdifference)适用范围:一对或几对在专业上有特殊意义的样本均数间的比较。检验统计量t的计算公式为式中注意:LSD-t检验公式与两样本均数比较的t检验公式区别在于两样本均数差值的标准误和自由度ν的计算上。_1077023287.unknown_1080651269.unknown_1165253163.unknown_1080651210.unknown_1077023254.unknown在两样本均数比较的t检验公式里是用合并方差来计算,ν=n1+n2-2;LSD-t检验是用方差分析表中的误差均方来计算,ν=ν误差。_1077023287.unknown_1080651269.unknown_1165253163.unknown_1077023254.unknown例对例2资料,问高血脂患者的降血脂新药2.4g组、4.8g组、7.2g组与安慰剂组的低密度脂蛋白含量总体均数有无差别?降血脂新药2.4g组与安慰剂组的比较:,即降血脂新药2.4g组与安慰剂组的低密度脂蛋白含量总体均数相等,即降血脂新药2.4g组与安慰剂组的低密度脂蛋白含量总体均数不等α=0.05 根据例题,=2.72,=3.43,==30,=0.43,误差=116。==0.17LSD-t==-4.18以ν=116,t=4.18查附表的t界值表,得P<0.001。按水准,拒绝H0,接受H1,有统计学意义。可认为降血脂新药2.4g组的低密度脂蛋白含量总体均数低于安慰剂组。_1079440268.unknown_1079441647.unknown_1080651439.unknown_1165253163.unknown_1165253671.unknown_1080396046.unknown_1079441628.unknown_1077631861.unknown_1079160759.unknown_1076914240.unknown新药4.8g组VS安慰剂组:LSD-t为-4.297.2g组VS安慰剂组:LSD-t为-8.59。同理:按水准,降血脂新药4.8g组、7.2g组与安慰剂组间差别有统计学意义。
/
本文档为【第七讲 方差分析一】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索