为了正常的体验网站,请在浏览器设置里面开启Javascript功能!
首页 > 中山大学2014生物统计学考试复习

中山大学2014生物统计学考试复习

2021-06-30 29页 doc 655KB 24阅读

用户头像

is_963767

暂无简介

举报
中山大学2014生物统计学考试复习中山大学2014生物统计学考试复习1名词解释⏹概率与概率分析相关概念⏹样本统计量的抽样分布相关概念第一节抽样与抽样分布一.总体、个体和样本总体(Population):调查研究的事物或现象的全体个体(Itemunit):组成总体的每个元素样本(Sample):从总体中所抽取的部分个体样本容量(Samplesize):样本中所含个体的数量二.关于抽样方法概率抽样:根据已知的概率选取样本1.简单随机抽样:完全随机地抽选样本2.分层抽样:总体分成不同的“层”,在每一层内进行抽样3.整群抽样:将一组被调查者(群)作为一个抽样单位4.等...
中山大学2014生物统计学考试复习
中山大学2014生物统计学考试复习1名词解释⏹概率与概率相关概念⏹样本统计量的抽样分布相关概念第一节抽样与抽样分布一.总体、个体和样本总体(Population):调查研究的事物或现象的全体个体(Itemunit):组成总体的每个元素样本(Sample):从总体中所抽取的部分个体样本容量(Samplesize):样本中所含个体的数量二.关于抽样方法概率抽样:根据已知的概率选取样本1.简单随机抽样:完全随机地抽选样本2.分层抽样:总体分成不同的“层”,在每一层内进行抽样3.整群抽样:将一组被调查者(群)作为一个抽样单位4.等距抽样:在样本框中每隔一定距离抽选一个被调查者非概率抽样:不是完全按随机原则选取样本1.非随机抽样:由调查人员自由选取被调查者2.判断抽样:通过某些条件过滤来选择被调查者配额抽样:选择一群特定数目、满足特定条件的被调查者三.样本均值的抽样分布与中心极限定理抽样分布:1.所有样本指标(如均值、比例、方差等)所形成的分布称为抽样分布2.是一种理论概率分布3.随机变量是样本统计量样本均值,样本比例和样本方差等4.结果来自容量相同的所有可能样本样本均值的均值(数学期望)等于总体均值样本均值的方差等于总体方差的1/n样本均值的抽样分布规律:当总体服从正态分布N(μ,σ2)时,来自该总体的所有容量为n的样本的均值也服从正态分布,的数学期望为μ,方差为σ2/n。即~N(μ,σ2/n)中心极限定理:设从均值为μ,方差为σ2的一个任意总体中抽取容量为n的样本,当n充分大时(n>30),样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布四.样本方差的抽样分布(Pearson)设总体服从正态分布N(μ,σ2),X1,X2,…,Xn为来自该正态总体的样本,则样本方差S2的分布为,将称为自由度为(n-1)的卡方分布均值的误五.两个样本方差比的分布(R.A.Fisher)设X1,X2,…,Xn1是来自于一个正态分布总体X~N(μ1,σ12)的一个样本,Y1,Y2,…,Yn2是来自正态总体Y~N(μ2,σ22)的一个样本,且Xi(i=1,2,…,n1),Yi(i=1,2,…,n2)相互独立,则将F(n1-1,n2-1)称为第一自由度为(n1-1),第二自由度为(n2-1)的F分布六.T统计量的分布(WillamSealyGosset)设X1,X2,…,Xn是来自正态总体N(μ1,σ12)的一个样本,称为统计量,它服从自由度为n-1的t分布⏹假设检验、参数估计相关概念(例如独立样本、配对样本、Aspin-Welch检验法、方差齐性检验)独立样本配对样本Aspin-Welch检验法两个总体均值之差的t检验(σ12、σ22未知但不相等)1.检验具有等方差的两个总体的均值2.假定条件l两个样本是独立的随机样本l两个总体都是正态分布l两个总体方差未知但不相等σ12≠σ223.近似t检验,Aspin-Welch检验法,检验统计量方差齐性检验⏹ANOVA,LSD法,随机误差和系统误差,因素和水平⏹ANOVA1.检验多个总体均值是否相等▪通过对各观察数据误差来源的分析来判断多个总体均值是否相等2.变量⏹1个定类尺度的自变量l2个或多个(k个)处理水平或分类⏹1个定距或定比尺度的因变量3.用于分析完全随机化试验LSD法随机误差在因素的同一水平(同一个总体)下,样本的各观察值之间的差异系统误差在因素的不同水平(不同总体)下,各观察值之间的差异因素所要检验的对象称为因素或因子水平因素的具体现称为水平⏹相关和回归分析及与之关联的概念例如⏹总体(Population)⏹所关心的所有元素的集合⏹样本(Sample)⏹总体的一部分⏹参数(Parameter)⏹总体的数字特征⏹统计量(Statistic)⏹样本的概括性测度值2简答题统计数据的如何收集与整理?抽样调查1.从总体中随机抽取一部分单位(样本)进行调查2.目的是推断总体的未知数字特征3.最常用的调查方式4.具有经济性、时效性强、适应面广、准确性高等特点抽样调查5.从总体中随机抽取一部分单位(样本)进行调查6.目的是推断总体的未知数字特征7.最常用的调查方式8.具有经济性、时效性强、适应面广、准确性高等特点重点调查和典型调查1.重点调查从调查对象的全部单位中选择少数重点单位进行调查调查结果不能用于推断总体2.典型调查从调查对象的全部单位中选择少数典型单位进行调查目的是描述和揭示事物的本质特征和规律调查结果不能用于推断总体统计报表1统计调查方式之一2过去曾经是我国主要的数据收集方式3按照国家有关法规的规定、自上而下地统一布置、自下而上地逐级提供基本统计数据4有各种各样的类型⏹统计数据的初步处理一频数表和频数图二整理和展示数据定序数据的整理(可计算的指标)1.累计频数:将各类别的频数逐级累加2.累计频率:将各类别的频率(百分比)逐级累加3.图形:累计频数分布图、环形图定类数据的整理1.列出各类别2.计算各类别的频数3.制作频数分布表4.用图形显示数据(条形图和饼图)频数分布表的编制                数据类型及图示频数分布的类型⏹点估计的常见方法及应用点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等⏹如何区分假设检验问题?决策:双尾检验H0:m=H1:m≠研究:将认为研究结果是无效的说法或理论作为H0;是把希望证明的有效假设作为H1;先确立H1声明:将所作出的声明作为H0,对该的质疑作为H1;先确立H0除非我们有证据表明“声明”无效,否则就应认为该“声明”是有效的⏹介绍两种以上多重比较方法Fisher提出的最小显著差异方法,简写为LSD,该方法可用于判断到底哪些均值之间有差异⏹分子生物学方差分析的作用和意义?⏹数据缺失如何处理?为何要进行数据的变换?P171⏹相关系数的其它计算形式⏹聚类分析的思想和步骤a)对数据进行变换;b)定义样品间的距离(如欧氏距离)、类别之间的距离(如最短距离);c)首先将t个样品各自视为一类:得到初始的分类G(1)(含有t类),计算t个样品两两之间的距离,它们等价于初始的类间距离,得到初始的距离矩阵D(1);d)将距离最近的两类合并为一新类,得到新的分类G(2)(含有t-1类),并计算新类与其它类的类间距离,得到新的类间距离矩阵D(2),再按照最小距离准则并类,得到G(3)(含有t-2类)、D(3),…。直到所有样品都并成一类;画出谱系聚类图,决定分类的个数及各类的成员。⏹Stata的背景和功能,操作特点和心得3计算题⏹区间估计一.总体均值的区间估计(σ2已知)1.假定条件总体服从正态分布,且总体方差(σ2)已知如果不是正态分布,可以由正态分布来近似(n≥30)2.使用正态分布统计量3.总体均值μ在1-α置信水平下的置信区间为二.总体均值的区间估计(σ2未知)1.假定条件总体方差(σ2)未知总体必须服从正态分布1.使用t分布统计量2.总体均值在1-置信水平下的置信区间为三.总体比例的区间估计1.假定条件两类结果总体服从二项分布可以由正态分布来近似1.使用正态分布统计量2.总体比例P的置信区间为三.样本容量的确定估计总体均值时样本容量的确定1.根据均值区间估计公式可得样本容量其中:2.样本容量n与总体方差2、允许误差、可靠性系数Z之间的关系为与总体方差成正比与允许误差成反比与可靠性系数成正比估计总体比例时样本容量的确定1.根据比例区间估计公式可得样本容量其中:2.若总体比例P未知时,可用样本比例来代替第四节两个总体均值及两个总体比例之差的估计一.两个总体均值之差估计(σ12,σ22已知)1.假定条件两个样本是独立的随机样本两个总体都服从正态分布若不是正态分布,可以用正态分布来近似(n1≥30和n2≥30)2.两个独立样本均值之差的抽样分布服从正态分布,其期望值为其标准误差为3.使用正态分布统计量4.两个总体均值之差μ1-μ2在1-α置信水平下的置信区间为二.两个总体均值之差估计(σ12,σ22未知,但相等)1.假定条件两个总体都服从正态分布σ12,σ22未知,但相等2.总体方差σ2的联合估计量为3.估计量x1-x2的标准差为4.使用t分布统计量5.两个总体均值之差1-2在1-置信水平下的置信区间为自由度三.两个总体均值之差估计(σ12,σ22未知,且不相等)1.假定条件两个总体都服从正态分布12、22未知,且12222.使用的统计量为3.两个总体均值之差1-2在1-置信水平下的置信区间为四.两个总体比例之差估计1.假定条件两个总体是独立的两个总体服从二项分布可以用正态分布来近似2.两个总体比例之差P1-P2在1-α置信水平下的置信区间为第五节正态总体方差及两正态总体方差比的区间估计一.正态总体方差的区间估计1.估计一个总体的方差或标准差2.假设总体服从正态分布3.总体方差σ2的点估计量为S2,且4.总体方差在1-置信水平下的置信区间为二. 两个正态总体方差比的区间估计1.比较两个总体的方差比2.用两个样本的方差比来判断如果S12/S22接近于1,说明两个总体方差很接近如果S12/S22远离1,说明两个总体方差之间存在差异3.总体方差比在1-置信水平下的置信区间为⏹一般假设检验问题的计算一.总体方差已知时的均值检验(双尾Z检验)1.  假定条件总体服从正态分布若不服从正态分布,可用正态分布来近似(n30)2.原假设为:H0:m=m0;备择假设为:H1:mm03.使用Z-统计量总体方差已知时的均值检验(单尾Z检验)1.假定条件l总体服从正态分布l若不服从正态分布,可以用正态分布来近似(n30)2.  备择假设有<或>符号3.  使用Z-统计量二. 总体方差未知时的均值检验(t检验)1.  假定条件l总体为正态分布l如果不是正态分布,只有轻微偏斜和大样本(n30)条件下2.  使用t-统计量三. 总体比例的假设检验(Z检验)1.假定条件l有两类结果l总体服从二项分布l可用正态分布来近似2.P0为假设的总体比例比例检验的Z-统计一.总体方差的检验(χ2检验)1.  检验一个总体的方差或标准差2.  假设总体近似服从正态分布3.  原假设为H0:s2=s02S2样本方差;σ2假设的总体方差4.  检验统计量第三节两个正态总体的参数检验一.两个总体参数之差的抽样分布二.两个总体均值之差的Z检验(σ12、σ22已知)1.假定条件l两个样本是独立的随机样本l两个总体都是正态分布l若不是正态分布,可以用正态分布来近似(n130和n230)2.原假设:H0:m1-m2=0;备择假设:H1:m1-m203.检验统计量为两个总体均值之差的t检验((σ12、σ22未知但相等)1.检验具有等方差的两个总体的均值2.假定条件l两个样本是独立的随机样本l两个总体都是正态分布l两个总体方差未知但相等σ12=σ223.检验统计量两个总体均值之差的t检验(σ12、σ22未知但不相等)4.检验具有等方差的两个总体的均值5.假定条件l两个样本是独立的随机样本l两个总体都是正态分布l两个总体方差未知但不相等σ12≠σ226.近似t检验,Aspin-Welch检验法,检验统计量三.假设检验中相关样本的利用两个相关(配对或匹配)样本的均值检验四.两个总体比例之差的检验(配对样本的t检验)1.  检验两个相关总体的均值l配对或匹配l重复测量(前/后)2.  利用相关样本可消除项目间的方差3.  假定条件l两个总体都服从正态分布l如果不服从正态分布,可用正态分布来近似(n130,n230)统计量55        自由度df=nD-1样本均值        样本标准差两个总体比例之差的检验(Z检验)1.假定条件l两个总体是独立的l两个总体都服从二项分布l可以用正态分布来近似2.检验统计量⏹单因素方差分析问题计算和检验提出假设●H0:m1=m2=…=mk (因素有k个水平)●H1:m1,m2,…,mk不全相等构造检验统计量1.为检验H0是否成立,需确定检验的统计量2.构造统计量需要计算总离差平方和(SST)、误差项离差平方和(SSE)、水平项离差平方和(SSA)之间的关系SST=SSE+SSASSA的均方也称为组间方差,记为MSA,计算公式为SSE的均方也称为组内方差,记为MSE,计算公式为统计决策将统计量的值F与给定的显著性水平的临界值F进行比较,作出接受或拒绝原假设H0的决策▪根据给定的显著性水平,在F分布表中查找与第一自由度df1=k-1、第二自由度df2=n-k相应的临界值F▪若F>F,则拒绝原假设H0,表明均值之间的差异是显著的,所检验的因素(A)对观察值有显著影响▪若FF,则不能拒绝原假设H0,表明所检验的因素(A)对观察值没有显著影响⏹相关系数计算1.三.相关系数的显著性检验1.检验两个变量之间是否存在线性相关关系2.等价于对相关系数的检验3.采用t检验4.检验的步骤为1.提出假设:H0:;H1:02.计算检验的统计量:3.确定显著性水平,并作出决策1.若t>t,拒绝H02.若t
/
本文档为【中山大学2014生物统计学考试复习】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索