预防医学总论流行病学统计学复习资料
总论
现代医学
预防医学包括预防医学、基础医学、临床医学预防医学是通过研究环境因素、行为和生活方式、医疗卫生服务、生物遗传因素等对健
康的影响、疾病的分布规律,以及健康和疾病之间相互演变归路,已制定维护健康、防
治疾病、提高生命质量、延长寿命的对策和措施的一门学科预防医学的主要内容和特点:
①医学模式、健康观念与三级预防的策略和措施
②群体健康及其影响因素
③环境因素,包括生物、无力、化学和社会等因素对人类健康的影响
内④常用医学统计方法
容⑤人群健康研究的流行病学原理和方法,包括调查研究、实验研究、健康状况评价、健康危险因
素评价和生命质量评价等
⑥社区卫生服务,特别是疾病的社区卫生防治和人群的社区保健,健康促进和疾病预防
⑦突发公共事件的应急处理和预防
①工作对象:个体和群体
②主要着眼于健康人和无症状患者特③研究重点为影响健康的因素与人体健康的关系点④采取的对策更具积极作用,具有较临床医学更大的临床健康效应
⑤研究方法上更注重微观和宏观相结合
医学---心理---社会医学模式以系统论为原则,认为人的生命是一个开放的系统,通过与周围环境的
相互作用,以及系统内部的调控能力,决定健康的状况
健康是整个身体、精神和社会生活的完好状态,而不仅仅是没有疾病或补虚弱。
健康权健康是人类的一项基本需求和权利,也是社会进步的重要标志和潜在动力
疾病三级预防策略:(医务工作者是贯彻三级预防的主体)
第一级预防即病因预防或根本性预防,是在疾病尚未发生时对病因采取的预防措施,是预防控制
和消灭疾病的根本措施。它包括健康促进和健康保护两个方面“治未病”
第二级预防即临床前期预防,是在疾病潜伏期,为组织或延缓疾病发展而采取的措施,包括“三
早”,即早发现、早诊断、早治疗(慢性病)
第三级预防即临床预防,也称综合预防。是在疾病临床期为减少其危害而采取的措施,它的目的
在于防止伤残和促进功能恢复,提高生命质量,降低病死率,包括对症治疗和康复治疗
传染病“五早”早发现、早诊断、早
、早隔离、早治疗
流行病学(方法学)
学科形成前期
学科形成期
学科发展期(现代流行病学时期)18世纪18世纪末~20世纪初20世纪40、50年代
Johnsnow霍乱地图伦敦
流行病学研究人群中疾病和健康状态的分布及其影响因素,以及防治疾病和促进健康的策略与措施的科学
A.现况调查法,又称横断面调查
①描述性研究B.监测,纵向调查观察性研究C.生态学研究
流行病学研究方法②分析性研究病例对照研究、队列研究
①临床研究实验性研究②社区实验
理论性研究
1
预防医学总论流行病学统计学复习资料
死亡率:指某人群在一定期间内(通常为1年)的总死亡人数与该人群同期平均人口数之比。
病死率:指一定时期内(通常为1年),在患某种疾病的人群中,因该病而死亡的比例。
罹患率:是衡量某一局限范围较短期间内新发病例的频数。
感染率:指在调查时受检人群中某病现有感染的人数所占比例,通常用百分率表示。
生存率:又称存活率,指患某病的人(或接受某种治疗措施的人)经n年的随访,到随访结束时仍存活的病例数占观
察病例数的比例。发病率:指一定期间内,一定人群中发生某病新病例的频率
患病率:指某特定时期内一定人群中某病新旧病例数所占比例
发病率×病程=患病率发病率
资料来源
计算分子
计算分母
观察时间
适用疾病种类
特点
用途
影响因素
疾病的三间分布
地区分布
时间分布
人群分布国家间及国家内分布;城乡分布短期波动;季节性;周期性;长期变异性别;年龄;职业;种族和民族;行为疾病报告、疾病监测、队列研究观察期间新发病例数平均人口数或暴露人口数一般为1年或更长时间各种疾病动态描述疾病流行强度相对少、疾病流行情况、诊断水平、疾病报告质量等现况调查观察期间病例数(新、旧病例)调查人数或平均人口数较短、一般为1个月或几个月慢性病或病程较长的疾病静态描述疾病现患状况或慢性病流行情况较多、影响发病率变动的因素病后死亡或痊愈及复发情况及患者病程等患病率
描述性研究
描述性研究通过在特定人群中收集、归纳、整理资料及数据处理等手段,描述疾病和健康状况在时间、地点和人
群方面的分布特点及发生、发展规律,提出初步防治对策或进一步的研究方向
现况调查又称横断面调查,在一个特定的人群中,在某一时点或短期时期内,同时评价暴露与疾病或健康的状
况,用以描述暴露、疾病或健康的分布以及两者可能的相关关系
目的和用途:①描述疾病或健康状况的分布②提供病因线索③早期发现病人④评价疾病的防治效果
现况调查类型
普查
抽样调查
抽样调查按照一定的抽样方法,随机抽取某研究人群中有代表性的一部分人群进行调查,以所得的结果估计该人
群某疾病的患病率或某些特征的情况,即以局部推论总体的调查方法
抽样方法①单纯随机抽样②系统抽样③分层抽样④整群抽样⑤多级抽样
优缺点
2
预防医学总论流行病学统计学复习资料
优点:①节省时间、人力物力②调查范围小,调查工作容易做的细致③适合于调查发病率较高的疾病
缺点:①调查设计、实施和资料分析均较复杂,重复和遗漏不易被发现,且不适用于调查变异较大的资料
②当某病的发病率很低时,小样本不能提供足够的信息,而若样本扩大到近于总体的75%时,直接进行普查更有意义
分析性研究
病例对照研究
病例对照研究是选择一组患有所研究疾病的病例人群作为病例组,另选一组目前未患此病的人群作为对照组,
分别调查其既往暴露于某个(或某些)危险因子下的情况及程度,以判断暴露危险因子与研究疾
病有无关联程度大小的一种观察性研究方法
暴露:指研究对象具有某种疑为与疾病有关的特征或受到某种可以因子的影响
特点
①属于观察性研究
②设立对照
③观察方向是由“果”及“因”
④一般不能论证暴露与疾病的因果关联
类型①非匹配设计的病例对照②匹配设计的病例对照研究
用途①探索疾病的可疑危险因素②检验病因假设③提供进一步研究的线索
选择研究对象病例的选择对照的选择①特别适合用于少见病、罕见病的研究
②省力省钱省时,并易于组织实施
优点③还可用于疫苗免疫学效果考核及暴发调查等
④可同时研究多个因素与某种疾病的联系
⑤对研究对象多无损害
①不适于研究暴露比例很低的因素
②选择偏倚难以避免
缺点③暴露于疾病时间先后难以判断,信息真实性差
④存在回忆偏倚
⑤不能测定暴露和非暴露组疾病的率
OR
OR的意义表示两组中某事件发生的概率与不发生的概率的比值的比OR值是相对危险度的估计值,表示在暴露因素是不存在暴露因素发生某病的风险倍数(与1的关系)
偏倚及其控制
偏倚是随机误差以外的可导致研究结果与真实情况差异的系统误差
主要有选择偏倚、信息偏倚、混杂偏倚概念
选择偏倚分类
控制
概念
信息偏倚分类
控制
混杂偏倚概念指由于选择研究对象的方法存在问题而使研究结果偏离真实的情况①入院率偏倚②检出偏倚③奈曼偏移④易感性偏倚⑤无应答偏倚⑥失访偏倚①科研设计要严谨,严格掌控纳入和排除研究对象的标准②提高应答率,减少失访率③设立多组对照指在研究的实施阶段,从研究对象获得信息时,由于收集资料的方式不可比,因而造成研究结果与真实值之间的系统误差①回忆偏倚②暴露怀疑偏倚③诊断怀疑偏倚④测量偏倚制定严格的收集资料和质量控制方法。对研究者进行统一的
,统一收集资料的方法和标准,要求研究者有严谨、科学的态度。尽量使用客观的指标,以避免研究着和研究对象人为的偏倚。采用权威的诊断标准由于一种或多种潜在的混在因素影响,是结果分析缩小或夸大了研究因素与疾病的关系,从而
3
预防医学总论流行病学统计学复习资料
医学统计学
医学统计学
是运用概率论、数理统计的基本理论与方法,结合医学世纪,阐述统计设计的基本原理和步骤,研究医学资料或信息的搜集、整理与分析的一门学科
同质:指观察单位件被研究指标的影响因素相同
变异:指在同质基础上各观察单位间某观察指标的差异总体:指根据研究目的确定的同质观察单位的全体
样本:是从总体中随机抽取的具有代表性的个体的集合参数:反映总体的统计指标(希腊字母表示)统计量:反映样本的统计指标(英文字母表示)
统计变量的分类(变量:研究对象的某种属性或特征)
数值变量:又称定量变量
二分类变量
分类变量
(定性变量)多分类变量:①有序多分类变量
②无序多分类变量
区间估计:按预先确定的概率估计总体均数所在范围(可信区间)医学统计工作的基本步骤:
①医学研究设计②收集资料③整理资料④分析资料
集中趋势的统计指标
样本中各观察值与其均数的差值平方和小于各观
算术均数
直接法加权法
察值与任意其他数值的差值平方和;
样本中各观察值与其均数差值(离均差)的总和等于0
几何均数中位数Me百分位数
将数据按大小顺序排列起来,形成一个数列,居于数列中间位置的那个数据
适用于观察值呈倍数关系变化平均增长率适用于偏态分布;适用于分布不明的资料;适用于开口数据资料适用于对称分布
①正态分布时均数=中位数>几何均数②正偏态分布时(左):均数>中位数③负偏态分布时(右):均数<中位数
变异程度的统计指标
按间距计算:极差、四分位数间距极差(R)
也称全距,观察值中最大值与最小值之差
通常仅用于粗略说明变量波动范围,呈明显偏态分布时会更加不稳定
仍未用到每一个具体的观察值,统计分析中应用不普遍
适用于任何一种分布适用于偏态分布;适用于开口数据;适用于分布不明的数据适用于正态分布适用于正态分布;适用于近似正态分布
标准差除以均数
唯一无单位的指标
适用于单位不同的数据;适用于均值相差悬殊的数据
四分位数间距(Q)
按平均差距计算:方差、标准差、变异系数方差(S)标准差(S)变异系数(CV)
2
离均差平方和除以自由度df
正态分布(高斯分布)
4
预防医学总论流行病学统计学复习资料
特点:1.单峰分布,以X=μ为对称轴,正态曲线以X轴为渐近线,不与X轴相交
2.在X=μ处取得最大值,f(μ)=1/(σ√2π);X=μ+-σ处有拐点
3.μ是位置参数;σ是形态参数,σ越大曲线越矮胖,σ越小曲线越瘦高
4.曲线下面积即为概率;总面积为1;左右任意个标准差范围内面积相同
(μ+-1.64σ范围90.00%;μ+-1.96σ范围95.00%;μ+-2.58σ范围99.00%)
运算:1.μ→ψ(μ)2.ψ(μ)→μ3.ψ(μ)→μ→X4.X→μ→ψ(μ)
标准正态分布
医学参考值范围
是指包括绝大多数正常人的人体形态、功能和代谢产物等各种生理及生化指标常数,也称正常值
1.无肝、肾、心、脑、肌肉等疾患
2.近期未服用对肝脏有损害的药物
3.检测前未做剧烈运动,还要注意划分同质对象
计算方法:1.正态分布法2.百分位数法
参数估计与假设检验
参数估计:由样本统计量估计总体参数(点估计,区间估计)
抽样误差:由抽样造成的样本统计量与总体参数的差异
标准误:样本统计量的标准差
点估计:用单一的数值直接作为总体参数的估计值
区间估计:按预先给定的概率,计算出一个区间,使它能够包含未知的总体参数
(理解可信区间:95%可信区间表示该区间包括总体均数μ的概率为95%,即若作100次抽样算得100个可信区间,则平均有95%可信区间包括μ,只有5个可信区间不包括μ。按一定的概率或可信度(1-α)用一个
区间来估计总体参数所在的范围)
①σ已知()
②σ未知,n>30()
③σ未知,n<30()
正态分布总体中进行抽样服从自由度ν=n-1的t分布,t分布是以0为中心的对称分布。
随自由度ν的增大,t分布曲线越来越接近于标准正态分布曲线,当ν→∞,t分布的极限分布就是标准正态分布
标准差与标准误的联系与区别标准差
含义
意义反映标量值离散程度大小的统计指标标准差越大,变量值的离散程度越大,平均数对
标量值的代表性越差
描述离散程度;
计算变异系数;
计算医学参考值范围
随n的增大,标准差趋于稳定标准误描述均数抽样误差大小的统计指标标准误越大,均数的抽样误差越大,样本均数对总体均数的代表性越差衡量抽样误差的大小;计算可信区间;假设检验随n的增大,标准误越小应用与n的关系
联系都是描述变异程度大小的统计指标;
用标准差计算标准误;
5
预防医学总论流行病学统计学复习资料
95%医学参考值范围
定义
公式
用途作为参照诊断疾病统计推断同质总体内包括95%个体值的估计范围95%可信区间
按95%可信度估计的总体均数的所在范围
假设检验
服从t分布(Sd为差值的标准差)
基本步骤
①建立假设和确定检验水准H0为原假设(无效假设)α=0.050.010.1常用0.05即检验水准或拒绝域
(其实就是建立要否定的结论,设立假设最后否定之)H1是备择假设
②选择检验方法和计算检验统计量(假设检验、卡方检验等)
③根据P值做出统计推断
(当ABS(t)≥ta/2,ν,则P≤α,按α检验水准拒绝H0,接受H1,“差异有统计学意义”;若P>α,则不能拒绝H0“尚不能认为差别有统计学意义”)
P值意义P值是在H0成立时大于等于用样本计算出的统计量值出现的概率
假设检验注意事项
①保证假设检验的结论有指导意义
②检验方法必须根据变量的类型、设计类型、样本含量的大小来选择
③注意假设检验中的两类错误
t检验
单样本t检验
适用于样本均数()与已知总体均数μ0的比较,目的是检验样本均数()所代表的总体均数μ是否与已知总体均数μ0有差别
配对样本均数t检验
同源配对
同一受试对象不同部位比较
同一受试对象处理前后对比
同一受试对象接受不同的处理方式
两个独立样本均数t检验
①独立性要求这两个样本所对应的主题相互独立
②正态性这两个样本所对应的总体服从正态分布
③方差齐性这两个样本所对应的总体方差相等
t检验中的注意事项
1.假设检验结论正确的前提①代表性(相应的总体)②均衡性
2.检验方法的选用及其适用条件T检验以正态分布和方差相同为基础
3.双侧检验与单侧检验的选择相同检验水准下,对同一资料作单侧检验更容易获得显著的结果;一般应用双侧
4.假设检验的结论不能绝对化假设检验统计结论的正确性是以概率作保证的,统计结论时不能绝对化
5.正确理解P值的统计意义P≤α只能说明差异具有统计学意义,并不代表实际差异的大小
6.假设检验和可信区间的关系假设检验用于推断总体均数间是否不同,而可信区间则用于估计总体均数所在的
范围,计算时都利用了抽样误差估计公式
假设检验中的两类错误
Ⅰ.拒绝了实际成立的H0所犯的错误假阳性
Ⅱ.不拒绝实际上不成立的H0所犯的错误假阴性
确定的检验水准α值越小,出现Ⅱ类错误的概率β越大,反之亦然,若要同时减小α和β,可以通过增加样本
6
异源配对两个受试对象按照某一属性配对
预防医学总论流行病学统计学复习资料
容量的方法实现
第八章方差分析
方差分析由R.A.Fisher首先提出,又称F检验。基本思想:将全部观测值的总变异按影响因素分解为相应的若干部分变异,在此基础上,计算假设检验的统计量F值,实现对总体均数是否有差别的推断
①处理因素分子:组间基本思想②误差因素
分母:组内误差因素
步骤:
①提出检验假设,确定检验水准
②计算检验统计量F值
③确定P值,做出推断结论
第三节多个样本均数的两两比较
SNK-Q检验(对于单因素分析MS误差就是MS组内)各比较组样本含量可不相等
若Q值大于或等于Q界值,则可以推断比较的两组间差别有统计学意义
不用T检验的原因:
T检验对K组均数进行两两比较C(2,K)次,需要进行N次比较,若规定检验水准α=0.05,在原假设H0成立的条件下,n次检验均不犯Ⅰ类错误的概率为0.95^n,累计犯Ⅰ类错误的概率为1-0.95^n,可明显大于0.05。因此,均数间的多重比较不能直接使用两均数比较的t检验。
(对于两组资料的比较,方差分析与t检验——完全等价)
第四节方差齐性检验
Bartlett检验法Levene检验法
第四章定性数据的统计描述
率:是频数指标,表示某现象发生的强度与频率
构成比:是构成指标,表示事物内部各构成部分所占的比重或分布情况
相对比:是两个有关联的指标之比
相对数:两个有关的绝对数之比,也可以是两个有关联统计指标之比
为什么引入相对数?
意义:消除基数影响,便于事物间的比较构成比和率的区别
构成比
某事物内部各组成部分在整体中所占的比重
1.各部分可直接相加
2.各部分之和等于100%
3.某部分变化,其它部分随之变化1.各率不可直接相加2.总率不一定等于各率之和3.某率的变化,不影响其它各率率在一定空间范围内某现象的发生数与可能发生的总数之比
相对比:①两类别例数之比②相对危险度
比数比:流病中表示病例组和对照组中的暴露比例与非暴露比例的比值之比,反映疾病与暴露之间关联强度的指标标准化率
为了正确比较率,统计学上用标准化的方法消除内部结构构成的影响(选择的标准不同,得到的标准化率可能不同)相对数指标使用的注意问题
①不要把构成比与率混淆
②使用相对数时分母不宜过小
③注意资料的可比性
④样本率或构成比存在抽样误差
第九章卡方检验
四个表资料的卡方检验
当两个样本率不同时,有两种可能:
7
预防医学总论流行病学统计学复习资料
1.π1=π2;P1、P2的不同是由抽样误差造成的
2.π1≠π2;P1、P2的不同是由本质差异造成的
,ν=(行数-1)(列数-1);A为实际频数,T为理论频数(基于H0成立算得,即π1=π2确定)
计算理论频数公式,为相应行与列的周边合计数,n为总例数
值反映了实际频数与理论频数的吻合程度。若检验假设H0成立,实际频数与理论频数的差值应高较小,即值也应该较小;若检验假设H0不成立,实际频数与理论频数的差值应高较大,即值也会较大。因为公式每个加数都大于0,所以自由度愈大,值也会愈大。
查表:值愈大,P值愈小;反之值愈小,P值愈大。若检验水准为α,当时,P≤α,拒绝H0,接受H1;当时,P>
α,不拒绝H0
四个表资料检验的专用公式
使用条件:总例数n≥40且所有格子的T≥5时,可用专用公式
四格表资料检验的校正公式(分布是连续型分布,实际频数A为分类资料不连续,计算得的值得出的P偏小)校正公式为:
;
在实际工作中,对于四格表资料,常用规定为
①当n≥40且所有的T≥5时,用检验的基本公式或四格表资料检验的专用公式
②当n<40但有1<T<5时,用四格表资料检验的校正公式
③当n<40或T<1时,用四格表资料的Fisher确切概率法
配对四格表资料的检验
总体有B=C
b+c≥40→,;b+c<40→
R*C列联表资料的检验
多个样本率间多重比较
Bonferroni方法,重新规定检验水准α’;
多个实验组间两两比较:α’=(=,k为需要比较样本率的组数
实验组与同一个对照组的比较:α’=
R*C列联表资料的检验的注意事项
1.对于多个率或频率分布比较的检验,结论为拒绝H0时,仅表示多组之间有差别,并不是任意2组之间都有差别。
若要明确哪两组之间不同,还需要进一步作两两比较
2.R*C列联表检验要求理论频数不宜太小,一般不宜有1/5以上的格子的理论频数小于5,或有一个理论频数小于1
3.检验不适于有序分类资料的比较分析
第五章统计表与统计图
统计表标题在上面;统计图标题在下面(考)
统计表
统计表的编制原则①重点突出,简单明了②主谓分明,层次清楚③数据表达
,文字和线条从简
统计表由标题、标目(包括横标目、纵标目)、线条、数字和备注构成(填空题)
统计表分类:简单表、复合表
编制统计表的注意事项:1.统计表不一定是唯一的2.避免内容混杂,表达不清,结构混乱
统计图
统计图由标题、图域、标目、图例和刻度组成(填空题)描述定量数据的统计图
直方图
线图连续性频数分布资料连续性资料主要用于表示连续变量频数分布情况适用于描述一个变量随另一个变量变化的趋势纵轴刻度必须从0开始若纵坐标按对数尺度,横坐标按算
数尺度,制作的线图叫半对数线图
8