三维不完备列联表的独立性及其临床资料
三维不完备列联表的独立性及其临床资料
分析
三维不完备列联表的独立性及其临床资料分析
张丕德
【摘要】目的系统讨论三维不完备表的独立性估计和检验方法方法通过实例分析
说明直接计算方法和
SAS程序实现办法.以及结果解释.结果实例分析说明对临床资料的应用是可行的.
结论不完备表在实践中
是常见的.本文讨论的方法具有推广和应用的价值
【关键词J不完备表极大似热估计y.检验似然比检验
IndependenceofTliree-dimensionalIncompleteContingencyTableandClinicalDataAnalysisZhangPide,Depart
meritSorla~MedicineandHealthStatistics,G"d咖茸
CollegeofP~rnmcy,Guangzhou.510224
【AbstractJObjectiveToscL.ssmethodsof3estimationandtestofindependentincompletet
dimen~ionM hree—
contingencytableMethodsToshowhowtoapplythesemethodsmanuallyorbySASproceduresandexp]alntheresults
intheexample.ResultsItshowedtheexamplethatapplingthesemethodstoclinicaldataisfeasible.Conclusion
IncompletecontingencytablesareoommoD,sothemethodsdLscu~edinthispapera"worthbeingspreadandapplied.
【Keywords】
IncompletecontingencytableX2-testMaximumlikelihoodtestMaximumlikdihoodestimate
不完备表有两种形式:一种是由于抽样容量不
够大或抽样规则的限制使某些格子的实际频数为
零,即含有"抽样零"的不完备表.这时可以给每个零 格赋予一个很小的数(如100.)将列联表完备化.从 而按照完备表的方法处理;另一种是由于总体按某 些指标分类带有一定的倾向性.使得某些交叉分类 的格子出现频数的理论概率为零.即含有"结构零" 的不完备表.这类表在实际工作中经常会出现.但国 内对这种表的研究较少.而且往往被不恰当地处理. 因此,本文将文献中已有的结果进行整理和一定的 推导,就三维的情形展开详细讨论,在实例部分还给 出统计软件SAS实现方法,便于实际工作者选择使 用.
I含有"结构零"的不完备表
I.1Deming-Stephan比例迭代极大似然估计 法【1.2】
假定一不完备表.有J行.J列,K层.记非结构 零基本格集合为S.,T和t分别为(i,j,) 格的实际频数,理论频数及其极大似然估计,-T++ =+=
表示一维与二维实际频数边缘
和.其它边缘和记号与计算方法类似,建立对数线性 模型:
10gT="+"1(|)+"2(Jj+",(j+12(q)+
"l,()+2,<)+"123(神j,(i-,)?S
式中."为平均效应,"l,"2,",."12,1,."2,,"l23
分别表示主效应,二阶交互作用及三阶交互作用.且 满足对同一足标求和为零的要求;下标1,2和3分 别代表行,列和层的效应.
在不同的假设之下.进行迭代似然估计,由于极 大似然估计要求理论频数估计的边缘与实际频数的
边缘一致.因此.在迭代循环的过程中,每一步都要 根据实际额数充分轮廓的边缘对似然估计按比例校 正.直到满足事先规定的精度(如maxlt一
tf<或(m
.
axlt一t-2l<占为止.
是事先给定的很小的正数.一般取=0.001.具 体迭代方法见表1,表2和表3.
表1三价交互作JII为零夏二价交互作JII奎为零时的遣代估计过程
怍者单位:510224广东药学院社会医学与卫生统计教研室广州市
表2三阶交互作用及一个二阶交互作用为零时的迭代估计过程
其中为基本格结构零格数,-r,2和^分别为轮 廓l++I,{.r+,+l和f++}的结构零格数,,1, ^3和,2,分别为轮廓{'r+I,}+}和{.r~tk}的结 构零格数,(i,J,k)?S.
12建立模型检验统计量
利用最终似然估计于m=t(或于)构造
检验统计量.Pearsony统计量或似然比统计量 z,(一于)/~Fok
或G2x6~log(2"ijj)
两者均服从Y分布,自由度确定见表1,表2 和表3.
2实例分析
Fienberg和Bish.P口J曾研究击伤病人击伤部位 和入院,出院病情状态的关系.将击伤部位分为左部 和右部,入院,出院病情状态按严重程度分为1,2,3 三个等级,由于医院不让病人病情加重后出院(死亡 除外).因此,病人出院时要幺保持入院时的状态.要
幺有明显病情减轻,这样资料分类时就会出现结构 零("一"表示).见表4.应用上述方法.在各种假 设条件下(不妨设下标1,2,3分别表示入院,出院, 部位分类轮廓)直接求迭代似然估计,检验结果见表 5.可见.假设(1)m=0,(2)"l2="l23:0,(3)"l3
="123:0与(4)"l2:"l3="l23=0按水平0.05是 显着接受的.其他情况P值接近于显着水平,先不 考虑.从方差分析的角度看.(1)是(2),(3)的特例, (2),(3)是(4)的特例,在(1)满足的条件下检验(2), (3).G差值分别为0与4.62.自由度为1与2.P 值均大于0.05.即"】2=0与"l3=0条件地成立;在 (2),(3)的条件下检验(4),G差值分别为4.88与 0.26,自由度为2与1.P值均大于0.05,故",:0 与"l3=0条件地成立.因此本资料在H0:"12= "13="123=0假设之下拟合能够得到满意的结果. 说明病人入院击伤的状态与出院的状态和受伤部位
不同的 都无关.而出院的状态却与受伤的部位有关,部位治疗效果有差异.也可使用SAS软件CAT— MOD过程分析.但在输入数据时需要将结构零 的基本格剔除.而对抽样零赋予一个很小的数(如 10-20).简单程序见附注.
表4击伤惠者数据的三准不完善表
"】230
"】2="123=0
?="123=0
"l23=0
】2"l3l230
?""L2】0
】2"n"Ln0
H.,"1,",.,】=0
0.60
0.60
522
776
548
ll62
803
11.89
439
741
156
051
241
040
090
064
附注:实倒SAS程序,A,B与C表示入院,出院与部位分类变量,?T为观察频数.
Dm?0Iogllnalblc@2{/*拟台Hl=0-/ iz~putABCw1_@@;ruD: lWT=0thenWT=IE一20;/*校正抽样零*//l.gnalcblc:甜台l2="m;0
cards;Ir~linalbblc:拟合ul,="】2,=0
11I61128211722132123[~linalba}c:拟台口="】=0 2221311173211033113312I~linbl?拟台Hl2="l】=um;0
363225332l0It,l1
.albc;拟台H?="=Hl2=0
{I.雩aIcb;拟台"】2=;l=0
Drocoatmeal;weightWT;
I.雩山nabc;拟台ul2"="="l口=0
modela*bc=respol~se/J'reqDred=ffeq:
/
3讨论
本文只讨论了三维不完备表的处理办法+对更
高维的不完备表处理方法一样,但迭代计算的公式 较复杂,可能的假设条件也相应增多,这时,对有条 件者采用SAS软件处理是最佳选择.若抽样零太 多.应用赋小值的方法校正未必恰当+需补充信息或 利用条件似然估计的方法.
参考文献
lLeoA.(nTheanalysis.cms自-cl皿sifteddatahavi~Dr_
deredarld/ormorderedcatees:As.~eiatlonm~tels.correlation
models,曲d?me?ymodelsfor0?dng翱cy钮withorwith— Dutnu~ingentries.Tanna/s.f5tsti~tics.1985.13(1):l0,70 2张尧庭译离散多元分析:理论与实践.北京:中国统计出版社. 1998.214,310
3SASI,lstitu坼Ine.SAS/STATUser'sGuide.Volume1(6).
1994405,519
(收稿日期:2~011411.11)
影响医院信息系统建设的主要因素及其对策
姚伟沈康
医院信息系统(HospitatInformationS~temmH1S)建设 是医院建设的一个重要方面,是实现医院科学管理和运行的 支撑环境.目前国内各大医院都非常重视HIS的建设.正在 投人资金建设新系统或对旧系统进行改造.但由于许多医 院对HIS的认识不够,而出现一次又一次地交学费"的现 象.笔者根据本院HIS建设的体会.对当前HIS建设的主 要影响因素谈一些粗浅的认识,与同道们一起切磋.
1HIS建设的主要影响因素
1.1在观念上对建设HIS的重要性认识不足.几乎所有医 院的领导者对加强大型医疗设备购置和医院基车设施建设 的重要性理解得十分透彻.他们已经在这些方面的投人上获 得了较大的经济回报.因而乐此不疲.然而对HIS建设的重 要性认识不足.他们肘先进的科学管理手段和方法反应滞 后.认为计算机技术是高科技产物,难以被人掌握和使用.对 计算机信息管理所产生的经济效益持有怀疑态度.使医院 管理停留在传统的粗放式的经验型经营管理模式上. 1.2专业人才缺乏.应用队伍力量薄弱.信息技术是一门 多元的新兴技术.无论开发还是应用,都要涉及到不同专业 的知识.但我国目前绝大部分的医院峨乏既懂计算机软硬 件知识,又懂医疗业务和医院管理知识的复合型的专业人 才.同时计算机信息技术在医院的运用.需要一支规模宏大 的应用队伍,目前应用队伍力量薄弱,跟不上发展的要求. 13HIS软件不规范.HIS作为一个整体.它包括硬件和 软件两个方面,在这两者中硬件技术对HIS建设的要求来 说已基率成熟,而HIS软件尚有诸多问
:?戟件开发投有
,开发所依靠的平台不一,语言多种多样,扩展和升级难 度大;0戟件停留在信息精入,统计阶段,没有上升到信息分 析和预测的智能化程度;?开发人员中缺乏有经验的医疗专 业人员和医院管理人员.开发的软件没有体现"以病人为中 心.以医疗活动为纽带这一行业特点.实用性较差;?软件 的子系统步,功能单一,大多仅有经济管理部门模块,系统不 完整,可扩充性差.
1.4软件市场的不成熟.目前的软件市场就象王码广告中 说的一样"万马奔腾".就HIS而言,开发的公司很多.其中 作者单位:226361江苏省南通市肿靖医院信息辩