[doc
] 《中国骨伤》杂志论文中存在的统计学错误辨析(9)
《中国骨伤》杂志论文中存在的统计学错误
辨析(9)
中国骨伤2008年l0月第2l卷第lO期ChinaJOrthop&Trauma,Oct.2008,Vo1.21,No.10
《中国骨伤》杂志论文中存在的统计学错误辨析(9)
?
继续教育园地?
周诗国,胡良平
(军事医学科学院生物医学统计学咨询中心,北京100850)
ZhongguoGushang/ChinaJOahop&Trauma,2008,21(10):802—806WWW.zggszz.con
本文对《中国骨伤》杂志2006年第9期与2007年第9期
所刊载的”临床研究”和”基础研究”类的论文,从统计学方法
的应用角度作了较为细致的考察,就试验设计,统计
达与描
述和统计分析3个方面存在的问题进行了辨析,并提出了改
进的建议和意见,希望能够帮助读者进一步提高科研工作的
科学性和严谨性.
1试验设计方面的错误辨析
最常见的标准的试验设计类型有单因素设计(包括单组
设计,配对设计,单因素两水平设计和单因素多水平设计),多
因素析因设计和重复测量设计.还有一种是七拼八凑搞出来
的试验方案,不是标准的试验设计,叫做”非平衡的多因素组
合试验”l1..
例1,(CT引导下经皮空心拉力螺钉固定治疗骶髂关节
损伤》一文,探讨CT引导下经皮空心钛合金拉力螺钉内固
定治疗骶髂关节损伤的临床疗效.受试对象为骶髂关节损伤
患者36例,其中男26例,女10例;年龄19,68岁.按Tile分
类:B型6例,B2型16例,B3型4例;Cl型4例,C型3例,C3
型3例.采用CT引导下经皮空心钛合金拉力螺钉内固定术
治疗,硬膜外麻醉下共置人48枚宅心钛合金拉力螺钉.术后
随访3,27个月.依据骨盆创伤治疗标准,影像学评价优29例,
良6例,差1例;临床评价优23例,良l3例.并发症包括轻度
下腰痛l例,骶尾部痛l例.得出”CT引导下经皮空心钛合金
拉力螺钉内固定治疗骶髂关节损伤,置钉精确,安全有效,并
发症少”之结论.请问:此结论可信吗?为什么?
辨析:此研究的结论不可信.因为此研究中的36例骶髂
关节损伤患者全部接受的是CT引导下经皮空心钛合金拉力
螺钉内固定术治疗,没有患者接受其他方案的手术治疗,所以
此研究缺少对照组.缺少对照,则结论缺乏说服力,不可信.假
如存在另外一种手术治疗方案,用其治疗骶髂关节损伤,与研
究者所采用的治疗方案相比,置钉更精确,更安全有效,且并
[5]丁继华.伤科集成续集.北京:中医古籍出版社,2007.31.
[6]胡廷光着.胡晓峰整理.伤科汇纂.北京:人民卫生出版社,2006.
147.
[7]OlderTM,StablerEU,CassebaumWH.Collesfracture:evaluation
ofselectionoftherapy.JTrauma.1965.5:469—476.
[8]GartlandJJJr,WerleyCW.EvaluationofhealedCollesfracture.J
BoneJointSurg(Am),195l,33(4):895—907.
[9]SarmentoA,PrattGW,BerryNC,eta1.Collesfracture:functionbr—
acinginsupination.JBoneJointSurg(Am),1975,57(3):3l1—5l7.
[10]JakimI,PieterseHS,SweetMB.Externalfixationforintra-artieu.
tarfractureofthedistalradius.JBoneJointSurg(Br),1991.73
(2):302—306.
[11]FrykmanG.Fractureofthedistalradiusincludingsequelae—shoul-
der—hand—fingersyndrome.distrubanceinthedistalradio—ulnar
jointandimpairmentofnervefunction.Aclinicalandexperimen—
talstudy.ActaOrthopScand,1967,108(Supp1):155.
[12]MeloneCPJr.Articularfracturesofthedistalradius.OrthopClin
North(Am),1984.15(2):2l7-236
[13]MeloneCPJr.Distalradiusfracturespatternsofarticularfragmen—
tation.OrthopClinNorth(Am).1993,24(2):239—253.
[14]MullerME,AllgowerM,SchneiderR,eta1.Manualofinternalfix.
ation.TechniquesrecommendedbytheAO-ASIFgroup.3rdEdit.
NewYork:Springer.1991.1.
MissakianMI,CooneyWP,AmadioPC.Openreductionandinte一
131alfixationfordistalradiusfracture.JHandSurg,1992.17(4):
745—755.
FernandezDl.Fraetuersofthedistalradius.operativetreatnlent.
AA0SInstCourseLec.1993.42:73-88.
CooneyWP.Fractureofthedistalradius:amoderntreatmentbas—
edclassification.OrthopClinNorth(Am),1993,24(2):21卜216.
DoiK,HattoriY,OtsukaK.eta1.1ntra?articularfractureofthedis—
seopieallyassistedreductioncon— talaspectoftheradius:arthro—
paredwithopenreductionandinternalfixation.jBoneJointSurg
(Am),1999,8l(8):1093-11lO.
陆蓉.桡骨远端骨折分型及其临床意义.南通医学院,
l999,19(3):325.
王晓峰,陈宇.桡骨远端骨折分类浅析.中国冶金T业医学杂
志,2001,18(2):76.
宋炳华,龚晓东.桡骨远端骨折分型新论.中国骨伤,2007,20
(1):46.
[22]尚天裕.中国接骨学.天津:天津科学技术出版社,1995.175-
189.
(收稿日期:2008—06—18本文编辑:连智华)
“加
中国骨伤2008年lO月第2l卷第lO期
ChinaJOrthop&Trauma,Oct.2008,Vo1.21,No.10
发症更少,则原作者所陈述的结论是错误的.
此外,此研究的受试对象性别不同,年龄跨度大,骶髂关
节损伤的类型不同,随访时间差别也很大,因而受试对象的同
质性不好.而性别,年龄,骶髂关节损伤的类型,随访时间等重
要的非试验因素对疗效是有影响的,因此,该研究所得出的疗
效是不确定的,情况变了,疗效也会发生很大变化.
例2,《?型浮膝损伤术后膝关节功能康复》一文,为了
总结?型浮膝损伤患者的治疗方法和手术后膝关节功能康复
疗效,回顾分析经治的68例患者,男57例,女l1例;年龄
l7—60岁.68例共74侧肢体的?型浮膝损伤一膝关节内骨折
病例.根据患者骨折类型,是否存在开放性损伤,软组织损伤
程度分别采用内固定(髓内钉,解剖钢板)和支架外固定方法,
术后均采用统一,系统的康复治疗……使用检验对两种固
定方法治疗后膝关节功能康复效果差别进行显着性分析.所
有病例均得到l,4年的随访.内固定组优良率64.29%,支架
外固定组优良率80.43%.内固定组与支架外固定组比较,膝
关节活动受限度指标有统计学差异(P<0.05),说明?型浮膝
损伤应当注重对关节内骨折的复位和减少对膝关节周围软组
织的破坏.请问:该研究的试验设计正确吗?为什么?
辨析:该研究的试验设计不正确.首先,研究者根据患者
骨折类型,是否存在开放性损伤,软组织损伤程度分别采用内
固定和支架外固定方法治疗,因此,内固定组与支架外固定组
除了固定方法不同外,骨折类型,开放性损伤情况,软组织损
伤程度也不同,两个组是不可比的,试验设计违背了均衡原
则.其次,由于68例患者性别不同,年龄相差悬殊,骨折类型,
开放性损伤情况,软组织损伤程度不同,随访时间也不同,所
以该试验设计还违背了受试对象的同质性原则.而患者的性
别,年龄,骨折类型,开放性损伤情况,软组织损伤程度,随访
时间等重要的非试验因素对疗效是有影响的,因此,该研究所
得出的治疗或康复效果是很不确定的.
例3,《踝关节骨折手术治疗的综合分析》H】一文,探讨手
术治疗踝关节骨折的方法,对手术疗效进行回顾性分析并总
结临床经验.将随访资料完整的187例踝关节骨折患者作为
研究对象,男106例,女8l例;年龄l3,63岁.按照Lauge—
Hansen分型,旋后外旋型13l例,旋前外旋型33例,旋后内
收型16例,旋前外展型7例.所有病例均行开放复位内固定.
术后随访时阃为6,36个月.请问:此研究的试验设计妥当
吗?为什么?
辨析:此研究的试验设计不妥当.首先,研究者只将随访
资料完整的187例踝关节骨折患者作为研究对象,这样做违
背了受试对象选取的随机性原则,所得到的受试对象不具有
代表性.其次,所有病例均行开放复位内固定,缺少对照组,违
背了试验设计的对照原则,研究结论不可信.再次,受试对象
的性别不同,年龄跨度大,踝关节骨折类型各异,随访时间相
差悬殊,因而受试对象的同质性差,而性别,年龄,骨折类型,
随访时间等重要的非试验因素对疗效是有影响的,因此,研究
结论的可信度不够高.
例4,《骨松宝胶囊治疗老年人胸腰椎压缩性骨折疗效分
析》一文,受试者入选标准为:年龄/>55岁,按AO分型均属
A型压缩性骨折,属轻度外伤引起的轻型骨折,无明显神经受
伤表现.分组:住院病例共50例,随机分为实验组25例,对照
组25例.试验组男l5例,女10例;年龄55~82岁,平均为
67.5岁.胸椎骨折4例,胸腰段骨折l8例,腰椎骨折3例.对
照组男l6例,女9例;年龄58~78岁,平均65.2岁.胸椎骨折
3例,胸腰段骨折l9例,腰椎骨折3例.两组性别,年龄及病
情轻重经统计学处理无显着性意义.请问:该研究者的试验设
计正确吗?为什么?
辨析:该研究者的试验设计不正确.理由是:研究者的试
验分组方法不正确.由于受试对象在性别,年龄,骨折部位,病
情轻重等重要非试验因素方面是不同的,所以当样本含量较
小时,采用完全随机分组的方法进行分组是不恰当的,宜采用
最小不平衡指数法进行分组.采用完全随机分组的方法进行
分组时,很可能会造成最终形成的两个组在性别构成,年龄构
成,骨折部位构成,病情轻重构成等方面的不均衡,不可比,虽
然本例中研究者采用该法进行分组所形成的两个组在性别构
成,年龄构成及病情轻重构成等方面碰巧差异无统计学意义.
但在如此小的样本中能得到如此好的分组结果,令人感到怀
疑.
2统计表达与描述方面的错误辨析
在资料的表达与描述中,最常见的错误有:编制统计表
时,用”组别”,”(试验)分组”,”(试验)处理”等模糊,抽象的词
语作为横标目的总称;将分组标志(或分组变量)放置在观测
指标(或统计指标,或结果变量)的位置上而导致表中数据的
含义不清楚.绘制统计图时,坐标轴上的刻度值标得不符合数
学原则,资料与所选用的统计图类型不匹配等.
例5,《人工寰齿关节设计依据及可行性分析》l一文,测
量32套正常成年人寰齿关节新鲜标本的相关参数,结果如
表l所示,请问:这样表达资料正确吗?为什么?
表1枢椎解剖学测量指标及结果(n=32,mm)
辨析:这样表达资料是不正确的.理由是:?未说明表中
数据是”“还是”yc蜘;”,读者无法知道表中数据的具体含
义;?将各测量指标作为横标目不妥当;?由于各测量指标的
计量单位不同,故在表的标题上写计量单位不合适;?有关角
度的两项指标,变量符号与计量单位的组合形式不妥当;?用
“平均值”无法概括表中第2列的数据.假定表l第2列给出
的数据为均数和标准差,则对表l的修改结果如表2所示.
例6,《微动对骨折端骨密度的影响》n]一文,研究骨折端
微动时应力对骨密度的影响.60只新西兰大白兔随机分为微
动组与固定组,每组30只.固定组术后使骨折端固定.微动组
中国骨伤2008年1O月第21卷第l0期ChinaJOrthop&Trauma,Oct.2008,Vo1.21,No.10
表2枢椎解剖学测量指标及结果((min~max),n=32)
AP:椎体前后径;TD:椎体横径;VAH:椎体前缘高;VPH:椎体后缘高;DD:齿状突前后径;DW:齿状突横径;DH:齿状突高度;B:齿状突后倾角
0:齿面角
表3术后不同时间两组骨密度值及骨密度比率
固定
微动
0.039+
0.0o5
0.042+
0.006
0.115-+
0.0l3
0.133-+
O.Ol7
O.2l5-+
O.0l9
0.260?
0.0l8
0.307-+
0.020
0.349-+
0.023
0.348-+
0.02l
0.342-+
0.025
l2.1?
1.6
12.2-+
1.7
35.3-+
3.5
40.5-+
3.1
65.9?
4.1
79.9-+
5.5
94.2-+
5.1
l07.4-+
4.O
106.6-+
4.4
l04.7?
5.6
使外固定架中间杆有0.5mm的轴向移动,术后动物自由行
走,依靠体重使外固定架产生微动.利用双能X线骨密度测
量仪测定两组动物骨痂的骨密度.资料如表3所示.请问:表
3编制得是否正确?为什么?
辨析:表3的编制不够正确,存在的主要问题是:?未说
明表中数据是”“还是”;”,读者无法知道表中数据的具
体含义;?用”分组”作为横标目的总称,具有误导作用,因此,
编制统计表时,不宜用”组别”,”(试验)分组”,”(试验)处理”
等模糊,抽象的词语作为横标目的总称;?在表中标注了统计
分析的结果,而这样做无法说明研究者所采用的统计学分析
方法是否正确,因此,最好是在表注部分或论文的其他部分清
楚说明对该表资料所采用的统计学分析方法,并给出统计分
析的详细结果(包括统计量的具体值及对应的具体的P值);
未在表中给出样本含量,若表3中的数据为相应指标的均
数和标准差,则对表3的修改结果如表4所示.
例7,《骨松宝胶囊治疗老年人胸腰椎压缩性骨折疗效分
析》]一文,实验结果见表5和表6.请问:研究者对资料的表
达是否正确?为什么?若不正确,正确的表达是什么?
表5两组患者平均卧床时间及胸腰背痛持续时间(周)
辨析:表5和表6编制得都不正确.表5和表6都未说
明表中数据是”“还是”贾;”,未给出各组样本含量,而且
都在表中标注统计分析的结果.此外,表5的纵横标目颠倒,
表6用”组别”作为横标目的总称都是不妥当的.若表中数据
都是相应指标的均数和标准差,则对表5和表6的修改结果
如表7和表8所示(表中口服药物的种类及样本含量查原文
得知).
表6治疗前后两组患者骨密度的结果(m/see)
表7两组患者平均卧床时间及胸腰背痛持续时间(,n=25)
表8治疗前后两组患者的骨密度(m/see)测量结果(赴s,n=25)
3统计分析方面的错误辨析
分析定量资料时常犯的错误有:不交代资料所对应的试
验设计类型,资料是否满足某些前提条件,所采用的是何种具
体的统计学分析方法,而是笼统地讲”对资料进行t检验(或
方差分析)”,”采用t检验(或方差分析)对资料进行处理”等;
不检查或者忽视t检验和方差分析的前提条件,误用参数检
验代替非参数检验;误用单因素两水平设计定量资料的t检
验处理多因素设计定量资料或多因素非平衡组合试验定量资
料,等.
中国骨伤2608年10月第2l卷第lO期ChinaJOrthop&Trauma,Oct.2008,Vo1.21,No.10
表9临床分类变量与人工全髋关节置换术后DVT形成的单因素分析
相关因素有DVT(例)无DVT(例)OR值(95%CI)P值相关因素有DVT(~J)无DVT(例)OR值(95%CI)P值
年龄激素
41—601231l无34551
61~7019212.887(1.135~7.346)0.024有725.662(1.111~28.857)0.022
>701055.167(1.460,18.279)0.008静脉曲张
性别无3954l
男l837l有230.923(0.147~5.789)0.932
女232O2.364(1.039~5.380)0.039手术人路
BMI后外侧2228l
<241336l外侧19291.132(0.5l8N2.472)0.756
24~2820192.915(1.194,7.116)0.017手术医生
>28821I.077(2.076,59.093)O.(x】l甲2l221
0A乙24350.718(0.325~1.586)0.412
否l729l骨水泥
是24281.462(0.651~3.286)0.357无2248l
RA有l994.606(1.799,l1.792)0.001
否3l4ll髋关节手术
是lOl60.827(0.330,2.069)0.684单3252l
糖尿病双952.925(0.900~9.505)0.066
无3553l麻醉
有642.27l(0.598,8.633)0.219全麻35381
饮酒硬膜外6190.343(0.123,0.957)0.036
无2650l肢体延长长度
有1573.57l(1.270,10.042)0.013?2cm3556l
吸烟>2cm619.600(1.109~83.136)0.015
无33521踝泵练习
有852.521(0.760,8.366)0.122无3l221
有10350.203(0.083,0.494)0.000
表10临床分类变量与人工关节置换术后DVT形成的多因素分析
分析定性资料时常犯的错误有:不交代列联表的具体类
型;不作统计分析而直接根据指标值的大小作出统计推断或
研究结论;资料不满足某种分析方法所要求的前提条件时仍
盲目套用;对列联表中定性变量的性质不加区分而导致统计
分析方法的误用;将检验当作万能工具用于分析一切列联
表资料,等等.
例8,资料同例2.请问:研究者使用检验对两种固定
方法治疗后膝关节功能康复效果差别进行统计分析是否正
确?为什么?
辨析:不正确.因为研究者所采用的结果变量为”疗效”,
而且有”优”,”良”,”中”,”差”4种取值,因此”疗效”为有序
(或等级)变量.对于结果变量为有序变量的单向有序2xk列
联表资料,采用检验处理是不正确的,宜采用秩和检验,
Ridit分析或有序变量的Logistic回归分析处理.
例9,对于例6中的表3资料,原作者采用Student—
Newman—Keuls检验是否正确,为什么?若不正确,应如何正确
分析?
辨析:不正确.表3资料所对应的试验设计类型为具有一
个重复测量的两因素设计,有两项统计指标.原作者不但没有
正确判断表3资料所对应的试验设计类型,而且还采用了用
于单因素多水平设计定量资料两两比较的方法一SNK法或t
检验法来分析资料,犯了用单因素多水平设计定量资料的分
析方法代替多因素设计定量资料的分析方法,割裂了整体设
计,不但不能分析因素之间的交互作用,而且降低了资料信息
中国骨伤2008年10月第2l卷第10期ChinajOrthop&Trauma,Oct.2008,Vo1.21,No.10
的利用率,增加了犯假阳性错误的概率,降低了结论的可靠
性,因此,这样做是不合适的.
若资料满足参数检验的前提条件,对于表3中的每一项
统计指标来说,宜采用具有一个重复测量的两因素设计定量
资料的一元方差分析处理;若资料不满足参数检验的前提条
件,可先对资料进行某种变量变换,使变换后的新变量满足参
数检验的条件,然后再对新变量采用前述参数检验法处理,否
则,只能采用合适的非参数检验法对资料进行处理(但目前还
没有公认的适合处理这种设计类型定量资料的非参数检验方
法).
例10,对于例7中的表8资料,研究者采用”配对样本f
检验”处理是否正确?为什么?
辨析:不正确.表8资料所对应的试验设计类型也为具有
一
个重复测量的两因素设计,原作者采用配对设计定量资料
的t检验处理,是不合适的.
对于表8资料,由于重复测量因素”时间”只有两个水平,
且该两个水平分别为”治疗前”和”治疗后”,所以,分析该资料
时,虽然总的原则都是”资料(经变量变换后)满足参数检验的
前提条件时用参数检验,不满足参数检验的前提条件时用非
参数检验”,但还必须考虑基线时统计指标在组与组之间是否
具有可比性,是否需要考察因素之间的交互作用,是否需要考
察疗前疗后指标的差异等具体情况,采用具体的统计分析方
法进行处理.当基线时统计指标在组与组之间具有可比性,
即治疗前两个组的骨密度值差别无统计学意义时,将资料看
作具有一个重复测量的两因素设计一元定量资料,按例9指
出的方法处理,但当治疗前两个组的骨密度值差别具有统计
学意义时,这样分析的结果不正确;?将治疗前的骨密度值作
为协变量,以治疗后的骨密度值,或治疗前后的骨密度差值,
或治疗前后的骨密度差值与治疗前的骨密度值之比值作为统
计指标,在资料满足参数检验的前提条件时,进行单因素两水
平设计一元定量资料的一元协方差分析,若资料不满足参数
检验的前提条件,可先对资料进行某种变量变换,使变换后的
新变量满足参数检验的前提条件,然后再对新变量采用前述
参数检验法处理,否则,只能采用合适的非参数检验法对资料
进行处理.
例l1,《人工全髋关节置换术后下肢深静脉血栓形成的
多因素分析》一文,为了分析影响人工全髋关节置换术
(THA)后下肢深静脉血栓形成(DVT)的危险因素,研究者对
98例(1l8个关节)人工全髋关节置换术后DVT发生情况进
行分析……对l7项临床因素与人工关节置换术后DVT形成
的相关性进行了分析.分类变量用检验,多因素分析用
Logistic回归分析.资料及分析结果见表9和表lO.研究结
论:年龄,肥胖及肢体延长大于2cm是人工关节置换术后发
生DVT的危险因素,而硬膜外麻醉和踝泵练习是减少术后发
生DVT的保护因素.请问:此研究结论可信吗?为什么?
辨析:此研究结论可信度较低.理由是:?研究者没有交
代进行Logistic回归分析时是否进行变量筛选以及如何进行
变量筛选,因此读者无法判断研究者所进行的Logistic回归
分析是否正确;?研究者也没有交代进行单因素分析的目的
是什么,是不是只将单因素分析时P<0.05的那些因素弓1人
Logistic回归分析模型,由于论文中没有交代,读者也不得而
知,但如果研究者的确这样做了,则此Logistic回归分析是有
问题的,因为通过单因素分析来筛选变量的方法是不正确的.
综上所述,在医学科研工作中,实际工作者对统计学的应
用确实还存在很多错误,有待于进一步加强学习.因为试验设
计的不完善,不合理,统计表达与描述的不正确统计分析方
法选择的错误,都会导致试验结论的错误或不可信.还需要指
出的是,统计学的使用应该贯穿于整个科研工作的始终,而不
是仅仅局限于最后的试验数据处理(分析)阶段.
参考文献
[1]胡良平.口腔医学科研设汁与统计分析.北京:人民军医出版社,
20o7.304—322.
[2]李明,李开凡,徐荣明,等.CT引导下经皮空心拉力螺钉固定治
疗骶髂关节损伤.中国骨伤,2006,19(9):526-528.
[3]万春友,金鸿宾,王敬博,等.?型浮膝损伤术后膝关节功能康
复.中国骨伤,2006,19(9):537—539.
[4]陈金栋,侯树勋,李文锋.踝关节骨折手术治疗的综合分析.中
国骨伤,2007,20(9):592—593.
[5]汤勇智,杨俊龙.骨松宝胶囊治疗老年人胸腰椎压缩性骨折疗
效分析.中国骨伤,2007,20(9):644—645.
[6]胡勇,杨述华,谢辉,等.人工寰齿关节设计依据及可行性分析.
中国骨伤,2007,20(9):587—591.
[7]乔林,侯树勋,张树明,等.微动对骨折端骨密度的影响.中国骨
伤,2007,20(9):603—604.
[8]顾海伦,王欢,段景柱.人工全髋关节置换术后下肢深静脉血栓
形成的多因素分析.中国骨伤,2007,20(9):611-613.
(收稿日期:2008—07一l8本文编辑:李为农)
本刊关于稿件查询和网上投稿的通知
《中国骨伤》杂志社开通的网站可进行稿件查询,欢迎作者上网查询稿件审理的进度.请登陆.
同时也欢迎作者网上投稿,投稿信箱:E-mail:tgzggs@163.com.
《中国骨伤》杂志社