为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

对临床试验统计学假设检验中非劣效_等效和优效性设计的认识

2019-06-27 1页 pdf 142KB 33阅读

用户头像 个人认证

崇亮

资深中学教育工作者

举报
对临床试验统计学假设检验中非劣效_等效和优效性设计的认识药政管理对临床试验统计学假设检验中非劣效、等效和优效性设计的认识Considerationsonthestatisticalhypothesisofnoninferiority,equivalenceandsuperioritydesigninclinicaltrial黄 钦,赵 明(国家食品药品监督管理局药品审评中心,北京 100038)HUANGQin,ZHAOMing(CenterforDrugEvaluation,StateFoodandDrugAdministration,Beijing100038,China)收稿...
对临床试验统计学假设检验中非劣效_等效和优效性设计的认识
药政管理对临床试验统计学假设检验中非劣效、等效和优效性设计的认识Considerationsonthestatisticalhypothesisofnoninferiority,equivalenceandsuperioritydesigninclinicaltrial黄 钦,赵 明(国家食品药品监督管理局药品审评中心,北京 100038)HUANGQin,ZHAOMing(CenterforDrugEvaluation,StateFoodandDrugAdministration,Beijing100038,China)收稿日期:2006-09-12修回日期:2006-12-14作者简介:黄钦(1969-),男,博士,主管药师,主要从事药品审评工作通讯作者:黄钦Tel:(010)-68585566E-mail:huangq@cde.org.cn摘要: 在对国内药物注册临床试验报告的审评中,常遇到以传统显著性检验代替非劣效、等效和优效性检验的错误,就它们的区别及适用范围,本文对判断界值的确定、样本含量、推断结论及审评中的主要关注点进行了阐释。关键词:非劣效检验;等效性检验;优效性检验;显著性检验中图分类号:R954   文献标识码:C文章编号:1001-6821(2007)01-0063-05药品临床试验设计要求随机、盲法和对照药物比较,以判断和区别其实际的疗效。我国药品研发,以仿制国外已上市药品为主;基于临床认识和伦理学因素,临床研究也多选择针对目标适应症的已有治疗药物为对照,即所谓的阳性对照药。目前,已公认的传统假设检验(又称显著性检验)在临床试验中用于判断药物的疗效是不合理的,它不能准确区分2药疗效差异的方向性和体现差异大小所揭示的临床实际意义。因此,国际上根据研究目的不同,普遍用非劣效、等效或优效性假设检验。1 显著性检验无效假设H0:A药疗效-B药疗效=0备择假设H1:A药疗效≠B药疗效结论:如P>0.05,按α=0.05的检验水准,不能拒绝H0假设;如P≤0.05,则接受H1假设。问题是这种假设检验推断的2个总体均数是否不相等,是纯粹的统计学意义,而未体现实际的临床意义,虽然有单双侧之分,如单侧为H0:μ1-μ2=0,H1:μ1-μ2>0(或μ1-μ2<0),它检验的依然是样本所代表的总体均数的统计学含义,而未将实际临床意义包含进来考虑。此外,对检验结论:①如P>0.05,表示2药疗效的差别无统计学意义,不拒绝H0假设,说明现有数据尚无法对2药疗效的总体均数是否不等的判断下结论,并不是当然的接受H0假设,即并非认为H0假设必然成立;而2药疗效的总体均数一定相等,此时有可能2药疗效的总体均数确实近似,也有可能是检验效能(把握度)不够,尚需更大样本量进行检验。②如P≤0.05,2药疗效的差别有统计学意义,2药疗效的总体均数确实不相等;但这种统计学意义的差异不一定具有实际的临床意义,可能其临床意义却是优效、等效或非劣效的,因此传统的假设检验,无论是何结论,都无法判定所比较的2药是优36ChinJClinPharmacolVol.23No.1Jan.2007(SerialNo.105)©1994-2009ChinaAcademicJournalElectronicPublishingHouse.Allrightsreserved.http://www.cnki.net效、等效、还是非劣效。显然,这种方式所得结论是不符合临床试验的目的要求的;但在国内的临床试验中,这种检验却屡见不鲜。本文就对非劣效、等效或优效性试验设计中的有关统计检验原则,进行相应的阐释,关于临床试验中的统计学一般原则,见ICHE9[1]。2 非劣效、等效和优效性检验2.1 统计学原理统计学家们提出了区间假设检验的方法,以临床意义的差异Δ来进行假设检验,即非劣效、等效和优效性检验的概念和方法。这种临床意义的差异Δ,不是特指药物的疗效指标,也可用于评估安全性,本文主要探讨疗效方面的应用。尽管安全性指标也可确定差异Δ,但对疗效终点的许多讨论,不适用于评估安全性试验。2.1.1 非劣效检验非劣效性试验[1]指主要研究目的是显示对试验药的反应,在临床意义上不差于(非劣于)对照药的试验。设A药为待确证疗效的试验药,B药为对照药,下同。非劣效试验的假设检验如下。无效假设H0:A药疗效-B药疗效≤-Δ备择假设H1:A药疗效-B药疗效>-Δ结论:如P>0.025,按单侧α=0.025的检验水准不能拒绝H0假设,即无法判断A药不差于B药;如P≤0.025,则接受H1假设,可认为A药不差于B药。根据非劣效试验的统计学原理,治疗差异(A药疗效-B药疗效)>0,则试验药的疗效较好;治疗差异<0,则对照药疗效较好;如果治疗差异>-Δ,则试验药非劣效于对照药,此处的Δ表示临床意义上判断疗效不差、所允许的最大差异值,即非劣效试验的判断界值。2.1.2 等效性检验等效性试验指主要研究目的是要显示2种或多种处理的反应间差异的大小,在临床上并无重要性的试验,通常通过显示真正的差异、在临床上可以接受的等效的上下界值间来证实。等效性试验的假设检验如下。无效假设H0:A药疗效-B药疗效≤-Δ或A药疗效-B药疗效≥Δ备择假设H1:-Δ<A药疗效-B药疗效<Δ结论:如P1>0.025或P2>0.025,按2α=0.05的检验水准不能拒绝H0假设,即无法判断A药等效于B药;如P1≤0.025且P2≤0.025,则接受H1假设,可认为A药等效于B药。2.1.3 优效性检验优效性试验指主要研究目的是显示所研究的药物反应优于对比制剂(阳性或安慰剂对照)的试验。优效性试验的假设检验如下。无效假设H0:A药疗效-B药疗效≤Δ备择假设H1:A药疗效-B药疗效>Δ结论:如P>0.025,按单侧α=0.025的检验水准不能拒绝H0假设,即无法判断A药优于B药;如P≤0.025,则接受H1假设,可认为A药优于B药。实际应用中,更多采用的是可信区间法检验,它是分析时最直接的方法,且比假设检验可提供更多的信息。非劣效性试验中,仅关注1个方向的可能差异,因此试验药与对照药的疗效差异的单侧97.5%(或双侧95%)可信区间,应当完全在-Δ值的右侧,即其单侧97.5%(或双侧95%)可信区间的下限应该大于设定的判断界值-Δ,即[单侧97.5%CI(A-B)的下限]>-Δ(或[双侧95%CI(A-B)下限]>-Δ);同理,在等效性试验中,等效的结果应该是其95%可信区间范围,包括在-Δ~Δ,即-Δ<[95%CI(A-B)]<Δ;而优效性试验的结果,则应该是其单侧97.5%(或双侧95%)可信区间的下限大于Δ值,即[单侧97.5%CI(A-B)下限]>Δ或[双侧95%CI(A-B)下限]>Δ。2.2 适用范围对1个新研发的试验药,通常具有某方面的优势,如给药方便、耐受性较好、毒性较低或价格便宜等;一般需与安慰剂进行优效性试验,以比较其真正的疗效和安全性,来判断其上市的利益风险。如果当前已有上市、曾用优效性试验证实为有效药物,还常与其进行比较,并判定待验证药物的疗效至少不差于(非劣于)已上市的有效药物。作为其上市的最低,非劣效性试验通常用于与已上市的有效药物或标准治疗进行比较,以求能提供1个新的治疗选择。少数情况下,当安慰剂对照不被允许或违反伦理时,用以间接证明试验药优于安慰剂。等效性试验的应用多见于对同一活性成分的生物等效性以及血浆无法测定时的临床等效验证。对国内尚未上市的药品,无论是创新药还是仿制药,如选安慰剂为对照,则应证实其优效性。如选国内已上市的同一治疗领域的药物作为阳性对照药,则应至少验证其具有非劣效性。与已上市药物具有相同活性成分的药品,应进行生物等效性或临床等效性验证。这既是我国非劣效、等效和优效性试验的适用范围,也是国际多数药品注册管理机构共同的基本要46中国临床药理学杂志第23卷 第1期 2007年1月(总第105期)©1994-2009ChinaAcademicJournalElectronicPublishingHouse.Allrightsreserved.http://www.cnki.netduanhh下划线duanhh下划线duanhh下划线求。2.3 判断界值(Δ)的确定非劣效、等效和优效性试验的区间检验与传统假设检验最大的不同是考虑了临床意义,以临床意义的差异Δ来进行假设检验。因此,如何确定这个疗效差异的判断界值就至关重要。若Δ太大,将把疗效远不如对照药的药物,判断为有效或等效;若Δ太小,则可能将本来可推广应用的有效药物,误判为无效而得不到及时上市,并且所需的样本含量可能会大得不切实际。因此,Δ的确定应当合适,理论上应该是药效间具有临床意义的最大允许差异值;但实际确定起来往往较困难和复杂,需要根据已有的文献数据,设计类型及数据的分布类型,从临床认识水平及成本效益来综合考虑,将统计学推理和临床判断相结合。2.3.1 非劣效检验非劣效检验的Δ值的确定最为复杂,通常参考阳性对照药与安慰剂间的疗效差异,即阳性对照药的绝对疗效来判定,需要达到2个目标(满足2个条件)才是适合的判断界值:使试验药物(A)疗效既要优于安慰剂(P)以保证药物的有效性(A-P>0);又要好到不差于阳性对照药(B)(A-B>-Δ)。因此,ICH及EMEA等均推荐,同时包括安慰剂对照和阳性对照药的3个试验组设计的研究,试验药必须证明在统计学意义上优于安慰剂(试验产品与安慰剂差异的双侧95%可信区间的下限必须>0;如果试验药和参照药均未能显示、在统计学意义上优于安慰剂,可能提示试验不灵敏或者是测定方法不灵敏);然后,要用临床判断来所观察到的结果与安慰剂的差异,是否具有临床意义。在国内研究设计中,更多见仅为试验药组和阳性对照组2试验组研究;而没有安慰剂对照组,且阳性对照药的绝对疗效常不易确定,这时就要检索文献,参考历史数据,并利用荟萃分析等以找出所用阳性对照药和安慰剂进行比较的同类研究,估计在目标患者人群中、阳性对照药物和安慰剂之间的差异,确定药效灵敏度(sensitivitytodrugeffects)。关于对照药的选择原则及其优缺点的考虑,请参见ICH-E10[2]。需注意,药效灵敏度和试验的检测灵敏度(assaysensi2tivity)是不同的,很多情况下,药效灵敏度难以维持恒定不变。由于临床实践可能发生变化,或者测量效果的标准或方法的不同,某些既往的研究结论可能会毫无意义。当前试验设计中,应考虑和既往试验进行比较,看是否有可能会影响治疗结果的变化。例如,入选标准、诊断方法、允许的合并治疗、参照产品的给药方案、测定终点、评价时间等。如果试验设计有不可避免的差异,那么其差异的意义应当认真考虑,这有可能导致无法确定合适的非劣效性界值。另外,还应当考虑阳性对照药的疗效随时间发生的变化。例如,在某些情况下,可能由于医疗水平总体改善,疾病或事件的发生率降低了,计算时只能用较近期的研究,如果不能确保近期的试验与当前试验中治疗效果的恒定性,那么选择非劣效性边界时,应当保守一些。为保持已确定的Δ值的可靠性,应当重视试验的检测灵敏度和严格控制试验的质量,保证阳性对照药在试验中、显示出其应有的疗效。在充分考虑了以上因素的基础上,当试验目的是通过与阳性对照药比较,间接说明试验药优于安慰剂时,在确保试验药和安慰剂的间接疗效差异的95%可信区间的下限>0时,Δ可选为试验药与对照药疗效差异95%可信区间的下限;但通常选择比这一间接计算提示的数值小一些的值。对试验目的是为说明试验药可代替阳性对照药而疗效无显著降低时(非劣效性试验最常见的目的),通常做法是以阳性对照药与安慰剂之间预期疗效差异的百分比来确定Δ值。FDA认为,应该不大于有效药物与安慰剂间疗效差异值的1/2。有些学者提出[3],选定疗效指标测定的1/5~1/2个标准差,或阳性对照药疗效均数的1/10~1/5,相对数(如率、比值)最大不超过阳性对照组样本率的1/5。但如此确定的理由尚不充分,还须通过临床证据来确认和认可Δ值无重要差异的意义[4]。实际做法(尤其对市场上目前只有1个有效药物时)是对临床医生进行调查,了解他们认为无关紧要的差异,有多大范围,根据他们回答结果和分析选择Δ。如果预期试验药的安全性优于阳性对照药(其他情况包括:给药途径更方便、剂量更方便、次要疗效终点更优等),由于有安全性方面的受益作为补偿,可稍微降低疗效,选择较大的Δ值,但应能证明疗效优于安慰剂。这种情况下,选择复合的主要终点十分有用,可以用1个终点证明安全性的优效性;而另1个终点证明疗效的非劣效性。2.3.2 等效性检验等效性检验的Δ一般较为确定,在生物等效性研究中,当评价2种剂型的药代动力学参数平均值是否足够接近时,2者比值90%可信区间在80%~125%成为可接受的标准,此时的Δ为±Ln0.8。当用生物等效性试验不可能时(例如仿制的吸入药或外用药等局部用药),可进行临床等效性试验,得出双侧95%可信区间,其等效界值的确定仍然是统计学推理和临床判断相结合,具体药品具体分析,而无恒定的界值数值。56ChinJClinPharmacolVol.23No.1Jan.2007(SerialNo.105)©1994-2009ChinaAcademicJournalElectronicPublishingHouse.Allrightsreserved.http://www.cnki.netduanhh下划线duanhh下划线duanhh下划线duanhh下划线duanhh下划线2.3.3 优效性检验对优效性检验,一般情况下取Δ=0(绝对数指标)或1(相对数指标);特殊情况,需确定另外的数值。2.4 样本含量和检验效能对样本含量和检验效能的具体计算公式,请参考有关文献[3,5-7]。需注意,所用公式的假定前提和适用条件,通常受试者被随机分配到试验组(A药)和对照组(B药);2组方差齐性。双侧检验取α=0.05,单侧检验取α=0.025;β取0.1或0.2。目前认为,在生物等效性研究中例外,取单侧为0.05。通常用阳性对照的非劣效性试验、等效性试验、优效性试验,所需样本含量均较安慰剂对照试验大。因为,一般确定的优效界值小于等效界值,也小于非劣效界值。因而所得样本含量由少到多可依次排列为:安慰剂对照优效试验、非劣效性试验、等效性试验和阳性对照优效试验。若取非劣效界值为阳性对照与安慰剂疗效差异△的1/2,则进行阳性对照非劣效性试验所需的样本含量,至少是安慰剂对照优效性试验的4倍。试验中,还应考虑到病人的脱落、2组比例不同、因依从性问题而引起稀释效应等因素,来校正估计实际的样本含量(N),例如,设脱落率为Q,则Ntest=Nreference/(1-Q)2.5 统计推断[8]从实际的国内临床试验看,将试验药和阳性药在临床疗效上的非劣效、等效甚至优效,错误地称为“疗效相当”的现象并不少见,有时会将非劣效性试验误认为是设计为等效性试验。只有认清不同研究设计所要达到的目的,才能正确地下结论。对非劣效性试验,下结论时一定要注意考察检测灵敏度和研究质量,必须分析其可能的影响因素,估计对检测灵敏度的影响。如果按照非劣效性试验设计,结果试验药的效应好于阳性对照药。当非劣效性试验的无效假设被拒绝,可进一步检验其是否具有优效性;如果治疗作用的95%可信区间既大于-Δ,也大于0,那么在5%水平(P<0.05)有优效性的证据。在这种情况下,可计算与优效性检验相关的P值,并评价这一P值是否足够小,以拒绝无差异的假设。只要新药与对照药的安全性特点相似,通常证明优效本身就足够;但当不良事件增加时,一定要估计作用的大小,以评价临床上受益是否足以超越不良反应。即从非劣效性试验向优效性试验转换是可行的,前提是:试验要按照非劣效性试验的严格要求来设计和实施,并按照意向治疗原则进行分析。如果优效性试验结果表明,治疗组间差异无显著性,试验目的从优效性向非劣效性转换是可行的,前提是对照治疗的非劣效性边界,要事先指定或具有充分的合理理由(可能性极小,仅限于有广泛接受的公认Δ值的情况);意向治疗原则(ITT)的全分析集(FAS)和符合方案集(PP)分析的结果应相似,显示劣效性无效假设的可信区间和P值;试验按照非劣效性试验的严格要求设计和实施(见ICHE9和E10);试验的灵敏度足够高,以确保能够检测出实际的差异;有直接或间接证据表明,对照治疗显示其应有的疗效。3 审评要求药品审评部门常关注以下几方面内容。研究设计 非劣效性试验有时会被误认为是试验设计为等效性试验,而产生混淆。应该根据不同的研究目的,选择适当研究比较类型,注意非劣效、等效和优效性设计3者之间的联系和区别,选择合适的对照组。关于对照药的选择,ICH-E10已进行了全面的阐释。应该在试验方案中,对研究的假设事先明确,须注意传统的假设检验,由于不能准确区分2药疗效差异的方向性和体现差异大小所揭示的临床实际意义,不适于判断药物临床试验的疗效。非劣效界值的确定 要比较的药效间差异的判断界值的确定至关重要,尤其是非劣效界值的确定,需要详细分析论证,对其数值的计算和假定,应合理有据,并且无精确统一的算法;而是统计学推理和临床判断综合考虑的结果。在设计阶段确定,研究中一般不得更改。研究的把握度 试验结果应得出统计学结论,以确保足够的把握度,临床意义的差异Δ越小,所需的样本量越大。进行阳性对照的非劣效性试验所需的样本含量,至少是安慰剂对照优效性试验的4倍。统计分析过程 用正确的统计量,建议疗效间的差异以双侧95%可信区间表示。统计学结果所揭示的临床意义 应当重视试验的检测灵敏度和试验质量的控制,保证阳性对照药在试验中显示出其应有的疗效,分析既往成功的同类试验的设计要点和结果,分析可能降低检测灵敏度的种种因素及其对结论的影响。应注意,试验中的以下因素常能降低试验的检测灵敏度:如研究人群对药物作用的反应较差;对治疗的依从性差;同时合并其他用药,干扰了或降低了对受试药物的反应范围、程度;部66中国临床药理学杂志第23卷 第1期 2007年1月(总第105期)©1994-2009ChinaAcademicJournalElectronicPublishingHouse.Allrightsreserved.http://www.cnki.net分受试者有自发改善而不会对药物有反应;诊断标准不明确,而入选了无所研究疾病的阴性患者;疗效指标不敏感;疗效指标测量变异太大;盲法不严格,导致评价偏倚等。参考文献:[1]InternationalConferenceonHarmonisation.GuidanceE9:Statisticalprinciplesforclinicaltrials[J/OL].http://www.emea.europa.eu/pdfs/human/ich/036396en.pdf,1998-03-01.[2]InternationalConferenceonHarmonisation.GuidanceE10:Choiceofcontrolgroupandrelatedissuesinclinicaltrials[J/OL].http://www.emea.europa.eu/pdfs/human/ich/036496en.pdf,2000-07-01.[3]刘玉秀,姚晨,陈峰,等.非劣效性/等效性试验中的统计学分析[J].中国临床药理学杂志,2000;16:448-452.[4]EMEACPMP:Guidelineonthechoiceofthenon-inferioritymargin[J/OL].http://www.emea.europa.eu/pdfs/human/ewp/215899en.pdf,2005-07-01.[5]于莉莉,夏结来,蒋卫红,等.几种简单设计的等效性检验的样本量与检验效能[J].第四军医大学学报,2004;25:1045-1049.[6]JonesB,JarvisP,LewisJA,etal.Trialstoassessequivalence:theimportanceofrigorousmethods[J].BrMedJ,1996;313:36-39.[7]CampbellMJ,JuliousSA,AltmanDG.Estimatingsamplesizesforbi2nary,orderedcategorical,andcontinuousoutcomesintwogroupcom2parisons[J].BrMedJ,1995;311:1145-1148.[8]EMEACPMP:Pointstoconsideronswitchingbetweensuperiorityandnon-inferiority[J/OL].http://www.emea.europa.eu/pdfs/human/ewp/048299en.pdf,2000-07-01.信息·书讯·其他《当代药学辞典》征订  《当代药学辞典》于2006年4月由北京化学工业出版社出版发行。本书以药学名词为主,由60余位专家学者历时5年,查阅大量有关集体编撰而成。收载了药剂学、药理学、药物分析、药物经济学、生物医药技术、药事管理与法规、中医药、药物化学、基础化学、药物流行病学、预防药学、军事药学、药学服务(循证医学,药学、药品流通等)及网络药学(含计算机药学、计算机药物设计)等15个药学分支学科主要名词术语近8000余条。词典正文每个词目包括中文名称、英文名称、中文释义,同时也标示了条目所属学科。本书为双语检索,即文前附有汉字笔画检字索引,文后附有英文索引,查找方便、省时、快捷。词典附录包括常见微生物英汉对照表、常用检验项目参考表、常见失准医药名词对照表等22个附表。本书收载原则体现新(新名词)、要(重要名词)、范(和代表性名词)、准(释义准确)等特色,力求全面系统,是教学、科研和日常工作中必备的、有实用价值的重要工具书。有意购买者,全国各医药书店有售,或与北京天坛医院药剂科联系购买,凡订购5本以上者(含5本)可给予9.5折优惠,定价:80元/本(含邮资)。主 编:赵志刚副主编:吕强 翟所迪 王景田 田少雷 曲守伟史录文 王爱国 崔嵘 李安明 徐建中地 址:北京天坛医院药剂科(北京市崇文区天坛西里6号),邮编:100050电 话:(010)67096858传 真:(010)67022063E-mail:1022ZZG@sina.com联系人:赵志刚 庄洁 徐春敏76ChinJClinPharmacolVol.23No.1Jan.2007(SerialNo.105)©1994-2009ChinaAcademicJournalElectronicPublishingHouse.Allrightsreserved.http://www.cnki.net
/
本文档为【对临床试验统计学假设检验中非劣效_等效和优效性设计的认识】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索