null临床研究
临床研究设计概要概要观察性研究
病例系列
病例对照研究 (回顾性)
横断面研究 &调查
队列研究 (前瞻性)
历史性队列研究
随机临床试验
随机试验中的设计问题
受试者入选
可归纳性
盲法
结果
其他设计
析因、 交叉、 大样本简明设计设计问题设计问题观察性研究观察性研究病例系列
病例对照研究 (回顾性)
横断面研究 &调查
队列研究 (前瞻性)
历史性队列研究病例系列病例系列没有研究假设
没有对照受试者
对本质的描述
唯一目的是为未来的研究建立假设
病例病例对照研究病例对照研究从(疾病)结果的出现或消失开始,然后按时间回顾,探寻可能的起因或风险因素过去病例对照研究的优点病例对照研究的优点费用相对较低
更易于接触受试者
应用已有的医院的病例记录,具有相似特征的病例和对照
获取结果更加快速
所需病例数少于前瞻性研究
所需病例数少,适宜少见疾病
可以识别多个风险因素病例对照研究的缺点病例对照研究的缺点信息可能缺失
信息可能没有记录
信息可能没有准确记录
面谈可能导致回忆性偏倚
面谈时患者可能忘记
回答可能有偏倚
个体可能编织事件,使故事完整
罹患重疾的个体,发生严重偏倚的机率更大
选择对照时可能存在偏倚横断面研究和调查横断面研究和调查在某时点而不是一段时间内采集一组受试者的数据
也称之为患病率研究
调查是横断面研究的一种形式横断面研究的优点横断面研究的优点一站式、一次性采集数据
显示疾病和健康状态在人群的相对分布
费用更低,更便于实施
为策划健康服务提供了有用的信息
提供疾病和健康状态在人群分布的相关性
不依赖接受治疗的个体横断面研究的缺点横断面研究的缺点对发生率水平非常低的疾病无效
常规取样方法: 仅代表接受调查的个体
未表征季节变化或复发病,因为在进行研究时,疾病可能潜伏或处于高峰
更适于慢性疾病,不适于流行性疾病横断面研究的五种数据采集方法横断面研究的五种数据采集方法面对面交谈
发放调查问卷
邮寄调查问卷
电话交谈
快报或杂志调查队列研究队列研究根据是否暴露风险因素,选择受试者
一段时间内随访受试者以观察结果队列研究的优点队列研究的优点信息更加完整、准确
具有检测控制和预防措施的机会
提供实施临床干预的机会
数据质量高,因为数据并非一次性暴露
考虑了季节变化或波动
可追踪和评估衰老过程的自然影响队列研究的缺点队列研究的缺点死亡、退出或搬家导致受试者丢失
费用相当高
追踪受试者的后勤保障难以实施
检验过程中难以保证质量、有效性和可靠性
研究人群不易进行归纳
采集信息和评价结果的时间周期长历史性队列研究历史性队列研究根据既往是或否暴露风险因素选择受试者
应用历史信息,但要经过一段时间内随访,以观察结果临床研究方法总结临床研究方法总结临床研究的证据水平临床研究的证据水平观察性研究
I/II期临床试验
随机 III期临床试验
单中心试验
多中心试验
组间试验
一个统计办公室
QA
其他证据
IV 期临床试验
临床试验数据的Meta分析随机临床试验随机临床试验随机试验 是指将对照科学试验的原理应用于临床医学
当比较对两组患者干预的结果时,没有其他方法确定结果是偶然的还是干预本身引起的。
无随机化 始终有这样的可能性,虽然很小,即选择受试者的过程导致组间系统性差异(混杂)混杂实例混杂实例注: 未分层分析时,治疗显著(a),但是分层分析(b)和(c)不显著。 临床试验问题临床试验问题临床试验有关的问题
随机化
盲法
分层
对照组 (安慰剂)
结果
样本量
期中分析
数据& 安全性监查
亚组分析
相互作用
伦理和知情同意
数据管理和 QA检验因果关系
需要合理的试验设计,明确和详细的
以及试验研究的基础设施
获取符合伦理、可靠而有效的数据实效性 vs 解释性实效性 vs 解释性实效性
目标是做决定
群体尽可能与“真实世界”一样
象 “现实”中一样给予干预解释性
目标是检验假设或证明理论
以“最好机会”给予干预为原则,选择群体
给予干预获得最大效果实效性 vs 解释性(接上页)实效性 vs 解释性(接上页)实效性
对照必须是当前的标准
结果的测量必须 实用、令人信服
分析包括所有受试者,即“意向治疗”解释性
选择对照的目的是“分离”治疗效应
应选择对治疗效应反应最灵敏的结果测量方式
分析可能不包括“未贡献信息”的受试者疗效、效力和效率 vs.分期疗效、效力和效率 vs.分期疗效试验–在最理想的条件下它有效吗?
效力试验 – 现实中它有效吗?
效率试验 – 它有优势吗?I期 –可以安全使用吗?
II期 –有疗效吗?
III期 –与现有干预相比,它如何?
IV期 –III期结果可扩展至“真实”世界吗?受试者入选问题受试者入选问题“感兴趣”人群的定义 –广度和精确度的问题
排除部分不合格个体的必要性
未经良好检测的干预更易出现这种问题
识别可分层的亚组,如果可能,单独分析
感兴趣群体和实际研究群体之间的关系可归纳性可归纳性相同的是相对治疗效果;不是分别评估两治疗组的结果
要推断相对治疗效果无效,则
治疗和群体亚组间必须存在相互作用
此类相互作用几乎没有
可归纳性是基于逻辑合理性而言,而不是统计推理评估和/或改善可归纳性的方法评估和/或改善可归纳性的方法患者日志
更加现实的试验设计
仔细界定入选群体
结果的内在一致性
多重和/或多中心试验盲法盲法试验组不仅只在基线相似
试验过程中,治疗和观察应该相似
盲法旨在确保客观评价,结论不受治疗分配知识影响盲法盲法WHO谁
征求知情同意的人员
受试者
医生
结果评价者
WHEN何时
如果这些个体的行为受到分配知情影响,那么可能影响真实结果或
的结果盲法 (接上页)盲法 (接上页)HOW如何
分配– 已经讨论
受试者– 药物 vs 给药方案,不良反应
医生– 安慰剂效果,剂量调整
结果– 受试者,医生,第三方的
Issues问题
分配过程, 药物供应
接盲
接盲存在的问题接盲存在的问题使用活性药物的受试者可能:
报告更加良好的结果,因为他们期望受益
如果他们知道他们使用活性药物,更可能留在研究中
对好结果或不良事件更加敏感
在非治疗组的受试者:
观察员可能不会识别并报告治疗缓解接盲存在的问题(接上页)接盲存在的问题(接上页)治疗分配知情可能影响:
获取研究或随访数据的努力
对受试者是否应该保持治疗或联合用药或其他辅助治疗的判断
对特定受试者的结果是否纳入分析的判断
统计分析的选择结果结果可能的终点可能的终点疗效终点
缓解
生存期
生活质量
临床获益
安全性结果
不良事件
治疗相关的毒性null患者生存百分比中位生存期 (月)
生存期 截尾 截尾 6个月
9个月
12个月 生存时间(月)Log-RANK检验QOL终点QOL终点QOL 不是一个直观的概念
它不单是体力状态、毒性等级、肿瘤大小或实验室参数
它指的是多维结构
心理、情感和其他主观表现健康的领域
获取自患者自填的调查问卷临床试验中评价QOL的原因临床试验中评价QOL的原因支持性护理干预引起的不良反应的影响
预后差的癌症
各组的生存期相等
从患者的角度识别全范围的毒性
利用QOL作为缓解和生存期的预后因素QOL相关的问题有那些?QOL相关的问题有那些?治疗对 QOL的影响
患者治疗时,各组间的比较
治疗对 QOL的长期影响
进程后健康恶化
可能接受试验方案外的治疗方案
由于进程而引起的删尾影响
数据采集和数据管理的难度患者日志患者日志患者自己报告的CINV发生率日志
所有间发恶心和呕吐 (日期和时间),D1~5。
服用止吐药补救 (名称、剂量、日期、时间),D 1~5
恶心直观模拟量表 (VAS)
在无刻度的100-mm VAS上报告过去的24小时里恶心感,D1-5
教育患者在她/他恶心水平相应的位置画竖线
得分: 从量表的最左边到患者的标记之间的mm数
过去的24小时里你有过几次恶心 ?0 mm100 mm无恶心恶心的难受程度功能性生活指数-呕吐 (FLIE)1功能性生活指数-呕吐 (FLIE)1D1(CTx前基线)和D6(测量5天回忆,即化疗后5天)测量CINV对患者维持日常生活能力的影响。
2 区域: 恶心(N)和呕吐(V)
每个区域还有9个与日常功能相关的相同项目
100mm直观模拟量表上标记的缓解相当于1 (“相当大”)和7 (“无/一点也没有”)之间的一个数值
将两区域得分相加得到总分
“N/V对日常生活无或轻微影响” (NIDL) 是指在N/V区域内7分量表上平均项目得分大于6
例如: “在过去的5天里,恶心影响你进行日常娱乐和休闲活动的能力 了吗?”相当大一点也没有1234567NIDLnull为帮助人们判断健康状况如何,我们制作了这样一个量表(非常象体温计),你可以想象的最佳状态表记为100,你可以想象的最差状态标记为0。
我们希望,你能够在这个量表上以你的观点标注你今天的健康状况如何。请从下方的方框开始画一条线到反映量表上反映你今天健康状况的任意点上,以此指示你今天的健康状况。Best imaginable
health stateWorst imaginable
health state今天,你的健康状况EuroQol EQ - VAS2EORTC QLQ-C303EORTC QLQ-C303在 4分 Lickert 量表上,对大多数项目分级:
1=一点也不, 2=稍微, 3=相当大, 4=非常
整体健康状况/QoL 分为 7分
1= 非常糟糕, 7=极好
所有项目的缓解线性转换为0-100量表临床获益实例临床获益实例Burris 等. 1997: 目的:展示吉西他滨提高晚期胰腺癌患者临床效益
随机分入:
A:吉西他滨
B: 5-FU
提交FDA批准终点终点主要终点:临床获益
综合测量疼痛强度和止痛药使用量、PS和体重
次要终点
缓解率
至进程的时间
生存期null表1 临床获益测量分类 主要测量
疼痛
疼痛强度(使用MPAC 0-100可视模拟量表测量,每日一次)
阳性:比基线改善50%以上,持续4周以上,假设最低疼痛得分大于等于20
阴性:比基线期恶化,持续4周。
稳定:没有其他结果。
止痛药消耗量(测量每周吗啡消耗量,mg)
阳性:比基线改善50%以上,持续4周以上,假设最低止痛药消耗量大于等于10
阴性:比基线期恶化,持续4周。
稳定:没有其他结果。
Karnofsky 体力状况(每周测量一次)
阳性:对于体力状况为50、60或70的患者,比基线提高20分以上,持续4周。
阴性:比基线降低20分以上,持续4周以上。
稳定:没有其他结果。
次要测量(每周测量一次)
体重
阳性:体重比基线增加7%,持续4周以上。
非阳性:没有其他结果null止痛药 消耗量 疼痛强度
疼痛
体力状况 缓解
两个参数均改善 一个参数稳定, 另一个改善 稳定 两个参数均稳定 未缓解 任一个参数恶化 体重 缓解 体重增加7% 未缓解 体重稳定或降低 null吉西他滨 5-氟尿嘧啶 疼痛测量 止痛药 消耗量 稳定 疼痛强度 稳定 疼痛强度 稳定 止痛药 消耗量 稳定 总阳性= 总阳性= 临床获益主要指标 稳定 稳定 总阳性= 总阳性= 稳定 稳定 疼痛 疼痛 Karmolsky体力状况 Karmolsky体力状况 临床获益 体重 体重 阳性 非阳性 阳性 非阳性 临床获益= 非临床获益= 临床获益= 非临床获益= 稳定 稳定 主要指标 主要指标 图2 (A)吉西他滨和5-FU疼痛改善分类(B) 吉西他滨和5-FU主要临床获益指标
(C)吉西他滨合用5-FU整体临床获益(包括主要指标和体重) null表2 随机接受吉西他滨或5-FU治疗的患者的特征 特征 吉西他滨 患者数 性别 男 女 中位年龄(岁) 范围 分期 Karnafsky体力状况 基线疼痛强度得分 基线止痛药需求量 (吗啡含量,mg) null未进程患者百分比 中位至进程的时间 (月)
无进程生存期 截尾 截尾 6个月
9个月
12个月 时间 (月)Log-RANK检验结果推荐结果推荐根据研究的目的,必须明确定义研究的主要终点
测量的标准和频率
客观vs.主观测量
其他相关问题
分析和样本量
结果的监查
其他设计其他设计回答多个问题回答多个问题动机
效率
应用多项研究中的患者群体
应用对照组做多重比较
设计原因
需要对创新治疗的多方面进行“对照”
需要处理慢性疾病随时间推移浮现的问题
方法
多组
多重比较,复杂性
序贯设计或基于缓解性的设计
析因设计基于缓解性的设计实例基于缓解性的设计实例卵巢癌未完全 切除的患者随机1方案
A方案
B剖腹手术 再评价缓解好缓解差随机2方案
I方案
II问题:随机2的结果会影响对随机1的解释吗?反之亦然吗?析因设计析因设计为检验研究治疗的疗效 C+D vs. A+B?为检验高剂量RT的效果 B+D vs. A+C?标准治疗 vs.联用 A vs. D如何? 析因设计存在的问题析因设计存在的问题优点
高效
能够检测到相互作用
缺点:
复杂
概念化析因设计实例
泰素剂量方案析因设计实例
泰素剂量方案这项试验“确立了”短期输注的安全性和有效性,但是不明确“标准”治疗方案应该是什么。交叉设计交叉设计2N例患者随机ABABN 例患者N 例患者交叉设计 (接上页)交叉设计 (接上页)使用交叉的动机
每例患者作为自身的对照
每例患者能够“选择“,例如表达偏爱
所需病例数少
应用交叉存在的问题
第一治疗阶段使用的药物可以影响第二治疗阶段获得的结果
对每例患者的研究时间长于平行设计
退出是分析时的一大麻烦交叉的类型交叉的类型大样本简明试验大样本简明试验原理
两治疗组在一些重要结果上的真实差异可能不大,但是在某些重要结果上即使适度的差异可能很有价值”
“如果对于一些业已识别范畴的患者,两治疗组在对特定治疗结果影响上确实存在适度的差异,而在其他已识别范畴的患者中这种差异或大或小,但是不可能逆转”大样本简明试验大样本简明试验应用
最低入选标准
有时候,关键标准将遵循“不确定原则”,例如 “当患者和医生都无法确定某位患者是否适合试验的每一项治疗”
数据采集有限
无详细的知情同意
无生活质量数据
无经济上的数据