为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

逆抽样条件下含结构零的2_2列联表中相对差的估计

2018-01-19 9页 doc 29KB 15阅读

用户头像

is_601191

暂无简介

举报
逆抽样条件下含结构零的2_2列联表中相对差的估计逆抽样条件下含结构零的2_2列联表中相对差的估计 逆抽样条件下含结构零的 2×2 列联表中相对差的估计 1,2江绍萍 ,1.云南民族大学 数学与计算机科学学院 ,昆 明 650500,2.云南大学 数学与统计学院 ,昆 明 650500, 摘 要 ,含 结 构 零 的 列联表的统计推断是当今社会的一个热点问题 。文 中 建 立 信 息 2×2 Fisher 阵 以求解感兴趣参数的方差并建立了四 个 统 计 量 ,wald 统 计 量 、score 统 计 量 、wald-score 统 计 量 和 似 然 比 统 计...
逆抽样条件下含结构零的2_2列联表中相对差的估计
逆抽样条件下含结构零的2_2列联表中相对差的估计 逆抽样条件下含结构零的 2×2 列联表中相对差的估计 1,2江绍萍 ,1.云南民族大学 数学与计算机科学学院 ,昆 明 650500,2.云南大学 数学与统计学院 ,昆 明 650500, 摘 要 ,含 结 构 零 的 列联表的统计推断是当今社会的一个热点问 。文 中 建 立 信 息 2×2 Fisher 阵 以求解感兴趣的方差并建立了四 个 统 计 量 ,wald 统 计 量 、score 统 计 量 、wald-score 统 计 量 和 似 然 比 统 计 量 。基于 蒙特卡洛的方法模拟得到的结果表明 score统计量是最优 的 ,其既能保证犯第一错误 概率最小又能使得功效达到最大 。 关 键 词 ,逆 抽 样 ,相 对 差 ,Wald 统 计 量 ,score 统 计 量 ,似 然 比 统 计 量 中 图 分 类 号 ,文 献 标 识 码 ,文 章 编 号 ,,,O212 A 1002)6482071002)0014-03 列联表的对角线上有一个元素为零 ,且 在 理 论 上 ,这 个 为2×2 零的格子在试验中是观察不到次数的 ,故 含 结 构 零 的 2×2 列 引言0 [1]联 表 就 产 生 了 。如 1997年日本进行结核病的临床试 验称 为 TB 试 验 ,总 共 进 行 两 次 TB 试 验 。 在 第 一 次 TB 试 验 后 ,都 在 实 际 生 活 中 ,研究者经常遇见这样的一类 问 题 , 即 在 希 基 金 项 目 ,云南省教育厅科学研究基金资助项目 ,,08Y0264 作 者 简 介 ,江 绍 萍 ,1982-,,女 ,云 南 禄 丰 人 ,云南大学在读博士生 ,研 究 方 向 ,应 用 统 计 。 Σ m m n 1 1.7862 1.6287 Σ Σ λ+[pb-b]=0 ΣΣΣ (pb-b)wΣΣijjkik P= 0.5599 1 0.9118 Σijjkikk Σ ΣΣ i = 1 j = 1 Σ k = 1 Σ1 0.6140 1.0967 ,7, Σ n ΣΣ ,, 求 解 方 程 组 ,, 可 得 指 标 权 重 0.4934 37W=[0.1357 Σω=1Σ kΣ k = 1 Σ0.3709] 求 解 方 程 组 ,7,可得指标的权重 ω,ω,…,ω。 12n ,4,计算各综合属性值 ,4, 由各属性的权重 , 并 由 式 ,3, 计 算 各 方 案 综 合 属 性 ,,, 所 以 , 由 此 得z =0.5449z =0.3051z =0.3346A >A >A 1 2 3 1 3 2 值 ,对方案进行排序和择优 。 最 优 方 案 为 。A 1 实例3 结论4 设某一决策问题有 3 个 候 选 方 案 A,A,A和 3 个 评 价 123 本 文提出的决策方法使用于属性权重未知且对方案有 指 标 C,C,C, 各 候 选 方 案 在各指标下的特性用 vague集 表 123偏 好 的 vague集 多 属 性 决 策 问 题 , 提 出 了 将 属 性 vague值 * * , 决策者对各方案 的 偏 好 为 ,a=[0.8,0.9],a=示 如 下 所 示 1 2 和 偏 好 vague值 转 化为互反判断矩阵来建立最优化模型 ,从 * [0.5,0.7],a=[0.4,0.8]试选取最优方案。 3 而 求 得 各 属 性 的 权 重 ,通过计算各方案的综合属性值对方A={(C,[0.1,0.1]) ,(C,[0.8,0.9]),([0.2,0.4])} C1123案进 行 排 序 。 该方法考虑了决策者偏好信息对权重的影 响 , A={(C,[0.3,0.6]) ,(C,[0.1,0.7]),([0.3,0.4])} C2123评 价 结 果 较 为 客 观 ,易于计算机实现 。 A={(C,[0.4,0.5]) ,( C,[0.5,0.6]),(C[0,0])} 3123 应 用 Matlab计 算 结 果 如 下 , 参 考 文 献 , ,1,应 用 式 ,1,将 上 述 vague 值转换为模糊值 [1] 要 瑞 璞 ,沈 惠 璋 .vague集多指标决策的模糊值线性序 法 [J].计 算 机 0.1 0.8890.25 工 程 与 应 用 ,2009(6,). B= 0.429 0.25 0.333 ΣΣ[2]樊治平,姜 艳 萍.基 于 OWG 算子的不同形式偏好信息的群决策方法 0.4440.556 0 [J].管理科学学报,2003,27(1). ,2,将决策者对方案的偏好值转换为模糊值 ,并 由 式 ,2, ,责 任 编 辑/亦 民 , 望 被 试 验 者 呈 强 阳 性 ,也就是有肺结核抗体 ,。过 一Positive 鄣L(θ) 鄣L(θ) T ,通过似然函数得到有效的得分函数 U(θ)=( , )鄣δ 鄣π 1到三周后在进行第二次 TB 试 验 , 若 第 一 次试验后呈阳性反 其 中 ,。 求 解 ,得到无条件限制下参数 的 极 大 θ=(鄣π)U(θ)=0θ 1应的患者将不进行第二次 TB 试 验 。经 过 第 二 次 TB 试 验 后 , 赞 赞 赞 患 者 还 是 出 现阳性或者阴性的反应 , 从而得到含结构零的 似 然 估 计 ,记 为θ=(δ,π)。 其 中 ,1 22×2列 联 表 。 这 个 试 验 中 ,试验的总样本数是固定的 ,若 样 本 X +X X -X X 11 10 11 00 X+X 10 赞 赞 1011 ,π= δ=1 数 小 ,那 么可能使得其它三个格子中的样本数为零 。 为 了 避 ,,,,X +X X +X +X X +X +X 10 11 11 10 00 00 10 11 免这种情况的发生 ,在试验中加入了逆抽样过程 。同 理 ,可 以 求 得 在 H:δ=δ条件下参数的极大似然估计 , 00 逆 抽 样 ,又称为负二项分布 ,即为连续抽样直到获得先 赞 赞 赞 记 为 ,θ=(δ,π)。 即求解如下方程 , 1前 固 定 的 r 个感兴趣的样本时 才 停 止 抽 样 。 在 现 实 生 活 中 , 鄣L X +,2π -δ , X [,1+δ ,-2π ] X 11 1 0 10 0 1 00= + - =0 逆抽样条件下相对差的估计问题具有很高的实用价值 。所 以 鄣ππ,π-δ, π[,1+δ,-π] 1-π 1 1101011[3,4,5] 一些学者已作过类似的研究 ,如 KungJongLui把 逆 抽 样 的 得 关 于 的一元三次方程 ,π 1 3思 想 加 入 到 2×2列联表的研究过程 中 , 他 只 是 建 立 了 Wald ,2X +2X +X ,π -[,4X +3X +X ,+δ ,3X +3X 2X ,] 11 10 00 11 10 00 0 11 10+ 00 1 统 计 量 和 对 数 Wald 统 计 量 进 行 假 设 检 验 , 且在求解得方 法 2 2,,,,,,,π+[δX+X+X+δ4X+4X+X+2X+X]π-X+1110001110001110111 1 0 0 采用极大似然估计的方法求解感兴趣参数的估计及方差 。M. X,δ,1+δ,=0 1000[4]L.Tang作了逆抽样条件下两组独立的样本的风险比的检验 计 算过程中采用一元三次方程的求根公式来求解上述 问 题 。 方 程 组 的 根 。 以 往 求解感兴趣参数的期望和方差 ,通常的做法是采用 概率密度函数及其相对差的定义1 delta方 法 ,但 delta方法是一种近 似 求 解 的 方 法 ,得 到 的 结 果 带有一定的偏差 。 为了避免出现偏 差 ,本 文 采 用 Fisher-score 本 文 在 含结构零的列联表中加入逆抽样 以 检 测 结 核 病, 的方法来求解参数的方差 。 由 此 建 立 Fisher信 息 阵 如 下 , 抗体的试验为例 ,即 在 TB 试验中连续抽样,直 到 抽 到 先 前 固 2 22 2 定 x(x>0)的 个 第 一 次 TB 反应为阴性的 样本时才停止抽样 。 鄣 L 鄣 L 2211 ,,,, E E --222 22鄣δ 鄣δ鄣π 1II 2 2 我们得到如下的列联表的形式 , 11 12 22I= = 222 2 22鄣L ) 鄣L 22 II ,,,E- 21 22 , E- 22 2第 二 次 TB 试 验 22鄣δ鄣π 1 22鄣π 1 22否 是 在 求 解 Fisher信息阵的过程 中 应 该 注 意 到 , 变 量 X服 11 第 一 次 TB ,,π,X, π,X, πX 否 111110101.1.π,X,是 试 验 0000 从 参 数 为 和 的 二 项 分 布 ,同 理 服 从 参 数 为 和 --- π,X, xπ/πXx000011 111 10 1 ,,,,πX πx 1111.0.0 π 1π/π的 二 项 分 布 ,而 变 量 X服 从 参 数 为 x和 π*= 101 00 1 π+π 100其 中 0<π<1(j=0,1) 是列联表的相应格子中 的 概 率 ,X, ij11的 负 二 项 分 布 。 故可以得到各随机变量的期望如 下 , 为落入相应格子的 样 本 数 。 并 且 满 足 ,, X,Xπ=π+ππ+1000 111101 , xππx(1-π*πxx111 110 1100,, E(X)= E(X)= E(X)= = 111000π* ππππ=1,X=0,1,…x,X=0,1,… ,x,X=0,1,… 。从 而 得 到 变 量 1110011110100 X=,X,X,X,的概率密度函数为 , 通 过 求 解 信息阵的逆矩阵得 到感兴趣参数的方 Fisher 111000 x x10 x00差 为 , 11 ,x(x+X-1)1100 f(X|π)=( ) π π π(1) 11 10 00 X(x-1)X!2 10011-1 (π-δ)(1+δ-π)(π-1-2δ) 11 1 -1 Varδ=?(θ)=(I-III) =111212 在 含 结 构 零 的 2×2列 联 表 中 ,相对差的定义为 , 22 x (π -1-2δ) 1 1 δ=π-π/π 1111建立统计量如下 , 根据相对差的定义 , 可 以 用 参 数 δ 和 π表 示 出 其 它 的 1 赞 T赞 -1赞 Wald统 计 量 T=(δ-δ)(?(δ))(δ-δ) 100参 数 ,即 π=π(π-δ),π=π(1+δ-π),π=(1-π)。 从 而 得 到 11111011001軌軌軌Score统 计 量 T=U(θ)T?(θ)U(θ) 2δ了 由 参 数 δ 和 π表示的似然函数 , 1 赞 T軌-1赞 L(δ,π)=X1n[π(πδ)]+X)1n[π(1δπ)]+X1n(1π)+C ---- 111111011001Wald-score统 计 量 T3=(δ-δ)(?(θ))(δ-δ)00其 中 ,C 为 不 依 赖 于 δ 和 π常 数 ,δ 为 感 兴 趣 参 数 ,π1 1 軌赞 )] 似 然 比 统 计 量 T=-2[L(θ)-L(θ4为 讨 厌 参 数 。 模拟研究3 参数估计及其统计量的建立2 在 实 际 中 ,可以通过求解各统计量条件下犯第一类错误 是否等于先前固定的某 本 文感兴趣的是检验相对差 δ 的概率和功效来检验建立的统计量的优劣性 。并 采 用 蒙 特 卡 一 个 值 δ,从而建立如下的假设检验问题 , 0洛的方法对有限样本进行模拟 。 当 给 定 了 δ和 π的 值 之 后 , 0 1 , H:δ=δ圮H:δ?δδ?(-1,1)00100通过相对差的定义得到 π,π,π的 值 。 所以模拟的过程 111000 统 计 与 决 策 年 第 期 ,总 第 期 ,2010 2 302 15 表 统 计 量 条件下犯第一类错误的概率 统 计 量 条 件 下 的 功 效1 T,T,T,T 表 2 T,T,T,T 1234 1234 件 下 ,T统计量求解得的功效比 T统 计 1 3 δπxTTTTπxTTTTδ0 1 1 1 2 3 4 0 1 1 1 2 3 4 量 差 一 些 。-0.2 0.3 30 6.13 5.13 5.55 5.31 -0.2 0.3 30 79.7 100 100 79.2 通 过 观 察犯第一类错误的概率发现 , 50 5.64 4.98 5.18 5.28 50 92.5 100 100 94.5 T统计量即似然比统计 量的性质比较稳 4 100 5.49 5.15 5.31 5.26 100 99.4 100 100 99.4 30 5.97 4.94 5.21 5.41 30 99.1 98.9 99.2 99.1 0.5 0.5 定 , 但 是 观 察功效发现波动性比较大 ,不 50 5.58 5.13 5.53 5.24 50 99.9 99.9 99.9 99.9 太 稳 定 , 所 以 T统计量比其他的统计量 4 100 5.17 4.99 5.09 4.95 100 100 100 100 100 性 质 要 差 一 点 。 30 4.83 6.54 5.21 4.36 30 97.7 84.5 84.9 45.2 0.7 0.7 50 5.18 5.23 5.36 5.01 50 99.9 85.2 85.2 39.9 100 5.32 5.15 4.81 5.09 100 100 80.7 80.7 31.7 讨论4 -0.1 0.3 30 79.1 99.8 99.8 79.1 -0.1 0.3 30 6.33 5.14 5.49 5.46 50 5.81 5.03 5.16 5.23 50 92.5 100 100 92.5 100 5.51 5.13 5.30 5.19 100 99.4 1009 100 99.4 现 实生活中逆抽样的问题经常涉及 0.5 30 5.78 4.87 5.03 5.05 0.5 30 92.1 1.0 92.0 91.7 到 。 本 文 除 了应用逆抽样的方法外 ,还 采 50 5.44 4.82 5.05 4.98 50 99.2 99.0 99.2 99.2 100 5.16 4.86 5.12 4.97 100 100 100 100 100 用 Fisher -Score 的 方 法 求 解 感 兴 趣 参 数 0.7 30 6.50 4.52 5.27 5.98 0.7 30 85.4 83.8 86.6 80.4 的 方 差 。 这种方法可以比较准确地求解参 50 5.53 4.87 5.25 5.31 50 97.6 95.8 96.3 94.4 数 方 差 , 避 免 了 采 用 delta方 法 求 解 感 兴 100 5.27 5.00 4.87 5.11 100 99.8 99.6 99.6 99.4 0.0 0.3 30 6.65 4.96 5.23 5.53 0.0 0.3 30 64.6 67.0 64.9 65.3 趣参数方差时存在的误差 。 另 外 ,文 中 建 50 6.04 5.11 5.36 5.33 50 86.1 87.3 86.3 86.5 立 了 四 个 统 计 量 ,并讨论了这四个统计量 100 5.68 5.07 5.43 5.34 100 99.2 99.3 99.3 99.3 所 使 用 的 条 件 ,还得到了一个最优的统计 0.5 30 5.81 5.02 4.77 5.15 0.5 30 66.3 64.3 60.6 63.4 50 5.46 4.92 5.15 5.08 50 85.1 84.2 82.5 84.0 量 , 为 以 后 的 研究提供了一个有用的方 100 5.21 4.96 5.08 5.02 100 98.9 98.9 98.7 98.9 法 。 在 以 后 的问题的讨论过程中 ,可 以 采 30 6.13 4.87 4.86 5.41 30 64.5 79.9 77.8 62.6 0.7 0.7 2 50 5.56 4.90 5.33 5.17 50 90.8 96.2 95.7 89.6 用类似的方法讨论 π/π的 假 设 检 验 问 111100 5.21 5.05 4.80 4.95 100 99.5 99.9 99.9 99.5 题 。0.1 0.3 30 7.03 4.78 5.62 5.62 0.1 0.3 30 90.3 89.4 88.6 88.4 50 6.21 5.03 5.29 5.41 50 98.7 98.6 98.4 98.5 100 5.80 5.13 5.30 5.32 100 99.9 99.9 99.9 99.9 参 考 文 献 , 0.5 30 5.94 5.01 5.27 5.26 0.5 30 89.4 89.4 87.3 88.9 [1]Toyota, M ., Kudo, K., Sumiya, M ., Kobori, 50 5.57 5.00 5.16 5.16 50 98.4 98.4 98.2 98.4 O. High Frequency oIndf ividuals with 100 5.26 5.13 5.19 5.06 100 99.9 99.9 99.9 99.9 0.7 30 5.87 4.64 5.11 5.46 0.7 30 80.1 97.3 96.7 78.8 Strong Racetion to Tuberculosis amongC lini- 50 5.55 4.83 5.02 5.18 50 93.9 99.9 99.9 92.9 cal Trainess[J].Japanese Journal of Infectious 100 5.22 4.81 4.96 5.01 100 99.6 100 100 99.6 Diseas,e1999,52. [2]Nian-Sheng Tang,Mna-lai Tang,Ivan uS-iFung Chan. On Test o f 中 , 相 对 差 δ取 值 为 -0.2,-0.1,0.0,0.1,π取 值 为 0.3,0.5, 0 1 0.7,显 著 水 平 为 α=5%,得到相应的结果见表 1、表 2。 Equvialence Via Non -unity Relative Risk for Matched -pair De- sign[J].Sattistics in Medicine,2003,22. 通 过计算犯第一类错误的概率和功效 , 得 到 如 下 的 结 [3]Kung-Jong Lui. Estimation of Rate Rtioa and Rleative Difference 论 , in Matched- pairs under Inverse S ampling [ J ] . Envrionmetrics , 观 察 表 1、表 2 发 现 ,Score 统计量是最优的 。 因 为 在 参 数 2001,12.取 值 相 同 的 条 件 下 ,它能保证犯第一类错误的概率最小且功 [4]M.L.Tang,Y.J.Liao,H.K.T.Ng,P.S.Chaen. sting T of Rate Rtioa under 效还能达到最大 。 Inverse S ampling[J]B.iometrical Journal,2008,89. T统 计 量 即 Wald-score 统计量适用于 处理大样本的情 3 [5]Kung Jong Lui.Point Estimation on Rleative Risk under Inverse - Sampling[J]B.iometrical Journal,1996,38. 况 。 在 T统 计 量 条 件 下 ,所求得的犯第一类错误的概率随着 3 [6]Kikuchi,D.A.Inverse Sampling in Case C ontrol Studies Inv oling a 样 本 值 的 增 大 而 减 小 ,并趋近于置信水平 。 所求解得的功 效 Rare E xposure[J].Biometerical Journal,1987,29. 随 着 r 的 增 大 而 增 大 。 [7]Kung- Jong Lui. Confidence In tervals for the Risk Ratio in 在 模 拟 过 程 中 , 无 论 样 本 值 r 的 取 值 如 何 ,T统 计 量 2 Cohort Studies under InvSearse mplin g[J].Biometrical Journal,1995, 即 Score统计量都能使得犯第一类错误的概 率 达 到 最 小 , 同 37. 时 也使得功效达到最大 。特 别 在 样 本 值 r 小 于 30 的 情 况 [8]Kung-Jong Lui.Sample Sifze or the Exact C onditional Test undr e下 ,犯 第一类错误的概率接近于置信 水 平 。 随 着 样 本 值 r 的 Inverse S ampling[J].Sattistics in Medicine,1995,15. 增 大 ,功 效 变 化 不 大 。 故 可 以 T统计量来处理小样本问题 。 2 通过观察犯第 一类错误的概率发现 ,统 计 量 即 TWald1 责 任 编 辑亦 民(/) 统 计 量 比 统 计 量 性质更稳定一些 , 但是在相同的参数条 T3 统 计 与 决 策 2010年 第 2 期 ,总 第 302 期 , 16
/
本文档为【逆抽样条件下含结构零的2_2列联表中相对差的估计】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索