为了正常的体验网站,请在浏览器设置里面开启Javascript功能!
首页 > 嵌套logit模型在Stata软件中的拟合

嵌套logit模型在Stata软件中的拟合

2018-12-29 7页 doc 56KB 72阅读

用户头像

is_531654

暂无简介

举报
嵌套logit模型在Stata软件中的拟合嵌套logit模型在Stata软件中的拟合 王静,叶冬青 摘要: [ 目的 ] 掌握嵌套 logit 模型的原理及其在 Stata 软件中的拟合过程。 [ 方法 ] 运用实例来介绍该模型的拟 合过程。 [ 结果 ] 在 Stata 软件中的拟合过程中, 需注意数据结构的正确性、构建模型中的各层次及解释变量、检验 IIA 假设, 最后采用 nlogit 模块进行嵌套 logit 模型的拟合。 [ 结论 ] 嵌套 logit 模型可以解决反应变量的各个类别之间 的相关性问题, 正确分析因素对反应变量的影响效应。 关键词: 嵌套...
嵌套logit模型在Stata软件中的拟合
嵌套logit模型在Stata软件中的拟合 王静,叶冬青 摘要: [ 目的 ] 掌握嵌套 logit 模型的原理及其在 Stata 软件中的拟合过程。 [ 方法 ] 运用实例来介绍该模型的拟 合过程。 [ 结果 ] 在 Stata 软件中的拟合过程中, 需注意数据结构的正确性、构建模型中的各层次及解释变量、检验 IIA 假设, 最后采用 nlogit 模块进行嵌套 logit 模型的拟合。 [ 结论 ] 嵌套 logit 模型可以解决反应变量的各个类别之间 的相关性问, 正确分析因素对反应变量的影响效应。 关键词: 嵌套 logit 模型; Stata 软件; 拟合 FITTING OF NESTED LOGIT MODEL IN STATA SOFTWARE WANG Jing, YE Dong - qing. ( Department of Epidemiology and Health Statistics in Anhui Medical University, Hefei 230032, China) Abstr act : [ Obje ctive ] To understand the principle and fitting process of nested logit model. [ Me thods ] The fitting process of this model was introduced via an example. [ Re s ults ] The validity of data structure, establishment of each level and explanatory variables and test of IIA hypothesis must be finished before fitting the nested logit model via nlogit module during the overall fitting process in Stata software. [ Conclus ion ] Nested logit model can deal with the problem of dependencies of each categories, which helps to correctly analyze the effects of factors on dependent variable. Key wor ds: Ne s te d logit mode l; S ta ta s oftwa re ; fitting 数 亚 组 , 反 应 变 量 套 logit , 称 GEV ( Generalized Extreme Value, 少 1 , 嵌模型又各亚组内包含至个类别。例如 [ ] 1 并由广义极值) 模型, 首次由 Ben- Akiva( 1973 年) , restaurant 分为 A~G 7 , 量 type 提出个类别从专业上将其作为新变 [ ] 2分为 3 个亚组: type1、type2、type3, type1 包含 A、B, type2 构建, McFadden( 1981 ) 是多项 logit 年模型的扩展。包含 C、D、E, type3 包含 F、G。这样就构成了两层嵌套 logit 模 型 , 第 一 层 ( 高 层 次 ) 为 type ( I) , 第 二 层 ( 低 层 次 ) 为 [ 3] 原理1 restaurant ( j) , x、y 分别对应于低层次和高层次的解释变量iji 嵌套 logit 模型主要可以 解 决 反 应 变 量 的 各 个 类 别 之 间 存 在 相 关 性 的 问 题 , 矢量, 则嵌套 而 这 一 点 是 多 项 logit 模 型 所 不 能 容 忍 的 , logit 模型的概率可以表达为两个简单 logit 模型 概率的乘积: 因为多项 logit 模型要求各类别之间是独立不相关的 ( Indepen- 任何dence of Irrelevant Alternatives) , 我们称为 IIA 假设, 即: Pr= Pr?Pr ij j|I i 两类别的概率之比不随其他类别的存在与否而改变。 其中的条件概率[ ] 4该假设可以采用 hausman 方法 ( 1978 年) 来检验, 可先Pr =exp ( x?β) / ?exp ( x) ?βj|I ij ij 在条件 logit 模型中拟合包括所有类 别 的 模 型 和 去 除 某 类 别 后 概率 Pr的计算前需定义高层次中每组的包含值 ( inclusive i values, IV) , 因 type 分为 3 个亚组, 即对应 3 个 IV 值。 的模型, 再用 hausman 方法比较各个估计系数之间的差异, 因 i IV定义为: i 2 2 χ分 布 , 即 进 行 χ检 验 , 若 P 值 ,0.05, 则为它们服从联合 IV= ln[ ?exp( x?β) ] i ij 不服从 IIA 假设, 提示不能采用多项 logit 模型, 要用嵌套 logit 则 模型。 Pr= exp( y?α+ λ?IV) / ?exp( y?α+ λ?IV) i i i i i i i 在嵌套 logit 模型中, 将 反 应 变 量 的 所 有 类 别 分 成 若 干 少 其中 λ测量了高层次中 每 个 亚 组 内 未 观 察 因 子 之 间 的 相 i 关性, 范围在 [ 0, 1] 之间, λ越大, 说明该亚组内各类别之 i 间相关性越小。 基 金 项 目 :2006 年 度 安 徽 省 教 育 厅 自 然 科 研 项 目 ( 2006KJ360B) ; 若各 IV均为 1, 则两层嵌套 logit 模型变成单层嵌套 logit i 2005 年 度 安 徽 省 教 育 厅 自 然 科 研 项 目 ( 2005KJ348zc) ; 模型, 等价于条件 logit 模型。 2005 年 度 安 徽 省 高 校 青 年 教 师 科 研 资 助 项 目 ( 2005jq1094) 1972- ) , 王静 ( 作 者 简 介 :流行病学女, 硕士, 副教授, 研究方向: 与卫生统计 2 在 Stata 软件中的拟合 采 用 http: / /www.stata- press.com /data /r9 /restaurant 数 据 : 作 者 单 位 安徽医科大学流行病与卫生统计学系, 合肥,230032 文件来拟合。大样本量资料, 这样的数据准备工作比较繁琐) 。 该资料中是 300 个家庭对当地 7 类饭店 ( A~G) 的选项, 2.2 构建嵌套 logit 模型中的各层次及其解释变量 还有一些变量: 家庭的收入 income、孩子数 kids、饭店的等级 拟合嵌套 logit 模型时, 先 将 7 个 饭 店 分 为 3 个 亚 组 , 每 个亚组包含若干个选项 ( 见 1 中的阐述) , 所以要采用 nlogit- rating、平均每人每顿饭的花费 cost、家到饭店的距离 distance, 前两个变量在每个家庭内是不变的, 而后三个变量对于不同的 gen 命令来产生一个能识别第一层选项的新分类变量 type ( 见 饭店是变化的。欲分析哪些因素影响家庭对饭店的选择, 并计 数据结构) 。 算出每个家庭选择每类饭店的概率大小, 从而作出预测。 再分别确定第一层次 ( type) 和第二层次 ( restaurant) 的 2.1 数据结构 在拟合之前, 注意数据结构的正确性, 例如, 第一个家庭 解释变量, 而高cost、rating 和 distance 为低层次的解释变量, 层次的解释变量需重新产生, 以 type = 2 为参照组, 产生 type 分 别 与 income、 kids 之 间 的 交 互 项 inctype1、 inctype3、 kid- 则数据录入为此处选择 A~G 中的 B 项, subject 为配比组, ( type1、kidtype3 作为高层次的解释变量。 为家庭序号; choice: 0 为不选择, 1 为选择) : 2.3 IIA 假设的检验 在条件 logit 模型中, 采用 clogit 模块, 以 choice 为反应变 subject restaurant choice type 量, 指定配比组变量 subject, 设定解释变量 5 个, 运行结果见 1 A 0 1 表 1。 1 1 1 B 将其保存到变量 partset 中。 再在模型 1 基础上加上 type3, 运行结果见表 2。 1 C 0 2 最后将它与 partset 进行 hausman 检验, 结果见表 3。 1 D 0 2 chi2 ( 5) =( b - B) ' [ ( V_b - V_B) ?( - 1) ] ( b - B) = 10.70, Prob 1 E 0 2 ,chi2 = 0.0577 1 F 0 3 1 G 0 3 可以采用检验后 P 值接近 0.05, IIA 假设, 不能认为满足 嵌套 logit 模型。 ( 对 于 300 配比组 , 若有 则 数 据 共 有 300 ×7 = 2 100 行 家到饭店的距离、每个家庭的收入、孩子数影响家庭对饭店的2.4 嵌套 logit 模型的拟合 选择。 采用 nlogit 模块, 以 choice 为反应变量, 指定配比组变量 Predict 命令计算每个家庭 选 择 每 种 饭 店 的 预 进一步采用 subject, 分别设定第一层和第二层的解释变量, 4。 运行结果见表 测概率 ( 计算公式见前, 略) , 从而进行回代预测: 若某家庭 嵌套 logit 模型与条件 logit 模型 的 似 然 比 检 验 ( LR test) , 选择 7 类饭店的预测概率中, C 类所对应的预测概率最大, 则 P,0.05, 更加说明了该数据适合用嵌套 logit 模型。 该家庭判为选择 C 类饭店。在 300 个家庭的 2 100 次选择中, 发 现 : 平 均 每 人 每 顿 饭 的 花 费 、 嵌 套 logit 模 型 分 析 后 , 学领域中普遍使用的原因。3 讨论 本 文 所 阐 述 的 嵌 套 logit 模 型 , 虽 然 可 以 写 成 two- level, 但为了与多水平模型区别开, 这里的 level 被翻译成 “层”, 而 参考文献: 且第一层为最高层, 第二层为次高层, 以次类推; 在多水平模 [ 1 ] Ben - Akiva, M. The Structure of travel demand models [ C] . PhD [ 5] Thesis, MIT. 1973. 型中“水平”也叫 level, 但水平 1 为最低水平, 水平 2 为较 McFadden, D. Econometric models of probabilistic choice. In Struc- [ 2 ] 高水平, 以次类推。 tural Analysis of Discrete Data with Econometric Applications [ M] . 笔者对该数据进行条 件 logit 模 型 分 析 后 , 也 进 行 了 回 代Cambridge, MA: MIT Press, 1981. 198- 272. 预测, 发现其预测正确率为 85.7%, 高于嵌套 logit 模型的预测 Heiss, F. Structural choice analysis with nested logit models [ J] . [ 3 ] 正 确 率 80.4% , 是 因 为 条 件 logit 模 型 的 –2* ( 对 数 似 然 函 数 Stata Journal 2002, 2 : 227- 252. 值) 大于嵌套 logit 模型的该值而造 成 的 , 可 能 资 料 中 还 未 观 [ 4 ] Hausman , J. Specification tests in econometrics [ J] . Econometri- 察到另一些影响因素。 ca , 1978, 46: 1251- 1271. 拟合嵌套 logit 模型时, 各 选 项 的 亚 组 划 分 应 遵 循 该 领 域 或专业上的要求, 而且每层内的属性特征需明确, 否则会导致 嵌[ 5 ] H.Goldstein 原著; 李晓松 主译. 多水平统计模型 [ M] . 第 2 版. 套 logit 模型的拟合失败, 也许这是嵌套 logit 模型很难在医 四川科学技术出版社, 1999. ( 收稿日期: 2006- 08- 16) "!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!" !!!!欢迎订阅《现代预防医学》杂志
/
本文档为【嵌套logit模型在Stata软件中的拟合】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索