为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

关于计量经济学模型随机扰动项的讨论

2010-06-07 6页 pdf 366KB 68阅读

用户头像

is_894124

暂无简介

举报
关于计量经济学模型随机扰动项的讨论 关于计量经济学模型随机扰动项的讨论 3 李子奈 李鲲鹏   内容提要 :论文指出了计量经济学模型中源生的随机扰动项和衍生的随机误差项之间的区别 ;讨论或证明了 , 如果模型存在总体设定误差和变量观测误差 ,在很多情况下将导致随机误差项对 Gauss 假设以及正态性假设的违 背。 关键词 :计量经济学模型 ;随机扰动项 ;模型设定误差 ;变量观测误差 中图分类号 :0212    文献标识码 :A    文章编号 :1002 - 4565 (2009) 02 - 0062 - 06 Discussion about t...
关于计量经济学模型随机扰动项的讨论
关于计量经济学模型随机扰动项的讨论 3 李子奈 李鲲鹏   内容提要 :论文指出了计量经济学模型中源生的随机扰动项和衍生的随机误差项之间的区别 ;讨论或证明了 , 如果模型存在总体设定误差和变量观测误差 ,在很多情况下将导致随机误差项对 Gauss 假设以及正态性假设的违 背。 关键词 :计量经济学模型 ;随机扰动项 ;模型设定误差 ;变量观测误差 中图分类号 :0212    文献标识码 :A    文章编号 :1002 - 4565 (2009) 02 - 0062 - 06 Discussion about the Stochastic Disturbance Term of Econometric Models Li Zinai &Li Kunpeng Abstract :The paper highlights the distinguish between the original stochastic disturbance term and the derived stochastic error term , suggests that if the relationship error of model or the measurement error of variables exist in an econometric model , in the most of cases the stochastic error term will not fellow the normal distribution assumption and some other Gauss Assumptions. Key words :econometric model ; stochastic disturbance term ; relationship error of model ; measurement error of variables 3 本文获国家社会科学基金重点项目“计量经济学模型方法论 基础研究”(08AJ Y001)的资助。   一、随机扰动项的源生性 随机扰动项在计量经济学模型中占据特别重要 的地位 ,也是计量经济学模型区别于其它经济数学 模型的主要特征。李子奈 (2008) 将计量经济学应用 研究的总体模型设定归纳为 :将影响被解释变量的 因素集进行有效分解 ,按照与被解释变量关联关系 的恒常性和显著性两个维度 ,分解为显著的恒常性 因素集、显著的偶然性因素集和无数单独影响可以 忽略的非显著因素集 ;所有显著的恒常性因素作为 解释变量 ;显著的偶然性因素对被解释变量的影响 , 则通过对数据进行奇异点诊断后采用技术手段予以 消除 ;而无数非显著因素对被解释变量的影响则用 一个随机扰动项 (stochastic disturbance term) 表示 ,并 引入模型。W. H. Greene (2000) 指出 ,没有什么模型 可以期望处理经济现实的无数偶然因素 ,因此在经 验模型中纳入随机因素是必须的 ,被解释变量的观 察值不仅要归于已经清楚了解的变量 ,也要考虑来 自人们并不清楚了解的偶然性和无数微弱因素的影 响。于是 ,对于单方程计量经济学模型 ,总体回归模 型的一般形式为 : yi = f ( Xi ,β) + μi  i = 1 ,2 , ⋯, n 其中 , y 称为被解释变量 ; X 称为被解释变量 ,可能 包括多个变量 ;β为反映解释变量和被解释变量之 间关系的参数 ,一般称为结构参数 ; n 表示随机抽取 的样本数量 ;μ即为随机扰动项。 显然 ,这样界定的随机扰动项具有源生性。从 经济学意义上 , X 包含了所有对于 y 具有显著影响 的因素 , f ( Xi ,β) 表达了这些因素与 yi 之间的动力 学关系 ,生成了 yi 的条件期望值。但是 ,无数不显 著因素的影响对于生成 yi 的观测值是不可忽略的 , “不显著”不是“没有影响”。从统计学意义上 ,在 Xi 的条件下重复抽样 ,无数不显著因素对 yi 的均值没 有影响 ,但是在一次抽样中 ,它们对 yi 的个值的影 响是不可忽略的。 在基于随机抽样的截面数据的经典计量经济学 模型中 ,这个源生的随机扰动项μ由大数定理保证 其满足 Gauss 假设 ,由中心极限定理可以证明其服 从正态分布。于是 ,建立在 Gauss 假设和正态分布 假设基础上的统计推断具有可靠性。  第 26 卷第 2 期 2009 年 2 月 统计研究 Statistical Research Vol . 26 , No12 Feb. 2009     二、随机误差项的衍生性 正如 W. H. Greene (2000) 指出的 ,在确定性模型 中引入随机扰动 ,并不是为了掩盖确定性模型的不 足之处。因此 ,如果所谓的未被解释的随机扰动并 不是真正的不能被解释的因素 ,模型就是不适当的。 牢记这一点对计量经济学是非常重要的。统计推断 的理论不像确定性理论那样 ,会被仅仅一个不符实 际的观察否定。引入随机要素后 ,对预期结果的描 述从确切的表述转化为可能性的描述 ,除非有占优 证据 (占优本身则是很难清楚界定的) ,很难否定随 机模型。当然 ,如果未被解释的随机扰动并不是真 正的不能被解释的因素 ,即使这样的模型难以被否 定 ,也是建模者自欺欺人。Greene 的担忧在很多情 况下成了现实 :在很多计量分析中 ,随机误差项成了 确定性模型不足之处的遮羞布。在大部分计量经济 学教科书中 ,例如 D. N. Gujarati (2003) ,在第一次引 入随机扰动项的概念时 ,都将它定义为“被解释变量 观测值与它的期望值之间的离差”,即 μi = yi - E ( y | Xi ) 用一个平衡式代替定义式 , 并且将随机扰动项 (stochastic disturbance term) 与随机误差项 ( stochastic error term)等同。一个“源生”的随机扰动项变成了 一个“衍生”的误差。而且在解释它的具体内容时 , 一般都在“无数非显著因素对被解释变量的影响”之 外 ,加上诸如“变量观测值的观测误差的影响”、“模 型关系的设定误差的影响”等。国内出版的计量经 济学教科书也是这样。 将“源生”的随机扰动变成“衍生”的误差 ,有许 多理由可以为此辩解。如果不对数据生成过程的理 论结构做出假定 ,即进行总体模型设定 ,就无从开始 模型研究。但是 ,相对于物理学 ,经济学家对经济现 实所知较少 ,总体模型被研究者有限的知识所确定 , 因此误差在所难免 ,只能将总体模型方程的误差项 设定为衍生性的。 问在于 ,关于随机扰动项的 Gauss 假设以及 正态性假设 ,都是基于“源生”的随机扰动而成立的。 如果存在模型设定误差、变量观测误差等确定性误 差 ,并将它们归入“随机误差项”,那么它是否满足这 些基本假设 ? 如果不满足 ,进而进行的统计推断就 缺少了基础。对于这个问题 ,一般的计量经济学教 科书没有进行讨论 ,有的只是进行简单的说明 ,例 如 ,在 W. H. Greene (2000)的教科书中就有以下的说 明 :鉴于我们对随机误差来源的描述 ,中心极限定理 的条件一般都成立 ,至少近似成立 ,因此 ,正态性假 定在多数情况下也都是合理的。   三、包含模型设定误差的随机误差项   (一)存在模型关系误差的情形 所谓“关系误差”,指模型的总体设定不能准确 反映所研究的经济系统中的动力学关系。这样动力 学设定之间的偏差将不可避免的进入随机扰动项 , 影响其正态性。 对于一个回归的模型 ,假定真实的数据生成过 程是 : yi = f ( Xi ,β) + μi  t = 1 ,2 , ⋯, n 这里的随机扰动项μi 服从经典假设 ,即独立同分 布、高斯正态。假定模型被错误的设定为 : yi = g ( Xi ,„β) + vi  t = 1 ,2 , ⋯, n 简单的数学变换后可得 : vi = μi + ( f ( Xi ,β) - g ( Xi ,„β) ) 显然这里的分布与 ( f ( Xi ,β) - g ( Xi , „β) ) 有密 切的关系 ,这里我们分两种情况讨论 : 第一种情况 : Xt 是非随机的。这时关键是如何 看待 „β,由于 „β是在模型错误设定下的参数 ,因此没 有很好的定义。不过对每一个给定 „β, ( f ( Xi ,β) - g ( Xi ,„β) )是确定性变量的函数之差 ,因此错误模型 中的误差 vi 是一个正态随机数μi 与非随机数 ( f ( Xi ,β) - g ( Xi ,„β) )之和 ,因此仍然是正态的。考虑 到 „β的任意性 ,因此 vi 将是正态的。 第二种情况 : Xt 是随机的。这种情况下 , ( f ( Xi ,β) - g ( Xi ,„β) )将必然是一个随机数 ,而且这个 随机数受到了三个因素的影响 : ( a) 模型的正确动 力学关系 f ; ( b)模型被误设的动力学关系 g ; ( c) 随 机回归元 Xt 的分布。注意到 : vi - μi = ( f ( Xi ,β) - g ( Xi ,„β) ) 因此误差 vi 是一个正态随机数的充要条件是 ( f ( Xi ,β) - g ( Xi , „β) ) 是正态的。而在上面提到的三 个因素的作用下 , ( f ( Xi ,β) - g ( Xi ,„β) ) 的正态性即 使在大样本下 ,也不能为任何数学定理所保证。 (二)存在遗漏显著变量的情形 可以通过一个例子来说明。假如模型的正确设 定应该为 : 第 26 卷第 2 期 李子奈 李鲲鹏 :关于计量经济学模型随机扰动项的讨论 ·63   ·  yi = β0 + β1 x1 i + β2 x2 i + μi  μi ~ i . i . d . N (0 ,σ2 )  i = 1 ,2 , ⋯, n 即被解释变量由两个解释变量来解释。如果将模型 错误设定为 : yi = β0 +β1 x1 i +εi  i = 1 ,2 , ⋯, n 那么 ,该模型的随机误差项为 εi = μi +β2 x2 i 其中μi ~ i . i . d . N (0 ,σ2 ) 。显然 ,该随机误差项的 分布不仅受到μi 还受到 x2 i 的影响 ,如果 x2 i 是正态 零均值 ,独立同分布的 ,则εi 仍然满足零均值、正态 独立同分布的性质 ;如果 x2 i 是正态非零均值 ,独立 同分布的 ,则εi 将不再具有非零均值 ,但具有正态 独立同分布性质 ;如果 x2 i 是正态非零均值 ,同分布 但不独立 ,则εi 将是正态非零均值 ,同分布但不独 立 ;如果 x2 i 是非正态的 ,则εi 也将不再具有正态 性。 (三)存在函数变换的情形 通过函数变换将一些简单的非线性模型转换为 线性模型 ,是计量经济学模型估计中常用的 ,但是 , 人们对于变换后模型随机扰动项的性质却缺少讨 论。需要强调的是 ,这种变换与前面讨论的模型误 设有所不同 ,这里以常用的 Cobb - Dauglas 生产函数 模型为例来予以说明 ,假定用于估计的模型形式为 : ln yi = β0 +β1 ln x1 i +β2 ln x2 i +β3 ln x3 i +εi  i = 1 ,2 , ⋯, n 虽然 x1 , x2 , x3 已经包括了所有对产出量 y 有显著 影响的投入要素 ,我们仍然不能对模型随机扰动项 ε的分布给出明确的界定 ,因为它不是源生的 ,而是 由下列模型 yi = Ax β11 i x β22 i x β33 iμi  i = 1 ,2 , ⋯, n 经过对数变换后“衍生”得到的 ,它的分布不仅取决 于原模型随机扰动项的分布 ,而且取决于用于变换 的函数。如果原模型μi~ i . i . d . N (0 ,σ2 ) 中 ,那么 显然εi = lnμi 将不再服从正态分布。如果原模型是 如下形式 : yi = Ax β11 i x β22 i x β33 i + μi  i = 1 ,2 , ⋯, n 其中μi~ i . i . d . N (0 ,σ2 ) 。该模型虽然具有更合理 的经济学解释 ,但是却使得经过对数变换得到的线 性模型的随机扰动项更加复杂。 以上分别讨论了模型设定误差的几种形式对模 型随机扰动项的影响 ,表明这些误差的存在 ,可能导 致随机扰动项对 Gauss 假设以及正态性假设的违 背 ,随之进行的模型估计及统计推断的基础将受到 损害。   四、包含观测误差的随机误差项 现在讨论观测值的观测误差。所谓“观测误 差”,指变量的样本观测值不能准确反映变量的实际 状态。观测误差是普遍存在的 ,正如 W. H. Greene (2000)指出的 ,在理论上确定变量之间的关系并不 难 ,但要得到这些变量的准确度量则完全是另外一 回事。例如 ,合理度量利润、利率、资本存量或资本 存量提供的服务流量的困难 ,是经验文献中反复出 现的主题 ;在极端情况下 ,甚至找不到理论变量的可 观测的对应物。所以 ,观测误差构成了“衍生”的随 机误差的主要内容。 为了方便 ,下面分别讨论被解释变量的观测误差 和解释变量的观测误差存在的情况下 ,随机误差项是 否满足关于扰动项的 Gauss 假设和正态性假设。 (一)存在被解释变量观测误差的情形 假定没有观测误差时 ,第 i 个被抽样的值是 yni , 有观测误差时 ,第 i 个被抽样的值是 yei ,根据以上假 设 ,应该有 yei = yni + ei ,这里 ei~ i . i . d (0 ,σ2e ) 是观 测误差。进一步 ,没有观测误差的回归方程是 : yni = X′iβ+μi  μi ~ i . i . d . N (0 ,σ2 )  i = 1 , 2 , ⋯, n 将 yei = yni + ei 代入得到 : yei = X′iβ+ (μi + ei ) 如果 ei 是正态的 ,则 (μi - ei ) 也应该是正态 的 ,经典假设不被破坏 ,基于正态分布的统计推断仍 然成立。如果 ei 是非正态的 ,显然 (μi - ei ) 就不可 能再是正态分布 ,此时基于中心极限定理给出的所 有的统计推断都是近似成立。 这里需要说明 :为什么要将μi 和 ei 区别看待 ? 这是因为μi 和 ei 的本质是不一样的 ,μi 是无数的 无法辨别地非显著的影响的总和 ,我们无法对μi 的 来源做一个清晰的界定。但是 ei 则不同 ,它的来源 清晰明确 ,就是抽样时的测量误差 ,它的影响也是显 著的。如果从林德贝格—费勒中心极限定理的角度 来看待 (μi - ei ) ,则上面的分析等同于这样的论断 , 林德贝格条件要求每一个误差因子要“一致地”小 , 因而其对总和的极限分布不产生影响 ,但是 ei 这个  ·64   · 统计研究 2009 年 2 月  因子不具有这一特征 ,破坏了林德贝格条件 ,正态性 不再成立。 众所周知 ,如果扰动项不服从正态分布 ,统计量 的分布在渐近意义下仍然是正态的。基于此 ,我们 很自然地要问 ,上面讨论的问题在实际中多大程度 上是重要的。下面我们通过计算机模拟来回答这个 问题。 我们模拟三种测量误差分布对检验结果的影 响 , 这 三 种 分 布 是 贝 努 利 分 布 ( bernoullian distribution) 、均匀分布 ( uniform distribution) 、正态分 布。为了使三种分布对结果的影响具有可比性 ,我 们使计算机上生成的三种误差具有相同的均值 (都 是 0)和方差。引入差比参数ρ=σeΠσ。具体来 说 ,我们设定的贝努利分布是 : P{ ei =ρΠ3} = 019 , P { ei = - 3ρ} = 011 ;均匀分布是 : ei = 2 3ρ(ε- 015) , 这里ε是一个服从[0 ,1 ]均匀分布的随机数 ;正态分 布是 : ei =ρζ,其中ζ是一个标准正态随机数。 在模拟试验中 , 真实的数据生成过程 ( data generating process)是 : yni = 1 + 115 xi + μi 这里μi 是标准正态随机数 ,即μi ~ N (0 ,1) 。回归 元 xi 可能是随机的也可能是非随机的 ,两种情形我 们都予以考察 ,如果 xi 是非随机的 ,我们设定 xi = i ①;如果 xi 是随机的 ,设定 xi = i +η,这里η也是 一个标准正态随机数 ,且与μ和ζ各期都独立。通 过生成 xi 和μi 计算出 yni ,再通过前面的误差 ei 生 成程序 ,计算出 yei ( yei = yni + ei ) 。据此进行 yei 对 1 和 xi 的回归 ,计算出 xi 的 t 统计量。将上述方法重 复 10000 次 ,找出 5 %的双侧分位点。 上述模拟中 ,标准差比ρ和样本数量 n 是允许 变动的两个参数 ,我们让ρ的取值是ρ= 011、ρ= 1、 ρ= 20 ,这样可以考察不同的测量误差大小对正态性 的破坏程度。当然样本的数量大小是一个需要关注 的参数 ,随着样本的增大 ,统计量的质量将会得到改 进 ,因此需要予以控制。 计算机模拟结果如下 :   从上面的模拟中我们发现如下的结果 : 11 就伯努利分布而言 ,如果标准差比值ρ偏低 (ρ= 011) ,即使在小样本下 ( n = 10) ,实际的 t 值分 布与通常的 t 值分布差距也不是很大 (实际的 t 值 分布的 5 %双侧分位点是 21317 ,通常的 t 值分布的 标准差比ρ 样本数 n 回归元是确定的 回归元是随机的 伯努利 均匀 正态 伯努利 均匀 正态 真实 t 值 n = 10 ρ= 011 2. 317 2. 319 2. 301 2. 358 2. 340 2. 347 2. 306 n = 10 ρ= 1 2. 261 2. 301 2. 296 2. 259 2. 343 2. 305 2. 306 n = 10 ρ= 20 2. 048 2. 319 2. 311 2. 186 2. 316 2. 313 2. 306 n = 20 ρ= 011 2. 095 2. 111 2. 102 2. 102 2. 115 2. 088 2. 101 n = 20 ρ= 1 2. 084 2. 128 2. 094 2. 121 2. 124 2. 098 2. 101 n = 20 ρ= 20 1. 956 2. 127 2. 116 1. 944 2. 121 2. 115 2. 101 n = 30 ρ= 011 2. 023 2. 054 2. 050 2. 037 2. 038 2. 037 2. 048 n = 30 ρ= 1 2. 052 2. 105 2. 069 2. 031 2. 024 2. 037 2. 048 n = 30 ρ= 20 1. 943 2. 037 2. 058 1. 975 2. 014 2. 059 2. 048 5 %双侧分位点 21306) ,使用通常的 t 值分布以及 5 %的双侧分位点 ,不会对结果造成严重的影响 ;但 是如果标准差比值ρ较高 (ρ= 20) ,在小样本下 ,实 际的 t 值分布与通常的 t 值分布差距显著 ,使用通 常的 t 值分布以及 5 %的双侧分位点 ,会使检验的 显著性水平产生较大的扭曲 (实际的 t 值分布的 5 %双侧分位点是 21048 ,通常的 t 值分布的 5 %双 侧分位点 21306) 。这一扭曲程度随着样本的增大 得到明显的改善 ,在一个偏小样本下 ( n = 30) ,这一 扭曲程度已经不到 10 %了。 21 就均匀分布而言 ,表现比伯努利分布要好一 些 ,综合各种情形的结果来看 , t 值的偏误都在 115 %以内。 这里有一点需要指明 ,就是误差是均匀分布的 结果与误差是正态分布的结果在我们的报告中优劣 难以分辨。这是因为在计算机上生成的正态随机数 也不是标准的正态随机数 ,而是伪正态随机数 ,导致 了正态情形下模拟的 t 值与正确的 t 值有一定的偏 差而且有时偏差甚至很大的结果。同时这也可以解 释上面的结果 :既然均匀分布不是正态的 ,而伪正态 分布也不是正态的 ,那就很难比较它们之间孰好孰 坏了。 总结上面模拟试验的结果。一般而言 ,如果因 为测量误差的原因导致误差项正态性假设受到了一 定程度的破坏 ,即使在中等偏小的样本情况下 ,假定 正态性仍然是无害的。但是如果测量误差相对于回 归扰动项的标准差特别的大、样本长度又特别的小、 误差的形式相对较为“病态”,这时仍然假定误差项 是正态的假设会导致检验显著性水平产生一定程度 的扭曲。 ① 需要说明 ,在我们设定的回归中 ,x 前系数的收敛速度不再 是 n而是 n n。 第 26 卷第 2 期 李子奈 李鲲鹏 :关于计量经济学模型随机扰动项的讨论 ·65   ·  (二)存在解释变量观测误差的情形 我们将解释变量向量第 i 次抽样分为没有观测 误差 X1 i 和有观测误差 X2 i 两类 ,假定不存在观测误 差的抽样值是 Xni = ( X′1 i , Xn′2 i ) ,由于解释变量 X2 i 存在观测误差 ,于是引入观测误差向量εi ,则实际存 在观测误差的抽样值 Xei = ( X′1 i , Xe′2 i ) ,据此应该有 Xe2 i = X n 2 i +εi ,这里εi ~ i . i . d (0 , ∑ε) 是观测误 差 ,与μ的各期独立。 这里进一步假定回归方程形式 f ( Xni )已知 ,且 f ( Xni )充分光滑 ,性质良好。在没有误差的情况下 , 回归方程是 : yi = f ( Xni ) + μi = f ( X1 i , Xn2 i ) + μi 将 Xe2 i = Xn2 i +εi 代入并将其泰勒展开 : yi = f ( X1 i , Xe2 i - εi ) +μi = μi + f ( X1 i , Xe2 i ) +9f ( X1 i , Xe2 i )9Xe′2 i ( - εi ) + 9 12 ( - εi )′92 f ( X1 i , Xe2 i )9 Xe2 i 9 Xe′2 i ( - εi ) + ⋯ 这样回归方程的误差项是 : μi + 9 f ( X1 i , Xe2 i )9 Xe′2 i ( - εi ) + 12 ( - εi )′92 f ( X1 i , Xe2 i )9 Xe2 i 9 Xe′2 i ( - εi ) + ⋯ 上面误差项的分布形态依赖于 f ( x)和εi ,当εi 是非正态分布的情况下 ,线性的 f ( x) 就足以导致误 差项的非正态分布 ;而即使εi 是正态的情况下 ,一 个二次型的 f ( x) 也会使得误差项是由一个正态分 布和一个类卡方分布所组成 ,正态性的假设同样受 到破坏。正态性的假设要能够成立只有在极其严格 的条件下 ,也就是 f ( x) 是线性的 ,且误差项是正态 分布的情况中才有会出现 ,而这时估计的参数又是 非一致的 ,下面继续说明这一问题。 依上 ,设没有误差项的回归方程是 : yi = X n′ iβ+ μi = X′1 iβ1 + Xn′2 iβ2 + μi μi ~ i . i . d . N (0 ,σ2 ) i = 1 ,2 , ⋯, n 将 Xe2 i = Xn2 i +εi 代入得到 : yi = X e′ iβ+ (μi - ε′iβ2 ) = X′1 iβ1 + Xe′2 iβ2 + (μi - ε′iβ2 ) 据此可以得到回归的参数 : β^ = ∑ n i = 1 X e i X e′ i - 1 ∑ n i = 1 X e i yi = β+ ∑ n i = 1 X e i X e′ i - 1 ∑ n i = 1 X e i (μi - ε′iβ2 ) 进一步将 Xei = ( X′1 i , Xe′2 i )′代入得到 : β^ = β+ ∑ n i = 1 X e i X e′ i - 1 ∑ n i = 1 X1 i Xe2 i (μi - ε′iβ2 ) 则 : β^1 - β1 β^2 - β2 = 1 n ∑ n i = 1 X e i X e′ i - 1 1 n ∑ n i = 1 X1 i Xe2 i (μi - ε′iβ2 ) 依据大数定理①: 1 n ∑ n i = 1 X1 i (μi - ε′iβ2 ) P 0 1 n ∑ n i = 1 X e 2 i (μi - ε′iβ2 ) P - ∑β2 由此我们可知β^1 是有偏估计 ,β^2 是一个有偏估计 量。 综上 ,当解释变量存在观测误差时 ,正态性的假 设依赖于回归函数的形式和误差的分布形态。一般 情况下 ,正态性的假设都是不能成立的 ,只有在回归 函数是线性的 ,且误差分布是正态的特殊情形下 ,正 态性才成立 ,而在此情况下 ,参数的估计是非一致的。   五、结论与启示 在计量经济学模型中 ,用“衍生”的随机误差代 替“源生”的随机扰动 ,特别是将模型的设定误差和 变量的观测误差对被解释变量的影响引入随机误差 项 ,在很多情况下将导致随误差动项对 Gauss 假设 以及正态性假设的违背 ,随之进行的模型估计及统 计推断的基础将受到损害。这个问题应该引起计量 经济学理论研究的关注 ,也应该引起应用研究的高 度重视。 就十分重要的随机误差项正态性假设而言 ,具 体结论如下 :当存在模型关系误差时 ,如果解释变量 是随机的 ,随机误差项的正态性将得不到保证。当 模型遗漏了显著的变量 ,如果遗漏的变量是非正态 的随机变量 ,随机误差项将不具有正态性。如果待 ① 说明 ,导出下面的条件是需要额外条件的。例如在( x i ,μi , εi)是独立同分布的条件下 ,需要 x i ,μi ,εi 的一阶绝对矩存在 ,这是 kolmogorov大数定理的条件 ;如果去掉同分布的条件 ,则一般需要一 阶更高绝对矩存在的条件 ,这是 markov 大数定理的条件 ,当然还可 以继续放宽独立不同分布的条件 ,代之于更高的矩条件。关于这点 White (1984)对此有详细的论述 ,这里不多赘言 ,而默认这些条件是满 足的。  ·66   · 统计研究 2009 年 2 月  估计的模型是原模型经过函数变换得到的 ,随机误 差项将不再服从正态分布。当模型存在被解释变量 的观测误差 ,如果观测误差相对于随机误差项的标 准差特别大、样本长度又特别小 ,随机误差项的正态 性假设会导致显著性水平产生一定程度的扭曲。当 模型存在解释变量观测误差时 ,一般情况下 ,随机误 差项的正态性假设都是不能成立的 ;只有在回归函 数是线性的 ,且观测误差分布是正态的特殊情形下 , 随机误差项的正态性才成立。 克服这个问题的根本途径是设定正确的总体模 型 ,取得准确的变量观测值。计量经济学应用模型 的总体设定 ,即经济系统的主体动力学关系分析 ,不 是理论经济学的任务 ,而是计量经济学的任务。变 量观测值的获取 ,不是统计学的任务 ,也是计量经济 学的任务。一项计量经济学应用研究课题 ,或者一 篇计量经济学应用研究论文 ,必须将大部分工作或 者大部分篇幅放在模型的总体设定方面 ,放在数据 的采集和处理方面。否则研究课题是不可能成功 的 ,研究论文也是没有人愿意阅读的。另外 ,对模型 的随机误差项进行正态性检验 ,应该成为应用模型 研究的一个不可忽略的步骤。 参考文献 [ 1 ]李子奈. 计量经济学模型方法论的若干问题 [J ] . 经济学动态 , 2007 (10) :22 - 30. [ 2 ]李子奈. 计量经济学应用研究的总体回归模型设定 [J ] . 经济研 究 ,2008 (8) :136 - 143. [ 3 ]Milliam H. Greene , Econometric Analysis (4th edition) [ M] . Prentice Hall Inc. . 2000. [ 4 ]Damodar N. Gujarati , Basic Econometrics (4th edition) [M] , McGraw2 Hill Companies. 2003. [ 5 ]H. White , Asymptotic Theory for Econometricians [ M ] . Academic Press. 1984. 作者简介 李子奈 ,男 ,1946 年生 ,江苏阜宁县人。1970 年毕业于清 华大学工程物理系 ,1971 年获清华大学工学硕士学位。现为 清华大学经济管理学院教授 ,博士生导师。研究方向为计量 经济学理论、方法与应用。 李鲲鹏 ,男 ,1980 年生 ,湖北荆州市人。2007 年毕业于华 中师范大学经济学院 ,获经济学硕士学位。现为清华大学经 济管理学院数量经济学专业博士研究生 ,研究方向为计量经 济学理论、方法与应用。 (责任编辑 :李峻浩) 《统计研究》主要栏目中图分类号简明对照表 主栏目 分栏目 分类号 统计工作的改革与发展 C82912 法律法规 C829121 统计方法 C829122 统计管理体制 C829123 统计管理 ,统计信息化建设 ,统计数据库 C816 国外统计工作 C82911 经济统计学 F222 国民经济核算 F222133 统计方法的应用与创新 C81 统计调查、抽样与抽样分布 : C811 概率论 0211 数理统计方法 (如非参数统计、参数估计、假设检验、时间数 列、贝叶斯统计、相关分析与回归分析) 0212 统计指数 C813 统计灾证分析 C812 统计模型的应用 F22213 统计史 C829129 统计教育 C829129 第 26 卷第 2 期 李子奈 李鲲鹏 :关于计量经济学模型随机扰动项的讨论 ·67   · 
/
本文档为【关于计量经济学模型随机扰动项的讨论】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索