为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

第六章 自相关

2013-11-30 30页 doc 773KB 300阅读

用户头像

is_024762

暂无简介

举报
第六章 自相关第六章 自相关 引子: T检验和F检验一定就可靠吗? 为了研究居民储蓄存款Y与居民收入X的关系,设定模型为: 取某地区1985年—2000年居民储蓄存款Y和居民收入X的数据为样本数据,用普通最小二乘法估计其参数,结果为 (1.8690) (0.0055) t= (14.9343) (64.2069) F=...
第六章   自相关
第六章 自相关 引子: T检验和F检验一定就可靠吗? 为了研究居民储蓄存款Y与居民收入X的关系,设定模型为: 取某地区1985年—2000年居民储蓄存款Y和居民收入X的数据为样本数据,用普通最小二乘法估计其参数,结果为 (1.8690) (0.0055) t= (14.9343) (64.2069) F=4122.531 由估计检验结果可以看出,回归系数的误差非常小,t统计量较大,说明居民收入X对居民储蓄存款Y的影响非常显著。同时可决系数也非常高,F统计量=4122.531,也明模型异常的显著。 可是某些信息提示:以上结论是不可靠的!尽管所用样本数据都是真实的,但这样的估计结果却可能是虚假的,所计算的 和 的方差及标准误差都严重地被低估了,t统计量和F统计量都远远被虚假地夸大了,因此所得结果是不可信的。 有什么充分的理由提出这样的质疑呢? 前面几章的讨论中,我们假定随机误差项前后期之间是不相关的。但在经济系统中,经济变量前后期之间很可能有关联,使得随机误差项不能满足无自相关的假定。本章将探讨随机误差项不满足无自相关的古典假定时的参数估计问。 第一节 什么是自相关 一、自相关的概念 自相关(auto correlation)又称序列相关(serial correlation),是指总体回归模型的随机误差项 之间存在相关关系。前面几章中强调,在回归模型的古典假定中是假设随机误差项是无自相关的,即 在不同观测点之间是不相关的,即 ( ) (见2.15) 如果该假定不能满足,就称 与 存在自相关,即不同观测点上的误差项彼此相关。 自相关的程度可用自相关系数去表示,随机误差项 与滞后一期的 的自相关系数为 (6.1) (6.1)式定义的自相关系数 与普通相关系数的公式形式相同, 的取值范围为 。(6.1)式中ut-1是ut滞后一期的随机误差项,因此,将(6.1)式计算的自相关系数 称为一阶自相关系数。 根据自相关系数 的符号可以判断自相关的状态,如果 <0,则ut与ut-1为负相关;如果 >0,则ut与ut-1为正关;如果 = 0,则ut与ut-1不相关。 二、自相关产生的原因 1、经济系统的惯性 自相关现象大多出现在时间序列数据中,而经济系统的经济行为都具有时间上的惯性。例如GDP、价格、就业等经济数据,都会随经济系统的周期而波动。又如,在经济高涨时期,较高的经济增长率会持续一段时间,而在经济衰退期,较高的失业率也会持续一段时间,这种情况下经济数据很可能表现为自相关。 2、经济活动的滞后效应。 滞后效应是指某一变量对另一变量的影响不仅限于当期,而是延续若干期。由此带来变量的自相关。例如,居民当期可支配收入的增加,不会使居民的消费水平在当期就达到应有水平,而是要经过若干期才能达到。因为人的消费观念的改变存在一定的适应期。 3、数据处理造成的相关。 因为某些原因对数据进行了修正和内插处理,在这样的数据序列中可能产生自相关。例如,将月度数据调整为季度数据,由于采用了加合处理,修匀了月度数据的波动,使季度数据具有平滑性,这种平滑性可能产生自相关。对缺失的历史资料,采用特定统计方法进行内插处理,也可能使得数据前后期相关,而产生自相关。 4、蛛网现象。 蛛网现象是微观经济学中的一个概念。它表示某种商品的供给量 受前一期价格 影响而表现出来的某种规律性,即呈蛛网状收敛或发散于供需的均衡点。许多农产品的供给呈现为蛛网现象,供给对价格的反应要滞后一段时间,因为供给的调整需要经过一定的时间才能实现。如果时期t的价格Pt低于上一期的价格Pt-1,农民就会减少时期t+1的生产量。如此则形成蛛网现象,此时的供给模型为 (6.2) 这时式中的随机误差项u t可能产生自相关。 5、模型设定偏误。 如果模型中省略了某些重要的解释变量或者模型函数形式不正确,都会产生系统误差,这种误差存在于随机误差项中,从而带来了自相关。由于设定误差造成的自相关,在经济计量分析中经常可能发生。例如,本来应该用两个解释变量去解释Y,即   (6.3) 而建立模型时,模型设定为 (6.4) 这样,X3t对Yt的影响在(6.4)式中便归入到随机误差项ut中,由于X3t在不同观测点上是相关的,就造成了ut是自相关的。 模型函数形式的设定误差也会导致自相关现象。如将本来应是U形成本曲线的模型设定为线性成本曲线的模型,则会导致自相关。由设定误差产生的自相关,可通过改变模型设定予以消除。 自相关关系主要存在于时间序列数据中,但是在横截面数据中也可能会出现自相关,通常称其为空间自相关(Spatial auto correlation)。例如,一个家庭或一个地区的消费行为可能会影响另外一些家庭或另外一些地区,就是说不同观测点的随机误差项可能是相关的。多数经济时间序列在较长时间内都表现为上升或下降的超势,因此大多表现为正自相关。但就自相关本身而言,可以为正相关也可以为负相关。 三、自相关的表现形式 自相关的性质可以用自相关系数 的符号判断,即 <0为负相关, >0为正相关。当| |接近1时,表示相关的程度很高。自相关是u1,u2,…,u n序列自身的相关,因n个随机误差项的关联形式不同而可能具有不同的自相关形式。自相关大多出现在时间序列数据中,下面以时间序列为例说明自相关的不同表现形式。 对于样本观测期为n的时间序列数据,可得到总体回归模型(PRF)的随机误差项为u1,u2,…,u n,如果自相关形式为 u t = ut-1 + vt (-1< <1) (6.5) 其中, 为自相关系数,vt为满足古典假定的误差项,即E(vt) = 0,Var (vt) =σ2,Cov (vt,vt+s) = 0,s≠0。因为模型(6.5)中ut-1是ut滞后一期的值,则(6.5)式称为一阶自回归形式,记为AR(1)。(6.5)式中的 也称为一阶自相关系数。 如果(6.5)式中的随机误差项vt是不满足古典假定的误差项,即vt中包含有ut的成份,例如包含有ut-2的影响,则需将ut-2包含在回归模型中,即 ut = ut-1+ u t-2 (6.6) 其中, 为一阶自相关系数, 为二阶自相关系数, 是满足古典假定的误差项。(6.6)式称为二阶自回归形式,记为AR(2)。一般地,如果u1,u2,…,u t之间的关系为 (6.7) 其中,vt为满足古典假定的误差项。则称(6.7)式为m阶自回归形式,记为AR(m)。 此外,自相关的形式可能为移动平均形式,记为MA(n),还可能为更复杂的移动平均自回归形式,记为ARMA (m, n),这些是时间序列分析的专题内容,本书不作讨论。 在经济计量分析中,通常采用(6.5)式的一阶自回归形式,即假定自回归形式为一阶自回归AR(1)。这种假定简化了自回归形式,在实际分析中常能取得较好的效果,在本章中只讨论假定自相关为AR(1)的形式。 第二节 自相关的后果 当一个线性回归模型的随机误差项存在自相关时,就违背了线性回归方程的古典假定,如果仍然用普通最小二乘法(OLS)估计参数,将会产生严重后果。自相关产生的后果与异方差情形类似。 一、一阶自回归形式的性质 以一元线性回归模型为例,对于 (6.8) 假定随机误差项u存在一阶自相关 ut = u t-1+vt ​(6.9) 其中,ut为现期随机误差,ut-1为前期随机误差。vt是满足古典假定的误差项,即vt满足零均值E (vt) =0,同方差Var(vt) = ,无自相关E(vt vs) = 0(t≠s)的假定。 在大样本情况下, 的OLS估计式为 (6.10) 与 的相关系数为(当样本较大时, ) (6.11) 如果将随机误差项ut的各期滞后值 逐次代入 (6.9)式可得 (6.12) (6.12)式表明随机误差项ut可表示为独立同分布的随机误差序列vt,vt-1,vt-2,…的加权和,权数分别为1, , 2,…,当0< <1时,这些权数随时间推移而呈几何衰减;而当-1< <0时,这些权数是随时间推移而交错振荡衰减的。 在随机误差项 存在一阶自回归形式的自相关时,由(6.12)式可推得 (6.13) (6.14) (6.13)和(6.14)式表明,在ut为一阶自回归形式的自相关时,随机误差项ut依然满足零均值、同方差的假定。 由于现期的随机误差项vt并不影响回归模型中随机误差项ut的以前各期值ut-k(k>0),所以 与ut-k不相关,即有E(v t ut-k) = 0。因此,由(6.9)式可得随机误差项ut与其以前各期ut-k的协方差分别为 Cov (ut,ut-1) = E(u t ut-1) = E[( u t-1+vt)u t-1] = =   (6.15) Cov(ut,u t-2) = E(ut ut-2) = E[( u t-1+vt)ut-2] = E[( ut-2+ vt-1+ vt)ut-2] = 2E( ) =  (6.16) 以此类推,可得  (6.17) 这些协方差分别称为随机误差项ut的一阶自协方差、二阶自协方差和k阶自协方差,这些自协方差均不为零,这正是存在自相关的含义。 二、自相关对参数估计的影响 以一元线性回归模型(6.8)为例,当ut满足各项古典假定时,普通最小二乘估计 的方差为 (见2.40) 首先,当随机误差项ut存在自相关时, 依然是无偏的,即 ,因为在普通最小二乘法无偏性的证明中并不需要ut满足无自相关的假定。 再看OLS估计式的方差,(6.8)式中 的最小二乘估计式为 (6.18) 可以证明(见本章附录6.1) (6.19) 当随机误差项无自相关时, = 0,此时(6.19)式等价于(2.40)式。当存在正的自相关时,(6.19)式的方差将大于(2.40)式的方差。可以证明,当存在自相关时,普通最小二乘估计量不再是最佳线性无偏估计量,即它在线性无偏估计量中不是方差最小的。 由式(6.19)可以看出,当 >0,即有正相关时,对所有的j都有 >0。另外回归模型中的解释变量在不同时期通常也呈正相关,即对于xt和xt+j来说∑xt xt+j是大于0的。因此(6.19)式右边括号内的值通常大于0,如果仍用OLS法 去计算 的方差,将会低估存在自相关时参数估计值的真实方差。 此外,当随机误差项 不存在自相关时,已知 是 的方差 的无偏估计,即 。但是,如果随机误差项 存在一阶自相关,可以证明 (6.20) 当 及 都是正自相关时,(6.20)式中园括号内的值为正值,将使 的值降低。这说明如果仍用 去估计 的方差 ,则会导致低估真实的 。显然,这将使得参数估计值的方差被进一步低估。 三、自相关对模型检验的影响 通过前面的讨论已知,当存在自相关时,如果忽视自相关问题,依然用满足古典假定的OLS法去估计参数及其方差,会低估真实的 ,更会低估参数估计值的方差。由于对参数显著性检验的t统计量为 ~ ,当参数估计值的方差被低估时,其标准误差 也将被低估,从而过高估计t统计量的值,会夸大所估计参数的显著性,对本来不重要的解释变量可能误认为重要而被保留。这时通常的回归系统显著性的t检验将失去意义。 类似地,由于自相关的存在,参数的最小二乘估计量是无效的,使得F检验和R 2检验也是不可靠的。 四、自相关对模型预测的影响 模型预测的精度决定于抽样误差和总体误差项的方差 。抽样误差来自于对 j的估计,在自相关情形下, j的方差的最小二乘估计变得不可靠,由此必定加大抽样误差。同时,在自相关情形下,对 的估计 也会不可靠。由此可看出,影响预测精度的两大因素都因自相关的存在而加大不确定性,使预测的置信区间不可靠,从而降低了预测的精度。 第三节 自相关的检验 随机误差项存在自相关给普通最小二乘法的应用带来的后果是严重的。因此,必须设法诊断是否存在自相关。检测回归模型是否存在自相关的常用方法有以下几种。 一、图示检验法 图示法是一种直观的诊断方法,它是对给定的回归模型直接用普通最小二乘法估计其参数,求出残差项 ,以 作为随机项 的估计值,再描绘 的散点图,根据散点图来判断 的相关性。残差 的散点图通常有两种绘制方式。 1.绘制 和 的散点图。用( , )( )作为散布点绘图,如果大部分点落在第Ⅰ、Ⅲ象限,表明随机误差项 存在着正自相关,如图6.1所示。如果大部分点落在第Ⅱ、Ⅳ象限,那么随机误差项 存在着负自相关,如图6.2所示。 图 6.1 的关系 图6.2 的关系 2.按照时间顺序绘制回归残差项 的图形。如果 ( )随着 的变化逐次有规律地变化,呈现锯齿形或循环形状的变化,就可判断 存在相关,表明 存在着自相关;如果 随着 的变化逐次变化并不断地改变符号,那么随机误差项 存在负自相关;如图6.3所示。如果 随着 的变化逐次变化并不频繁地改变符号,而是几个正的 后面跟着几个负的,则表明随机误差项 存在正自相关,如图6.4所示。 图6.3 的分布 图6.4 的分布 二、DW检验法 DW检验是J.Durbin(杜宾)和G.S.Watson(沃特森)于1951年提出的一种适用于小样本的检验方法。DW检验方法是检验自相关的常用方法,许多计量经济学和统计软件都提供DW值。 DW检验法的前提条件是: (1)解释变量X为非随机的; (2)随机误差项为一阶自回归形式,即 ( 满足古典假定) (6.21) (3)线性模型的解释变量中不包含滞后的被解释变量,例如不应出现下列形式: (4)截距项不为零,即只适用于有常数项的回归模型; (5)数据序列无缺失项。 为了检验序列的相关性,构造的原假设是 。为了检验这一假设,构造DW统计量,首先要计算回归估计式的残差 ,定义DW统计量为 (6.22) 其中, 。 由 (6.22) 式可得 (6.23) 如果认为 ≈ ≈ ,则由 (6.23) 式得 (6.24) 同理,在认为 ≈ ≈ 时 (6.25) 因此, (6.26) 所以,DW值与 的对应关系如表6.1所示。 表6.1 DW值与 的值的对应关系 DW -1 (-1,0) 0 (0,1) 1 4 (2,4) 2 (0,2) 0 由上述讨论可知DW的取值范围为0≤DW≤4。 根据样本容量 和解释变量的数目 (不包括常数项),查DW分布表,可得临界值 和 ,然后依下列准则考察计算的DW值,以决定模型的自相关状态(见表6.2)。 表6.2 DW检验决策规则 0≤DW≤ 误差项 间存在正相关 <DW≤ 不能判定是否有自相关 <DW<4- 误差项 间无自相关 4- ≤DW<4- 不能判定是否有自相关 4- ≤DW≤4 误差项 间存在负相关   表6.2可以用坐标图更加直观地表示出来,如图6.5所示。 图6.5 DW检验示意图 需要注意的是,DW检验尽管有着广泛的应用,但也有明显的缺点和局限性。 (1)DW检验有运用的前提条件,只有符合这些条件DW检验才是有效的。 (2)DW统计量的上、下界表一般n≥15,这是因为样本如果再小,当n<15时,DW检验上下界表的数据不完整,利用残差很难对自相关的存在性做出比较正确的诊断; (3)DW检验不适应随机误差项具有高阶序列相关的检验; (4)DW检验有两个不能确定的区域,一旦DW值落在这两个区域,就无法判断。这时,只有增大样本容量或选取其他方法。或者采用修正的DW检验法进行检验,即扩大拒绝区域,当 时,不拒绝 ,认为不存在自相关;而当 或 时,就拒绝 ,认为存在自相关。这种修正实际是将拒绝区域扩大到不确定区域,由于自相关后果严重,在自相关不确定时,宁可拒绝 ,而不宜轻易接受无自相关。 第四节 自相关的补救 如果自相关是由于模型设定误差造成的,可以通过改变模型的设定去消除。对于设定正确的模型,如果随机误差项有自相关,则可采用如下方法予以消除。 一、广义差分法 由于随机误差项ut是不可观测的,通常我们假定ut为一阶自回归形式,即 ut = ut-1 + vt (见6.21) 其中,| |<1,vt为满足古典假定的误差项。 当自相关系数 为已知时,可使用广义差分法解决自相关问题。以一元线性回归模型为例 (6.27) 将模型(6.27)滞后一期可得 (6.28) 用 乘(6.28)式两边,得 (6.29) 用(6.27)式减去(6.29)式得 (6.30) 由(6.21)式,(6.30)式中的ut- ut-1 = vt是满足古典假定的误差项。因此,模型(6.30)满足古典假定,随机误差项ut- ut-1 = vt无自相关。 令 , , ,则式(6.30) 可表示为 (6.31) 对模型(6.31)使用普通最小二乘估计,可得到参数的最佳线性无偏估计量。因为(6.30)式中被解释变量与解释变量均为现期值减去前期值的一部分,所以称为广义差分方程。在进行广义差分时,解释变量X与被解释变量Y均以差分形式出现,因而样本容量由n减少为 ,即丢失了第一个观测值。如果样本容量较大,减少一个观测值对估计结果影响不大。但是,如果样本容量较小,则会对估计精度产生较大影响。此时,可采用普莱斯—温斯滕(Prais-Winsten)变换,将第一个观测值分别变换为 ,补充到差分序列 中,再使用普通最小二乘法估计参数。 二、科克伦—奥克特(Cochrane—Orcutt)迭代法 在实际应用中,自相关系数 往往是未知的,必须通过一定的方法去估计 。最简单的方法是依据DW统计量去估计 。由(6.26)式DW与 的关系可知 (6.32) 但是,(6.31)式得到的只是一个粗略的结果,这样得到的 只是对 精度不高的估计,根本原因在于对有自相关的回归模型使用了普通最小二乘法。为了得到 的更精确的估计值,可采用科克伦—奥克特(Cochrane—Orcutt)迭代法。 科克伦—奥克特(Cochrane—Orcutt)迭代法的基本思想,是通过逐次迭代去寻求更为满意的 的估计值,然后再采用广义差分法。具体来说,该方法是利用残差 去估计未知的 。 对于一元线性回归模型 , 假定ut为一阶自回归形式,即 ut = u t-1+vt (6.33) 科克伦—奥克特迭代法估计 的步骤如下: 第一步,使用OLS法估计模型 ,并计算残差 第二步,利用残差 作如下的回归 (6.34) 第三步,用OLS法估计(6.34)式中的 ,对模型(6.32)进行广义差分,即 (6.35) 令 , , ,对式(6.35)使用OLS法,可得样本回归函数为 (6.36) 第四步,由前一步估计的结果有 和 ,将 代入原回归方程(6.32),求得新的残差 (6.37) 第五步,利用残差 作回归                         (6.38) 用OLS法估计的 是对 的第二轮估计值。 当不能确认 是否是 的最佳估计值时,继续迭代估计 的第三轮估计值 。直到估计的 与 相差很小时,收敛并满足精度要求,或回归所得DW统计量说明已不存在自相关时为止。通常,经过迭代很快就能得到有较高精度的 ,用作广义差分对自相关的修正效果也较好。 三、其它方法简介 (一)一阶差分法 一阶差分法是模型存在完全一阶正自相关时消除自相关的一种简单有效方法。仍以一元线性回归模型为例 (6.39) 其中ut为一阶自回归AR(1) u t = ut-1 + vt。如果原模型存在完全一阶正自相关,即 =1,由(6.30)式,可将模型(6.39)变换为 (6.40) 其中, 。这时的随机误差为 (6.41) 其中,v t为满足古典假定的误差项,则(6.40)式的随机误差项 为满足古典假定的误差项,无自相关问题。对(6.40)式使用普通最小二乘法估计参数,可得到最佳线性无偏估计量。虽然实际经济问题中完全一阶正自相关并不多见。但是只要 是正的且比较大,一阶差分法往往是有效的。但应注意,一阶差分法得到的回归方程(6.40)中没有常数项,如回归分析要求有常数项,该方法就不一定适用。 (二)德宾两步法 当自相关系数 未知时,也可采用德宾提出的两步法去消除自相关。 将广义差分方程(6.30)表示为 (6.42) 采用如下的两个步骤消除自相关。 第一步,将(6.42)式作为一个多元回归模型,使用普通最小二乘法估计其参数。把Yt-1的回归系数 看作 的一个估计值,它是 的一个有偏、一致估计。 第二步,利用估计的 进行广义差分。求得序列 和 ,然后使用OLS法对广义差分方程估计参数,求得最佳线性无偏估计量。 第五节 案例分析 一、研究目的 2003年中国农村人口占59.47%,而消费总量却只占41.4%,农村居民的收入和消费是一个值得研究的问题。消费模型是研究居民消费行为的常用工具。通过中国农村居民消费模型的分析可判断农村居民的边际消费倾向,这是宏观经济分析的重要参数。同时,农村居民消费模型也能用于农村居民消费水平的预测。 二、模型设定 正如第二章所讲述的,影响居民消费的因素很多,但由于受各种条件的限制,通常只引入居民收入一个变量做解释变量,即消费模型设定为 (6.43) 式中,Yt为农村居民人均消费支出,X t为农村人均居民纯收入,ut为随机误差项。表6.3是从《中国统计年鉴》收集的中国农村居民1985-2003年的收入与消费数据。 表6.3 1985-2003年农村居民人均收入和消费 单位: 元 年份 全年人均纯收入 (现价) 全年人均消费性支出 (现价) 消费价格指数 (1985=100) 人均实际纯收入 (1985可比价) 人均实际消费性支出 (1985可比价) 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 397.60 423.80 462.60 544.90 601.50 686.30 708.60 784.00 921.60 1221.00 1577.70 1923.10 2090.10 2162.00 2214.30 2253.40 2366.40 2475.60 2622.24 317.42 357.00 398.30 476.70 535.40 584.63 619.80 659.80 769.70 1016.81 1310.36 1572.10 1617.15 1590.33 1577.42 1670.00 1741.00 1834.00 1943.30 100.0 106.1 112.7 132.4 157.9 165.1 168.9 176.8 201.0 248.0 291.4 314.4 322.3 319.1 314.3 314.0 316.5 315.2 320.2 397.60 399.43 410.47 411.56 380.94 415.69 419.54 443.44 458.51 492.34 541.42 611.67 648.50 677.53 704.52 717.64 747.68 785.41 818.86 317.40 336.48 353.42 360.05 339.08 354.11 366.96 373.19 382.94 410.00 449.69 500.03 501.77 498.28 501.75 531.85 550.08 581.85 606.81 注:资料来源于《中国统计年鉴》1986-2004。 为了消除价格变动因素对农村居民收入和消费支出的影响,不宜直接采用现价人均纯收入和现价人均消费支出的数据,而需要用经消费价格指数进行调整后的1985年可比价格计的人均纯收入和人均消费支出的数据作回归分析。 根据表6.3中调整后的1985年可比价格计的人均纯收入和人均消费支出的数据,使用普通最小二乘法估计消费模型得 (6.44) Se = (12.2238) (0.0214) t = (8.7332) (28.3067) R2 = 0.9788,F = 786.0548,d f = 17,DW = 0.7706 该回归方程可决系数较高,回归系数均显著。对样本量为19、一个解释变量的模型、5%显著水平,查DW统计表可知,dL=1.18,dU= 1.40,模型中DW措施
。 三、自相关问题的处理 为解决自相关问题,选用科克伦—奥克特迭代法。由模型(6.44)可得残差序列et,在EViews中,每次回归的残差存放在resid序列中,为了对残差进行回归分析,需生成命名为e的残差序列。在主菜单选择Quick/Generate Series或点击工作文件窗口工具栏中的Procs/ Generate Series,在弹出的对话框中输入e = resid,点击OK得到残差序列et。使用et进行滞后一期的自回归,在EViews命今栏中输入ls e e (-1)可得回归方程 et= 0.4960 et-1 (6.45) 由式(6.45)可知 =0.4960,对原模型进行广义差分,得到广义差分方程 (6.46) 对式(6.46)的广义差分方程进行回归,在EViews命令栏中输入ls Y-0.4960*Y (-1) c X-0.4960*X (-1),回车后可得方程输出结果如表6.4。 表6.4 广义差分方程输出结果 Dependent Variable: Y-0.496014*Y(-1) Method: Least Squares Date: 03/26/05 Time: 12:32 Sample(adjusted): 1986 2003 Included observations: 18 after adjusting endpoints Variable Coefficient Std. Error t-Statistic Prob. C 60.44431 8.964957 6.742287 0.0000 X-0.496014*X(-1) 0.583287 0.029410 19.83325 0.0000 R-squared 0.960914 Mean dependent var 231.9218 Adjusted R-squared 0.958472 S.D. dependent var 49.34525 S.E. of regression 10.05584 Akaike info criterion 7.558623 Sum squared resid 1617.919 Schwarz criterion 7.657554 Log likelihood -66.02761 F-statistic 393.3577 Durbin-Watson stat 1.397928 Prob(F-statistic) 0.000000 由表6.4可得回归方程为 (6.47) (0.0294) t = (6.7423) (19.8333) R2 = 0.9609 F = 393.3577 d f = 16 DW = 1.3979 式中, , 。 由于使用了广义差分数据,样本容量减少了1个,为18个。查5%显著水平的DW统计表可知dL = 1.16,dU = 1.39,模型中DW = 1.3979> dU,说明广义差分模型中已无自相关,不必再进行迭代。同时可见,可决系数R2、t、F统计量也均达到理想水平。 对比模型(6.44)和(6.47),很明显普通最小二乘法低估了回归系数 的标准误差。[原模型中Se( )= 0.0214,广义差分模型中为Se( )= 0.0294。 经广义差分后样本容量会减少1个,为了保证样本数不减少,可以使用普莱斯—温斯腾变换补充第一个观测值,方法是 和 。在本例中即为 和 。由于要补充因差分而损失的第一个观测值,所以在EViews中就不能采用前述方法直接在命令栏输入Y和X的广义差分函数表达式,而是要生成X和Y的差分序列X*和Y*。在主菜单选择Quick/Generate Series或点击工作文件窗口工具栏中的Procs/Generate Series,在弹出的对话框中输入Y*= Y-0.4960*Y (-1),点击OK得到广义差分序列Y*,同样的方法得到广义差分序列X*。此时的X*和Y*都缺少第一个观测值,需计算后补充进去,计算得 =345.236, =275.598,双击工作文件窗口的X* 打开序列显示窗口,点击Edit+/-按钮,将 =345.236补充到1985年对应的栏目中,得到X*的19个观测值的序列。同样的方法可得到Y*的19个观测值序列。在命令栏中输入Ls Y* c X*得到普莱斯—温斯腾变换的广义差分模型为 (6.48) (0.0297) t = (6.5178) (19.8079) R2 = 0.9585 F = 392.3519 d f = 19 DW = 1.3459 对比模型(6.47)和(6.48)可发现,两者的参数估计值和各检验统计量的差别很微小,说明在本例中使用普莱斯—温斯腾变换与直接使用科克伦—奥克特两步法的估计结果无显著差异,这是因为本例中的样本还不算太小。如果实际应用中样本较小,则两者的差异会较大。通常对于小样本,应采用普莱斯—温斯腾变换补充第一个观测值。 由差分方程(6.46)有 (6.49) 由此,我们得到最终的中国农村居民消费模型为 Y t = 119.9292+0.5833 X t (6.50) 由(6.50)的中国农村居民消费模型可知,中国农村居民的边际消费倾向为0.5833,即中国农民每增加收入1元,将增加消费支出0.5833元。 第六章小结 1、 当总体回归模型的随机误差项在不同观测点上彼此相关时就产生了自相关问题。 2、 时间序列的惯性、经济活动的滞后效应、模型设定错误、数据的处理等多种原因都可能导致出现自相关。 3、 在出现自相关时,普通最小二乘估计量依然是无偏、一致的,但不再是有效的。如 果仍用OLS法计算参数估计值的方差,将会低估存在自相关时参数估计值的真实方差。而且会因低估真实的 ,导致参数估计值的方差被进一步低估。由于真实 的低估和参数估计值方差的低估,通常的t检验和F检验都不能有效地使用,也使预测的置信区间不可靠,降低了预测的精度。 4、 随机误差项的自相关形式决定于其关联形式,可以为m阶自回归形式 ,即 。为了研究问题的方便和考虑实际问题的代表意义,通常将自相关设定为一阶自相关即AR(1)模式。用一阶自相关系数 表示自相关的程度与方向。 5、 由于ut不可观测,通常使用ut的估计量et判断ut的特性。绘制 , 的散点图或按照时间顺序绘制回归残差项 的图形,可以判断自相关的存在。判断自相关的存在最常用的方法是依据et计算的DW统计量,但要注意DW检验法的前提条件和局限性。 6、 如果自相关系数 是已知的,我们可以使用广义差分法消除序列相关。 7、 如果自相关系数 是未知的,我们可采用科克伦—奥克特迭代法或德宾两步法求得 的估计值,然后用广义差分法消除序列相关。 主要公式表 1、自相关系数 2、一阶自回归形式AR(1) u t = ut-1 + vt 3、m阶自回归形式AR(m) 4、自相关时参数估计式的方差 EMBED Equation.3 EMBED Equation.3 5、DW统计量 6、DW值与 的关系 7、广义差分 思考题与练习题 思考题 6.1 如何使用DW统计量来进行自相关检验?该检验方法的前提条件和局限性有哪些? 6.2 当回归模型中的随机误差项为AR(1)自相关时,为什么仍用OLS法会低估 的标准误差? 6.3 判断以下陈述的真伪,并给出合理的解释。 (1)当回归模型随机误差项有自相关时,普通最小二乘估计量是有偏误的和非有效的。 (2)DW检验假定随机误差项ui的方差是同方差。 (3)用一阶差分法消除自相关是假定自相关系数 为-1。 (4)当回归模型随机误差项有自相关时,普通最小二乘估计的预测值的方差和标准误差不再是有效的。 6.4 对于四个解释变量的回归模型    如果样本量n=50, 当DW统计量为如下数值时,请判断模型中的自相关状况。 (1)DW=1.05 (2) DW=1.40 (3)DW=2.50 (4) DW=3.97 6.5 如何判别回归模型中的虚假自相关? 6.6 在回归模型     中, 无自相关。如果我们错误地判定模型中有一阶自相关,即 ,并使用了广义差分模型   将会产生什么问题? 练习题 6.1 下表给出了美国1960-1995年36年间个人实际可支配收入X和个人实际消费支出Y的数据。 美国个人实际可支配收入和个人实际消费支出 单位:100亿美元 年份 个人实际可支配收入 X 个人实际 消费支出 Y 年份 个人实际可支配收入 X 个人实际 消费支出 Y 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 157 162 169 176 188 200 211 220 230 237 247 256 268 287 285 290 301 311 143 146 153 160 169 180 190 196 207 215 220 228 242 253 251 257 271 283 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 326 335 337 345 348 358 384 396 409 415 432 440 448 449 461 467 478 493 295 302 301 305 308 324 341 357 371 382 397 406 413 411 422 434 447 458 注:资料来源于Economic Report of the President,数据为1992年价格。 要求:(1)用普通最小二乘法估计收入—消费模型; (2)检验收入—消费模型的自相关状况(5%显著水平); (3)用适当的方法消除模型中存在的问题。 6.2 在研究生产中劳动所占份额的问题时,古扎拉蒂采用如下模型 模型1 模型2 其中,Y为劳动投入,t为时间。据1949-1964年数据,对初级金属工业得到如下结果: 模型1 t =    (-3.9608)   R2 = 0.5284 DW = 0.8252 模型2 t = (-3.2724)(2.7777) R2 = 0.6629 DW = 1.82 其中,括号内的数字为t统计量。 问:(1)模型1和模型2中是否有自相关; (2)如何判定自相关的存在? (3)怎样区分虚假自相关和真正的自相关。 6.3下表是北京市连续19年城镇居民家庭人均收入与人均支出的数据。 北京市19年来城镇居民家庭收入与支出数据表(单位:元) 年份 顺序 人均收入 (元) 人均生活消 费支出(元) 商品零售 物价指数(%) 人均实 际收入(元) 人均实际 支出(元) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 450.18 491.54 599.40 619.57 668.06 716.60 837.65 1158.84 1317.33 1413.24 1767.67 1899.57 2067.33 2359.88 2813.10 3935.39 5585.88 6748.68 7945.78 359.86 408.66 490.44 511.43 534.82 574.06 666.75 923.32 1067.38 1147.60 1455.55 1520.41 1646.05 1860.17 2134.65 2939.60 4134.12 5019.76 5729.45 100.00 101.50 108.60 110.20 112.30 113.00 115.40 136.80 145.90 158.60 193.30 229.10 238.50 258.80 280.30 327.70 386.40 435.10 466.90 450.18 484.28 551.93 562.22 594.89 634.16 725.87 847.11 902.90 891.07 914.47 829.14 866.81 911.85 1003.60 1200.91 1445.62 1551.06 1701.82 359.86 402.62 451.60 464.09 476.24 508.02 577.77 674.94 731.58 723.58 753.00 663.64 690.17 718.77 761.56 897.04 1069.91 1153.70 1227.13 要求:(1)建立居民收入—消费函数; (2)检验模型中存在的问题,并采取适当的补救措施预以处理; (3)对模型结果进行经济解释。 6.4 下表给出了日本工薪家庭实际消费支出与可支配收入数据     日本工薪家庭实际消费支出与实际可支配收入 单位:1000日元 年份 个人实际可支配收入 X 个人实际 消费支出 Y 年份 个人实际可支配收入 X 个人实际 消费支出 Y 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 239 248 258 272 268 280 279 282 285 293 291 294 302 300 311 329 351 354 364 360 366 370 378 374 371 381 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 304 308 310 312 314 324 326 332 334 336 334 330 384 392 400 403 411 428 434 441 449 451 449 449 注:资料来源于日本银行《经济统计年报》数据为1990年价格。 要求:(1)建立日本工薪家庭的收入—消费函数; (2)检验模型中存在的问题,并采取适当的补救措施预以处理; (3)对模型结果进行经济解释。 6.5下表给出了中国进口需求(Y)与国内生产总值(X)的数据。 1985~2003年中国实际GDP、进口需求 单位: 亿元 年份 实际GDP (X, 亿元) 实际进口额 (Y, 亿元) 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 8964.40 9753.27 10884.65 12114.62 12611.32 13090.55 14294.88 16324.75 18528.59 20863.19 23053.83 25267.00 27490.49 29634.75 31738.82 34277.92 36848.76 39907.21 43618.58 2543.2 2983.4 3450.1 3571.6 3045.9 2950.4 3338.0 4182.2 5244.4 6311.9 7002.2 7707.2 8305.4 9301.3 9794.8 10842.5 12125.6 14118.8 17612.2 注:表中数据来源于《中国统计年鉴2004》光盘。实际GDP和实际进口额均为1985年可比价指标。 要求:(1)检测进口需求模型   的自相关性;    (2)采用科克伦-奥克特迭代法处理模型中的自相关问题。 6.6下表给出了某地区1980-2000年的地区生产总值(Y)与固定资产投资额(X)的数据。 地区生产总值(Y)与固定资产投资额(X) 单位:亿元 年份 地区生产 总值(Y) 固定资产投资额(X) 年份 地区生产 总值(Y) 固定资产投资额(X) 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1402 1624 1382 1285 1665 2080 2375 2517 2741 2730 216 254 187 151 246 368 417 412 438 436 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 3124 3158 3578 4067 4483 4897 5120 5506 6088 7042 8756 544 523 548 668 699 745 667 845 951 1185 1180 要求:(1)使用对数线性模型   进行回归,并检验回归模型的自相关性;    (2)采用广义差分法处理模型中的自相关问题。    (3) 令 (固定资产投资指数), (地区生产总值增长指数),使用模型  ,该模型中是否有自相关? 第六章附录: 附录6.1: 存在自相关时参数估计值方差的证明 + + EMBED Equation.3 ������� et et-1 et-1 ������� e
/
本文档为【第六章 自相关】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索