序列相关性
第六章 序列相关性
1、理解序列相关性的含义、原因和后果
2、掌握序列相关性的诊断
3、会序列相关性的处理
1、古典假定3
对于模型
ytn,,,,,,,,,,,XXX+ 1,2, (6-1) tttkkt01122t
假定随机误差项之间不存在相关性,即
cov(,)0 (),,,,ts (6-2) ts
2、序列相关
如果随机误差项之间存在相关关系,则
cov(,)0 (),,,,ts (6-3) ts
这时,称随机误差项之间存在序列相关或自相关。由于通常假定随机误差项均值为零且同方差,则
序列相关性又可以
示为:
Ets()0 (),,,, (6-4) ts
随机误差项的序列相关性有多种形式,其中最常见的是随机误差项之间存在一阶序列相关 ,即
随机误差项只与其前一期相关:cov(,)()0,,,,,,E。一阶序列相关性可以表示为 tttt,,11
,,,,,,, (6-5) ttt,1其中,,,,是与的之间的系数,是满足回归模型基本假定的随机误差项。 ,tt,1t
1
随机误差项之间存在序列相关性的原因很多,但主要是由经济变量自身特点、数据处理、变量
选择及模型形式选择所引起的。
原因(一)经济变量自身特点引起随机误差项序列相关
经济变量是对经济现象的客观反映。任何一种经济现象都有其历史的延续性与继承性,现在的
状况是在过去基础上演进而来的,过去的发展水平、速度、特征都会对现在的状况产生重要影响。
同一经济变量,在前期与后续时期总存在一定的相关性,不可能互不相关。大多数经济时间序列都
有一个明显的特点,就是它的惯性,如国民生产总值 、价格指数、就业和失业、消费和投资等。当经济复苏,宏观经济从谷底开始上升时,大多数经济变量一般会持续上升,在向上移动的过程中,
序列某一点的值会大于其前期值。这种向上的“动力”存在,直到经济开始衰退。当宏观经济从高
涨的顶峰开始紧缩下降时,这类经济变量一般会持续减小 ,其值可能会小于前期值。这种“阻力”存在,直到经济开始复苏。因此,利用时间序列资料建立模型时,经济发展的惯性使得模型存在序
列相关性。随机误差项作为模型中的一个特殊经济变量,它虽然包含的具体
很多,不具有单一
的经济含义,但它与模型中独立出现的解释变量相类似,不同观测期的取值也不可能完全互不相关 ,
总存在一定的相关性。
此外,经济变量的运行往往表现在时间前后期的相互关联上所形成的惯性。例如,一个企业的
固定资产的形成,不仅与当期固定资产投资有关,还与前期多年固定资产投资相关。农作物的单位
面积产量,不仅取决于当年投入的生产要素的数量与质量,而且还与往年投入物的数量与质量有关。
如果模型忽略了这些前后相联的因素的影响,误差项的系统性影响就会在模型中体现出来,产生序
列相关问题。
原因(二)解释变量选择引起随机误差项序列相关
在现实经济活动中,某一经济现象的发展变化往往是多种因素综合作用的结果。利用计量经济
模型研究经济变量的变化规律或者测度经济变量之间的数量依存关系,只能将重要的影响因素作为
独立的解释变量在模型中列示,而将那些次要的影响因素予以舍弃。但这些被略去的次要因素的影
响力在模型中并不会消失,它们的综合影响会在随机误差项中反映出来。进入模型随机误差项的次
要因素在不同观测期的值可能是高度相关的,这就会带来随机误差项的序列相关。例如,在商品需
2
求函数中,如果解释变量只有收入和商品自身的价格,则随机误差项中将包含其他商品价格对该商
品需求的影响,价格变量一般是逐期相关的,从而使模型产生了序列相关性。
原因(三)模型函数形式设定偏误引起随机误差项序列相关
在对实际经济问题的研究中,用于分析与测度经济变量之间数量依存关系的模型,是研究者根
据一定的经济理论、实践经验确定的。由于研究对象自身的复杂性、经济理论的局限性及人们对研
究对象认识的片面性,可能导致对模型形式选择的失准。如果模型形式不能正确反映经济变量之间
内在真实的数量依存关系,就会造成随机误差项的序列相关。比如,边际成本与产量之间的函数关
系式应为:
2y,,,,,,,,XX 012tttt
式中,yx表示边际成本,表示产量。由于认识上的偏误,结果设成了线性形式: tt
y,,,,,,X ttt01
22这时,由于,,,,,XX,中包含了带有对边际成本的系统影响,使得之间很可能出现序列相2ttttt
关。
原因(四)观测数据的处理引起随机误差项序列相关
在计量经济分析中使用的时间数据序列,因多种原因在代表性上存在某些缺陷,为增强数据的
代表性或弥补其他方面的缺陷,往往需要对原始观测数据进行内插或平滑处理。经这样处理后的时
序资料与原始时间序列数据之间的差异便会在随机误差项中反映出来,并引起随机误差项的序列相
关。比如,在回归分析建模中,我们经常要对原始数据进行一些处理,如在具有季节性时序资料的
建模中,我们必须消除季节性影响,对数据作修匀处理。但如果采用了不恰当的数据变换,就会带
来序列的自相关性。
当一个线性回归模型的随机误差项存在序列相关时,就违背了线性回归方程设定的基本假设3,
如果直接用普通最小二乘法估计未知参数,将会造成严重后果。
3
(一)模型参数估计值不具最优性
当模型存在序列相关性时,OLS估计仍然是无偏估计,但不再具备有效性。这与存在异方差性
时的情况一样,说明存在其他的参数估计方法,其估计误差小于OLS估计的误差;也就是说,对于
存在序列相关的模型,应该改用其他方法估计模型中的参数。 1.参数估计值仍然是无偏的
以一元线性回归模型为例,其模型为:
Ytn,,,,,,,X 1,2, (6-6) ttt01
,X设随机误差项具有零均值、齐性方差,且与独立,但存在序列相关性。在普通最小二乘tt
ˆˆˆˆ法下计算得到,,且有(见式2-17)。因此,()(),,,,,kEkE,,,,,,,,,,,11tt111tt01
ˆˆ,,这表明满足无偏性。同理也可以证明是的无偏估计量。这个结果说明只要随机误差项与,,0t10
解释变量,相互独立,无论随机误差项之间是否存在序列相关性,对参数的最小二乘估计值的无Xtt
偏性都没有影响。
2.参数估计值不再具有最小方差性
ˆ参数,的最小二乘估计值的方差为 ,11
22ˆˆˆˆ var()[()]()EEE,,,,,,,,,11111
222 ,,EkEkkk()=[2],,,, ,,,tttttstsks,
22 ,,kEkkE()2(),,, (6-7) ,,tttstsks,
ˆ在随机误差项,Ets()0 (),,,,,不存在序列相关的假定下,,参数的估计值的方差,tts11
为
2,2222ˆ (6-8) ,,,var()(),,,kEk,,ttt12(XX),,
,ˆ 在随机误差项,Ets()0 (),,,,,存在序列相关性的情形下,。令参数的估计值用表,tts11
示,此时
,22ˆˆ var()()2()var()2(),,,,,,,,,,,kEkkEkkE (6-9) ,,,11tttstststs,,ksks
如果随机误差项存在正的序列相关性,也即Ets()0 (),,,,,那么 ts
4
,ˆˆ (6-10) var()var(),,,11
大多数时间序列数据由于受到经济波动规律的影响,一般随着时间的推移有向上或向下的变动
,ˆˆ趋势,所以往往表现出正的序列相关性。因而,的方差也往往会大于的方差,此时参数估计,,11的最小方差性将不再能得到保证。如果随机误差项,存在序列相关性,我们仍然用普通最小二乘法t
ˆ估计参数,就很有可能低估了参数估计值的真实方差。同理,可以证明也有类似结果。 ,0
(二)模型参数的统计检验失效
在随机误差项,存在序列相关性的情形下,如果仍然用普通最小二乘法来估计模型参数,则会t
2,ˆ低估了参数估计值的真实方差,从而低估了参数估计值的
误差:s(),,。而12(XX),,
ˆ,1ˆ的低估将直接导致统计量被过高估计,从而得出回归参数统计检验为显著的结论,t,s(),1ˆs(),1
但实际上可能是并不显著的。同样,在进行检验时,由于参数估计值的方差的低估,导致统计FF
量的虚增,使得检验失效。 F
(三)模型的预测及经济分析功能失效
在随机误差项,存在序列相关性的情形下,用普通最小二乘法估计模型参数,其估计值不再具t
有最小方差性,失去了最优性,使得模型的样本估计式失准。估计值真实方差的低估,将导致统计
检验的失效以及预测区间的可信度降低,用此模型进行预测和结构分析将会带来较大的偏差甚至错
误的解释。
如果回归模型的随机误差项之间存在序列相关性,将对模型的参数估计、统计检验以及模型预
测的可靠性带来严重的影响。因此,在采用最小二乘法对模型进行估计之前,我们必须检验模型是
否存在序列相关性。常见检验方法如下:
5
图示法是一种很直观的检验方法,它是通过对残差散点图的分析来判断随机误差项的序列相关
性。把给定的回归模型直接用普通最小二乘法估计参数,求出残差项ee,,并把作为随机误差项ttt
ee,,的估计值,画出的散点图。由于把残差项作为随机误差项的估计值,随机误差项的性质tttt也应能在残差e中反映出来。 t
(一)按时间顺序绘制残差图
如果残差ee,,随着时间的变化而呈现有规律的变动,则存在相关性,进而可tT,1,2,,ttt以推断随机误差项e,之间存在序列相关性。如果随着时间的变化,并不频繁地改变符号,而是ttt
取几个正值后又连续地取几个负值(或者,与之相反,几个连续的负值后面紧跟着几个正值),则表
明随机误差项e,存在正的序列相关,(见图6-1);如果随着时间的变化,不断地改变符号(见ttt
图6-2),那么随机误差项,之间存在负的序列相关。 t
et et
t tt
eett,1(二)绘制,的散点图
计算eeeeeetT,2,,,1和,以为纵轴,为横轴,绘制(,),的散点图。如果大tt,1tt,1t,1t
部分点落在第?,?象限,表明随机误差项,存在正的序列相关(见图6-3);如果大部分点落在第t
?,?象限,表明随机误差项,存在负的序列相关(见图6-4)。 t
6
e te t
e e t,1t,1
图6-3 正序列相关 图6-4 负序列相关
D-W
1、适用条件
杜宾——瓦特森检验,简称D—W检验,是J.Durbin(杜宾)和G.S.Watson(瓦特森)于1951年提
出的一种适用于小样本的检验序列相关性的方法。D-W检验是目前检验序列相关性最为常用的方法,
但它只适用于检验随机误差项具有一阶自回归形式的序列相关问题。在使用该方法时前,必须注意
该方法的适用条件。回归模型含有截距项,即截距项不为零;解释变量是非随机的;随机误差项X
,,,,,,,为一阶自相关,即;回归模型中不应含有滞后内生变量作为解释变量,即不应出ttt,1t
现下列形式:YXY,,,,,,,,YY 其中,为的滞后一期变量;无缺失数据。当上tttt0121,t,1t述条件得到满足时,我们可以利用D-W方法检验序列相关问题。
2、具体过程
(1)提出假设H:0,,H:0,,,即不存在序列相关,,即存在序列相关性 01
(2)定义D-W检验统计量
为了检验上述假设,构造D-W检验统计量首先要求出回归估计式的残差e,定义D-W统计量为: t
n2()ee,tt1,,t2,DW,n (6-11) 2te,t1,
其中,etn,,,YY,1,2,。 ttt
由(6-11)式有
7
nnn22eeee,,2tttt11,,,,,ttt222,,,DW,n (6-12) 2te,t1,
nn22由于ee与只有一次观测之差,故可认为近似相等,则由(6-12)式得 tt1,,,t2t2,,
nnn,,222eeeee,,,,,,,111ttttt,,,,,222ttt,, (6-13) DW,,,21nn,,22ee,,,,11tt,,,,,,22tt
随机误差序列,,,,,,的自相关系数定义为: 12n
n
,,,tt,1t,2 (6-14) ,,nn22tt,1,,,,tt,,22
在实际应用中,随机误差序列的真实值是未知的,需要用估计值e代替,得到自相关系数的估计值t为:
n
eett,,1t,2ˆ (6-15) ,,nn22tt,1ee,,tt,,22
nn22在认为ee与近似相等的假定下,则(6-15)式可化简为: tt1,,,t2t2,,
n
eett,,1t,2ˆn,, (6-16) 2te,1,t,2
所以,(6-13)式可以写成
ˆDW,,2(1), (6-17)
(3)检验序列相关性
因为自相关系数ˆˆˆ,02(1)4,,,,DW,,的值介于-1和1之间,所以:,而且有值与DW
的对应关系如表6-1所示。
8
ˆ6-1 ,DW
DW值 随机误差项的序列相关性 ˆ值 ,
-1 4 完全负序列相关
(-1,0) (2,4) 负序列相关
0 2 无序列相关
(0,1) (0,2) 正序列相关
1 0 完全正序列相关 从表6-1中,我们可以知道当值显著地接近于0或者4时,则存在序列相关性;而接近于DW
2时,则不存在序列相关性。这样只要知道统计量的概率分布,在给定的显著性水平下,根据DW
临界值的位置就可以对原假设H进行检验。但是统计量的概率分布很难确定,作为一种变通DW0
的处理方法,杜宾和瓦特森在5%和1%的显著水平下,找到了上限临界值dd和下限临界值,并LU编制了D-W检验的上、下限表。这两个上下限只与样本的大小n和解释变量的个数有关,而与k解释变量的取值无关。具体的判别规则为:
(1) 0,,DWdH,,拒绝,表明随机误差项之间存在正的序列相关; L0t
(2) 44,,,dDWH,,拒绝,表明随机误差项之间存在正的序列相关; L0t
(3) d,DW,4,dH,,接受,即认为随机误差项之间不存在序列相关性; UU0t(4) dDWd,,44,,,,dDWd或,不能判定是否存在序列相关性。 LUUL
上述四条判别规则可用图6-5表示:
fDW()
正正
序不不序
列能能列
无序列相关区 相确确相
关 定 定 关
区 区 区 区
0
4 DWd 4- 2 dUd4- LUd L0 6-5 DW
9
3.D-W检验特点
D-W检验法的优点在于其计算简单、应用方便,目前已成为最常用的序列相关性检验的方法。
EViews软件在输出回归分析结果中直接给出了DW值,并且人们也习惯将DW值作为常规的检验统
2计量,连同Rt,值等一起在
回归分析的计算结果时表明。
但D-W检验也存在很大的局限性,在应用时应予以重视。D-W检验不适应随机误差项具有高阶序列相关的检验; D-W检验有两个无法判别的区域,一旦DW值落入这两个区域,必须调整样本容量或采取其他的检验方法;这一方法不适用于对联立方程模型中各单一方程随机误差项序列相关性
的检验;D-W检验不适用于模型中含有滞后的被解释变量的情况。
1、定义
回归检验法适用于任一随机变量序列相关性的检验,并能提供序列相关的具体形式及相关系数
的估计值。
2、应用步骤
分三步进行:
第一步,依据模型变量的样本观测数据,应用普通最小二乘法求出模型的样本估计式,并计算
出随机误差项e,的估计值; tt
第二步,建立eee与、的相互关系模型,由于它们相互关系的形式和类型是未知的,需要tt,1t,2
用多种函数形式进行试验,常用的函数形式主要有:
ee,,,,ttt,12 ee,,,, ttt,1
eee,,,tttt1122,,,,,
ee,,,,ttt,1
ee,,,,ttt,1
第三步,对于不同形式的eee与、的相互关系模型,用普通最小二乘法进行参数估计,得tt,1t,2
出回归估计式,再对估计式进行统计检验。如果检验的结果是每一种估计式都不显著的,就表明e与t
ee,、是不相关的,随机误差项之间不存在序列相关性。如果通过检验发现某一个估计式是t,1t,2t
10
eee,显著的(若有多个估计式显著就选择最为显著的),就表明与、是相关的,随机误差项tt,1t,2t
之间存在序列相关性,相关的形式就是统计检验显著的回归估计式,相关系数就是该估计式的参数
估计值。
回归检验法需要用多种形式的回归模型对eee与、的相关性进行试验分析,工作量大、计tt,1t,2算复杂,显得极为繁琐。
线性回归模型中随机误差项序列相关性的检验,在计量经济学的研究中是一个很重要的问题。
但目前应用的检验方法都存在一些缺限和局限,还不能对这一问题进行完全有效的检验,更为完善
的检验方法有待于进一步研究。有关于高阶序列相关性的检验,可以参考其它相关教科
。
如果检验发现随机误差项之间存在序列相关性,应当首先分析序列相关产生的原因,引起序列
相关的原因不同,修正序列相关的方法也不同。如果是回归模型变量选用不当,则应对模型中包含
的解释变量进行调整,去掉无关的以及非重要的变量,引入重要的变量;如果是模型的形式选择不
当,则应重新确定正确的模型形式;如果以上两种方法都不能消除序列相关性,则需要采用其他数
学方法进行处理以消除序列相关性,然后再对模型中的未知参数进行估计。
差分法将原模型变换为差分模型,用增量数据代替原来的样本数据。差分法分为一阶差分法和
广义差分法。
(一)一阶差分法
假设原模型为:
YXXX 1,2,,,,,,,,,,,,,tn (6-18) tttkktt01122
一阶差分法变换后的模型为:
,,,,,,,,,,YXXX 2,,,,,tn (6-19) tttkktt1122
其中,,,YYY,,,,- , ttt,1ttt,1
如果,原模型存在完全一阶正相关,即 ,,,,,,,其中不存在序列相关性,那么差分ttt,1t
11
模型满足应用普通最小二乘法的基本假设。用普通最小二乘法估计差分模型得到的参数估计值,即
为原模型参数的无偏、有效估计值。
(二)广义差分法
一阶差分法仅适用于随机误差项的自相关系数等于1的情形。但在一般情况下,完全一阶正,相关的情况并不多见,在这种情况下,随机误差项的序列相关性就要用广义差分法进行修正。
对于模型(6-18)如果随机误差项存在一阶自相关,即,,,,,,,其中,为随机误差项,ttt,1
,,的自相关系数,且有,不存在序列相关性。 ,,1tt
将(6-18)式滞后一期,并左右两边同乘,可得 ,
,,,,,,,,,,,YXXX ,,,,,, (6-20) tttkktt,,,,,1011(1)22(1)(1)1
将(6-18)式减去(6-20)式,得
YY(1)(XX)(XX),,,,,,,,,,,,,,,tttttt,,,10111(1)222(1) (6-21) (XX)(-) ,,,,,,,,kktkttt(1)1,,
在为已知的情况下,我们可以对(6-21)式进行如下变换 ,
,,Y,,YY,,ttt1,,X,,XX,,,tt11t1(1),,X,,XXtt22,,,t2(1) (2,3,,)tn,, (6-22) , ,,,Xktktkt(1),,XX,,,,ttt1,-,,,,,
将变换后的新变量代入(6-21)式,便可得到一个新的模型表示式:
,,,,Y(1)XX X 2,3,,,,,,,,,,,,,,,,tn (6-23) tttkktt01122
我们把上述变换过程称为广义差分变换,把通过广义差分变换得到的模型称为广义差分模型。
,,我们应该注意到这一变换过程所构建的新变量YX,,由于差分变换要损失一个观测值,样本个tit数由n个减少到个。为了避免损失自由度,可以将第一个观测值作如下变换: n,1
,2,2Y1,Y,,,X1,X,, 1111
通过对原模型进行广义差分变换,我们可以得到广义差分模型,广义差分模型中的随机误差项
12
满足线性回归的经典假设,对广义差分模型进行OLS估计,得到的参数估计值仍然是最佳估计量。
,进行广义差分变换的前提是已知的值。但是随机误差项的自相关系数,的值不可观测,,,t使得的值也是未知的。所以利用广义差分法处理序列相关性时,首先需要估计出的值。这可以,,用杜宾(Durbin)两步估计法。
我们以一元线性回归模型为例,对于模型
YX 1,2,,,,,,,,,tn (6-24) ttt01
如果随机误差项,存在阶自回归形式的序列相关,即 ht
,,,,,,,,,,,,,,, ()hn (6-25) ttththt1122,,,
2当E()0,,E()0,,,,、、时,便可利用杜宾两步法对的相关系数进行估计。 Var(),,,,ttt,1tt,
第一步,对(6-24)式进行差分变换,可得
YYYY(1),,,,,,,,,,,,,,,,ttththh1122012,,,
(XXXX),,,,,,,,, (6-26) 11122ttthth,,,
(,,,,,,,,,,,,)hth,ttt1122,,
整理(6-26)式,可得
Y,,,,,,,,,,,,,,,,(1)YYYt0121122tt,,hhth, (6-27) ()()(),,,,,,,,,,,,,,XXXXtt11111221tt,,hth,
第二步:应用普通最小二乘法对包含被解释变量及解释变量的滞后变量在内的模型(6-27)式进行估计,求出随机误差项ˆˆˆ,,,,,,,的自相关系数,,„, 的估计值,,„, 。再2h2ht11将ˆˆˆ,,,,,„, 代入(6-26)式,可得 2h1
ˆˆˆˆˆˆYYY(1),,,,,,,,,,,,,,,,Yttththh1122012,,, (6-28) ˆˆˆ (XXXX),,,,,,,,,,,11122ttththt,,,
(6-28)式的随机误差项ˆˆ,,,具有零均值、方差齐性、不存在序列相关性的特点。在,,„, 2t1
ˆˆˆ,,,已知的情况下,可以用普通最小乘法对(6-28)式进行估计,求出参数、的估计值、。,,h0101
此方法也适用于多元线性回归模型。杜宾两步法不但求出了自相关系数ˆ ,的估计值,而且也得,
13
出了模型参数的估计值。
迭代估计法或科克伦-奥克特(Cochrane-Orcutt)估计法,是用逐步逼近的办法求的估计, 值。仍以(6-24)式为例,假设随机误差项,,,,,,,存在一阶自回归形式的序列相关,即,tt11t,t
,,其中满足零均值、方差齐性、无序列相关性。迭代估计的具体步骤为: tn,1,2,,t
第一步,利用OLS法估计模型YX , 1,2,,,,,,,,,tne,计算残差出; ttt01t
第二步,根据上一步计算出的残差ˆe计算的估计值,: ,t
nn2ˆ,,eee ttt11,,,,tt22,,
第三步,利用上一步求得的ˆ,值对(6-24)式进行广义差分变换:
,,YYY,,,,,ttt1 ,,,XXX,,,ttt1,,
,并得到广义差分模型:ˆY(1),,,,,,,,; tt01
,,,第四步,再利用OLS法估计ˆY(1),,,,ee,,,,,计算出残差,根据残差计算的,tt01tt
,第二次逼近值ˆ,:
nn,,,,2 ˆ,,eee ttt,,11,,tt,,33
第五步,重复执行第三、四步,直到的前后两次估计值比较接近,即估计误差小于事先给定,
,,的精度ˆˆˆ,,,,,,:。此时,以 作为的估计值,并用广义差分法进行变换,得到回归系数,,
的估计值。
实例分析如何在实际建模中处理序列相关性问题及其在EViews软件中的实现过程。
14
本章小结:
当经典线性回归模型关于随机误差项之间不相关性的假定不再成立时,便产生了序列相关性问题;导致序列相关性产生的原因很多,主要原因有:经济变量自身的特点如经济现象的惯性或粘滞性、
解释变量的选取、模型函数形式的设定、观测数据的处理等;通常我们用于序列相关性检验的方法
有图示法和D-W检验法等。D-W检验法由于其使用方便且很多经济计量或统计软件在结果输出时一
并给出,因而常常被人们所采用,但在使用过程中我们应该注意它的适用条件;用以修正模型序列相
关性的方法有差分法、杜宾两步法、迭代法等。在使用这些修正方法之前,首先应该分析是否是模型函数形式的设定、解释变量的选择等方面出现了问题而引起的序列相关性。在排除了这些方面可能
存在的问题后,再考虑使用这些修正方法。
15