第七章 序列相关性
Serial Correlation
一、序列相关性概念
二、实际经济问题中的序列相关性
三、序列相关性的后果
序列相关性
三、序列相关性的后果
四、序列相关性的检验
五、具有序列相关性模型的估计
六、案例(中国商品进口与国内生产总值)
一、序列相关性概念
对于模型
Yi=b0+b1X1i+b2X2i+…+bkXki+mi i=1,2, …,n
随机项互不相关的基本假设
现为
Cov(m , m )=0 i¹j, i,j=1,2, …,n
如果对于不同的样本点,随机误差项之间不再
是不相关的,而是存在某种相关性,则认为出现
了序列相关性。
Cov(mi , mj)=0 i¹j, i,j=1,2, …,n
在其他假设仍成立的条件下,序列相关即意味着
0)( ¹jiE mm
÷
÷
÷
ø
ö
ç
ç
ç
è
æ
=¢=
2
1
1
2
)(
)(
)()(
smm
mms
L
MOM
L
n
n
E
E
ECov μμμ
或
÷
÷
÷
ø
ö
ç
ç
ç
è
æ
=
2
1
1
2
ss
ss
L
MOM
L
n
n
IΩ 22 ss ¹=
称为一阶列相关,或自相关(autocorrelation)
其中: r被称为自协方差系数( coefficient of
如果仅存在
E(mi mi+1)¹0 i=1,2, …,n
自相关往往可写成如下形式:
mi=rmi-1+ei -1
标准的OLS假定的随机干扰项:
0)( =iE e ,
2)var( se =i , 0),cov( =-sii ee 0¹s
由于序列相关性经常出现在以时间序列为样本的模型中,
因此,本节将用下标t代表i。
二、实际经济问题中的序列相关性
大多数经济时间数据都有一个明显的特点:惯性,
表现在时间序列不同时间的前后关联上。
例如,绝对收入假设下居民总消费函数模型:
1、经济变量固有的惯性
由于消费习惯的影响被包含在随机误差项中,则
可能出现序列相关性(往往是正相关 )。
例如,绝对收入假设下居民总消费函数模型:
Ct=b0+b1Yt+mt t=1,2,…,n
2、模型设定的偏误
所谓模型设定偏误(Specification error)是指
所设定的模型“不正确”。主要表现在模型中丢掉
了重要的解释变量或模型函数形式有偏误。
例如,本来应该估计的模型为
Y =b +b X + b X + b X + mYt=b0+b1X1t+ b2X2t + b3X3t + mt
但在模型设定中做了下述回归:
Yt=b0+b1X1t+ b1X2t + vt
因此, vt=b3X3t + mt,如果X3确实影响Y,则出
现序列相关。
但建模时设立了如下模型:
b b
又如:如果真实的边际成本回归模型应为:
Yt= b0+b1Xt+b2Xt2+mt
其中:Y=边际成本,X=产出,
Yt= b0+b1Xt+vt
因此,由于vt= b2Xt2+mt,,包含了产出的平方对随
机项的系统性影响,随机项也呈现序列相关性。
3、数据的“编造”
在实际经济问题中,有些数据是通过已知数据
生成的。
因此,新生成的数据与原数据间就有了内在的
联系,表现出序列相关性。
例如:季度数据来自月度数据的简单平均,这
种平均的计算减弱了每月数据的波动性,从而使
随机干扰项出现序列相关。
还有就是两个时间点之间的“内插”技术往往
导致随机项的序列相关性。
计量经济学模型一旦出现序列相关性,如果仍
采用OLS法估计模型参数,会产生下列不良后果:
二、序列相关性的后果
1、参数估计量非有效
因为,在有效性证明中利用了
E(NN’)=s2I
即同方差性和互相独立性条件。
而且,在大样本情况下,参数估计量虽然具有
一致性,但仍然不具有渐近有效性。
2、变量的显著性检验失去意义
在变量的显著性检验中,统计量是建立在参
数方差正确估计基础之上的,这只有当随机误差
项具有同方差性和互相独立性时才能成立。
其他检验也是如此。
3、模型的预测失效
区间预测与参数估计量的方差有关,在
方差有偏误的情况下,使得预测估计不准
确,预测精度降低。
所以,当模型出现序列相关性时,它的
预测功能失效。
三、序列相关性的检验
序列相关性检验方法有多种,但基本思路相同:
首先,采用 OLS法估计模型,以求得随机误差项的
“近似估计量”,用~e 表示:
基本思路:
三、序列相关性的检验
然后,通过分析这些“近似估计量”之间的相
关性,以判断随机误差项是否具有序列相关性。
“近似估计量”,用~ei表示:
lsiii YYe 0)ˆ(~ -=
1、图示法
2、回归检验法
以 te~为被解释变量,以各种可能的相关量,诸如以 1~ -te 、
2
~
-te 、
2~
te 等为解释变量,建立各种方程:
ttt ee er += -1~~
tttt eee err ++= -- 2211 ~~~ tttt eee err ++= -- 2211
……
如果存在某一种函数形式,使得方程显著成
立,则说明原模型存在序列相关性。
回归检验法的优点是:(1)能够确定序列相
关的形式,(2)适用于任何类型序列相关性问
题的检验。
3、杜宾-瓦森(Durbin-Watson)检验法
D-W检验是杜宾( J.Durbin)和瓦森 (G.S.
Watson)于1951年提出的一种检验序列自相关的方法,
该方法的假定条件是:
(1)解释变量X非随机;
(2)随机误差项mi为一阶自回归形式:(2)随机误差项mi为一阶自回归形式:
mi=rmi-1+ei
(3)回归模型中不应含有滞后应变量作为解释变
量,即不应出现下列形式:
Yi=b0+b1X1i+¼bkXki+gYi-1+mi
(4)回归含有截距项
X
杜宾和瓦森针对原假设:H0: r=0,即不存在一
阶自回归,构如下造统计量:
å
å
=
=
--
= n
t
t
n
t
tt
e
ee
WD
1
2
2
2
1
~
)~~(
..
D.W. 统计量:
该统计量的分布与出现在给定样本中的X值有复杂
的关系,因此其精确的分布很难得到。
但是,他们成功地导出了临界值的下限dL和
上限dU,且这些上下限只与样本的容量n和解
释变量的个数k有关,而与解释变量X的取值无
关。
D.W检验步骤:
(1)计算DW值
(2)给定a,由n和k的大小查DW分布表,得临界值dL和dU
(3)比较、判断
若 0
c20.05(2) 故: 存在正自相关
2阶滞后:
3阶滞后:
321
~032.0~819.0~108.10003.0692.6~ --- +-+-= tttt eeeGDPe
(0.22) (-0.497) (4.541) (-1.842) (0.087)
R2=0.6615
于是,LM=21´0.6614=13.89
取a=5%,c2分布的临界值c20.05(3)=7.815
LM > c20.05(3)
表明: 存在正自相关;但ět-3的参数不显著,说
明不存在3阶序列相关性。
3、运用广义差分法进行自相关的处理
(1)采用杜宾两步法估计r
第一步,估计模型
ttttttt GDPGDPGDPMMM ebbbrrb ++++++= ---- 2
*
31
*
2
*
12211
*
0
2121 054.0096.0055.0469.0938.009.78ˆ ---- +-+-+= tttttt GDPGDPGDPMMM 2121 054.0096.0055.0469.0938.009.78 ---- +-+-+= tttttt GDPGDPGDPMMM
(1.76) (6.64) (-1.76) (5.88) (-5.19) (5.30)
第二步,作差分变换:
)469.0938.0( 21
*
-- --= tttt MMMM
)469.0938.0( 21
*
-- --= tttt GDPGDPGDPGDP
则M*关于GDP*的OLS估计结果为:
** 020.018.86ˆ tt GDPM +=
(2.76) (16.46)
取a=5%,DW>du=1.43 (样本容量24-2=22)
表明:已不存在自相关
162.300.469)0.938- /(186.18)ˆˆ1/(ˆˆ 21
*
00 =+=--= rrbb
于是原模型为:
tt GDPM 020.030.162ˆ +=
与OLS估计结果的差别只在截距项: tt GDPM 02.091.152ˆ +=
(2)采用科克伦-奥科特迭代法估计r
在Eviews下,2阶广义差分的结果为:
取a=5% ,DW>du=1.66(样本容量:22)
]2[801.0]1[108.1020.032.169ˆ ARARGDPM tt -++=
(3.81) (18.45) (6.11) (-3.61)
u
表明:广义差分模型已不存在序列相关性。
可以验证: 仅采用1阶广义差分,变换后的模
型仍存在1阶自相关性;
采用3阶广义差分,变换后的模型不再有自相
关性,但AR[3]的系数的t值不显著。