自相关
1. 非自相关假定
由第2节知回归模型的假定条件之一是,
Cov(ui, uj ) = E(ui uj) = 0, (i, j ( T, i ( j), (1.1)
即误差项ut的取值在时间上是相互无关的。称误差项ut非自相关。如果
Cov (ui , uj ) ( 0, (i ( j)
则称误差项ut存在自相关。
自相关又称序列相关。原指一随机变量在时间上与其滞后项之间的相关。这里主要是指回归模型中随机误差项ut与其滞后项的相关关系。自相关也是相关关系的一种。
2.一阶自相关
自相关按形式可分为两类。
(1) 一阶自回归形式
当误差项ut只与其滞后一期值有关时,即
ut = f (ut - 1) + vt
称ut具有一阶自回归形式。
(2) 高阶自回归形式
当误差项ut的本期值不仅与其前一期值有关,而且与其前若干期的值都有关系时,即
ut = f (ut – 1, u t – 2 , … ) + vt
则称ut具有高阶自回归形式。
通常假定误差项的自相关是线性的。因计量经济模型中自相关的最常见形式是一阶自回归形式,所以下面重点讨论误差项的线性一阶自回归形式,即
ut = 1 ut -1 + vt (1.2)
其中1是自回归系数,vt 是随机误差项。vt 满足通常假设
E(vt ) = 0, t = 1, 2 …, T,
Var(vt) = (v2, t = 1, 2 …, T,
Cov(vi, vj ) = 0, i ( j, i, j = 1, 2 …, T,
Cov(ut-1, vt) = 0, t = 1, 2 …, T,
依据普通最小二乘法
,模型(1.2)中 1 的估计公式是,
=
(
=
) (1.3)
其中T是样本容量。若把ut, u t-1看作两个变量,则它们的相关系数是
=
(r =
) (1.4)
对于大样本显然有
(
(1.5)
把上关系式代入(1.4)式得
≈
=
(1.6)
因而对于总体参数有 ( = 1,即一阶自回归形式的自回归系数等于该二个变量的相关系数。因此原回归模型中误差项ut的一阶自回归形式(见模型(1.2))可表示为,
ut = ( ut-1 + vt. (1.7)
( 的取值范围是 [-1,1]。当 ( ( 0 时,称ut 存在正自相关;当 ( ( 0时,称ut存在负自相关。当 ( = 0时,称ut不存在自相关。图1.1 a, c, e, 分别给出具有正自相关,负自相关和非自相关的三个序列。为便于理解时间序列的正负自相关特征,图1.1 b, d, f, 分别给出图1.1 a, c, e, 中变量对其一阶滞后变量的散点图。正负自相关以及非自相关性展现的更为明了。
a. 非自相关的序列图 b. 非自相关的散点图
c. 正自相关的序列图 d. 正自相关的散点图
e. 负自相关的序列图 f. 负自相关的散点图
图1.1时间序列及其自相关散点图
下面推导当误差项ut为一阶自回归形式时,ut 的期望、方差与协方差公式。由上式有
E(ut) = E(( ut -1 + vt) = ( E(ut -1) + E(vt) (1.8)
因为对于平稳序列有E(ut) = E(ut -1),整理上式得
E(ut) =
= 0. (1.9)
Var(ut) = E(ut)2 = E(( ut -1 + vt)2 = E((2 ut –12 + vt2 + 2( ut -1 vt ) = (2 Var(ut-1) +(v2
整理上式得
Var(ut) = (u2 =
(1.10)
Cov(ut, ut-1) = E(ut ut-1) = E((( ut -1 + vt) ut-1) = ( Var(ut-1) = ( Var(ut) = ((u2
同理 Cov(ut, ut-s) = ( s Var(ut) = ( s (u2, (s ( 0 ) (1.11)
令 u = (u1 u2 u3 … uT)’,
则由公式(1.9),(1.10),(1.11)得
E(u u’ ) = ( = (u2
(1.12)
其中(u2 =
。
从而验证了当回归模型的误差项ut存在一阶自回归形式时,Cov(ui, uj) ( 0。同理也可证明当ut 存在高阶自回归形式时,仍有Cov(ui, uj) ( 0。
注意,(1)经济问
中的自相关主要表现为正自相关(原因见3节)。(2)自相关主要针对时间序列数据。
3. 自相关的来源与后果
误差项存在自相关,主要有如下几个原因。
(1) 模型的数学形式不妥。若所用的数学模型与变量间的真实关系不一致,误差项常表现出自相关。比如平均成本与产量呈抛物线关系,当用线性回归模型拟合时,误差项必存在自相关。
(2) 惯性。大多数经济时间序列都存在自相关。其本期值往往受滞后值影响。突出特征就是惯性与低灵敏度。如国民生产总值,固定资产投资,国民消费,物价指数等随时间缓慢地变化,从而建立模型时导致误差项自相关。
(3) 回归模型中略去了带有自相关的重要解释变量。若丢掉了应该列入模型的带有自相关的重要解释变量,那么它的影响必然归并到误差项ut中,从而使误差项呈现自相关。当然略去多个带有自相关的解释变量,也许因互相抵消并不使误差项呈现自相关。
当误差项ut 存在自相关时,模型参数的最小二乘估计量具有如下特性。
(1) 只要假定条件Cov(X ' u) = 0 成立,回归系数
仍具有无偏性。
E(
) = E[ (X 'X )-1 X 'Y ] = E[ (X 'X )-1 X ' (X ( + u) ].
= ( + (X 'X)-1 X ' E(u) = (
以一元线性回归模型,yt = (0 + (1 xt + ut,为例,
E(
)=E(
)= E(
)=(1+
= (1
(2)
丧失有效性。
Var(
) = E [(
- ( ) (
- ( )' ] = E [(X 'X )-1 X ' u u' X (X 'X)-1 ]
= (X ' X)-1 X ' E (u u' ) X (X ' X )-1= (X 'X )-1 X ' ( X (X ' X )-1 (1.13)
与
(X ' X )-1不等。
以一元线性回归模型,yt = (0 + (1 xt + ut,为例,当ut非自相关时
Var (
) = E(
-(1)2 = E(
)2 = E[
]
=
E{ (x1-
)2u12+(x2-
)2u22+…+2[(x1-
)(x2-
)u1u2+(x1-
)(x3-
)u1u3+…]}
=
+2
E(ut us) =
当ut为一阶自回归形式时
Var (
) =
+2
EMBED Equation.3 (s-t
的方差比ut非自相关时大,失去有效性。因为OLS法仍然用
估计
的方差,而
项常常是正的,所以会低估
的方差。
低估回归参数估计量的方差,等于夸大了回归参数的抽样精度(t =
),过高的估计统计量t的值,从而把不重要的解释变量保留在模型里,使显著性检验失去意义。
(3) 有可能低估误差项ut的方差。
(4) Var(
) 和su2都变大,都不具有最小方差性。所以用依据普通最小二乘法得到的回归方程去预测,预测是无效的。
4. 自相关检验
下面介绍三种判别与检验
。
(1) 图示法
图示法就是依据残差
对时间t的序列图作出判断。由于残差
是对误差项ut 的估计,所以尽管误差项ut 观测不到,但可以通过
的变化判断ut 是否存在自相关。
图示法的具体步骤是,(1) 用给定的样本估计回归模型,计算残差
, (t = 1, 2, … T),绘制残差图;(2) 分析残差图。若残差图与图1.1 a 类似,则说明ut不存在自相关;若与图1.1 c类似,则说明ut 存在正自相关;若与图1.1 e 类似,则说明ut存在负自相关。
经济变量由于存在惯性,不可能表现出如图1.1 e那样的震荡式变化。其变化形式常与图1.1中a 相类似,所以经济变量的变化常表现为正自相关。
(2) DW(Durbin-Watson)检验法
DW检验是J. Durbin, G. S. Watson于1950,1951年提出的。它是利用残差
构成的统计量推断误差项ut 是否存在自相关。使用DW检验,应首先满足如下三个条件。
(1) 误差项ut的自相关为一阶自回归形式。
(2) 因变量的滞后值yt-1不能在回归模型中作解释变量。
(3) 样本容量应充分大(T ( 15)
DW检验步骤如下。给出假设
H0: ( = 0 (ut 不存在自相关)
H1: ( ( 0 (ut 存在一阶自相关)
用残差值
计算统计量DW。
DW =
(1.14)
其中分子是残差的一阶差分平方和,分母是残差平方和。把上式展开,
DW =
(1.15)
因为当样本充分大时,有
≈
≈
(1.16)
把(1.15)式中的有关项用上式中第2项代换,
DW ≈
= 2 (1 -
) = 2 (1 -
) (1.17)
因为 ( 的取值范围是 [-1, 1],所以DW统计量的取值范围是 [0, 4]。( 与DW值的对应关系见表1.1。
表1.1 ( 与DW值的对应关系及意义
(
DW
ut的表现
( = 0
DW = 2
ut 非自相关
( = 1
DW = 0
ut完全正自相关
( = -1
DW = 4
ut完全负自相关
0 < ( < 1
0 < DW < 2
ut有某种程度的正自相关
-1 < ( < 0
2 < DW < 4
ut有某种程度的负自相关
实际中DW = 0, 2, 4 的情形是很少见的。当DW取值在(0, 2),(2, 4)之间时,怎样判别误差项ut 是否存在自相关呢?推导统计量DW的精确抽样分布是困难的,因为DW是依据残差
计算的,而
的值又与xt的形式有关。DW检验与其它统计检验不同,它没有唯一的临界值用来制定判别规则。然而Durbin-Watson根据样本容量和被估参数个数,在给定的显著性水平下,给出了检验用的上、下两个临界值dU和dL 。判别规则如下:
图1.2
(1) 若DW取值在(0, dL)之间,拒绝原假设H0 ,认为ut 存在一阶正自相关。
(2) 若DW取值在(4 - dL , 4)之间,拒绝原假设H0 ,认为ut 存在一阶负自相关。
(3) 若DW取值在(dU, 4- dU)之间,接受原假设H0 ,认为ut 非自相关。
(4) 若DW取值在(dL, dU)或(4- dU, 4 - dL)之间,这种检验没有结论,即不能判别
ut 是否存在一阶自相关。判别规则可用图1.2表示。
当DW值落在“不确定”区域时,有两种处理方法。①加大样本容量或重新选取样本,重作DW检验。有时DW值会离开不确定区。②选用其它检验方法。
DW检验表4给出DW检验临界值。DW检验临界值与三个参数有关。①检验水平(,②样本容量T , ③原回归模型中解释变量个数k(不包括常数项)。
注意:
①因为DW统计量是以解释变量非随机为条件得出的,所以当有滞后的内生变量作解释变量时,DW检验无效。这时的表现是DW值常常接近2。当估计式为
yt = (0 + (1 yt-1 + (2 xt + ut
时,Durbin认为应该用下面的h统计量检验一阶自相关。
h =
EMBED Equation.3 = (1-
)
Durbin已证明h统计量近似服从均值为零方差为1的
正态分布。可以用标准正态分布临界值对h的显著性作出检验。注意:当
>1时检验无效。
②不适用于联立方程模型中各方程的序列自相关检验。
③DW统计量不适用于对高阶自相关的检验。
(3) LM检验(亦称BG检验)法
DW统计量只适用于一阶自相关检验,而对于高阶自相关检验并不适用。利用BG统计量可建立一个适用性更强的自相关检验方法,既可检验一阶自相关,也可检验高阶自相关。BG检验由Breusch-Godfrey提出。BG检验是通过一个辅助回归式完成的,具体步骤如下。
对于多元回归模型
yt = (0 + (1x1 t + (2 x2 t + … + ( k –1 x k-1 t + ut (6.18)
考虑误差项为n阶自回归形式
ut = (1 ut-1 + … + (n ut - n + vt (6.19)
其中vt 为随机项,符合各种假定条件。零假设为
H0: (1 = (2 = …= (n = 0
这表明ut不存在n阶自相关。用估计(6.18)式得到的残差建立辅助回归式,
=
EMBED Equation.3 + … +
EMBED Equation.3 +(0 +(1x1 t +(2 x2 t + … + ( k –1 x k-1 t + vt (6.20)
上式中的
是(6.18)式中ut的估计值。估计上式,并计算可决系数R2。构造LM统计量,
LM = T R2 (6.21)
其中T表示(6.18)式的样本容量。R2为(6.20)式的可决系数。在零假设成立条件下,LM统计量渐近服从 (2(n) 分布。其中n为(6.19)式中自回归阶数。如果零假设成立,LM统计量的值将很小,小于临界值。
判别规则是,若LM = T R2 ( (2(n),接受H0;
若LM = T R2 > (2(n),拒绝H0;
(4) 回归检验法
回归检验法的优点是,(1)适合于任何形式的自相关检验,(2)若结论是存在自相关,则同时能提供出自相关的具体形式与参数的估计值。缺点是计算量大。回归检验法的步骤如下:
①用给定样本估计模型并计算残差
。
②对残差序列
, (t = 1 ,2 ,… , T ) 用普通最小二乘法进行不同形式的回归拟合。如
= (
– 1 + vt
= (1
– 1 + (2
– 2 + vt
= (
- 12 + v t
= (
+ vt
…
(3) 对上述各种拟合形式进行显著性检验,从而确定误差项ut存在哪一种形式的自相关。
5. 克服自相关
如果模型的误差项存在自相关,首先应分析产生自相关的原因。如果自相关是由于错误地设定模型的数学形式所致,那么就应当修改模型的数学形式。怎样查明自相关是由于模型数学形式不妥造成的?一种方法是用残差
对解释变量的较高次幂进行回归,然后对新的残差作DW检验,如果此时自相关消失,则说明模型的数学形式不妥。
如果自相关是由于模型中省略了重要解释变量造成的,那么解决办法就是找出略去的解释变量,把它做为重要解释变量列入模型。怎样查明自相关是由于略去重要解释变量引起的?一种方法是用残差
对那些可能影响因变量但又未列入模型的解释变量回归,并作显著性检验,从而确定该解释变量的重要性。如果是重要解释变量,应该列入模型。
只有当以上两种引起自相关的原因都消除后,才能认为误差项ut “真正”存在自相关。在这种情况下,解决办法是变换原回归模型,使变换后的随机误差项消除自相关,进而利用普通最小二乘法估计回归参数。这种变换方法称作广义最小二乘法。下面介绍这种方法。
设原回归模型是
yt = (0 + (1x1 t + (2 x2 t+ … + ( k x k t + ut (t = 1, 2, …, T ) (1.19)
其中ut具有一阶自回归形式
ut = ( ut-1 + vt
其中vt 满足通常的假定条件,把上式代入(1.19)式,
yt = (0 + (1 x1 t +(2 x2 t + … + (0 xk t + ( ut - 1 + vt (1.20)
求模型(1.19)的 (t - 1) 期关系式,并在两侧同乘 (,
( yt -1= ( (0 + ( (1 x1 t -1 + ( (2 x2 t -1 + … + ( (k xk t - 1 + ( ut - 1 (1.21)
用(1.19)式与上式相减得
yt - ( yt -1 = (0 (1 - () + (1 (x1t - ( x1 t-1) +… + (k ( xk t - ( xk t -1) + vt (1.22)
令
yt* = yt - ( yt -1 , (1.23)
xj t* = xj t - ( xj t - 1, j = 1 , 2 , … k (1.24)
(0* = (0 (1 - ( ), (1.25)
则模型(1.22)表示如下,
yt* = (0*+ (1 x1 t* + (2 x2 t* +… + (k xk t* + vt ( t = 2 , 3 ,… T ) (1.26)
上述变换称作广义差分变换。上式中的误差项vt是非自相关的,满足假定条件,所以可对上式应用最小二乘法估计回归参数。所得估计量具有最佳线性无偏性。上式中的 (1 … (k 就是原模型(1.19)中的 (1 … (k,而 (0* 与模型(1.19)中的 (0 有如下关系,
(0* = (0 (1 - (), (0 = (0* / (1 - () (1.27)
注意:
(1)对(1.19)式进行OLS估计得到的(0, (1, … , ( k的估计量称作普通最小二乘估计量;对(1.26)式进行OLS估计得到的(0, (1, , … , ( k的估计量称作广义最小二乘估计量。
下图是以如下一元线性回归模型
yt = 0.5 + 0.8 xt + ut , ut = (1 ut-1 + vt
为基础用蒙特卡罗模拟方法给出四条关于(1的半个置信区间的收敛曲线。由上至下四条收敛曲线的设定条件见下表:
收敛曲线
(1
xt
估计方法
T = 50时的收敛相对比率
1
(1=0.7(有自相关)
I(1)+t
OLS
2.71
2
(1=0.7(有自相关)
I(1)+t
GLS
2.09
3
(1=0 (非自相关)
I(1)
OLS
1.20
4
(1=0 (非自相关)
I(1)+t
OLS
1.00
注:(1)由设定条件知yt 与xt 存在协整关系。
(2)下图横轴表示样本容量。曲线到横轴的垂直距离为置信区间半径(收敛于真值的半径)。
曲线①、②、③、④的收敛相对比率是以曲线④的置信区间半径为1的计算结果。图中
可见样本容量越大估计越准确。自相关条件下GLS估计量优于OLS估计量。
图1.3 图中横轴表示样本容量。曲线到横轴的垂直距离
为置信区间半径(收敛于真值的半径)。
(2)这种广义差分变换损失了一个观测值,样本容量变成(T- 1)。为避免这种损失,K. R. Kadiyala(1968)提出对yt与xj t的第一个观测值分别作如下变换。
y1* = y1
x j 1* = xj 1
, ( j = 1 , 2 , … k )
于是对模型(1.26),样本容量仍然为T。
这种变换的目的就是使相应误差项u1的方差与其它误差项u2, u3,…uT,的方差保持相等。作上述变换后,有
u1* = u1
则
Var(u1*) = (1 - (2 ) Var(u1)
把(1.10)式代入上式,
Var(u1*) = (1 - ( 2 ) [(v 2 / (1 - ( 2 )] = (v 2
u1与其他随机误差项的方差相同。
(3)当误差项ut 的自相关具有高阶自回归形式时,仍可用与上述相类似的方法进行广义差分变换。比如ut具有二阶自回归形式,
ut = (1 ut- 1 + ( 2 ut– 2 + vt ,
则变换过程应首先求出原模型(t-1)期与(t-2)期的两个关系式,然后利用与上述相类似的变换方法建立符合假定条件的广义差分模型。若ut具有k阶自回归形式,则首先求k个不同滞后期的关系式,然后通过广义差分变换使模型的误差项符合假定条件。
需要注意的是对二阶自回归形式,作广义差分变换后,要损失两个观测值;对k阶自回归形式,作广义差分变换后,将损失k个观测值。
(4)当用广义差分变量回归的结果中仍存在自相关时,可以对广义差分变量继续进行广义差分直至回归模型中不存在自相关为止。
6. 克服自相关的矩阵描述
对于线性回归模型
Y = X( + u (1.28)
假定E(u u ') = ( 2I 不成立。误差项ut 具有一阶自回归形式自相关,
ut = ( u t -1 + vt
则Cov(u) 由 (1.12) 式给出
Cov(u) = E(u u ' ) = ( = (u 2
其中(u2 = (v 2 / (1 - ( 2)。取
M =
(按K. R. Kadiyala 提议补上第一个观测值)
使
M ( M ' = (v 2 I (1.29)
用M左乘模型(1.28),
M Y = M X ( + M u (1.30)
令
Y* = M Y, X* = M X, u* = M u
则模型(1.30)表示为
Y* = X*( + u* (1.31)
其中
u* = M u =
EMBED Equation.3 =
=
(1.34)
(1.32) 和(1.33)式中带*号变量的变换规则与(1.24)和(1.25)式中相应带*号的变量变换规则相同,所以模型 (1.31) 是广义差分变换模型。因为
Var(u*) = E[u*u*' ] = E[
EMBED Equation.3 ]
= E
=
= ( v2 I
说明变换后模型(1.31)的误差项中不再有自相关。用普通最小二乘法估计 (1.31) 式中的 (。
= (X* ' X*) -1 X* ' Y*. (1.35)
则
具有最佳线性无偏性。
把原数据代入(1.35)式
= [(M X )' (M Y ) ] –1 (M X )' (M Y ) = (X ' M ' M X ) –1 X ' M ' M Y
= (X ' ( -1 X) – 1 X ' ( - 1 Y, (1.36)
其中 M ' M = ( -1 =
. (1.37)
7. 自相关系数的估计
上一节介绍了解决自相关的方法。这种方法的应用还有赖于知道 ( 值。下面介绍两种估计 ( 的方法。
(1) 用DW统计量估计(。
由(1.17)式,DW = 2 (1 -
),得
= 1 -(DW / 2) (1.41)
首先利用残差
求出DW统计量的值,然后利用上式求出自相关系数 ( 的估计值。
注意:①用此法时样本容量不宜过小。②此法不适用于动态模型(即被解释变量滞后项做解释变量的模型)。
(2) 用残差直接自回归的方法估计((特别对高阶自回归形式)。
8. 案例分析
案例1 天津市城镇居民人均消费与人均可支配收入的关系(file:AUTOCO6)
改革开放(1978~2000)以来,天津市城镇居民人均消费性支出(CONSUM),人均可支配收入(INCOME)以及消费价格指数(PRICE)数据见下表。现在研究人均消费与人均可支配收入的关系。
先定义不变价格(1978=1)的人均消费性支出(Yt)和人均可支配收入(Xt)。令
Yt = CONSUM / PRICE
Xt = INCOME / PRICE
得散点图如图1。显然Yt和Xt服从线性关系。
图1 Yt和Xt散点图 图2 残差图
(1)估计线性回归模型并计算残差
用普通最小二乘法求估计的回归方程,得结果如下。
= 111.44 + 0.7118 Xt (1.42)
(6.5) (42.1) R2 = 0.9883, s.e. = 32.8, DW = 0.60, T = 23
(2)检验误差项 ut是否存在自相关
已知DW = 0.60,若给定( = 0.05,查附表,dL = 1.26,dU = 1.44。因为 DW = 0.60 ( 1.26, 依据判别规则,认为误差项ut存在严重的正自相关。
BG(LM)自相关检验辅助回归结果是
= 0.6790
-1 + 3.1710 – 0.0047 Xt + vt
(3.9) (0.2) (- 0.4) R2 = 0.43, DW = 2.00
LM = T R2 = 23 ( 0.43 = 9.89
因为(20.05(1) = 3.84,LM = 9.89 > 3.84,所以BG(LM)检验结果也说明(1)式存在自相关。
(3)用广义最小二乘法估计回归参数
首先估计自相关系数
。依据式,
= 1 -
= 1 -
= 0.70
对原变量做广义差分变换。
GDYt = Yt - 0.70 Yt -1
GDXt = Xt - 0.70 Xt – 1
以GDYt, GDYt,t = 2 , 3 , … 22, 为样本再次回归,得
GDYt = 45.2489 +0.6782 GDXt (1.43)
(3.7) (20.0) R2 = 0.95, s.e. = 23.2, DW = 2.31, (1979-2000)
查附表4,dL = 1.26,dU = 1.43,因为DW = 2.31 < (4 -1.43) = 2.57,依据判别规则,已消除自相关。残差图见图3。
图3 残差图
由(1.46)式,
* = 45.2489。依据(1.43)式,
=
*/(1-
) = 45.2489/(1-0.70) = 150.8297
则原模型的广义最小二乘估计结果是
= 150.8297 + 0.6782 Xt
用普通最小二乘估计结果是
= 111.44 + 0.7118 Xt (1.44)
(6.5) (42.1) R2 = 0.9883, s.e. = 32.8, DW = 0.60, T = 23
注意:
(1)回归方程(1.43)与(1.42)相比,R2值有所下降。不应该因此不相信(1.43)式的结果。原因是(1.43)式中的变量是广义差分变量,而不是原变量,所以致使R2值下降。两个回归式所用变量不同,两个R2之间没有可比性。
(2)(1.43)式中的回归系数与(1.44)式中的回归系数有差别。计量经济理论认为用广义差分变换模型得到的回归系数估计量的特性优于误差项存在自相关的模型。所以模型(1.43)中的回归系数的统计特性更好,0.6782比0.7118更可信。从实际情形分析,特别是最近几年,消费的收入边际系数0.6782更可信,0.7118偏高。
(3)用EViews生成新变量的方法如下。假设已经建立关于CONSUM,INCOME和PRICE的工作文件。假设变量Yt和Xt分别用Y和X表示,从工作文件主菜单中点击Quick键,选择Generate Series …功能。这时会打开一个生成序列(Generate Series by Equation)对话框。在对话框中输入如下命令(每次只能输入一个命令),
Y = CONSUM / PRICE
X = INCOME / PRICE
按OK键。变量Y和X将自动保存在工作文件中。EViews的OLS估计方法见第2章。
用EViews进行BG(LM)自相关检验非常方便。以(6.42)式为例,具体步骤如下。在(6.42)式回归输出窗口中点击View键,选择Residual Tests/Serial Correlation LM Test …功能,会弹出一个设定滞后期(Lag Specification)对话框。输入1,点击OK键,就会得到LM = T R2 = 9.89的BG(LM)检验结果。
案例2(天津保费收入和人口的回归关系(二阶广义差分))(file:autoco5)
1967-1998年天津市的保费收入(万元)和人口(万人)散点图如下。
Lnyt = -11.18 + 0.0254 xt (1.47)
(-20.9) (37.2) R2 = 0.9788, s.e. = 0.34, DW = 0.36 (1967-1998)
(1.47) 式残差图 (1.48) 式残差图
对残差进行二阶回归
= 1.186
- 0.467
+ vt
(6.9) (-2.5) R2 = 0.71, s.e. = 0.19, TR2 = 1.6 (1969-1998)
推导二阶自相关ut = (1ut – 1+(2ut –2 + vt的广义差分变换式。设模型为
yt = (0 + (1 xt + ut (1.48)
写出上式的滞后一期、二期表达式并分别乘(1、(2:
(1 yt-1 = (1(0 + (1(1 xt-1 + (1ut -1 (1.49)
(2 yt-2 = (2(0 + (2(1 xt-2 + (2ut -2 (1.50)
用以上三式做如下运算,
yt -(1 yt-1 -(2 yt-2 = (0 -(1(0 - (2(0 + (1 xt - (1(1 xt-1 - (2(1 xt-2 + ut -(1ut - 1-(2ut -2
(yt -(1 yt-1 -(2 yt-2) = (0 (1- (1 - (2) + (1 (xt - (1 xt-1- (2 xt-2) + vt (1.51)
作二阶广义差分(注意:不要用错符号)。
GDLnyt = Lnyt -1.186 Lnyt-1 +0.467 Lnyt-2
GDxt = xt -1.861 xt-1 + 0.467 xt-2
广义最小二乘回归
GDLnyt = -3.246 +0.0259 GDxt (1.52)
(-10.0) (17.9) R2 = 0.92, s.e. = 0.19, DW = 1.99 (1969-1998)
由(1.48)式,因为
(0 (1 -1.186 + 0.467) = -3.246
(0 = -11.55
所以,原模型的广义最小二乘估计是
Lnyt = -11.55 + 0.0259 xt (1.53)
案例3 中国宏观消费分析(file:china)
按照我国现行国民经济核算体系,国内生产总值(按支出法计算)是由最终消费、资本形成总额和货物与服务的净出口之和三部分组成。前两部分占绝大多数。其中最终消费又分为居民消费和政府消费两类。而居民消费又可分为农村居民消费和城镇居民消费。
在这种核算体系下,居民消费包括居民个人日常生活中衣、食、住、用等物质消费以及在文化生活服务性支出中属于物质产品的消费。
政府消费包括国家机关、国防、治安、文教、卫生、科研事业单位,经济建设部门的事业单位,人民团体等非生产机构使用的燃料、电力、办公用品、图书、设备等物质消费。
国内生产总值中最终消费与资本形成总额的比例关系,即旧核算体系下国民收入中消费与积累的比例关系是国民经济正常运行的最基本的比例关系。如果这一比例关系发生严重失调,最终会成为制约经济正常运行的严重障碍。
下面分析中国的消费问题。为消除物价变动因素以及异方差的影响,以下分析所用的数据均为不变价格数据(1952 = 1)以及分别取自然对数后的数据。
图1.1给出不变价格的国内生产总值与消费曲线,图1.2和图1.3分别给出国内生产总值与消费的年增长率曲线。
图1.1 国内生产总值与消费(不变价格)曲线 图1.2 国内生产总值年增长率曲线
由图1.1、1.2可以看出国内生产总值与消费的增长都很快。国内生产总值曲线的波动幅度相比较大。消费曲线的波动幅度相对较小。这与宏观消费行为具有“惯性”有关。他既不可能随时间突然大幅增加,也不可能随时间突然大幅减少。
表1 改革前后两个时期年平均增长率及其标准差的比较
1952-1978
1979-2002
平均增长率
年增长率的标准差
平均增长率
年增长率的标准差
GDP
5.76%
0.10
9.15%
0.044
消费
4.79%
0.05
9.18%
0.040
图1.3 国内生产总值年增长率曲线 图1.4 消费额年增长率曲线
首先结合图1.3对国内生产总值序列的增长率变化做进一步分析。1952-1957年国民收入呈较稳步发展。以不变价格计算,平均年增长率为7.97%。1958年开始的大跃进使经济发展速度突然加快。在
经济体制下,这种人为的提高经济发展速度超出了国家物质基础所能承受的限度,所以在维持了短短两年超高速增长(1958年的年增长率为16.9%,1959年的年增长率为11.4%)之后,经济发展便出现了大倒退。1960年几乎为零增长。1961和1962年连续2年出现建国以来从未有过的负增长(分别为-27.2% 和 -11.1%)。由于国家及时采取了一系列经济调整措施,1963-1966年国民经济迅速得到恢复,并出现持续高增长态势。上述4年的增长率分别为17.8%, 15.8%, 16.1% 和12.5%。1966年开始的文化革命使中国经济进入一个很不稳定的发展阶段。1967和1968年国民经济再度出现负增长,随后经济发展出现“振荡”现象。自1978年实行改革开放政策以来,在由计划经济向市场经济转变过程中,经济发展突飞猛进。
1952-1978年国民收入年平均增长率为5.76%。1978-2002年的年平均增长率为9.15%。后一时期是前一时期的1.6倍(不变价格)。年增长率的标准差却比前一时期减小了一倍多。说明经济波动减小,宏观管理更加成熟。在后一时期里,经济增长速度如此之高,持续时间如此之长,发展趋势如此之稳定,在我国的经济发展史上是没有先例的。
图1.5 消费率、居民消费率曲线 图1.6 居民消费与总消费比的变化曲线
下面分析消费率(消费额 / 国内生产总值,1952-2002)序列的变化。见图1.5,总的来说变化幅度较大。
(1)从趋势看,中国宏观消费比率、居民消费率值的变化是逐年下降。消费比率数据对时间t(1952 =1)的回归结果如下:
ratio = 0.7581 – 0.0036t
(62.9) (-8.8) R2 = 0.61 (1952-2002)
51年间消费比率值平均每年减少0.0036。
居民消费率数据对时间t(1952 =1)的回归结果如下:
houratio = 0.7117 – 0.0049 t
(59.4) (-12.1) R2 = 0.75 (1952-2002)
51年间居民消费率平均每年减少0.0049。居民消费率下降快,是由于居民消费对总消费比的下降造成的。
(2)以1978年为界,改革开放之前(1949(1978)消费比率曲线波动大,改革开放之后(1979(2002)消费比率曲线波动小(见图1.5和表1)。1952(1978年宏观消费比率值的均值是0.7057,标准差是0.0656。1979-2002年宏观消费比值的均值是0.6206。标准差是0.0324。改革开放以后宏观消费比率值平均比改革开放前下降0.085。随着时间的推移,消费比率的均值减小,标准差减小。改革开放之后标准差减小说明宏观消费比率值的波动在减小,中央政府调控宏观经济的能力逐步在提高。
(3)宏观消费比率的最小值是0.5660,最大值是0.8379。都发生在上世纪50年代末和60年代初的经济困难时期。最小值0.5660发生在1959年是由于基本建设投资的极度扩张造成的(1958和1959年基本建设投资的年增长率分别是87.7%和30.0%)。最大值是0.8379发生在1962年是由于执行经济调整政策,首先解决人民生活所致。
(4)中国宏观消费比率值自1993年起跌破0.60大关。1995年达到最低点0.575。近10年来,宏观消费比率值基本上在0.60以下徘徊,平均值是0.5876。在中央政府努力扩大消费的政策下虽然宏观消费比率值在1999和2000年回升至0.60以上,但2001和2002年又跌落到0.60以下。当然这并不意味着中国宏观消费绝对值的减少。相反,宏观消费总量一直在快速提高。因为固定资产投资以更快的速度增长,所以导致宏观消费比率值偏低。
表2 中国消费比率数据的特征数
特征数名称
消费比率的特征数(1952~1978)
消费比率的特征数(1979~2002)
均值
0.7057
0.6206
标准差
0.0656
0.0324
极大值
0.8379
0.6751
极小值
0.5660
0.5749
变异系数
0.0930
0.0522
样本容量
27
24
注:(1)消费比率 = 中国宏观消费 / GDP。
(2)1952~1999年消费和GDP数据摘自《新中国五十年统计资料汇编》,1999
中国统计出版社。2000~2002年消费和GDP数据摘自《中国统计年鉴》,
2003,中国统计出版社。
(3)消费比率数据的特征数用消费比率数据计算。
(5)图1.6给出居民消费占总消费的比率曲线。该比值从0.91直线下降至0.76。这一方面反映出政府消费越削越增的过程,同时也反映出居民消费占总消费的比率变得更小。
中国宏观消费比率的国际比较
共选择6个工业发达国家和4个发展中国家和地区的GDP和宏观消费数据经计算后,与中国进行宏观消费比率的对比。6个工业发达国家是英国、美国、法国、意大利、加拿大和日本(GDP和消费均为年度数据,德国由于数据不全未选)。4个发展中国家和地区是菲律宾、墨西哥、香港(GDP和消费均为季节数据)和韩国(GDP和消费为年度数据)。上述10个国家和地区的宏观消费比率曲线与中国宏观消费比率曲线的对比分别见图1.7和图1.8。11个国家和地区宏观消费比数据的5个特征数见表2。结合图1.7和图1.8以及表2,分析如下:
图1.7 美国、英国、加拿大、法国、意大利、日本与中国的消费比率曲线比较
图1.8 墨西哥、香港、菲律宾、韩国与中国大陆的消费比率曲线比较
(1)在这11个国家和地区中,无论是和工业发达国家还是发展中国家和地区相比,中国的宏观消费比率是最低的。
(2)年平均消费比率在0.7以上的国家按消费比率值大小顺序排列是英国、菲律宾、美国、法国、意大利、加拿大和墨西哥。年平均消费比率在0.6~0.7之间的国家是日本、香港、韩国和中国。显然,这种差别与文化传统有着密切的联系。前7个国家都是具有西方文化色彩的国家;而后4个国家都是具有东方文化色彩的国家。
(3)从消费比率的标准差和变异系数来看,排除菲律宾、墨西哥和香港(这3个国家的数据为季节数据,他们的方差与其他国家无可比性),中国和韩国是消费比率值变化最大的国家。中国消费比率标准差是变化最小的法国和意大利的3倍多。在消费比率低于0.7的国家与地区中,日本和韩国的消费比率曲线是先降后升;香港呈震荡变化特征;而中国则是呈逐年下降趋势。
(4)中国的消费比率值为什么呈一路下滑趋势?主要原因是全国固定资产投资增长率(2002年是13.1%)多年来远远高于消费的增长率(2002年是5.8%),从而导致消费比率值连年下滑。
(5)中国目前的宏观消费比率这样低好不好?从长期看不好,应该改变消费与GDP之间的这种低比例关系。原因有四。①宏观消费和固定资产投资是维持经济高增长的两个最重要因素。在经济高增长条件下,消费比率偏低是靠连年的固定资产投资高增长率维持的。而连年的固定资产投资高增长率必然带来人力、物力和财力的瓶颈现象。中国近年来之所以没有出现像大跃进时期的物力和财力的瓶颈现象,主要是依靠外国直接投资和借外债支撑的。但长期借外债后,还款将成为一个沉重负担,同时经济长期超高速发展,高素质人才的缺乏将变得越来越突出。这些因素制约固定资产投资的超高速增长将随着时间的延长越来越突出。②若没有一个合理的消费比率做支撑,高投资比率将得不到延续,最终导致产品相对过剩和积压,经济发展速度下降。③提高消费比率,维持消费的高增长同样能带来经济的高增长。因为提高消费比率主要刺激的是第三产业的发展。第三产业的发展在促进经济增长的同时,还可以扩大劳动力的就业。为人民政府解决待业问题减轻压力。目前在这方面还有很大的潜力。以2002年为例,全国第三产业产值占GDP的比例只有0.34。④以经济建设为中心,不断提高中国人民的物质与精神生活水平是我们党和国家的工作重心,宏观消费比率长期保持低位不是我们的目的。
基于我国54年经济发展经验以及目前的经济发展规模,把年消费率平均值控制在0.65-0.70是比较合理的模式。
下面通过建立宏观消费计量经济模型进一步分析我国消费与国民收入的定量关系。(以下所用数据(1952-2002,file:China)均以不变价格(1952 = 1)计算。)
1952-2002年国内生产总值与消费额散点图见图1.10。说明消费与国内生产总值之间存在高度的线性关系。
(1)OLS估计
用CPt表示消费额(不变价格),GDPt表示国内生产总值(不变价格),用1952-2002年数据得消费函数的OLS估计结果如下:
= 164.0124 + 0.5919GDPt (1.1)
(5.2) (159.9)
R2 = 0.998, DW = 0.67, s.e. = 167.45
图1.10 国内生产