内生性问题
内生性问题与工具变量和两阶段最小二乘
一、背景
虽然在OLS的大样本性质中,我们放宽了强外生性的假定,用弱外生条件
,Ex()0,,来进行替代,即。但是,在实际的问题中,弱外生性的条件往往也是不容易满足的。也就是说,变量的内生性问题总是不可避免的。内生性引起的问题主要是引起参数估计的不一致。可以说,内生性问题是在实际应用中最经常遇到的问题。这个部分讨论的就是如何解决由内生性问题引起的参数估计的不一致。
二、知识要点
1、引起内生性的原因及其对参数估计的影响
2、代理变量法解决内生性问题
3、工具变量法和2SLS的性质
三、要点细纲
1、引起内生性的原因及其对参数估计的影响
,1,模型设定偏误,遗漏变量,
这主要是因为实际的问题中,一个变量往往受到许多变量的影响,在实际建模过程中无法将解释变量全部列出。在这样的情况下,遗漏的变量的影响就被纳入了误差项中,在该遗漏变量与其他解释变量相关的情况下,就引起了内生性
,Ex()0,,问题。即。
,2,测量误差
关于测量误差引起内生性的问题要基于测量误差的假设。测量误差可能是对被解释变量y的测量误差,也可能是由于对解释变量的测量误差。这两种情x
况引发的结果是不一样的。
A. 被解释变量y的测量误差。
*不妨假设y的真实值是,测量值为y,则可以将测量误差表示成:y
*eyy,,。假设理论的回归方程为: 0
*yxx,,,,,,,,? 011kk
将测量误差方程带入得到:
yxxe,,,,,,,,,? 0110kk
,,,,,,,xxv? 011kk
其中是实际回归方程的残差。显然,由于的测量误差是与相yve,,,ex00i
互独立的,所以实际回归方程的残差也与各解释变量相互独立(无关)。外生v
性条件满足。
B. 解释变量x的测量误差
yxx,,,,,,,,?假设在回归式中,测量误差产生于,即实际x011kkk回归式为:
*yxx,,,,,,,,? 011kk
*exx,,并有 kkk
如果假设,则将测量误差带入方程得到: cov(,)0xe,kk
,,,,,,,xxv?yxxe,,,,,,,,,,? 011kk011kkkk
显然,外生性条件满足。
**2cov(,)0cov(,)cov(,)xexexee,,,,,,如果假设。该假设条件kkkkkkke
称为Classical error-in-variables(CEV)假定。
由上述方程可以看出,此时测量误差会引起内生性问题。
( 3) 双向交互影响,或者同时受其他变量的影响,
这种情况引起的内生性问题在现实中最为常见。其基本的原理可以阐述为,
被解释变量y和解释变量之间存在一个交互影响的过程。的数值大小会引起xxy取值的变换,但同时y的变换又会反过来对构成影响。这样,在如下的回归x
方程中:
yxx,,,,,,,,? 011kk
如果残差项的冲击影响了的取值,而这样的影响会通过传导到上,yy,x
从而造成了和残差项的相关。也就是引起了内生性问题。 x,
这里举几个简单、但经常遇到的例子说明。 例1:金融发展与经济增长
例2:外商直接投资FDI与经济增长 例3:犯罪率与警备投入
2、代理变量(Proxy)法解决内生性问题 考虑如下的回归方程
yxxq,,,,,,,,,,? 011kk
其中,q是不可观测的变量(遗漏),假定z是对q的一个代理,z必须满
足下列条件:
EyqzEyq(|,,)(|,)xx,(1)
EqzEqz(|,)(|)x,(2)
qzr,,,,, 01
代理变量的缺点:
A、当有交互效应时会引起异方差问题 B、在实际问题中,通常对遗漏的变量是难以意识到的。
C、约束条件太强。
3、工具变量法和2SLS的性质
这里先讨论简单工具变量法,两阶段最小二乘2SLS是简单工具变量法的
一个扩展。
关于工具变量的大样本假设
,ZZLL,?、是一个有限、可逆的维正定矩阵。 plim=Qzzn
,ZXLK,?、是一个有限的的矩阵,并且该矩阵的秩是K。 plim=Qzxn
,Zε?、plim=0 n
,1,简单工具变量
考虑如下一个回归方程:
yxx,,,,,,,,,? 011kk
xx是内生的,也就是说,与残差项相关。在这样的情况下,现在假设,kk得到的参数估计值是有偏的。
再次强调,此时参数估计的偏差不仅仅存在于参数上,而是所有的参数,k
估计值都会受到影响。看普通最小二乘的结果:
,,11,,,,pbEEEElim()()()(),,,xxxyxxx,ε ,,,,
k,2其中,不妨设,则有:
2xx,,,xxx,,,,11112,,, xx,,xxx,,,,,,,,,,122xx,xxx22,,,,212,,
,11112x,,,,,qq,,X()XX,,1,,,,11,, plimpExxlim(),,,,,,,,,,,2122,,xnnqq,,,,,22,,,,
11121112x,,,,,qxqx,,,qq,,111122则可以看出: ,,,,,,,21222122x,qxqx,qq,,22,,,,1122,,
显然,当
现在回到一般的回归方程:
yxx,,,,,,,,,,,,?xβ 011kk
zzx仍然假设是内生的,如果可以找到一个工具变量,使得满足如下两11k
条假定:
Ezx()0,?、 1k
Ez()0,,?、 1
,z,(,,,,)xxxz?z那么,就可以定义,方程两边左乘,同取期望,1211k,得到参数估计值,使得:
,,11,,,,pEEEElim()()()()bzxzyzxz,,,,ε,,,, IV
但是,这样的简单工具变量得到的估计并不是无偏的(特殊的得到无偏估
zx计的情况是:与其他外生变量无关,只和相关)。正确的做法是,将内生变1k
x量对所有的外生变量进行投影(回归),也就是按照如下的公式计算: k
xxxzr,,,,,,,,,,? kkkk011111,,
x,,0只要系数,该工具变量就是有效的。也就是说,必须保证与是zk1
x在扣除了其他外生变量的影响下,仍然是相关的~这样,根据回归得到了的k估计值
ˆˆˆˆˆxxxz,,,,,,,,,? kkk011111,,
ˆ用估计出的代替原来的,进行OLS估计,就可以得到产生的无偏估xxkk
计。这实际上是将内生变量分成了内生部分和外生部分,通过投影得到了外生的部分,然后进入回归方程。
,2,多工具变量和两阶段最小二乘,2SLS,
多工具变量是简单工具变量的一个扩展。当我们可以找到的工具变量不只一个的时候,我们可以提高对内生变量的拟合优度。得到一个更好的估计值。另外一方面,如果一个多元回归方程中含有的内生变量个数不只一个,那么我们就必须分别找到它们各自的工具变量。总得来说,需要注意的是,工具变量的个数必须大于方程中内生变量的个数。每一个内生变量,都必须是对所有的外生变量进行投影,这样得到的参数估计才是一致的。
下面用一个具体的例子来说明。为了方便,我们仍然假设回归方程中只含
x有一个内生变量 k
yxx,,,,,,,,,,,,?xβ 011kk
(,,,)zzz?现在假设我们可以找到一组外生变量,正确的做法是: 12L
x(1)将对所有外生变量进行回归: k
xxxzzrr,,,,,,,,,,,,,,,??zα kkkLkk011111,,
z,(,,,,)xxzz??其中 111kL,
于是可以得到:
,1,,ˆxEEx,zzzz()(),, kk
x同理,对每一个外生的进行投影,也就是如下的回归: i
xxxzzrr,,,,,,,,,,,,,,,??zα,可以得到如ikkLkk011111,,
下的结果:
,1,,ˆxEExx,,zzzz()(),, iki
ˆˆˆˆˆx,,xxxxxx??(,,)(,,)(2)于是定义 1212kk
,1,,,ˆxzzzzxz,,EE()()Π,,
ˆx,,1ˆ,,xˆ2X, ,,?,,ˆxk,,
得到:
-1ˆ,,XZ(ZZ)ZXPX,, z
,,,111ˆˆˆˆˆ,,,,,,bXXXYPXPXPXYXXXY,,,()()[()()][()]()() 2SLSzzz
-1ˆ,,XZ(ZZ)ZX带入,得到: ,
,1-1-1-1ˆˆˆ,,,,,,,,,,bXXXYXZ(ZZ)ZZ(ZZ)ZXXZ(ZZ)ZY,,()()[()()][] 2SLS
-1-1,,,,,,,[()][]XZ(ZZ)ZXXZ(ZZ)ZY
,3,Proxy和IV的区别
Proxy方法是将不可观测的变量用近似的变量进行替代,也就是说,是在
残差项中提取出有用的信息,但是并没有对现有的解释变量进行处理。 而IV方法恰恰相反,它是对现有回归式中的内生变量进行的处理,找到
另外一个变量对其进行“替代”,但是对于方程的残差项没有进行任何的处理。 IV方法对工具变量有严格的外生假定条件,而Proxy不一定成立。 ,4,两阶段最小二乘的性质
?一致性
-1-1,,,,,,bXZ(ZZ)ZXXZ(ZZ)ZY,[()][] 2SLS
-1-1,,,,,,,,β[()][]XZ(ZZ)ZXXZ(ZZ)Zε
-1-1,,,,,,plim[()][]XZ(ZZ)ZXXZ(ZZ)Zε
-1-1,,,,,,,,,,XZZZZXXZZZZε,,,,,,,,,,,,,plim ,,,,,,,,,,,,,,,,nnnnnn,,,,,,,,,,,,,,,,,,,,
,Zε-1-1,,,,,,,,QQQQQ0plim ,,,,,,,,,,xzzzxzxzzz,,,,n,,所以,
plimb,β 2SLS
但是,如果在第一阶段的回归中没有包括方程中原有的外生变量,那么,
一致性就不能得到保证。假设有如下回归方程 yyu,,,zδ, 111211
z1,L1,L其中是的外生变量,是内生变量。并且有维的工具变量y1122
z。 2
yyu,,,zδ, 111211
z如果只是将对进行投影,得到如下结果: y22
,1,,ˆyZZZZy,()() 222222
ˆyyv,, 22
带入原式得到
ˆyyuv,,,,zδ,,() 1112111
δ,,1ˆxz,y令, ,,β,,,12,1,,
由OLS得到参数估计结果如下所示:
,,11ˆ,,ββ,,,,XXXuβXXXu()()
,(),vuZ,,1,,111,,,β()XX ,,ˆ()vuy,,,,211
cov(,)0zv,z因为回归中没有扣除的影响,所以一般来说,,从而造11
成参数估计的有偏。
?有效性
2SLS在第一阶段进行回归得到的结果如下:
,1,,,ˆxzzzzxz,,EE()()Π ,,
假设有另外一个关于的无偏投影: x
~,~β,其相应得到的的两阶段估计为。显然有如下两个结论成立: xz,Γβ
21,ˆ,ˆˆ ββ,,,xxAsynE.var[()][()]
211,,~,,,~~~~ AsynEEE.var[()][()][()][()]ββ,,,xxxxxx
~ˆˆ要证明的方差最小,只有证明是一βAsynAsyn.var[()].var[()]ββββ,,,
,1,,,,ˆˆ~~~~个正定的矩阵,也就是证明:是正定矩阵。 [()][()][()][()]EEEExxxxxxxx,
ˆ我们有,因此有: xx,,r
,,,,,,~ErErErEr()0()()()zx,,,,,ΓzΓz0 进而有:
,,,~~~ˆˆEErE()[()]()xxxxxx,,,
,1,,,,ˆˆ~~~~ [()][()][()][()]EEEExxxxxxxx,
,1ˆˆ,,,,,ˆˆˆˆ~~~~ ,,,[()][()][()][()]()EEEEExxxxxxxxss
-1ˆ,,ˆˆˆ~,ˆˆ~~~~其中,是对回归的残差。显然,。问题xxsx-xxxxx,[()]()EEE()ss0,
得证。
四、思考题
1、阐述引起内生性的原因及其对参数估计的影响。 2、在两阶段最小二乘中,如果在第一阶段的回归中没有包括原方程中所有
的外生变量,会引起参数估计的什么问题,请举例说明。 3、证明在第一阶段回归中将内生变量对所有外生变量进行投影后,利用简
ˆ单工具变量得到的参数估计值具有有效性。 β
小结
工具变量进行两阶段最小二乘估计的具体步骤
设有模型: gEMPgMINgPOPgGDPgGDP,,,,,,,,,,,,ttttt0112314
认为gMIN可以作为gMIN的工具变量使用。 1t
第一,gMIN对所有的外生变量进行回归,即建立如下的回归方程: 1t
gMINgMINgPOPgGDPgGDPe,,,,,,,,,,,1012314tttttt
若系数的t值显著,并且方程的整体拟合程度较好(F统计量值大于30),则该工,1
gMIN具变量是一个有效的工具变量,可以由上式得到的估计值。 gMIN1t1t
gMIN第二,将得到的估计值带入原方程进行回归,即建立回归方程: 1
gEMPgMINgPOPgGDPgGDP,,,,,,,,,,,, tttttt0112314
就可以得到方程参数的无偏估计。 z,(,,,)gPOPgGDPgGDPgMIN设 1
ˆx,,1ˆ,,x ˆ2ˆx,(,,,)gPOPgGDPgGDPgMINX,定义,且有 11,,?,,ˆxk,,
-1ˆ,,XZ(ZZ)ZXPX,,则: z
,,,111ˆˆˆˆˆ,,,,,,bXXXYPXPXPXYXXXY,,,()()[()()][()]()() 2SLSzzz
-1ˆ,,XZ(ZZ)ZX带入,得到: ,
,1-1-1-1ˆˆˆ,,,,,,,,,,bXXXYXZ(ZZ)ZZ(ZZ)ZXXZ(ZZ)ZY,,()()[()()][] 2SLS
-1-1,,,,,,,[()][]XZ(ZZ)ZXXZ(ZZ)ZY