为了正常的体验网站,请在浏览器设置里面开启Javascript功能!
首页 > 第6章 多重共线性

第6章 多重共线性

2013-12-26 44页 ppt 1MB 15阅读

用户头像

is_417983

暂无简介

举报
第6章 多重共线性nullnull第6章 多重共线性 6.1 多重共线性及其产生的原因 6.1.1 多重共线性(Multicollinearity)的定义nullnull 6.1.2 多重共线性产生的原因 根据经验,多重共线性产生的经济背景和原因有以下几个方面: 1.经济变量之间往往存在同方向的变化趋势 2.经济变量之间往往存在着密切的关联度 3.在模型中引入滞后变量也容易产生多重共线性 4.在建模过程中由于解释变量选择不当,引起了变量之间的多重共线性 6.2 多重共线性造成...
第6章  多重共线性
nullnull第6章 多重共线性 6.1 多重共线性及其产生的原因 6.1.1 多重共线性(Multicollinearity)的定义nullnull 6.1.2 多重共线性产生的原因 根据经验,多重共线性产生的经济背景和原因有以下几个方面: 1.经济变量之间往往存在同方向的变化趋势 2.经济变量之间往往存在着密切的关联度 3.在模型中引入滞后变量也容易产生多重共线性 4.在建模过程中由于解释变量选择不当,引起了变量之间的多重共线性 6.2 多重共线性造成的影响 6.2.1 完全共线性下参数估计量不存在 多元线性回归模型nullnull6.2.2 近似共线性造成的影响 1.增大最小二乘估计量的方差nullnull 2.参数估计量经济含义不合理 3.变量的显著性检验和模型的预测功能失去意义 在多元线性回归模型中,参数显著性检验的t统计量为间估计用于判断参数估计值的可靠性失去意义。变大的方差容易使预测的“区间”变大,从而降低预测精度,使预测失去意义。 4.回归模型缺乏稳定性 null6.3 多重共线性的检验 6.3.1 相关系数检验法(Klein判别法) EViews软件中可以直接计算(解释)变量的相关系数矩阵: [命令方式] COR 解释变量名 [菜单方式] 将所有解释变量设置成一个数组,并在数组窗口中点击View\Correlations。nullnullnullnullnull6.3.4 特征值检验 考察解释变量的样本数据矩阵: null 利用特征值还可以构造两个用于检验多重共线性的指标:条件数(或病态数)CN(Condition Number)和条件指数(或病态指数)CI(Condition lndex)。其指标定义为 CN=最大特征值/最小特征值 这两个指标都反映了特征值的离散程度,数值越大,表明多重共线性越严重。一般的经验法则是:CI>10即认为存在多重共线性,大于30认为存在严重的多重共线性。 6.3.5 根据回归结果判断null下的临界值,而发现:(1)系数估计值的符号与理论结果相违背;;(2)某些变量对应的回归系数t值偏低或不显著;(3)当一个不太重要的解释变量被删除后,或者改变一个观测值时,回归结果显著变化,则该模型可能存在多重共线性。 例6.3.1 分析我国居民家庭电力消耗量与可支配收入及居住面积的关系,以预测居民家庭对电力的需求量(具体数据见表6.3.1)。 表6.3.1 我国居民家庭电力消耗量与可支配收入及居住面积统计资料nullnull首先,作家庭电力消耗量电量与家庭可支配收入的回归模型,结果如下:可见,收入对用电量有很好的解释作用。 然后,作用电量与住房面积的的回归方程,结果如下:null同样,住房面积对电力也有很好的解释作用。作二元回归方程,结果如下: 表6.3.2 回归结果null住房面积的系数在方程(6.3.7)中是显著的,在方程(6.3.8)中不显著;从F统计量值可以看出,收入和住房面积对电力消费量的共同影响是显著的。 (1)相关系数检验:数组窗口中点击View\Correlations,结果如表6.3.3所示: 表6.3.3 相关系数X1与X2相关系数高达0.963124,两者高度正相关。null 图6.3.1 住房面积与收入之间的关系图 (2)辅助回归模型检验:将住房面积对收入进行回归,住房面积与收入之间存在显著的线性关系。null(3)方差膨胀因子检验:null6.4 多重共线性的解决方法 6.4.1 保留重要的解释变量,去掉次要的或可替代的解释变量 6.4.2 利用先验信息改变参数的约束形式 根据经济理论或其他信息,找出参数间的某种关系,并将这种关系作为约束条件与样本信息结合起来,进行有约束的最小二乘估计。例如,著名的Cobb-Douglas生产函数中: null 6.4.3 变换模型的形式 对原设定的模型进行适当的变换,也可以消除或削弱原模型中解释变量之间的相关关系。具体有三种变换方式,一是变换模型的函数形式;二是变换模型的变量形式;三是改变变量的统计指标。 例6.4.1 在电力消费量函数中,电力消费量与收入和住房面积之间可能是对数形式的模型,而不是线性模型。我们利用对数模型拟合上述数据,结果如下: 表6.4.1 回归结果null 与方程(6.3.8)相比,在对数模型中,收入和住房面积系数在统计上都是显著的,回归模型在整体上也是显著的。说明我们原先的线性回归模型是有误的。 null 例6.4.2 根据表6.4.2,建立我国进口需求与GNP和消费价格指数之间的关系模型。 表6.4.2 我国进口支出与GNP和消费价格指数 (单位:亿元人民币)null根据表6.4.2中的数据,回归结果如表6.4.3所示。 表6.4.3 回归结果null 回归结果表明,在5%的显著性水平下,收入和价格的系数各自均不是统计显著的。模型通过F检验。我们可以断定方程(6.4.5)中存在严重的多重共线性。为解决这个问,我们可以用实际进口额对实际收入进行回归,得到如下结果: 表6.4.4 回归结果null 这表明,实际进口额与实际收入显著正相关。这样,通过将名义变量转换为实际变量,显然削弱了原模型中的多重共线性。 6.4.4 综合使用时序数据与截面数据 在模型的参数估计中,如果模型利用的是时间序列数据,这时模型又存在多重共线性,可考虑用时间序列数据与截面数据相结合的办法来修正多重共线性对模型的影响。 6.4.5 逐步回归法 从所有解释变量中间先选择影响最为显著的变量建立模型,然后再将模型之外的变量逐个引入模型;每引入一个变量,就对模型中的所有变量进行一次显著性检验,并从中剔除不显著的变量;逐步引入——剔除——引入,直到模型之外所有变量均不显著时为止。这种消除多重共线性的方法称为逐步回归法也称Frisch综合分析法。null 具体步骤为 (1)利用相关系数从所有解释变量中选取相关性最强的变量建立一元回归模型。 (2)在一元回归模型中分别引入第二个变量,共建立k-1个二元回归模型(设共有k个解释变量),从这些模型中再选取一个较优的模型。选择时要求模型中每个解释变量影响显著,参数符号正确,调整的R2值有所提高。 (3)在选取的二元回归模型中以同样方式引入第三个变量;如此下去,直至无法引入新的变量时为止。 6.4.6 增加样本容量 6.4.7 主成分回归null6.5 分析——我国旅游市场收入函数 根据理论和经验分析,影响国内旅游市场收入Y的主要因素,除了国内旅游人数和旅游支出以外,还可能与相关基础设施有关。为此,考虑的影响因素主要有国内旅游人数X1,城镇居民人均旅游支出X2,农村居民入均旅游支出X3,并以公路里程X4和铁路里程X5作为相关基础设施的代表。统计数据如表6.5.1所示。试估计以下形式的计量经济模型: 其中,Y为全国旅游收入(亿元);X1为国内旅游人数(万人/次);X2为城镇居民人均旅游支出(元);X3为农村居民人均旅游支出(元);X4为公路里程(万km);X5为铁路里程(万km)。 表6.5.1 1994~2003年中国旅游收入及相关数据nullnull 利用EViews软件,输入Y、X1、X2、X3、X4、X5等数据,采用这些数据对模型进行OLS回归,结果如表6.5.2所示。 表6.5.2 回归结果null由此可见,该模型可决系数很高,F检验值173.353,明显显著。但是X1、X5系数的t检验不显著,而且X5系数的符号与预期的相反,这表明很可能存在严重的多重共线性。 1.多重共线性检验 (1)相关系数检验 在命令窗口键入:COR Y X1 X2 X3 X4 X5,输出的相关系数矩阵为 表6.5.3 相关系数矩阵null 由相关系数矩阵可以看出,各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性。 (2)辅助回归模型检验 建立每个解释变量对其余解释变量的辅助回归模型:nullnullnull 从以上辅助回归模型中的R2、F统计量的数值可以看出,解释变量X1 X2 X3 X4 X5之间存在较为严重的多重共线性。 (3)方差膨胀因子检验 从以上辅助回归模型可知,VIF1 =17.9;VIF2 =19.2;VIF3 =4.4;VIF4 =10.9;VIF5 =20。明显大于10,解释变量X1、X2、X3、X4、X5之间存在较为严重的多重共线性。null 2.修正多重共线性:逐步回归法 采用逐步回归的办法,去检验和解决多重共线性问题。分别做Y对X1、X2、X3、X4、X5的一元回归,结果如表6.5.4所示。 表6.5.4 一元回归结果(被解释变量为Y,下同) null 其中,含有解释变量X2的回归方程,调整的R2最大,以X2为基础,顺次加入其他变量逐步回归,结果如表6.5.5所示。 表6.5.5 加入新变量的回归结果(一)null经比较,新加入X4的方程,其调整的R2=0.972,改进最大,而且各参数的t检验显著,选择保留X4,再加入其他新变量逐步回归,结果如表6.5.6所示。 表6.5.6 加入新变量的回归结果(二)null 在X2、X4基础上加入X3后的方程,其调整的R2=0.987明显增大,而且各个参数t检验都显著。加入X1后不仅调整的R2下降,而且X4参数的t检验变得不显著。加入X5后不仅调整的R2下降,X5参数的t检验不显著,甚至X5的符号也变得不合理。 保留X3,再加入其他新变量逐步回归,结果如表6.5.7所示。加入X1后调整的R2没有改进,而且X1参数的t检验不显著。加入X5后虽然调整的R2略有改进,但X5参数的t检验不显著,并且参数为负值不合理。这说明X1、X5引起严重多重共线性,应予剔除。null表6.5.7 加入新变量的回归结果(三)最后修正严重多重共线性影响的回归结果如表6.5.8所示。 表6.5.8 最终回归结果nullnull 这说明,在其他因素不变的情况下,当城镇居民人均旅游支出X2和农村居民人均旅游支出X3分别增长1元,公路里程X4每增加1万km时,国内旅游收入Y将分别增长4.216亿元、3.222亿元和13.629亿元。
/
本文档为【第6章 多重共线性】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索