一元线性回归方程有关检验问
的研究
ValueEngineering?1?
一
元线性回归方程有关检验问题的研究
LinearRegressionEquationStudyofRelevantInspectionQuestion 张敏静?ZhangMinjing;刘雅娜?LiuYana;薛志群?XueZhiqun
(?石家庄学院,石家庄050035;?石家庄铁道学院,石家庄050043)
((~)ShijiazhuangUniversity,Shijiazhuang050035,China;(~)ShijiazhuangRailwayInstit
ute,Shijiazhuang050043,China)
摘要:文章从数学角度给出T检验,F检验,相关系数的显着性检验三者一致性证明;
明确了决定系数和残差分析在诊断回归效果中的作
用.利用三spss软件实例分析,使得一元线性回归问题中的几种检验间的关系及作
用进一步明确.
Abstract:ThisstudyattemptstotestifythecoherenceofT—test,F—
testandTestofSignificanceofcorrelationcoefficientfrommathematicalangle,
whichcanc0nfirmtheroleofresidualanalysisinregressiondiagnosis.Ourresearchfurthercl
arifiestherelationshipbetweentheseseveraltestsandtheir rolesinsimplelinearregression,usingExcelsoftware. 关键词:一元线性回归;显着性检验;残差分析
Keywords:simplelinearregression;TestofSignificance;residualanalysis 中图分类号:0151文献标识码:A
0引言
问题的提出:一元线性回归是描述两个变量之间统计关系的最
简单的回归模型,通过模型的建立过程,我们可以了解到回归分析
方法的基本统计思想及他在实际问题中的应用原理.回归分析的主
要任务就是通过n组样本观测值(x.,Y.)(i=1,2,3…n)采用OLSE法
和MLE法对,p.做出估计得到变量Y关于x的经验回归方程Y=
6.+.x,但实际中这个方程能不能直接拿来做因素分析或预测呢? 由于所做估计受到观测值得影响,这个方程必须经过必要的回归检 验,只有这些检验都通过才可以为我们所用.这就出现如何选择检 验量进行检验的问题.本文我们就来研究有关检验的问题. 文中通常假设8;,N(0,2),
记L(i—i)=(y;一)'=(
.
一
)(yl-y),
1变量x与v间的线性关系检验
1.1t检验用于回归系数的显着性检验,即检验因变量v对自 变量x的影响程度是否显着.
检验的原假设:H:p=0
对立假设:HI:B1?0
当原假设成立时pA
.,N10,},
此时p,在0附近波动,构造t统计量
t:一一:一
131V%/x(1)
V/LX仃
其中=(y一9;)'是0-2的无偏估计
则t~t(n一2),若显着性水平为0【,有如下结论: 1tItlItl<t
拒绝原假设H.I接受原假设
口,显着不为0,y对x一元线性回归成立1B为0,y对x一元线性回归不成立
1.2F检验
从回归效果检验方程的显着性.
SST=SSR+SSE,
其中SST=?(v:一y)称为总平方和
基金项目:国家自然科学基金资助项目(基金编号10872136o 作者简介:张敏静(1967一),女,河北石家庄人,副教授,硕士,研究方向为算 子逼近论;刘雅娜(1974一),女,河北石家庄人,讲师,硕士,研究 方向为算子逼近论;薛志群(1965一),男,河北鹿泉人,教授,硕 士,研究方向为非线性分析及应用.
文章编号:1006—4311(2012J02—0001—02
的简单相关系数.它的取值范围为lrI1,查相关系数的检验
得到 相关系数绝对值的临界值,一般地,当大于表中0【=5%相应值,但 小于0【:1%相应值时,称x与v有显着的线性关系;当Irl大于表中 =
1%相应值时,称x与v有高度显着的线性关系;当Irl~Jx于表中0【= 5%相应值时,称X与v无明显的线性关系.
也可以构造统计量t=毕(3)
l—
此时t,t(n一2),当hit(n一2),回归系数显着不为0,有时直接 按P值(Sig)判定.
2三种检验的一致性关系
2.1回归系数显着性的t检验与相关系数显着性的t检验等价 (1)式等于(3)式,事实上
AAA
.一p一p,/一,v/n一2p,/Lx
,//Lx盯A,/一
AA
一,/n一2B,/k一,/n一2B,/
面
:
三:至鱼A:!至
A2
瓜卜
因此,对于同一组观测值两个t检验量值相同,都服从自由度 为n一2的t分布.
?
2?价值
2.2F检验与两个t检验的等价
F统计量(2)式是t检验量的平方,事实上
一SSR/!==舞由此可见,对一元线性回归三种检验实际只需做一种即可,三 种检验只是从不同角度做了分析,结果是一致的.
一
个线性回归方程通过了t检验,F检验或相关系数的显着性 检验中任何一种,就表明变量x与Y之间线性关系是显着的,或说 线性回归方程有效,但这并不能保证拟和的效果好,要用这个方程 进行分析或预测之前还必须看他拟合效果如何,这就要考察决定系 定义回归平方和与总离差平方和之比为决定系数,也称为判 定系数.记为r2,即r2:Z2,kL-y
?(一)
决定系数r2是一个回归直线与样本观测值拟和优度的相对指 标,反映了因变量的变异中能用自变量解释的比例,0<Ir2l<1.一般 地,决定系数与1越接近,因变量不确定性的绝大部分能由回归方 程解释,回归方程拟和忧度就好,反之效果就不好,应该修改. 3.2残差e.
=y一=y.一一px.
标隹化残差ZRE.
=
【丁
学生化残差sRF.
ei
1
_二二hI其中h?+
,/一"x
以自变量x(或以y)做横轴,以残差(
化残差或学生化残 差)做纵轴,做出相应的残差点得到残差图,一般来说残差如果围 绕e=0随机波动,拟合效果较好,回归方程满意.否则的话要具体 分析.
4实例验证
表11992—2006河北省城镇居民人均可支配收入与消费情况 年份人均消费支出(元)v人均可支配收入(元)x 19921547l872
】993l8982334
199425l33l77
19953612392l
l99634244443
l99740044959
l99838345085
l99940265365
200043485661
2oo144795985
2【)I)250696679
2【x】354397239
2oo458197951
2oo5669991O7
2oo6734310304
数据来源国家统计数据库
随着居民可支配收入的增加,人均消费额也在增加,选用直线 回归模型,采用SPSS软件,选中统计量,得输出结果. 表2相关性
支出可支配收入
支出1000.995
Pearson相关性可支配收入9951
.
000
支出000
Sig.(单侧)
?
可支配收入oo0
支出15】5
N可支配收入l515
表3模型汇总
更改统计量模型RlR方调整R方标准估计的误差 R方更改F更改
.dflIdr2lSig.F更改
1995a990.989171.30362. 99012613l61I131000 表4Anovab
模型平方和df均方FSig
回归3.701E7137O1E712613160o0
1残差3814840771329344.929 总计3.739E714
表5系数a
非标准化系数标准系数相关性模型
iSig.BI标准误差试用版零阶偏部分
(常委)440.196『1165623777oo2l .
6831.019.99535.5l5.ooO995.995995
a因变量:Y
表6
VRESZRESRE
l5470O18720O一17228499一l00573—1.15554
1898.oo23340O一l3695770-079950—0.89480
25l3.003177.0O-97.95790-057184-061701 36】20O3921.OO492686052876lO3.03582 3424.0O4443.
005l983l1一030346—031701
4004.00495900l75.447371O24l9l06314 3834.oo508500-80.645】9-047077-0488l9
4026oo5365.O0—79.96198—0.46679—048336
4348005661.0O39.788840.23227024()43 4479OO598500-50.59202-029534-0.306) 5069.o06679.oo6521564038070039717 5439OO7239.O052.582050.306950.3236l 5819OO7951OO-5390922—031470-033857
6699oo9lO7O03622573021147023965 7343,OO1O3o4.OO一l37.65356-0.80356-099298 0
因变量.支出
2000O04090O06000O0800000
支出
图1散点图
结果分析:
(1)从相关表中看到,相关系数r=0.995,单侧检验显着性sjg一
0.000,说明Y与x有显着线性关系.?从模型汇总表中看到,决定系 数r2=0.995.从相对水平上看,回归方程能够减少因变量v的99.5% 的方差波动.?从方差分析表中看到,F=I261.316,显着性Sig一
0.000,说明v对X的线性回归高度显着,与相关系数的检验结果一 致.?从系数表中得到回归方程为=440.196+0.683x,回归系数B. 检验的t值=35.515,显着性Sig0.000,与F检验和相关系数的检
验结果一致.?从计算出的残差表,及所画的残差图知道,本例数据 基本正常,模型基本合适.
在实际应用中,要得到可靠的结果,需要F检验,散点图,残差 分析等一起使用,得到一致的结果时才可以下结论.
参考文献:
『11刘次华,万建平概率论与数理统ff[M].2版.北京:高等教育出版社. 2008.
f2】何晓群,刘文卿.应用回归分析【M】.2版.北京:中国人民大学出版社, 2007.
『3]王天营.一元线性回归分析中三种检验的等价性研究『JI.统计与决策. 2011(3)8—11.