为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

魏宗舒版《概率论与数理统计教程》第三版-课后习题PPT课件

2021-11-05 20页 ppt 682KB 193阅读

用户头像 机构认证

熊猫图文

公司专注课件、范文、教案设计制作等。用户至上,受到广大客户的一致好评,公司秉着用户至上的原则服务好每一位客户

举报
魏宗舒版《概率论与数理统计教程》第三版-课后习题PPT课件数学的一个重要任务是从数量方面分析、揭示、表达现实世界中普遍地存在着的变量之间的关系。一般来说,变量之间的关系可分为两类:1.确定性的函数关系:已知一个(或几个)变量的值,就可以精确地求出另一个变量的值。如V=4/3R3,S=Vt2.非确定性的相关关系:几个变量之间存在着密切的关系,但不能由一个(或几个)变量的值精确地求出另一个变量的值。在相关关系中至少有一个变量是随机变量。如人的血压与年龄,环境因子与农作物的产量,树木的直径与高度,人均收入与商品的销量,商品的价格与消费者的需求量。回归分析是研究变量之间的相关关系的一种统计...
魏宗舒版《概率论与数理统计教程》第三版-课后习题PPT课件
数学的一个重要任务是从数量方面分析、揭示、达现实世界中普遍地存在着的变量之间的关系。一般来说,变量之间的关系可分为两类:1.确定性的数关系:已知一个(或几个)变量的值,就可以精确地求出另一个变量的值。如V=4/3R3,S=Vt2.非确定性的相关关系:几个变量之间存在着密切的关系,但不能由一个(或几个)变量的值精确地求出另一个变量的值。在相关关系中至少有一个变量是随机变量。如人的血压与年龄,环境因子与农作物的产量,树木的直径与高度,人均收入与商品的销量,商品的价格与消费者的需求量。回归分析是研究变量之间的相关关系的一种统计方法。回归(regression)这一术语是1886年高尔顿(Galton)研究遗传现象时引进的。本章仅简单介绍一元线性回归分析和多元线性回归分析。8.2回归分析例1以家庭为单位,某商品年需求量与其价格之间的调查数据如下:价格x(元)1222.32.52.62.833.33.5需求量y(500g)53.532.72.42.521.51.21.21.x与y之间是相关关系,不能用解析表达式y=f(x)表示。2.作散点图。发现这些点分布在一条直线附近。一元线性回归yi=β0+β1xi+i(i=1,2,…,n)3.把y看成是由两部分叠加而成:一是x的线性式β0+β1x;二是由随机因素引起的误差。于是有y=β0+β1x+(1)假定i相互独立,且i~N(0,2)。称(1)式为线性回归的数学模型。4.为估计未知参数β0、β1,将观测值(xi,yi)代入得称它们为正规(正则)方程。解正规方程得选取bi使残差平方和Q最小:则即记则一、β0,β1的最小二乘估计设b0,b1分别为β0,β1的估计值,即整理得记则得到经验回归方程但当假定y=β0+β1x+ε不成立时,求得的经验回归方程是无意义的。所以,要检验“y与x存在线性关系”这一假设。实际上,对任何一组数据都可以用上述方法配一条直线。因此,必须判断y与x是否真的存在线性相关关系。欲检验假设H0:β1=00SRSe于是总平方和剩余平方和回归平方和当F>F(1,n-2)时,拒绝H0二、回归问的统计检验即Syy=SR+Se相关系数R(样本相关系数)t检验:~t(n-2),当t>t(n-2)时拒绝H0查相关系数表得临界值R(n-2),当|R|>R(n-2)时拒绝H0查F分布表得临界值F(1,n-2),当F>F(1,n-2)时拒绝H0三、预报和控制所谓预报问题,就是问当x=x0时y应取何值。很自然地想到用来预报y的真实值y0=β0+β1x0+ε,由于y是随机变量,给出y0的区间估计更为合理。通常是在一定的置信度1-α下,给出y0的容许限或y0的预报区间。不难证明,当一元线性回归的基本假定成立时,统计量其中,为σ的估计。因此,得到的置信度为1-α的预报区间为2将曲线问题线性化本节主要介绍一元线性回归分析中将曲线问题线性化的方法,本节涉及的几条曲线都是初等数学中的常见曲线,无复杂和困难的地方,故本节内容让同学们自学,不再赘述。值得注意的是,模型y=0+1x+2x2+pxp是所谓的多项式回归,令x1=x,x2=x2,xp=xp,则有y=0+1x+2x2+pxp这就是§10.3中要介绍的多元线性回归问题。一、多元线性回归的数学模型将n次观测数据(xi1,x12,…,xip,yi),i=1,2,…,n代入上面的方程,可得多元线性回归的数学模型:设因变量y与p个自变量x1,…,xp之间有线性关系:假定ε1,ε2,…,εn相互独立,且服从同一正态分布N(0,σ2)。其中ε为随机变量,称为随机误差。3多元线性回归二、回归系数的最小二乘估计这里ei是i的估计值,仍称为残差或剩余。令为yi的估计值,即类似于一元线性回归,对βi进行最小二乘估计是要选取bi,使残差平方和Q达到最小。故得正规方程从正规方程解出b1,b2,…,bp,再求出b0,得经验回归方程:假设由某种方法得到β0,β1,…,βp的估计值b0,b1,…,bp则y的观测值可表示为即三、回归方程和回归系数的显著性检验Syy为总平方和SR为回归平方和Se为剩余平方和当H0成立时1.回归方程的显著性检验检验多元线性回归方程是否显著,就是检验y与x1,x2,…,xp,中的某些自变量之间是否有较密切的线性关系。检验假设为H0:β1=β2=…=βp=0回归方程显著并不意味着每个自变量xi对y的影响都重要。若想从回归方程中剔除那些可有可无的变量,重新建立更为简单有效的回归方程。就要检验xj对y的影响是否显著。统计假设为H0j:βj=0,1≤j≤p当假设H0成立时,统计量服从自由度(1,n-p-1)的F的分布。若Fj>F,则拒绝假设H0,认为xj是重要的,应保留在回归方程中;若Fj≤F,则认为变量xj可以从回归方程中剔除。2.回归系数的显著性检验复相关系数R描述了y与x1,x2,…,xp之间的线性相关程度。显然,R2表示SR在Syy中所占的比例。一般情况下,R越大,表明y与自变量间的相关性越好。通常,也将R作为回归方程显著性检验的统计量。Ri表示在p个自变量中,除去其它p-1个自变量的影响外,xi与y的相关程度。(1)复相关系数注意:R的大小与n和p有关,当n相对于p并不很大时,常有较大的R。特别当n=p+1时,总有R=1。一般认为n为p的5~10倍比较合适。(2)偏相关系数3.相关系数下面的例题说明了对方程及变量进行统计检验的重要性,以及在剔除变量后变量显著性的变化。例2卫生陶瓷用量y与城镇楼房住宅建筑面积x1,医疗卫生机构建筑面积x2,办公室建筑面积x3有关。为预测未来卫生陶瓷用量,收集了20组有关数据。(1)试建立y关于x1,x2,x3的回归方程;(2)对回归方程和各自变量进行显著性检验;(3)剔除不显著的变量后重新建立回归方程,直至方程和所有自变量均显著。序号x1x2x3y19.001.402.904.0029.001.102.806.00310.001.103.104.00417.001.004.103.00516.001.105.005.00618.001.404.507.00710.000.801.8010.0089.000.400.604.0099.000.500.805.001010.000.902.107.001112.001.102.1011.001214.002.204.008.001319.002.204.009.001421.002.403.6010.001520.002.204.2014.001622.002.304.6018.001721.002.104.0020.001828.002.304.3024.001933.002.404.7022.002050.002.606.0026.00解依公式(10.23)和(10.24),有于是得到正规方程解得再算出于是得到回归方程Syy=1008.55,SR=803.8157,Se=204.7344,F=20.9394,F1=18.021,F2=5.780,F3=4.458。查表得F0.05(3,16)=3.24,F0.05(1,16)=4.49。由于,故认为所建回归方程是显著的,又因为F1>F0.05(1,16),F2>F0.05(1,16),F3
/
本文档为【魏宗舒版《概率论与数理统计教程》第三版-课后习题PPT课件】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索