为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

统计学思考题答案

2017-10-08 34页 doc 71KB 306阅读

用户头像

is_995397

暂无简介

举报
统计学思考题答案统计学思考题答案 统计学思考题 一、名词解释 1.参数:描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值。所关心的参数主要有总体均值、标准差、总体比例等。总体参数通常用希腊字母表示 2.残差: 因变量的观测值与根据估计的回归方程求出的预测值之差,用e表示。 反映了用估计的回归方程去预测而引起的误差,可用于确定有关误差项ε的假定是否成立 3.标准分数:变量值与其平均数离差除以标准差后的值就是标准分数也称标准化值或z分数。P87 4.次序统计量:一组样本观测值X,X,„,Xn由小到大的排序X?X?„? ...
统计学思考题答案
统计学思考题答案 统计学思考题 一、名词解释 1.参数:描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值。所关心的参数主要有总体均值、差、总体比例等。总体参数通常用希腊字母表示 2.残差: 因变量的观测值与根据估计的回归方程求出的预测值之差,用e表示。 反映了用估计的回归方程去预测而引起的误差,可用于确定有关误差项ε的假定是否成立 3.标准分数:变量值与其平均数离差除以标准差后的值就是标准分数也称标准化值或z分数。P87 4.次序统计量:一组样本观测值X,X,„,Xn由小到大的排序X?X?„? X12(1)(2)?„? X后,称X,X,„,X为次序统计量 。中位数、分位数、四(i)(n)(1)(2)(n) 分位数等都是次序统计量 5.β错误:原假设为伪是没有拒绝,犯这种错误的概率用表示,所以也称β错误或取伪错误 错误:原假设为真时拒绝原假设,犯这种错误的概率用α表示,所以也被6., ,称为错误或弃真错误。 7.多元回归方程:描述因变量 y 的平均值或期望值如何依赖于自变x量, 1x ,„,xk的方程。多元线性回归方程的形式为 2 E( y ) = ,+ ,x + ,x +„+ ,x 01 12 2k k 8.多元回归模型:描述因变量 y 如何依赖于自变量 x , x ,„, x 和误差12k项, 的方程,称为多元回归模型。 其一般形式为 : E( y ) = ,+ ,x + ,x +„+ ,x+ ε 01 12 2k k 9.多重判定系数:是多元回归中的回归平方和占总平方和的比例,它是度量多元回归方程拟合程度的一个统计量,反映了在因变量y的变差中被估计的回归方程所解释的比例。 10.F分布:设随机变量Y与Z相互独立,且Y与Z分别服从于自由度为m和n的 2,分布,随机变量X有如下表达式:F=nY,mZ,则称X服从于第一自由度为m,第二自由度为n的F分布,记作X,F(m,n) 11.方差分析:检验各个总体均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。 212.分布:设随机变量X1,X2,„,Xn相互独立,且Xi(i=1,2,„,n)服, 2从标准正态分布N(0,1)则他们的平方和 服从自由度为n的分布。期望, 1 22为:E(,)=n,方差为:D(,)=2n(n为自由度) 13.非平稳序列:是有趋势、季节性和周期性的序列,他可能只含有一种成分也可能含有几种成分的组合。 14.偏态:由统计学家皮尔逊提出,它是对数据分布对称性的测度。测度偏态的统计量是偏态系数,记作SK。偏态系数=0为对称分布,偏态系数> 0为右偏分布,偏态系数< 0为左偏分布 15.峰态:由统计学家皮尔逊提出,它是对数据尖峰或平峰程度的测度即数据分布扁平程度的测度。测度峰态的统计量是峰态系数,记作K。 16.截面数据: 在相同或近似相同的时间点上收集的数据,描述现象在某一时刻的变化情况。比如,2005年我国各地区的国内生产总值数据 17.离散系数:标准差与其相应的均值之比,对数据相对离散程度的测度,消除了数据水平高低和计量单位的影响。用于对不同组别数据离散程度的比较。 计算公式为 18.列联系数:又称列联相关系数,简称C系数,主要用于大于2×2列联表的情况。 2回归平方和占总误差平方和的比例,记作R19.判定系数:. 反映回归直线对观测数据的拟合程度,取值范围在 [ 0 , 1 ] 之间 20.平均增长率:也称平均增长速度,它是序列中各逐期环比值(也称环比发展速度) 的几何平均数减1后的结果。 21.平稳序列: 基本上不存在趋势的序列.各观察值基本上在某个固定的水平上波动,虽有波动,但并不存在某种规律,而其波动可以看成是随机的 22.趋势:是时间序列在长时间内呈现出来的某种持续向上或持续下降的变动,也称长期趋势。时间序列中的趋势可以是线性的也可以是非线性的。 23.四分位差:反映了中间50%数据的离散程度,也称为内距或四分间距。是对顺序数据离散程度的测度,不受极端值的影响。用于衡量中位数的代表性 上四分位数与下四分位数之差:Qd = QU – QL 24.t分布:高塞特以“Student”(学生)为笔名的中首次提出。t 分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散。P140 25.显著性水平:是一个统计专用名词。在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险,即假设检验中犯弃真错误的概率。它是由人们根据检验的要求确定的,用α表示。 ,26.相关系数:测度2,2列联表中数据相关程度。对于2,2 列联表,,系数的 2 值在0,1之间。列联表中变量的位置可以互换,,的符号没有实际意义,故取绝对值即可 27.异众比率:是对分类数据离散程度的测度,是指非众数组的频数占总频数的比例。 用于衡量众数的代表性 28.中位数:排序后处于中间位置上的值,不受极端值的影响。主要用于顺序数据,也可用数值型数据,但不能用于分类数据 29.众数: 一组数据中出现次数最多的变量值。适合于数据量较多时使用,不受极端值的影响,一组数据可能没有众数或有几个众数。主要用于分类数据,也可用于顺序数据和数值型数据 30.最小二乘法:由德国科学家高斯提出,也称最小平方法。它是通过因变量的观察值与估计值之间的误差平方和达到最小来求得 和 的方法。P274 二、简答题 1.统计数据可分为哪几种类型,各有什么特点, (1)按计量尺度分: 分类数据:只能归于某一类别的非数字型数据,对事物进行分类的结果,数据表现为类别,用文字来表述。例如,人口按性别分为男、女两类 顺序数据:只能归于某一有序类别的非数字型数据,对事物类别顺序的测度,数据表现为类别,用文字来表述。例如,产品分为一等品、二等品、三等品、次品 数值型数据:按数字尺度测量的观察值,结果表现为具体的数值,对事物的精确测度。例如:身高为175cm、168cm、183 (2)按收集方法分 观测的数据: 通过调查或观测而收集到的数据,在没有对事物人为控制的条件下而得到的。有关社会经济现象的统计数据几乎都是观测数据 实验的数据: 在实验中控制实验对象而收集到的数据。比如,对一种新药疗效的实验,对一种新的农作物品种的实验等。自然科学领域的数据大多数都为实验数据 (3)按时间状况分 截面数据: 在相同或近似相同的时间点上收集的数据,描述现象在某一时刻的变化情况。比如,2005年我国各地区的国内生产总值数据 时间序列数据: 在不同时间上收集到的数据,描述现象随时间变化的情况。比如,2000年至2005年国内生产总值数据 2.解释分类数据、顺序数据和数值型数据的含义。 3 分类数据:只能归于某一类别的非数字型数据,对事物进行分类的结果,数据表现为类别,用文字来表述。例如,人口按性别分为男、女两类 顺序数据:只能归于某一有序类别的非数字型数据,对事物类别顺序的测度,数据表现为类别,用文字来表述。例如,产品分为一等品、二等品、三等品、次品 数值型数据:按数字尺度测量的观察值,结果表现为具体的数值,对事物的精确测度。例如:身高为175cm、168cm、183 3.变量可分为哪几种类型, 含义:说明现象某种特征的概念。如商品销售额、受教育程度、产品的质量等级等。变量的具体表现称为变量值,即数据 变量的基本分类: 分类变量:说明事物类别的名称。 顺序变量:说明事物有序类别的名称。 数值型变量:说明事物数字特征的名称 。包括:离散变量(取有限个值), 连续变量(可以取无穷多个值) 其他分类:随机变量和非随机变量 经验变量和理论变量,经验变量所描述的是我们周围可以观察到的事物;理论变量则是由统计学家用数学方法所构造出来的一些变量,比如,z 统计量、t 统计量、F 统计量等 4.数据的预处理包括哪些内容, 数据审核:检查数据中的错误 数据筛选:找出符合条件的数据 数据排序:升序和降序,寻找数据的基本特征 数据透视:按需要汇总 5.数值型数据的分组方法有哪些, 有单变量值分组和组距分组两种。 单变量值分组是把每一个变量值作为一组,这种分组通常只适用于离散变量,且变量值较少的情况下使用。组距分组它是将全部变量值依次划分为若干个区间,并将每一个区间的变量值作为一组,适应于连续性变量或变量值较多的情况下。 6.简述组距分组的步骤。 (1)确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,组数一般为5,K ,15 (2)确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即 4 组距,( 最大值 - 最小值)? 组数 (3)统计出各组的频数并整理成频数分布表 7.鉴别图表优劣的准则有哪些, (1)精心、有助于洞察问题的实质 (2)使复杂的观点得到简明、确切、高效的阐述 (3)能在最短的时间内以最少的笔墨给读者提供最大量的信息 (4)是多维的 (5)表述数据的真实情况 8.绘制统计表应注意哪些问题, (1)合理安排统计表的结构 2)总标题内容应(满足3W 要求 (3)数据计量单位相同时,可放在表的右上角标明,不同时应放在每个变量后 或单列出一列标明 (4)表中的上下两条横线一般用粗线,其他线用细线 (5)通常情况下,统计表的左右两边不封口 有小数点时应以小数点对齐,而且小数点的位(6)表中的数据一般是右对齐, 数应统一 (7)对于没有数字的单元,一般用“—”表示 (8)必要时可在表的下方加上注释 9.一组数据的分布特征可以从那几个方面进行测度, 数据的分布特征可以从三方面进行测度和描述:一是分布的集中趋势,反映一组数据向其中心值靠拢或聚集的程度:二是分布的离散程度,反映各数据原离其中心值的趋势;三是分布的形状,反映数据分布的峰态和偏态。 10.简述众数、中位数和平均数的特点和应用场所。 众数:不受极端值影响,具有不惟一性。数据分布偏斜程度较大且有明显峰值时应用 中位数:不受极端值影响。数据分布偏斜程度较大时应用 平均数:易受极端值影响,数学性质优良。数据对称分布或接近对称分布时应用 11.简述异众比率、四分位差、方差或标准差的适用场所。 异众比率:是对分类数据离散程度的测度,是指非众数组的频数占总频数的比例。 用于衡量众数的代表性 四分位差:反映了中间50%数据的离散程度,也称为内距或四分间距。是对顺序数据离散程度的测度,不受极端值的影响。用于衡量中位数的代表性 上四分位数与下四分位数之差:Qd = QU – QL 5 方差或标准差:数据离散程度的最常用测度值,反映了各变量值与均值的平均差异 12.测度数据分布形状的统计量有哪些, 峰态系数和偏态系数 偏态系数:偏态是对数据分布偏斜程度的测度。偏态系数=0为对称分布,偏态系数> 0为右偏分布,偏态系数< 0为左偏分布。偏态系数大于1或小于-1,被称为高度偏态分布;偏态系数在0.5,1或-1,-0.5之间,被认为是中等偏态分布;偏态系数越接近0,偏斜程度就越低 峰态系数:峰态是对数据分布扁平程度的测度。峰态系数=0扁平峰度适中,峰态系数<0为扁平分布,峰态系数>0为尖峰分布 13.简述评价估计量好坏的标准。 (1) 无偏性:估计量抽样分布的数学期望等于被估计的总体参数 (2) 有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效 (3)一致性:随着样本量的增大,估计量的值越来越接近被估计的总体参数 14.简述样本量与置信水平、总体方差、边际误差的关系。 样本量与置信水平成正比。在其他条件不变的情况下,置信水平越大,所需的样本量也就越大。样本量与总体方差成正比,总体的差异越大所要求的样本量也就越大。样本量与估计误差的平方成反比,即可以接受的估计误差的方差越大,所需的样本量就越小。 15.假设检验和参数估计有什么相同点和不同点。 参数估计和假设检验是统计推断的两个组成部分,他们都是利用样本对总体进行某种推断,但推断的角度不同。 参数估记讨论的是用样本统计量估计总体参数的方法,总体参数μ在估计前是未知的。而在假设检验中,则是先对μ的值提出一个假设,然后利用样本信息进行检验这个假设是否成立。 16.什么是假设检验中的两类错误, 第一类错误(弃真错误):原假设为真时拒绝原假设,第一类错误的概率为a,被称为显著性水平 第二类错误(取伪错误):原假设为假时接受原假设,第二类错误的概率为β 17.在单侧检验中原假设和备择假设的方向如何确定, 原假设:待检验的假设,又称“0假设”,表示为 H 研究者想收集证据予以反对0 的假设,总是有等号 =,?或? 备择假设:与原假设对立的假设,也称“研究假设”,表示为 H 研究者想收集证1 据予以支持的假设总是有不等号: ?,< 或 > 6 18.方差分析包括哪些类型,它们有何区别, 方差分析是检验多个总体均值是否相等,有单因素方差分析和双因素方差分析两类。单因素方差分析:涉及一个分类的自变量。双因素方差分析:涉及两个分类的自变量 19.简述方差分析的基本步骤。 方差分析包括提出假设,构造检验的统计量,统计决策等步骤。为检验自变量对因变量是否有显著影响,首先需要提出“两个变量在总体中没有关系”的原假设,然后构造一个用于检验的统计量来检验这一假设是否成立。单因素方差分析与双因素方差分析步骤类似。P251.P240 20.简述相关系数显著性检验的步骤。 (1)提出假设:H:, , , ;H:, , 0 01 (2)计算检验的统计量 (3)确定显著性水平,,并作出决策:若,t,>t,拒绝H;若,t,F,拒绝H若Ft,拒绝H;, t,记录
各自的装配时间(单位:分钟)如下: 甲方法: 31 34 29 32 35 38 34 30 29 32 31 26 乙方法: 26 24 28 29 30 29 32 26 31 29 32 28 两总体为正态总体,且方差相同。问在显著性水平为0.05的情况下两种方法的装配时间有无显著差异,() t(22),2.07390.025 解: ,,H:,,00AB H:,,,,01AB 2,31.75,,10.204xsAA 2,28.67,,6.061xs BB 22(12,1)s,(12,1)s112.244,66.671178.9152AB,,,,8.1325sp12,12,22222 31.75,26.67,05.08t,,,4.3631.164118.1325,(,)1212 t(12,12,2),2.0739 0.025 t,t(12,12,2)0.025 拒绝原假设。在显著性水平为0.05的情况下两种方法的装配时间有显著差异。 15.调查了339名50岁以上的人,其中205名吸烟者中有43个患慢性气管炎,在134名不吸烟者中有13人患慢性气管炎。调查数据能否支持“吸烟者容易患 ,,0.05z,1.645慢性气管炎”这种观点(),() 0.05 解: ,,H:,,0012 H:,,,,0112 13 4313(,),0205134z,,2.95 43431313,(1,),(1,)205205134134,205134 z,1.645 0.05 z,z0.05 在0.05显著性水平下拒绝原假设。 调查数据支持“吸烟者容易患慢性气管炎”这种观点。 第9章 列联分析 16.欲研究不同收入群体对某种特定商品是否有相同的购买习惯,市场研究人员 调查了四个不同收入组的消费者共527人,购买习惯分为:经常购买,不购买,有时购买。调查结果如下表所示。 项目 低收入组 偏低收入组 偏高收入组 高收入组 经常购买 25 40 47 46 不购买 69 51 74 57 有时购买 36 26 19 37 要求: (1)提出假设; 2(2)计算值; , ,,0.1(3)以的显著性水平进行检验。 解: (1)提出假设 H:,,,,,,, 低收入组、 偏低收入组、偏高收入组和高收入组的购买01234 习惯相同 H:,,,,,,,不完全相等。低收入组、 偏低收入组、偏高收入组和高收入组11234 的购买习惯不完全相同 2(2)计算值 , 期望值计算 RTCT,f,故?, en 项目 低收入组 偏低收入组 偏高收入组 高收入组 合计 ffff:25 :40 :47 :46 oooo 经常购买 158 ffff:38.975 :35.078 :41.973 :41.973 eeee 14 :69 :51 :74 :57 ffffoooo 不购买 251 :61.917 :55.725 :66.679 :66.679 ffffeeee :36 :26 :19 :37 ffffoooo 有时购买 118 :29.108 :26.197 :31.347 :31.347 ffffeeee 合计 130 117 140 140 527 2计算表 , 步骤一 步骤二 步骤三 22 f,fff(f,f)(f,f)/foeoeoeoee 25 38.975 -13.975 195.300 5.011 40 35.078 4.922 24.227 0.691 47 41.973 5.027 25.271 0.602 46 41.973 4.027 16.217 0.386 69 61.917 7.083 50.169 0.810 51 55.725 -4.725 22.326 0.401 74 66.679 7.321 53.597 0.804 57 66.679 -9.679 93.683 1.405 36 29.108 6.892 47.500 1.632 26 26.197 -0.197 0.039 0.001 19 31.347 -12.347 152.448 4.863 37 31.347 5.653 31.956 1.019 2ff,()oe2步骤四 17.626 ,,,,fe 2234fnPP(,,,)ff(,)ijij..22e0,,,,17.626,,(2,3),10.6446 ,,,0.1fnPP,,ij,,11eij.. (3)作出决策: 拒绝原假设。 n,20017.从总体中随机抽取的样本,调查后按不同属性归类,得到如下结果: n,28,n,56,n,48,n,36,n,32,依据经验数据,各类别在总体中12345 ,,0.1,,0.1,,,0.2,,,0.3,,,0.2,,,0.2的比例分别为:,以的显著性12345 水平进行检验,说明现在情况与经验数据相比是否发生了变化。 15 解: (1)提出假设 。 没有变化 H:,,0.1,,,0.2,,,0.3,,,0.2,,,0.2012345 原假设中至少有一个不成立。 有变化 H:1 2(2)计算值 , 第一类 第二类 第三类 第四类 第五类 观察频数 28 56 48 36 32 期望频数 200?200?200?200?200? 0.1=20 0.2=40 0.3=60 0.2=40 0.2=40 222(28,0.1,200)(56,0.2,200)(48,0.3,200)2,,,,,0.1,2000.2,2000.3,200 22(36,0.2,200)(32,0.2,200), 0.2,2000.2,200 ,14 P,0.007295,0.1 (3)作出决策: 拒绝原假设。 18.某报社关心其读者的阅读习惯是否与其文化程度有关,随机调查了254位读者,得到如下数据: 阅读习惯 大学以上 大学和大专 高中 高中以下 早上看 6 13 14 17 中午看 12 16 8 8 晚上看 38 40 11 6 有空看 21 22 9 13 以0.05的显著性水平检验读者的阅读习惯是否与文化程度有关。 解: (1)提出假设 H:阅读习惯与文化程度无关。 0 H:阅读习惯与文化程度有关。 1 2(2)计算值 , 期望值计算 RTCT,f,故?, en 阅读习惯 大学以上 大学和大专 高中 高中以下 总计 早上看 50 ffff:6 :13 :14 :17 oooo 16 :15.157 :17.913 :8.268 :8.661 ffffeeee 中午看 44 :12 :16 :8 :8 ffffoooo :13.339 :15.764 :7.276 :7.622 ffffeeee 晚上看 95 :38 :40 :11 :6 ffffoooo :28.799 :34.035 :15.709 :16.457 ffffeeee 有空看 65 :21 :22 :9 :13 ffffoooo :19.705 :23.287 :10.748 :11.260 ffffeeee 总计 77 91 42 44 254 2计算表 , 步骤一 步骤二 步骤三 22 f,fff(f,f)(f,f)/foeoeoeoee 6 15.157 -9.157 83.851 5.532 12 13.339 -1.339 1.793 0.134 38 28.799 9.201 84.658 2.940 21 19.705 1.295 1.677 0.085 13 17.913 -4.913 24.138 1.348 16 15.764 0.236 0.056 0.004 40 34.035 5.965 35.581 1.045 22 23.287 -1.287 1.656 0.071 14 8.268 5.732 32.856 3.974 8 7.276 0.724 0.524 0.072 11 15.709 -4.709 22.175 1,412 9 10.748 -1.748 3.056 0.284 17 8.661 8.339 69.539 8.029 8 7.622 0.338 0.114 0.015 6 16.457 -10.457 109.349 6.645 13 11.260 1.740 3.028 0.269 2ff,()oe2,,,步骤四 31.859 ,fe (3)作出决策: 17 2(,)ff2oe,,,31.859,fe 2,(3,3),16.919 0.05 22,,,(3,3)0.05 拒绝原假设,认为阅读习惯与文化程度有关。 19.教学改革后学生有了更多的选课自由,但学院领导在安排课程上也面临新问题。例如,MBA研究生班的学生选课学年之间的变化常常很大,去年的学生很多人选会计课,而今年的学生很多人选市场营销课。由于事先无法确定究竟有多少学生选各门课程,所以无法有效地进行教学资源的准备。有人提出学生所选课程与其本科专业所学课程有关。为此,学院领导将学生本科所学专业和MBA三门课程的选修情况做了统计,得到如下结果: MBA所选课程 本科专业 会计 统计 市场营销 专业一 31 13 16 专业二 8 16 7 专业三 12 10 17 其他专业 10 5 7 要求: (1)以0.05的显著性水平检验学生本科所学专业是否影响其读MBA期间所选课程。 (2)计算列联相关系数。 解: (1) 1)提出假设 不影响 H:,,,,,,,01234 H:,,,,,,,不完全相等。影响 11234 22)计算值 , 期望值计算 RTCT,f,故?, en 会计 统计 市场营销 总计 专业一 60 fff:31 :13 :16 ooo fff:24.079 :17.368 :18.553 eee 专业二 31 fff:8 :16 :7 ooo fff:12.441 :8.974 :9.586 eee 18 专业三 39 :12 :10 :17 fffooo :15.651 :11.289 :12.059 fffeee 其他专业 22 :10 :5 :7 fffooo :8.829 :6.368 :6.803 fffeee 总计 61 44 47 152 2计算表 , 步骤一 步骤二 步骤三 22 f,fff(f,f)(f,f)/foeoeoeoee 31 24.079 6.921 47.900 1.989 8 12.441 -4.441 19.722 1.585 12 15.651 -3.651 13.330 0.852 10 8.829 1.171 1.371 0.155 13 17.368 -4.368 19.079 1.099 16 8.974 7.026 49.365 5.501 10 11.289 -1.289 1.662 0.147 5 6.368 -1.368 1.871 0.294 16 18.553 -2.553 6.518 0.351 7 9.586 -2.586 6.687 0.698 17 12.059 4.941 24.413 2.024 7 6.803 0.197 0.039 0.006 2ff,()oe2步骤四 14.701 ,,,,fe 2(,)ff2oe,,,14.701,fe 2,(3,2),12.5916 0.05 22,,,(3,2)0.05 3)作出决策 拒绝原假设。认为本科专业与MBA选课有关。 2,14.701c,,,0.0881878,0.297(2) 214.701,152,,n 第10章 方差分析 20.一家管理咨询公司为不同的客户进行人力资源管理讲座。每次讲座的内容基本上是一致的,但讲座的听课者有时是高级管理者,有时是中级管理者,有时 19 是低级管理者。该咨询公司认为,不同层次的管理者对讲座的满意度是不同的。对听完讲座后随机抽取的不同层次管理者的满意度评分如下(评分标准从1~10,10代表非常满意): 高级管理者 中级管理者 低级管理者 7 8 5 7 9 6 8 8 5 7 10 7 9 9 4 10 8 8 ,,0.05取显著性水平,检验管理者的水平不同是否会导致评分的显著性差异,() F(2,16),3.6820.05 解: (1)提出假设 ,,,,H:,,,。管理者水平对评分没有显著影响01234 H:,,,,,,,不全相等。管理者水平对评分有显著影响11234 (2)构造检验统计量 1)计算各样本均值 管理者层次 高级管理者 中级管理者 低级管理者 7 8 5 7 9 6 8 8 5 7 10 7 9 9 4 10 8 8 x,7.6x,8.857x,5.833 123 x,7.5 2)计算各误差平方和 2222222SST,(7,7.5),(7,7.5),(8,7.5),(7,7.5),(9,7.5),(8,7.5),(9,7.5) 2222222,(8,7.5),(10,7.5),(9,7.5),(10,7.5),(8,7.5),(5,7.5),(6,7.5), 2222222222(5,7.5),(7,7.5),(4,7.5),(8,7.5),0.5,0.5,0.5,0.5,1.5,0.5, 2222222222221.5,0.5,2.5,1.5,2.5,0.5,2.5,1.5,2.5,0.5,30.5,.5,48.5 20 222SSA,5,(7.6,7.5),7,(8.857,7.5),6,(5.833,7.5) 222,5,0.1,7,1.357,6,1.667 ,5,0.01,7,1.841,6,2.779 ,0.05,12.887,16.674 ,29.611 222 SSE,(7,7.6),?,(8,8.875),?,(5,5.833),?,18.8903)计算统计量 SSA MSA,,14.805k,1 SSE MSE,,1.259n,k MSAF,,11.756 MSE (3)统计决策 F,11.756,F(2,16),3.6820.05 拒绝原假设,管理者水平对评分有显著影响。 21.为研究食品的包装和销售地区对其销售量是否有影响,在某周的三个不同地 区中用三种不同包装方法进行销售,获得的销售数据如下: 包装方法(B) 销售地区(A) BBB1 2 3 A 45 75 30 1 A50 50 40 2 A35 65 50 3 ,,0.05在显著性水平为的条件下,用无交互作用双因素方差分析方法检验不同地区和不同包装方法对该食品的销售量是否有显著影响,(F(2,4),6.944) 0.0522.为检验广告媒体和广告方案对产品销售量的影响,一家营销公司做了一项实 验,考察三种广告方案和两种广告媒体,获得的销售数据如下: 广告媒体 广告方案 报纸 电视 8 12 A 12 8 22 26 B 14 30 10 18 C 18 14 ,,0.05在显著性水平为的条件下,检验广告方案、广告媒体或其交互作用对 F(2,6),5.143F(1,6),5.987销售量的影响是否显著,(;) 0.050.05 11 23.学生在期末考试之前用于复习的时间(单位:h)和考试分数(单位:分)之 21 间是否有关系,为研究这一问题,一位研究者抽取了由8名学生构成的一个随机样本,得到的数据如下: 复习时间20 16 34 23 27 32 18 x 22 考试分数 64 61 84 70 88 92 72 y 77 (1)绘制复习时间和考试分数的散点图,判断二者之间的关系形态。 (2)计算相关系数,说明两个变量之间的关系强度。 (3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。 224.根据下面数据建立回归方程,计算残差、判定系数,估计标准误差,并Rse分析拟合程度。 x 15 8 19 12 5 y 47 36 56 44 21 第12章 多元回归分析 25.飞鸽公司的管理人员认为自行车的销售量依赖于本公司自行车的价格及其竞争对手的价格,并希望建立自行车销售量与该公司自行车价格和竞争厂商自行车价格的回归方程。下表列出了10个城市的价格资料。 竞争厂商的价格()/该公司的价格()/元 销售数量()/千辆 xxy12 元 256 240 102 280 260 100 380 352 120 260 300 77 310 320 46 350 300 93 250 300 26 290 300 69 360 400 65 300 350 85 (1)建立线性回归方程。 (2)对回归方程的系数作出解释。 (3)预测当飞鸽公司价格为270元,竞争厂商价格为280元时,自行车的销售量。 四、分析题 y1.为研究工资水平与工作xx年限和性别之间的关系,在某行业中随机抽取12 yxx10名职工,得到关于工资水平、工作年限、性别的数据,并引入虚拟变12 yx量,男性为1,女性为0。EXCEL输出的关于工资水平、工作年限、性别的线1x性回归结果如下: 2 回归统计 22 Multiple R 0.926928 R Square 0.859195 Adjusted R Square 0.818964 标准误差 459.0483 观测值 10 方差分析 df SS MS F Sig F 450040.00104回归分析 2 9000923 61 21.357 8 21072 残差 7 1475077 5.3 10476 总计 9 000 CoeffLower Upper icients 标准误差 t Stat P-value 95% 95% 1.99260 Intercept 930.4954 466.9741 60.086558 -173.723 2034.714 X Varia62.565196.19539 ble 1 387.6161 ‎‎ 60.000447 239.6729 535.5593 X Varia4.01969 ble 2 1262.693 314.1267 50.005062 519.9019 2005.485 (1)根据上表数据写出回归方程,并进行显著性检验。 (2)说明回归系数的含义。 2.一家公司拥有多家子公司,公司的管理者想通过广告支出来估计销售收入,为此抽取了8家子公司,得到广告支出和销售收入的数据如下(单位:万元) 广告支出x 12.5 3.7 21.6 60.0 37.6 6.1 16.8 41.2 y销售收入 148 55 338 994 541 89 126 379 yx销售收入关于广告支出的回归结果,EXCEL给出如下: 回归统计 Multiple R 0.947663 R Square 0.898064 Adjusted R 0.881075 Square 23 标准误差 108.7575 观测值 8 方差分析 df SS MS F Sign-F 回归分析 1 625246.3 625246.3 52.86065 0.000344 残差 6 70969.2 11828.2 总计 7 696215.5 Coefficien标准误差 t Stat P-value ts Intercept -46.2918 64.89096 -0.71338 0.502402 X Variable 1 15.23977 2.096101 7.270533 0.000344 (1)写出估计的回归方程。(2)进行拟合优度检验。(3)进行线性关系检验。(4)进行回归系数检验。(5)求广告费为6.1万元的那个子公司销售收入的点估计值。 3.某企业准备用三种方法组装一种新产品,为确定哪种方法每小时生产的产品数量多,随机抽取了30名工人,并指定每个人使用其中一种方法。通过对每个工人生产的产品数进行方差分析得到下面结果: 方差分析表 差异源 SS df MS F P-value F crit 组间 210 0.245946 3.354131 组内 3836 — — — 总计 29 — — — — (1)完成上面的方差分析表。 ,,0.05(2)在显著性水平为的条件下,检验三种方法组装的产品数量之间是否有显著差异, 4.某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。通过计算得到下面的有关结果: 方差分析表 变差来源 df SS MS F Significan ce F 回归 2.17E-09 残差 40158.07 — — 总计 11 1642866.67 — — — 参数估计表 Coefficients 标准误差 t Stat P-value Intercept 363.6891 62.45529 5.823191 0.000168 X Variable 1 1.420211 0.071091 19.97749 2.17E-09 (1)完成上面的方差分析表。 24 (2)汽车销售量的变差中有多少是由广告费用引起的, (3)销售量与广告费用之间的相关系数是多少, (4)写出估计的回归方程,并解释回归系数的实际意义。 ,,0.05(5)检验线性关系的显著性()。 25
/
本文档为【统计学思考题答案】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索