为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

统计学第四版--习题集及答案[1] (1)

2021-03-04 10页 doc 1006KB 31阅读

用户头像 机构认证

爱赢

公司经营范围:网络软件设计、制作、图文设计、影视制作(编辑)

举报
统计学第四版--习题集及答案[1] (1)...答案附在后面有一些(在题目上若要打印先把答案去掉)每单元后面都有答案第一章导论【重点】了解统计的科学涵义,明确统计学的学科性质及基本研究方法,掌握统计数据的特点及其不同类型,牢固掌握统计学的基本概念。【难点】准确掌把数据不同类型,牢固掌握统计学的基本概念并结合实例分析。思考题1.1什么是描述统计学、推断统计学?怎样理解描述统计学和推断统计学在探索事物数量规律性中的地位和作用?1.2统计学发展史上有哪几个主要学派?1.3“统计学”一词有哪几种含义?1.4什么是统计学?怎样理解统计学与统计数据的关系?1.5统计数据可分为哪几...
统计学第四版--习题集及答案[1] (1)
...答案附在后面有一些(在题目上若要打印先把答案去掉)每单元后面都有答案第一章导论【重点】了解统计的科学涵义,明确统计学的学科性质及基本研究方法,掌握统计数据的特点及其不同类型,牢固掌握统计学的基本概念。【难点】准确掌把数据不同类型,牢固掌握统计学的基本概念并结合实例。思考题1.1什么是描述统计学、推断统计学?怎样理解描述统计学和推断统计学在探索事物数量规律性中的地位和作用?1.2统计学发展史上有哪几个主要学派?1.3“统计学”一词有哪几种含义?1.4什么是统计学?怎样理解统计学与统计数据的关系?1.5统计数据可分为哪几种类型?不同类型的数据各有什么特点?1.6举例说明总体、样本、参数、统计量、变量这几个概念。练习题一、单项选择题1、指出下面的数据哪一个属于分类数据()A、年龄B、工资C、汽车产量D、购买商品的支付方式(现金、信用卡、支票)2、指出下面的数据哪一个属于顺序数据()A、年龄B、工资C、汽车产量D、员工对企业某项改革措施的态度(赞成、中立、反对)3、某研究部门准备在全市200万个家庭中抽取2000个家庭,据此推断该城市所有职工家庭的年人均收入,这项研究的统计量是()A、2000个家庭B、200万个家庭C、2000个家庭的人均收入D、200万个家庭的人均收入4、了解居民的消费支出情况,则()A、居民的消费支出情况是总体B、所有居民是总体C、居民的消费支出情况是总体单位D、所有居民是总体单位5、统计学研究的基本特点是()A、从数量上认识总体单位的特征和规律B、从数量上认识总体的特征和规律C、从性质上认识总体单位的特征和规律D、从性质上认识总体的特征和规律6、一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的回答他们的消费支付方式是使用信用卡。这里的“月收入”是()A、分类变量B、顺序变量C、数值型变量D、离散变量7、要反映我国工业企业的整体业绩水平,总体单位是()A、我国每一家工业企业B、我国所有工业企业C、我国工业企业总数D、我国工业企业的利润总额8、一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均消费是200元,他们选择在网上购物的主要原因是“价格便宜”。这里的参数是()A、1000个消费者B、所有在网上购物的消费者C、所有在网上购物的消费者的平均消费额D、1000个消费者的平均消费额9、一名统计学专业的学生为了完成其统计作业,在《统计年鉴》中找到的2006年城镇家庭的人均收入数据属于()A、分类数据B、顺序数据C、截面数据D、时间序列数据10、一家公司的人力资源部主管需要研究公司雇员的饮食习惯,改善公司餐厅的现状。他注意到,雇员要么从家里带饭,要么在公司餐厅就餐,要么在外面的餐馆就餐。他收集数据的方法属于()A、访问调查B、邮寄调查C、个别深度访问D、观察调查二、多项选择题1、欲了解某地高等学校科研情况()A、该地所有高等学校所有的科研项目是总体B、该地所有的高等学校是总体C、该地所有高等学校的每一科研项目是总体单位D、该地每一所高等学校是总体单位E、该地所有高等学校的所有科研人员是总体2、下表是《财富》杂志提供的按销售额和利润排列的500强公司的一个样本数据:公司名称销售额(百万美元)利润额(百万美元)行业代码BancOne102721427.08CPCIntl.9844580.019TysonFoods645487.019….….….….…..…….…..Woolworth8092168.748在这个例子中()A、总体是500强公司,总体单位是表中所列的公司B、总体是500强公司,总体单位是其中每一家公司C、总体是500强公司,样本是表中所列的公司D、总体是500强公司,样本是表中所列公司的销售额和利润额E、总体是表中所有的公司,总体单位是表中每一家公司3、一家具制造商购买大批木材,木材不干会影响家具的尺寸和形状。家具制造商从每批货中随机抽取5块木材检验湿度,如果其中任何一块木材的湿度超过,就把整批货退回。这个问题中()A、样本是从所有木材批次中随机抽取的部分批次木材B、样本是从每批木材中随机抽取的5块木材C、总体单位是从所有木材批次中随机抽取的部分批次木材D、总体单位是购买的每一块木材E、总体是购买的全部木材三、判断分析题(判断正误,并简要说明理由)统计运用大量观察法必须对所有的总体单位进行观察。()四、简答题1、报纸上报道一项民意调查的结果说:“43%的美国人对总统的整体表现感到满意。”报道最后写到:“这份调查是根据电话访问1210位成人所得,访问对象遍布美国各地。”这个调查的总体是什么?总体单位是什么?样本是什么?2、一个公司正致力于测试一种新的电视广告的效果。作为测试的一部分,广告在某市的当地新闻节目中下午6:30播出。两天以后,一市场调查公司进行了电话采访以获取记忆率信息(观众记得看过广告的百分比)和对广告的印象。这一研究的总体是什么?总体单位是什么?样本是什么?这种情况下为什么使用样本?简要解释原因。答案:一、D,D,C,B,B;C,A,C,C,D。二、BD,BC,BDE。三、×,统计运用大量观察法的目的是消除个别事物的差异,显现想象总体的数量特征。只要部分单位对总体有代表性,只要对足够多的总体单位进行观察,也能达到这个目的。四、1、答:总体是电视台覆盖范围内的所有成年观众;总体单位是电视台覆盖范围内的每一位成年观众;样本是受到电话采访的所有成年观众。2、答:总体是所有在6:30看到广告的观众;总体单位是每一位在6:30看到广告的观众;样本是受到电话采访的观众。第二章数据的搜集【重点】了解统计数据的不同渠道来源,掌握调查设计要领,学会调查问卷的设计,掌握抽样调查的特点及其基本的组织方式和方法。【难点】调查问卷的设计及应用。思考题2.1数据的来源有哪几种渠道?2.2常用的统计调查方式有哪些?2.3普查、抽样调查、重点调查和典型调查有何区别?2.4简述普查和抽样调查的特点。2.5调查方案包括哪几个方面的内容?2.6什么是问卷?它由哪几个部分组成?练习题一、单项选择题1、从含有N个元素的总体中抽取n个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中,这样的抽样方式称为()A、简单随机抽样B、分层抽样C、系统抽样D、整群抽样2、为了调查某校学生的购书费用支出,从全校抽取4个班级的学生进行调查,这种调查方法是()A、简单随机抽样B、分层抽样C、系统抽样D、整群抽样3、为了调查某校学生的购书费用支出,将全校学生的名单按拼音顺序排列后,每隔50名学生抽取一名进行调查,这种调查方式是()A、简单随机抽样B、分层抽样C、系统抽样D、整群抽样4、在一项调查中,调查单位和填报单位()A、无区别,是一致的B、有区别,是不一致的C、无区别,是人为确定的D、有区别,但有时是一致的5、对家用电器的平均寿命进行调查,应该采用()A、普查B、重点调查C、典型调查D、抽样调查二、多项选择题1、下列属于原始数据的是()A、统计部门掌握的数据B、说明总体单位特征的数据C、说明总体特征的数据D、还没有经过分组汇总的数据E、直接向调查单位登记得到的数据2、统计调查方案的内容包括有()A、确定调查目的B、确定调查对象、调查单位和单位C、确定调查项目和调查表D、确定调查方法和调查时间E、确定调查人员、经费等3、重点调查的“重点”单位指()A、在国民经济中作用重要的单位B、标志值在总体标志总量中所占比重比较大的单位C、全部单位中的一小部分单位D、在国民经济中地位显赫的单位E、能反映总体基本情况的单位三、简答题1、抽样调查与重点调查、典型调查有哪些主要区别?2、进行产品质量调查和市场占有率调查,你认为采用什么调查方法最合适?简要说明理由。3、简述普查和抽样调查的特点。答案:一、A,D,C,D,D。二、BDE,ABCDE,BCE。三、1、答:选取调查单位的方式不同;调查的目的和作用不同;对代表性误差的处理不同。2、答:抽样调查,理由略。3、答:(1)普查:周期性;数据准确;规定统一时间;范围比较窄等;(2)抽样调查:经济性;时效性强;适应面广;准确性高等等。第三章数据的整理与显示【重点】了数据整理的全过程,掌握分组方法及变量数列编制的原则,灵活设计统计表和统计图。【难点】针对不同类型的数据进行图、表的设计,区分不同图、表的应用。思考题3.1分类数据和顺序数据的整理和图示方法各有哪些?3.2数值型数据的分组方法有哪些?简述组距分组的步骤。3.3直方图与条形图有何区别?3.4茎叶图与直方图相比有什么优点?3.5统计表由哪几个主要部分组成?练习题一、单项选择题1、在累计次数分布中,某组的向下累计次数表明()A、大于该组上限的次数是多少B、大于该组下限的次数是多少C、小于该组上限的次数是多少D、小于该组下限的次数是多少2、数据筛选的主要目的是()A、发现数据的错误B、对数据进行排序C、找出所需要的某类数据D、纠正数据中的错误3、样本或总体中各不同类别数值之间的比值称为)A、频率B、频数C、比例D、比率4、将比例乘以100得到的数值称为()A、频率B、频数C、比例D、比率5、下面的哪一个图形最适合描述结构性问题()A、条形图B、饼图C、雷达图D、直方图6、下面的哪一个图形适合比较研究两个或多个总体或结构性问题()A、环形图B、饼图C、直方图D、茎叶图7、将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组,这样的分组方法称为(B)A、单变量值分组B、组距分组C、等距分组D、连续分组8、下面的哪一个图形最适合描述大批量数据分布的图形(C)A、条形图B、茎叶图C、直方图D、饼图9、由一组数据的最大值、最小值、中位数和两个四分位数5个特征值绘制而成的,反映原始数据分布的图形,称为(D)A、环形图B、茎叶图C、直方图D、箱线图10、10家公司的月销售额数据(万元)分别为72,63,54,54,29,26,25,23,23,20。下面哪种图形不宜用于描述这些数据(B)A、茎叶图B、散点图C、条形图D、饼图二、多项选择题1、下列属于定性变量的有(AB)A、职业B、居住区域C、体重D、身高E、汽车产量2、下面的数列属于(ACE)身高(厘米)人数比重(%)150~1554020155~16010050160~1656030合计200100A、变量数列B、品质数列C、等距数列D、异距数列E、闭口数列三、简答题1、数值型数据的分组方法有哪些?2、直方图与条形图有何区别?3、茎叶图与直方图相比有什么优点?四、应用题1、下面是一个班50个学生的经济学考试成绩:88569179699088718279988534744810075956092836465699964457663696874948167818453912484628183698429667594(1)对这50名学生的经济学考试成绩进行分组并将其整理成频数分布表,绘制直方图。(2)用茎叶图将原始数据表现出来。2、下表中的数据为2001年全国研究生入学考试报考某专业的12名考生的5门课程的成绩。考生编号123456789101112英语664439585234747151416451政治696658566840736562485864专业课154252036214824228353919专业课2906285816454737868668075专业课3815645627063768665217473对英语和政治两门课程做直方图。答案:一、B,C,D,B,B;A,B,C,D,B。二、AB,ACE。三、1、答:主要有单变量值分组,这种分组方法通常只适合于离散变量,且在变量值较少的情况下使用;在连续变量或变量值较多的情况下,通常采用组距分组,它是将全部变量值依次划分成若干个区间,并将这一区间的变量作为一组。2、答:(1)条形图用条形的长度表示各类别频数的多少,其宽度则是固定的;直方图是用面积表示各组频数多少,矩形高度表示每一组的频数或频率,宽度表示各组组距,宽度和高度均有意义。(2)直方图的各矩形通常是连续排列;条形图则是分开排列。(3)条形图主要用于分类数据;直方图主要用于数值型数据。3、答:茎叶图是由“茎”“叶”两部分组成、反映原始数据分布的图形,其图形是由数字组成。通过茎叶图,可以看数据的分布形状及数据的离散状况,与直方图相比,茎叶图既能给出数据的分布状况,又能给出一个原始数据,即保留了原始数据的信息,而直方图不能给出原始数值。四、1、解:(1)组距频数百分比(%)累积百分比(%)20~3024.004.0030~4012.006.0040~5024.0010.0050~6024.0014.0060~701326.0040.0070~80816.0056.0080~901224.0080.0090~100918.0098.0010012.00100.00合计501​Chart221221381291Sheet1组距频数20~30230~40140~50250~60260~701370~80880~901290~10091001Sheet2Sheet3​(2)茎叶频数占总数的比重24924.00%3412.00%45824.00%53624.00%602344567899991326.00%714455699816.00%81112334445881224.00%9011244589918.00%10012.00%合计501.002、解:第四章数据分布特征的测度【重点】掌握各类统计指标的计算方法和应用原则,并进行初步的分析。【难点】结合实例准确进行集中趋势和离散程度的测度及分析。思考题4.1偏度和峰度是描述频数分布的哪些特征的方法?4.2一组数据的分布特征可以从哪几个方面进行侧度?4.3简述众数、中位数和均值的特点及应用场合。4.4简述异众比率、四分位差、方差或标准差的适用场合。4.5标准分数有哪些用途?4.6为什么要计算离散系数?练习题一、单项选择题1、一组数据排序后处于25%和75%位置上的值称为(C)A、众数B、中位数C、四分位数D、均值2、如果一个数据的标准分数是–2,表明该数据(B)A、比平均数高出2个标准差B、比平均数低2个标准差C、等于2倍的平均数D、等于2倍的标准差3、经验法则表明,当一组数据对称分布时,在均值加减1个标准差的范围内大约有(A)A、68%的数据B、95%的数据C、99%的数据D、100%的数据4、离散系数的主要用途是(C)A、反映一组数据的离散程度B、反映一组数据的平均水平C、比较多组数据的离散程度D、比较多组数据的平均水平5、离散系数(C)A、只能消除一组数据的水平对标准差的影响B、只能消除一组数据的计量单位对标准差的影响C、可以同时消除数据的水平和计量单位对标准差的影响D、可以准确反映一组数据的离散程度6、峰态通常是与标准正态分布相比较而言的,如果一组数据服从标准正态分布,则峰态系数的值(A)A、等于0B、大于0C、小于0D、等于17、如果峰态系数K>0,表明该组数据是(A)A、尖峰分布B、扁平分布C、左偏分布D、右偏分布8、某大学经济管理学院有1200名学生,法学院有800名学生,医学院有320名学生,理学院有200名学生。在上面的描述中,众数是(B)A、1200B、经济管理学院C、200D、理学院9、某大学经济管理学院有1200名学生,法学院有800名学生,医学院有320名学生,理学院有200名学生。描述该组数据的集中趋势宜采用(A)A、众数B、中位数C、四分位数D、均值10、某居民小区准备采取一项新的物业管理措施,为此,随机抽取了100户居民进行调查,其中表示赞成的有69户,表示中立的有22户,表示反对的有9户,描述该组数据的集中趋势宜采用(B)A、众数B、中位数C、四分位数D、均值11、对于分类数据,测度其离散程度使用的统计量主要是(B)A、众数B、异众比率C、标准差D、均值12、甲、乙两组工人的平均日产量分别为18件和15件。若甲、乙两组工人的平均日产量不变,但是甲组工人数占两组工人总数的比重下降,则两组工人总平均日产量(B)A、上升B、下降C、不变D、可能上升,也可能下降13、权数对平均数的影响作用取决于(C)A、各组标志值的大小B、各组的次数多少C、各组次数在总体单位总量中的比重D、总体单位总量14、当各个变量值的频数相等时,该变量的(A)A、众数不存在B、众数等于均值C、众数等于中位数D、众数等于最大的数据值15、有8名研究生的年龄分别为21,24,28,22,26,24,22,20岁,则他们的年龄中位数为(B)A、24B、23C、22D、2116、下列数列平均数都是50,在平均数附近散布程度最小的数列是(B)A、02040506080100B、04849505152100C、012509899100D、0474950515310017、下列各项中,应采用加权算术平均法计算的有(B)A、已知计划完成百分比和实际产值,求平均计划完成百分比B、已知计划完成百分比和计划产值,求平均计划完成百分比C、已知各企业劳动生产率和各企业产值,求平均劳动生产率D、已知生产同一产品的各企业产品单位成本和总成本,求平均单位成本18、如果你的业务是提供足球运动鞋的号码,那么,哪一种平均指标对你更有用?(D)A、算术平均数B、几何平均数C、中位数D、众数19、假定某人5个月的收入分别是1800元,1840元,1840元,1840元,1840元,8800元,反映其月收入一般水平应该采用(C)A、算术平均数B、几何平均数C、众数D、调和平均数20、某组数据分布的偏度系数为正时,该数据的众数、中位数、均值的大小关系是(B)A、众数>中位数>均值B、均值>中位数>众数C、中位数>众数>均值D、中位数>均值>众数二、多项选择题1、变量数列中,各组变量值与频数的关系是(AC)A、各组变量值作用的大小由各组频数的多少反映B、各组变量值作用的大小由各组变量值的大小反映C、频数越大的变量值对总体一般水平的影响也越大D、频数越大的变量值对总体一般水平的影响越小E、频数越大,变量值也越大2、应该用加权算术平均法计算平均数的有(ACE)A、已知各组职工工资水平和各组职工人数,求平均工资B、已知各组职工工资水平和各组工资总额,求平均工资C、已知各组计划完成百分数和各组计划产值,求平均计划完成百分数D、已知各组计划完成百分数和各组实际产值,求平均计划完成百分数E、已知各组职工的劳动生产率和各组职工人数,求平均劳动生产率3、下列应该用几何平均法计算的有(BCE)A、生产同种产品的三个车间的平均合格率B、平均发展速度C、前后工序的三个车间的平均合格率D、平均劳动生产率E、以复利支付利息的年平均利率4、下列说法那些是正确的?(ABCD)A、应该用均值来分析和描述地区间工资水平B、宜用众数来描述流行的服装颜色C、考试成绩中位数的含义是有一半考生的成绩超过此数D、在数据组高度偏态时,宜用中位数而不是用众数来作为平均数E、一般常用算术平均法来计算年平均增长率三、填空题1、某班的经济学成绩如下表所示:435556565960676973757777787980818283838384868788888990909597该班经济学成绩的平均数为,众数为,中位数为,上四分位数为,下四分位数为,四分位差为,离散系数为。从成绩分布上看,它属于  ,你觉得用  描述它的集中趋势比较好,理由  。2、在某一城市所做的一项抽样调查中发现,在所抽取的1000个家庭中,人均月收入在200~300元的家庭占24%,人均月收入在300~400元的家庭占26%,在400~500元的家庭占29%,在500~600元的家庭占10%,在600~700元的家庭占7%,在700元以上的占4%。从此数据分布状况可以判断:(1)该城市收入数据分布形状属(左偏还是右偏)。(2)你觉得用均值、中位数、众数中的,来描述该城市人均收入状况较好。理由是。(3)从收入分布的形状上判断,我们可以得出中位数和均值中数值较大。上四分位数所在区间为,下四分位数所在区间为。四、判断分析题(判断正误,并简要说明理由)1、并非任意一个变量数列都可以计算其算术平均数、中位数和众数。()2、某企业某年各季度销售额和利润资料如下:季度1234销售额(百万元)利润率(%)15030180322003521036则该年各季度平均利润率为(30%+32%+35%+36%)/4=33.25%。()3、某企业计划劳动生产率比上年提高10%,实际只提高了5%,表明劳动生产率计划只完成了一半。()4、若数据组的均值是450,则所有的观察值都在450周围。()五、简答题1、简述众数、中位数和均值特点及应用场合。2、某公司下属两个企业生产同一种产品,其产量和成本资料如下:基期报告期单位成本(元)产量(吨)单位成本(元)产量(吨)甲企业乙企业6007001200180060070024001600合计6603006404000试问:报告期与基期相比,该公司下属各企业单位成本都没有变化,但该公司总平均成本却下降了20元,这是为什么?3、一项民意测验询问了2050个成年人,“你对今天的生活状况满意程度如何?”回答分类为满意、不满意和说不清。(1)这一调查的样本规模有多大?(2)回答的答案是属于品质型还是数量型?(3)使用平均数或百分比作为对这一问题的数据的汇总,哪一个更有意义?(4)回答中,8%的人说他们对今天的生活状况不满意,作出这种回答的人是多少?六、计算题1、下表中的数据反映的是1992年到2001年我国职工工资和居民消费价格增长指数:年份1992199319941995199619971998199920002001职工工资增长指数(%)118.5124.8135.4121.7112.1103.6100.2106.2107.9111.0居民消费价格指数(%)106.4114.7124.1117.1108.3102.899.298.6100.4100.7试根据上表数据比较我国1992年到2001年间职工工资平均增长指数与平均居民消费价格指数的大小。2、下面是甲地区空气质量指数(0~50表示良好,50~100表示适中)的一组数据:28,42,58,48,45,55,60,49,50。(1)计算全距、方差和标准差;(2)已知同期观察到的乙地区空气质量指数的平均数为48.5,标准差为11.66,试对两地区的空气质量作出比较。3、某一牧场主每年饲养600头牛。现在有人向他推荐一种个头较小的改良品种牛,每头牛吃草量较少,这样在原来同样面积的牧场上可以多养150头牛。饲养原品种牛和改良品种牛的利润如下:净利润(元/头)原品种牛改良品种牛频数频率(%)频率(%)–20036610122220018531574003676140合计600100100(1)牧场主应该选择哪一种品种?为什么?(2)改良品种牛的利润和频率可能与上表的计算值有差异。当饲养改良品种牛的利润有什么变化时,牧场主会改变他在(1)中所做的选择?答案:一、C,B,A,C,C;A,A,B,A,B;B,B,C,A,B;B,B,D,C,B二、AC,ACE,BCE,ABCD。三、1、77,83,80.5,68.5,87.25,18.75,0.173。左偏,中位数,是数据分布明显左偏又是顺序数据。2、(1)右偏;(2)中位数,数据分布明显右偏,频数较多的几个组家庭百分比相差不大;(3)均值,300~400,400~500。四、1、√,任意一个变量数列都可以计算算术平均数和中位数,但众数的计算和应用则是又条件的,对于呈均匀分布、U形分布或J形分布的数列,众数就不存在或没有意义,此外对于总体单位数不多的情况,众数也缺乏代表性。2、×,应为==33.54%。3、×,劳动生产率计划完成程度为==95.45%。4、√,均值是一组数列的集中趋势,所有的观察值以450为中心,有的比它大,有的比它小。五、1、答:众数是一组数据中出现最多的变量值,是位置代表值,不受极端值的影响,适合于作为分类数据的集中趋势测度值;中位数是一组数据经过排序后,处于中间位置的变量值,是位置代表值,不受极端值的影响,适合于作为顺序数据的集中趋势测度值;均值是一组数据相加后除以数据个数而得到的结果,利用了全部数据信息,主要适用于数值型数据,当数据呈对称分布或接近对称分布时,应选择均值作为集中趋势代表值,但易受极端值的影响,对于偏态分布数据,考虑选择众数或中位数等位置代表值。2、答:虽然两个组平均数即两个企业的平均成本不变,但由于两个企业产量占公司总产量的比重(权数)发生了变化,所以总平均数就会变化。由于单位成本较低的甲企业的产量所占比重上升而单位成本较高的乙企业产量比重相应相应下降,这种变化必然导致总平均数下降。3、答:(1)2050;(2)品质型;(3)百分比;(4)164。六、1、解:根据几何平均数公式计算职工工资平均增长指数和平均消费价格指数为:==1.137==1.069可以看出>,因此1992年到2001年间职工工资平均增长速度快于居民消费价格的平均增长速度。2、解:(1)R=32;=48.333;σ2=82.444;σ=9.0799;(2)Vσ甲=0.188,Vσ乙=0.24。可见两地区空气质量指数的平均水平很接近,甲地区微微优于乙地区;而从标准差或标准差系数来看,甲地区空气质量状况更稳定。总的来说,甲地区空气质量状况较好。3、解:(1)原品种=294元改良品种=272元;原品种牛的利润总额=294×600=176400元;改良品种牛的利润总额=272×750=204000元;所以应该选择改良品种牛。(2)若改良品种牛的平均利润少于235.2(176400÷750)元时,牧场主会选择原品种牛。第5章概率与概率分布【重点】掌握离散型概率分布和连续型概率分布。【难点】区分不同类型随机变量的概率分布。思考题5.1全概率公式和逆概率公式分别用于什么场合?5.2基本事件与复合事件。5.3概率的分配(计算)方法。5.4常用的离散、连续变量的概率分布。练习题一、单项选择题1、根据概率的统计定义,可用以近似代替某一事件的概率的是(ADBCD)。A、大量重复试验中该随机事件出现的次数占试验总次数的比重B、该随机事件包含的基本事件数占样本空间中基本事件总数的比重C、大量重复随机试验中该随机事件出现的次数D、专家估计该随机事件出现的可能性大小2、下列事件中不属于严格意义上的随机事件的是()。A、从一大批合格率为90%的产品中任意抽出的一件产品是不合格品B、从一大批合格率为90%的产品中任意抽出的20件产品都是不合格品C、从一大批优质品率为15%的产品中任意抽出的20件产品都是优质品D、从一大批合格率为100%的产品中任意抽出的一件产品是合格品3、假设A、B为两个互斥事件,则下列关系中,不一定正确的是()。A、P(A+B)=P(A)+P(B)B、P(A)=1-P(B)C、P(AB)=0D、P(A|B)=04、同时抛3枚质地均匀的硬币,巧合有2枚正面向上的概率为()。A、0.125B、0.25C、0.375D、0.55、下列由中心极限定理得到的有关结论中,正确的是()。A、只有当总体服从正态分布时,样本均值才会趋于正态分布B、只要样本容量n充分大,随机事件出现的频率就等于其概率C、无论样本容量n如何,二项分布概率都可以用正态分布近似计算D、不论总体服从何种分布,只要样本容量n充分大,样本均值趋于正态分布二、多项选择题1、下列关于随机变量的数学期望的表述中正确的是(ABE)。A、它又称为随机变量的均值B、它表示该随机变量所有可能取值的平均水平C、它度量的是随机变量的离中趋势D、任一随机变量都存在一个有限的数学期望E、它与加权算术平均数的不同之一是它以概率或分布密度为权数2、下列关于几种概率分布之间的关系的陈述中,正确的有(ABCE):A、二点分布(0-1分布)是二项分布的特例B、当n很大而p又很小时,二项分布可用参数λ=np的泊松分布近似C、当N很大而M/N很小是,超几何分布趋于二项分布D、当n>30时,不管p大小,二项分布的概率都可用正态分布来近似计算E、当n无限增大时,二项分布趋近于正态分布三、判断分析题(判断正误,并简要说明理由)1、频率的极限是概率。2、若某种彩票中奖的概率为5‰,那么随机购买1000注彩票将有5注中奖。四、简答题1、全概率公式与逆概率公式分布用于什么场合?五、计算题1、某厂生产的某种节能灯管的使用寿命服从正态分布,对某批产品测试的结果,平均使用寿命为1050小时,标准差为200小时。试求:(1)使用寿命在500小时以下的灯管占多大比例?(2)使用寿命在850~1450小时的灯管占多大比例?(3)以均值为中心,95%的灯管的使用寿命在什么范围内?答案:一、A,D,B,C,D;二、ABE;ABCE三、1、错误。当观察次数n很大时,随机事件发生的频率的稳定值就是概率,频率可作为概率的近似值。但是并不能认为概率就是频率的极限。因为当n很大时,频率稳定地在概率附近摆到,二者出现显著偏差的可能性极小,但并不意味着二者的偏差肯定越来越小。2、错误。中奖的概率为5‰,意味着在试验次数非常多的情况下,平均每1000注彩票大约有5注会中奖。并不意味着每1000注彩票必然有5注中奖。四、1、全概率公式:某一事件B的发生有各种可能的原因Ai(i=1,2,…,n),每一Ai都可能导致B发生,求B发生的概率。逆概率公式:在事件B已发生的条件下,寻找导致A发生的每个原因Ai的概率。五、1、(1)P{X<500}=Φ()=Φ(-2.75)=1-Φ(2.75)=1-0.99702=0.00298(2)P{850≤X≤1450}=Φ()-Φ()=Φ(2)-Φ(-1)=0.97725-0.15865=0.8186(2)由标准正态函数分布表可知,P{|Z|≤1.96}=0.95,即有:P{|Z|=||≤1.96}=P{|X-1050|≤392}=0.95所以95%的灯管的使用寿命在均值左右392小时(658~1442小时)的范围内。第6章抽样与参数估计【重点】深刻理解抽样分布的概念及中心极限定理的意义,灵活掌握均值和比例的区间估计方法的应用。【难点】在不同条件下的区间估计。思考题6.1什么是抽样误差?影响抽样误差的主要因素有哪些?6.2确定必要的抽样数目(样本容量)有何意义?必要抽样数目受哪些因素影响?6.3什么叫统计量?什么是参数?评价统计量优劣有哪些标准?6.4分层抽样与整群抽样的分组作用及方法各是什么?6.5解释抽样推断的含义。6.6解释简单随机抽样、分层抽样、系统抽样和整群抽样的含义。6.7什么是抽样分布?6.8样本统计量的分布与总体分布的关系是什么?6.9样本均值抽样分布的两个主要特征值是什么?它们与总体参数有什么关系?练习题一、单项选择题1、某品牌袋装糖果重量的标准是(500±5)克。为了检验该产品的重量是否符合标准,现从某日生产的这种糖果中随机抽查10袋,测得平均每袋重量为498克。下列说法中错误的是(B)A、样本容量为10B、抽样误差为2C、样本平均每袋重量是估计量D、498是估计值2、设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本平均数的分布都服从或近似服从趋近于(D)A、N(100,25)B、N(100,5/)C、N(100/n,25)D、N(100,25/n)3、在其他条件不变的情况下,要使置信区间的宽度缩小一半,样本量应增加(C)A、一半B、一倍C、三倍D、四倍4、在其他条件不变时,置信度(1–α)越大,则区间估计的(A)A、误差范围越大B、精确度越高C、置信区间越小D、可靠程度越低5、其他条件相同时,要使抽样误差减少1/4,样本量必须增加(C)A、1/4B、4倍C、7/9D、3倍6、在整群抽样中,影响抽样平均误差的一个重要因素是(C)A、总方差B、群内方差C、群间方差D、各群方差平均数7、在等比例分层抽样中,为了缩小抽样误差,在对总体进行分层时,应使(B)尽可能小A、总体层数B、层内方差C、层间方差D、总体方差8、一般说来,使样本单位在总体中分布最不均匀的抽样组织方式是(D)A、简单随机抽样B、分层抽样C、等距抽样D、整群抽样9、为了了解某地区职工的劳动强度和收入状况,并对该地区各行业职工的劳动强度和收入情况进行对比分析,有关部门需要进行一次抽样调查,应该采用(A)A、分层抽样B、简单随机抽样C、等距(系统)抽样D、整群抽样10、某企业最近几批产品的优质品率分别为88%,85%,91%,为了对下一批产品的优质品率进行抽样检验,确定必要的抽样数目时,P应选(A)A、85%B、87.7%C、88%D、90%二、多项选择题1、影响抽样误差大小的因素有(ADE)A、总体各单位标志值的差异程度B、调查人员的素质C、样本各单位标志值的差异程度D、抽样组织方式E、样本容量2、某批产品共计有4000件,为了了解这批产品的质量,从中随机抽取200件进行质量检验,发现其中有30件不合格。根据抽样结果进行推断,下列说法正确的有(ADE)A、n=200B、n=30C、总体合格率是一个估计量D、样本合格率是一个统计量E、合格率的抽样平均误差为2.52%3、用样本成数来推断总体成数时,至少要满足下列哪些条件才能认为样本成数近似于正态分布(BCE)A、np≤5B、np≥5C、n(1–p)≥5D、p≥1%E、n≥30三、填空题1、对某大学学生进行消费支出调查,采用抽样的方法获取资料。请列出四种常见的抽样方法:、、、,当对全校学生的名单不好获得时,你认为方法比较合适,理由是。四、简答题1、分层抽样与整群抽样有何异同?它们分别适合于什么场合?2、解释抽样推断的含义。五、计算题1、某糖果厂用自动包装机装糖,每包重量服从正态分布,某日开工后随机抽查10包的重量如下:494,495,503,506,492,493,498,507,502,490(单位:克)。对该日所生产的糖果,给定置信度为95%,试求:(1)平均每包重量的置信区间,若总体标准差为5克;(2)平均每包重量的置信区间,若总体标准差未知;();2、某广告公司为了估计某地区收看某一新电视节目的居民人数所占比例,要设计一个简单随机样本的抽样方案。该公司希望有90%的信心使所估计的比例只有2个百分点左右的误差。为了节约调查费用,样本将尽可能小,试问样本量应该为多大?3、为调查某单位每个家庭每天观看电视的平均时间是多长,从该单位随机抽取了16户,得样本均值为6.75小时,样本标准差为2.25小时。(1)试对家庭每天平均看电视时间进行区间估计。(2)若已知该市每个家庭看电视时间的标准差为2.5小时,此时若再进行区间估计,并且将边际误差控制在(1)的水平,问此时需要调查多少户才能满足要求?(α=0.05)答案:一、B,D,C,A,C;C,B,D,A,A。二、ADE,ADE,BCE。三、简单随机抽样,分层抽样,等距抽样,整群抽样,分层抽样,不用调查单位的名单,以院系为单位,而且各院系的消费差异也大,不宜用整群抽样。四、1、答:都要事先按某一标志对总体进行划分的随机抽样。不同在于:分层抽样的划分标志与调查标志有关,而整群抽样不是;分层抽样在层内随机抽取一部分,而整群抽样对一部分群做全面调查。分层抽样用于层间差异大而层内差异小,以及为了满足分层次管理决策时;而整群抽样用于群间差异小而群内差异大时,或只有以群体为抽样单位的抽样框时。2、答:简单说,就是用样本中的信息来推断总体的信息。总体的信息通常无法获得或者没有必要获得,这时我们就通过抽取总体中的一部分单位进行调查,利用调查的结果来推断总体的数量特征。五、1、解:n=10,小样本(1)方差已知,由±zα/2得,(494.9,501.1)(2)方差未知,由±tα/2得,(493.63,502.37)2、解:n===16913、解:(1)±tα/2=6.75±2.131×=(5.55,7.95)(2)边际误差E=tα/2=2.131×=1.2n===17第7章假设检验【重点】深刻理解假设检验的逻辑思想,了解假设检验含义和具体方法。【难点】区分不同条件选择检验方法。思考题7.1理解原假设与备择假设的含义,并归纳常见的几种建立原假设与备择假设的规则。7.2检验统计量具备怎样的特征和用途?7.3第一类错误和第二类错误分别是什么?它们发生的概率大小之间存在怎样的关系?7.4简述假设检验的一般步骤。练习题一、单项选择题1、按设计标准,某自动食品包装及所包装食品的平均每袋中量应为500克。若要检验该机实际运行状况是否符合设计标准,应该采用(C)。A、左侧检验B、右侧检验C、双侧检验D、左侧检验或右侧检验2、假设检验中,如果原假设为真,而根据样本所得到的检验结论是否定元假设,则可认为(C)。A、抽样是不科学的B、检验结论是正确的C、犯了第一类错误D、犯了第二类错误3、当样本统计量的观察值未落入原假设的拒绝域时,表示(B)。A、可以放心地接受原假设B、没有充足的理由否定与原假设C、没有充足的理由否定备择假设D、备择假设是错误的4、进行假设检验时,在其它条件不变的情况下,增加样本量,检验结论犯两类错误的概率会(A)。A、都减少B、都增大C、都不变D、一个增大一个减小5、关于检验统计量,下列说法中错误的是(B)。A、检验统计量是样本的函数B、检验统计量包含未知总体参数C、在原假设成立的前提下,检验统计量的分布是明确可知的D、检验同一总体参数可以用多个不同的检验统计量二、多项选择题1、关于原假设的建立,下列叙述中正确的有(CD)。A、若不希望否定某一命题,就将此命题作为原假设B、尽量使后果严重的错误成为第二类错误C、质量检验中若对产品质量一直很放心,原假设为“产品合格(达标)”D、若想利用样本作为对某一命题强有力的支持,应将此命题的对立命题作为原假设E、可以随时根据检验结果改换原假设,以期达到决策者希望的结论2、在假设检验中,α与β的关系是(CE)。A、α和β绝对不可能同时减少B、只能控制α,不能控制βC、在其它条件不变的情况下,增大α,必然会减少βD、在其它条件不变的情况下,增大α,必然会增大βE、增大样本容量可以同时减少α和β三、判断分析题(判断正误,并简要说明理由)1、对某一总体均值进行假设检验,H0:=100,H1:≠100。检验结论是:在1%的显著性水平下,应拒绝H0。据此可认为:总体均值的真实值与100有很大差异。2、有个研究者猜测,某贫困地区失学儿童中女孩数是男孩数的3倍以上(即男孩数不足女孩数的1/3)。为了对他的这一猜测进行检验,拟随机抽取50个失学儿童构成样本。那么原假设可以为:H0:P≤1/3。四、简答题1、采用某种新生产方法需要追加一定的投资。但若根据实验数据,通过假设检验判定该新生方法能够降低产品成本,则这种新方法将正式投入使用。(1)如果目前生产方法的平均成本是350元,试建立合适的原假设和备择假设。(2)对你所提出的上述假设,发生第一、二类错误分别会导致怎样的后果?五、计算题1、某种感冒冲剂的生产线规定每包重量为12克,超重或过轻都是严重的问题。从过去的资料知σ是0.6克,质检员每2小时抽取25包冲剂称重检验,并做出是否停工的决策。假设产品重量服从正态分布。(1)建立适当的原假设和备择假设。(2)在α=0.05时,该检验的决策准则是什么?(3)如果=12.25克,你将采取什么行动?(4)如果=11.95克,你将采取什么行动?答案:一、1、C2、C3、B4、A5、B二、1、CD2、CE三、1、错误。“拒绝原假设”只能说明统计上可判定总体均值不等于100,但并不能说明它与100之间的差距大。2、错误。要检验的总体参数应该是一个比重,因此应该将男孩和女孩的人数的比率转换为失学儿童中女孩所占的比例P(或男孩所占的比例P*)所以原假设为:H0:P=3/4(或P≤3/4);H1:P>3/4。也可以是:H0:P*=1/4(或P≥1/4);H1:P*<1/4。四、1、(1)H0:≥350;H1:<350。(2)针对上述假设,犯第一类错误时,表明新方法不能降低生产成本,但误认为其成本较低而被投入使用,所以此决策错误会增加成本。犯第二类错误时,表明新方法确能降低生产成本,但误认为其成本不低而未被投入使用,所以此决策错误将失去较低成本的机会。五、1、(1)H0:μ=120;H1:μ≠12。(2)检验统计量:Z=。在α=0.05时,临界值zα/2=1.96,故拒绝域为|z|>1.96。(3)当=12.25克时,Z===2.08。由于|z|=2.08>1.96,拒绝H0:μ=120;应该对生产线停产检查。(4)当=11.95克时,Z===-0.42。由于|z|=-0.42<1.96,不能拒绝H0:μ=120;不应该对生产线停产检查。第8章相关与回归分析【重点】明确相关关系,函数关系,因果关系,掌握基本的回归分析和预测方法,能应用实际资料构建一元线性回归模型,并借助计算机进行系统分析。【难点】多元线性回归分析和预测方法的准确运用。思考题8.1什么是函数关系?什么是相关关系?它们有何区别与联系?8.2相关关系有哪些分类?8.3相关系数与判定系数的关系。8.4解释相关关系的含义,说明相关关系的特点。8.5简述相关系数的取值及其意义。8.6解释总平方和、回归平方和、残差平方和的含义,并说明它们之间的关系。8.7在回归分析中,F检验和t检验各有什么作用?8.8什么是置信区间估计和预测区间估计?二者有何区别?练习题一、单项选择题1、下面的关系中不是相关关系的是(D)A、身高与体重之间的关系B、工资水平与工龄之间的关系C、农作物的单位面积产量与降雨量之间的关系D、圆的面积与半径之间的关系2、具有相关关系的两个变量的特点是(A)A、一个变量的取值不能由另一个变量唯一确定B、一个变量的取值由另一个变量唯一确定C、一个变量的取值增大时另一个变量的取值也一定增大D、一个变量的取值增大时另一个变量的取值肯定变小3、下面的假定中,哪个属于相关分析中的假定(B)A、两个变量之间是非线性关系B、两个变量都是随机变量C、自变量是随机变量,因变量不是随机变量D、一个变量的数值增大,另一个变量的数值也应增大4、如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上,则称这两个变量之间为(A)A、完全相关关系B、正线性相关关系C、非线性相关关系D、负线性相关关系5、根据你的判断,下面的相关系数取值哪一个是错误的(C)A、–0.86B、0.78C、1.25D、06、设产品产量与产品单位成本之间的线性相关关系为–0.87,这说明二者之间存在着(A)绝对值大于0.8A、高度相关B、中度相关C、低相关D、极弱相关7、在回归分析中,描述因变量y如何依赖于自变量x和误差项ε的方程称为(B)A、回归方程B、回归模型C、估计回归方程D、经验回归方程8、在回归模型y=中,ε反映的是(C)A、由于x的变化引起的y的线性变化部分B、由于y的变化引起的x的线性变化部分C、除x和y的线性关系之外的随机因素对y的影响D、由于x和y的线性关系对y的影响9、如果两个变量之间存在负相关关系,下列回归方程中哪个肯定有误(B)A、=25–0.75xB、=–120+0.86xC、=200–2.5xD、=–34–0.74x10、说明回归方程拟合优度的统计量是(C)A、相关系数B、回归系数C、判定系数D、估计标准误差11、判定系数R2是说明回归方程拟合度的一个统计量,它的计算公式为(A)A、B、C、D、12、已知回归平方和SSR=4854,残差平方和SSE=146,则判定系数R2=(A)4854/(4854+146)A、97.08%B、2.92%C、3.01%D、33.25%13、一个由100名年龄在30~60岁的男子组成的样本,测得其身高与体重的相关系数r=0.45,则下列陈述中不正确的是(D)A、较高的男子趋于较重B、身高与体重存在低度正相关C、体重较重的男子趋于较高D、45%的较高的男子趋于较重14、下列回归方程中哪个肯定有误(A)A、=15–0.48x,r=0.65B、=–15-1.35x,r=-0.81C、=-25+0.85x,r=0.42D、=120–3.56x,r=-0.9615、若变量x与y之间的相关系数r=0.8,则回归方程的判定系数R2为(C)A、0.8B、0.89C、0.64D、0.4016、对具有因果关系的现象进行回归分析时(A)A、只能将原因作为自变量B、只能将结果作为自变量C、二者均可作为自变量D、没有必要区分自变量二、多项选择题1、下列现象不具有相关关系的有(ABD)A、人口自然增长率与农业贷款B、存款期限与存款利率C、降雨量与农作物产量D、存款利率与利息收入E、单位产品成本与劳动生产率2、一个由500人组成的成人样本资料,表明其收入水平与受教育程度之间的相关系数r为0.6314,这说明(E)中度A、二者之间具有高度的正线性相关关系B、二者之间只有63.14%的正线性相关关系C、63.14%的高收入者具有较高的受教育程度D、63.14%的较高受教育程度者有较高的收入E、通常来说受教育程度较高者有较高的收入三、判断分析题(判断正误,并简要说明理由)1、一项研究显示,医院的大小(用病床数x反映)和病人住院天数的中位数y之间是正相关,这说明二者之间有一种必然的联系。()2、应用回归方程进行预测,适宜于内插预测而不适宜于外推预测。()四、简答题1、解释相关关系的含义,说明相关关系的特点。2、简述狭义的相关分析与回归分析的不同。五、计算题1、研究结果表明受教育时间与个人的薪金之间呈正相关关系。研究人员搜集了不同行业在职人员的有关受教育年数和年薪的数据,如下:受教育年数x年薪(万元)y受教育年数x年薪(万元)y83.0073.1262.00106.4030.34138.5451.6441.2194.3040.9430.51114.64(1)做散点图,并说明变量之间的关系;(2)估计回归方程的参数;(3)当受教育年数为15年时,试对其年薪进行置信区间和预测区间估计(α=0.05)();2、一国的货币供应量与该国的GDP之间应保持一定的比例关系,否则就会引起通货膨胀。为研究某国家的一段时间内通货膨胀状况,研究人员搜集了该国家的货币供应量和同期GDP的历史数据,如下表:单位:亿元年份货币供应量该国GDP19912.2036.05319922.2766.65919932.4548.27019942.8668.98119952.99211.34219963.59211.93119974.02112.76319984.32612.83419994.39214.71720004.80415.57720015.28815.68920025.34815.715(1)试以货币供应量为因变量y,该国家的GDP为自变量x,建立回归模型;(2)若该国家的GDP达到16.0,那么货币供应量的置信区间和预测区间如何,取α=0.05。答案:一、D,A,B,A,C;A,B,C,B,C。A,A,B,A,C;A二、ABD,AE。三、1、×,这种正相关是因为二者同时受到疾病的严重程度的影响所致。2、√,因为用最小平方法在现有资料范围内配合的最佳方程,推到资料范围外,就不一定是最佳方程。四、1、答:变量之间存在的不确定的数量关系为相关关系,可能还会有其他很多较小因素影响;特点是一个变量的取值不能由另一个变量唯一确定。2、答:变量性质不同,相关分析不必区分自变量和因变量,而回归分析必须区分;作用不同,相关分析用于测度现象之间有无相关关系、关系方向、形态及密切程度,而回归分析是要揭示变量之间的数量变化规律。五、1、解:(1)(2)建立线性回归方程,根据最小二乘法得:由此可得=0.732,=-2.01,则回归方程是=-2.01+0.732x(3)当受教育年数为15年时,其年薪的点估计值为:=-2.01+0.732×15=8.97(万元)估计标准误差:Sy=====0.733置信区间为:=8.97±2.228×0.733×=8.97±1.290预测区间为:=8.97±2.228×0.733×=8.97±2.0812、解:(1)建立线性回归方程,根据最小二乘法得:由此可得=0.0093,=0.316,则回归方程是=0.0093+0.316x
/
本文档为【统计学第四版--习题集及答案[1] (1)】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索