为了正常的体验网站,请在浏览器设置里面开启Javascript功能!
首页 > 统计学数据数值众数中位数平均数讲解与例题幻灯片

统计学数据数值众数中位数平均数讲解与例题幻灯片

2022-02-24 237页 ppt 3MB 28阅读

用户头像 个人认证

zzx

暂无简介

举报
统计学数据数值众数中位数平均数讲解与例题幻灯片第4章统计数据的静态分析4.1总量指标4.2相对指标4.3平均指标4.4标志变异指标4.5数据分布的形态学习本章的目的在于掌握总量指标、相对指标、平均指标、变异指标的概念、特点和它们的计算方法,并能够运用所学的方法分析具体问题。本章学习目的本章重点与难点重点:总量指标的种类、相对指标的数值表现形式、种类及计算方法;平均指标的种类,算术平均数、调和平均数和几何平均数的计算方法、应用场合;众数和中位数概念和特点;变异指标的作用、应用场合和计算方法。难点:时期指标和时点指标的区别、强度相对指标与平均指标的区别、各种平均数的计算及应用...
统计学数据数值众数中位数平均数讲解与例题幻灯片
第4章统计数据的静态分析4.1总量指标4.2相对指标4.3平均指标4.4标志变异指标4.5数据分布的形态学习本章的目的在于掌握总量指标、相对指标、平均指标、变异指标的概念、特点和它们的计算方法,并能够运用所学的方法分析具体问题。本章学习目的本章重点与难点重点:总量指标的种类、相对指标的数值表现形式、种类及计算方法;平均指标的种类,算术平均数、调和平均数和几何平均数的计算方法、应用场合;众数和中位数概念和特点;变异指标的作用、应用场合和计算方法。难点:时期指标和时点指标的区别、强度相对指标与平均指标的区别、各种平均数的计算及应用场合,变异指标的应用场合。什么是态数列4-1静态数列——又称变量数列,是指某一时间在分组的基础上,同时列出总体的次数和比率所构成的数列。总量数相对数2008年北京奥运会中国男篮运动员身高次数分布表总量数相对数平均数静态三数(图)第一模块(4.1、4.2)教学重点绝对指标的计算相对指标的六种形式相对指标的计算主要概念绝对指标相对指标结构相对指标比例相对指标比较相对指标强度相对指标动态相对指标完成相对指标回顾:什么是指标?统计指标统计指标是综合反映统计总体数量特征的概念和数值。指标名称指标数值反映总体某一方面的质的规定性,是对总体本质特征的一种概括。是总体量的规定性在一定时间、地点、条件下的具体表现。4.1总量指标学生总人数30人男生人数20人女生人数10人关于学生人数的总量指标江苏沙钢集团有限公司系江苏省重点企业集团,国家特大型企业,国家520家重点工业企业之一,现有总资产116亿元,占地面积7平方公里,职工7500余名。年生产能力为炼铁100万吨,炼钢400万吨,轧材500万吨,不锈钢板14万吨,热镀锌钢板12万吨,是目前国内最大的电炉钢和优质棒、线材材生产基地。总量指标是计算相对指标和平均指标的基础。作用4.1总量指标4.1.1总量指标意义是认识总体现象的起点。作用总量指标是计算相对指标和平均指标的基础。2010年中国500强平均营业收入552.5亿元,比去年提高6.27%,平均资产为1833.1亿元,比上年提高22.02%。2010美国企业500强总就业人数2479万人,人均收入39.4万美元,人均利润1.6万美元;中国企业500强总就业人数2701万人,人均收入14.8万美元,人均利润0.8万美元。1.按反映的总体内容不同分为:总体标志总量总体单位总量总体标志总量(标志总量)即总体中各总体单位在某一数量标志上表现的所有标志值之和。总体单位总量(总体总量、单位总量)是总体所含总体单位的数目。4.1.2总量指标的种类总体标志总量即总体中各总体单位在某一数量标志上表现的所有标志值之和总体单位总量是总体所含总体单位的数目某市四个企业的有关资料总体单位总量为4个企业标志标志总量一个总体中单位总量是唯一的,但标志总量有许多。判断4.1.2总量指标的种类某商品房展销会,共有32个楼盘参展。了解各楼盘的销售量及相关情况,确定总体和总体总量,第一天的销售量3000套是什么总量?思考回答了解第一天销售的3000套住房的基本情况,3000套是什么总量?4.1.2总量指标的种类结论:总体单位总量和总体标志总量不是固定不变的,统计研究目的发生变化时两者可能发生相互转化。2.按其所反映的时间状况不同分为:时期指标时点指标说明现象总体在某一时刻(瞬间)状态的总量。如在某一时点的总人口数、库存额、手机费余额、耕地面积、存款余额。不具有可加性、数值大小与时点之间间隔长短没有直接关系、由一次性登记调查得到。4.1.2总量指标的种类一月份的产量1月1日产量1月2日产量……1月31日产量汇总连续登记4.1.2总量指标的种类出生人数死亡人数t1时段t2时段t3时段t人口总数时期指标时点指标关于一个人口总体的总量指标通过下表:1、区分总体单位总量与总体标志总量2、区分时期指标与时点指标。总体标志总量时点指标时期指标总体单位总量2006年某地区纺织、化工、机械三个行业企业生产基本情况课堂练习:1.某年新增人口数是()质量指标B.时期指标C.相对指标D.时点指标2.下列指标中属于时点指标的有()。A.商品库存量B.机器台数C.企业个数D.新增设备台数E.产品产量3.某地区2009年新出生人口数为60万人,这一数值为()。A.时期数B.时点数C.绝对数D.数量指标E.总量指标课堂练习:4.某银行年末存款余额是()。质量指标B.数量指标C.相对指标D.绝对数E.时期指标F.时点指标5.某商场2007年空调销售量为6500台,库存年末比年初减少100台,这两个总量指标是()。A.时期指标B.时点指标C.前者是时期指标,后者是时点指标D.前者是时点指标,后者是时期指标3.按计量单位不同分为:实物指标价值指标劳动量指标4.1.2总量指标的种类自然单位:按被研究现象的自然状态单位,作为总量指标的计量单位。如人口以“人”、汽车以“辆”、电视机以“台”、油井以“口”等。度量衡单位:按照统一的度量衡的规定为总量指标的计量单位。钻井(工作量)进尺以米、输油管线长度以公里、原油产量以“吨”、天然气储量以“立方米”、功率以千瓦等采用实物单位计量的总量指标。表现总体的使用价值总量3.按计量单位不同分实物指标价值指标劳动量指标采用实物单位计量的总量指标。表现总体的使用价值总量双重单位(复合单位):将两种或两种以上的单位结合使用,作为总量指标的计量单位。2009年我国铁路运输量为25239.2亿吨公里。再如台/千瓦、人/平方公里实物单位:按统一的折算标准,作为同类现象总量的计量单位。2009年化肥(折100%)6599.7万吨;一次性能源28亿吨标准煤(我国含热7000千卡/公斤的定为标准煤)4.1.2总量指标的种类3.按计量单位不同分为:采用货币单位计量的总量指标。2010年全年国内生产总值40533.6亿元。以劳动时间为单位计量的总量指标。实物指标价值指标劳动量指标4.1.2总量指标的种类相对数NBA奇观:最高与最矮相对指标又称相对数,是社会经济现象中两个有联系的统计指标的比值。反映了现象之间数量对比关系和联系程度。4.2.1相对指标的概念和作用相对指标1978年我国经济总量占世界经济总量的比重仅为1.8%,2008年为6.4%。根据世界银行资料,折合成美元,我国2008年国内生产总值为38600亿美元,相当于美国的27.2%,日本的78.6%。4.2相对指标1.相对指标的概念和作用反映社会经济现象之间的相对水平和联系程度。相对指标的作用:提供现象之间比较的基础。4.2相对指标4.2.1相对指标的概念和作用平均总资产3000万元利税总额总资产资金利润率500万元5000万元16.7%12.5%比较两厂经济效益不可比可比平均总资产40000万元总人数30人男生人数20人女生人数10人男生比重为2/3女生比重为1/3男女比例为2:1总量指标相对指标 无名数有名数用倍数、系数、成数、﹪、‰等表示有具体文字计量单位的称为名数。绝大多数的强度相对指标用有名数表示。用双重计量单位表示的复名数2.相对指标的表现形式2009末我国电话普及率为79.9部/百人;万元国内生产总值用水量209.3立方米(209.3立方米/万元)无名数有名数用倍数、系数、成数、﹪、‰等表示用双重计量单位表示的复名数2.相对指标的基本表现形式分母为1.00分母为10分母为100分母为1000某城市出生人口性别比为1.08:12010年我国人口出生率为11.9‰;死亡率7.11‰,自然增长率为4.79‰。4.2.2相对指标的种类与计算相对数比较相对指标强度相对指标结构相对指标计划完成程度相对指标按相对数的作用和对比的基础不同相对数分以下几种:比例相对指标4.2.2相对指标的种类与计算1.计划完成相对指标概念:计划完成程度相对指标是社会经济现象的实际完成数与计划数对的比值,一般用百分数表示。计算公式:计划数所属的时间如果为1个月、1个季度、半年、一年的为短期计划。计划数所属的时间如果为五年、十年的称为长期规划。1.计划完成相对指标(1)短期计划,计划完成程度相对指标的计算短期计划计划数是绝对数(平均数)。例如:某年某商业企业,商品销售额计划指标为3000万元。计划数是相对数。例如:某企业计划利税额要比上年提高2%。1.计划完成相对指标①绝对数(平均数)的形式规定计划任务某年某商业企业,商品销售额计划指标为3000万元,当年该企业实际商品销售额为3600万元,计算该企业的计划完成程度。例(1)短期计划,计划完成程度相对指标的计算①绝对数(平均数)的形式规定计划任务某企业期计划生产甲种产品35000吨,实际生产了为38000吨,则甲种产品产量的计划完成程度为:例(1)短期计划,计划完成程度相对指标的计算说明该公司甲种产品产量实际超计划8.57%完成任务。②按提高率(降低率)等相对数规定计划任务,计划完成程度相对指标的计算某年某企业计划某产品的单位成本要比上年降低4%,实际比上年降低为5%,计算该企业单位成本计划完成程度相对数,说明该企业是否完成计划了任务。例同期计划数实际完成数该企业超额1.04%(100%-98.96%)完成了计划任务。(1)短期计划,计划完成程度相对指标的计算评价计划完成情况,要以计划指标的性质和要求为标准。财政收入、商品销售额、利润额是以最低限额提出计划任务的成果性指标,计划完成程度大于100%是超额完成计划;产品单位成本、商品流通费用、单位产品原材料消耗是以最高限额提出计划任务的支出性指标,计划完成程度小于100%是超额完成任务。(1)短期计划,计划完成程度相对指标的计算某企业计划利税额要比上年提高2%,实际利税额比上年提高了3%,计算该企业利税额计算完成程度相对数。练习(1)短期计划,计划完成程度相对指标的计算1.计划完成相对指标超额1.98%(101.98%-100%)完成计划任务。1.计划完成相对指标(2)长期计划完成程度相对指标的计算长期计划水平法:五年规划的指标是最后一年应达到的水平。累积法:五年规划的指标是全期应完成的累计数。1.计划完成相对指标某企业规定五年规划最后一年产品产量要达到60万吨,执行情况如下,计算计划完成程度相对数和提前完成任务的时间。例①水平法长期计划完成程度相对指标的计算1.计划完成相对指标(2)长期规划完成程度相对指标的计算①水平法长期计划完成程度相对指标的计算(一)计划完成相对数2.长期规划完成程度相对指标的计算该企业超额20%完成规划任务,提前完成任务的时间是9个月(14+15+15+16=60)。用水平法计算五年规划完成程度相对指标时,提前完成任务时间的计算方法是:如果在五年中有连续12个月(可跨年度计算)的数值之和,达到或刚好超过规划指标,剩余的时间就是提前完成任务的时间。某城市五年规划要投入基础设施建设资金800亿元,执行情况如下,计算计划完成程度相对数和提前完成任务的时间。例②累计法长期计划完成程度相对指标的计算1.计划完成相对指标(2)长期计划完成程度相对指标的计算1.计划完成相对指标(2)长期规划完成程度相对指标的计算该企业超额22.5%完成规划任务,提前完成任务的时间是一年(100+160+240+300=800)。用累计法计算五年规划完成程度相对指标时,提前完成任务时间的计算方法是:从规划执行之日起累计实际完成数,如果到某一时间累计数值之和达到或刚好超过规划指标时,剩余的时间就是提前完成任务的时间。(3)计划执行进度相对指标的计算全年计划执行进度相对数=84/310=27%当计划执行到计划期内的某一时间,用此时的实际完成数与全期计划对比,可计算计划执行进度相对指标。【例】某工厂某年1月份的产值为10万元,2月份的产值为24万元,3月份的产值为50万元,全年产值计划数为3310万元,则:1.计划完成相对指标【例】假设某油田2012年计划产品产量达到1850万吨,截止到2012年4月底已完成的产品产量为650万吨,则计划执行进度=(650/1850)×100%=35.14%说明截止到2009年4月底已完成产品产量全年计划的35.14%。课堂练习:2.某企业生产某种产品的资料如下,计算:(1)该产品单位成本计划降低率和实际降低率。(2)该产品单位成本计划完成程度,并说明是否完成计划。课堂练习:1.某企业,2005年某产品的单位成本为800元,2006年计划规定单位成本要比上年降低4.5%,实际降低5%。计算:(1)该产品2006年单位成本的计划数与实际数。(2)该产品2006年降低成本计划完成情况相对指标。3.某企业生产某种产品,按五年规划规定最后一年产量应达到100万吨,执行情况如下:试计算:(1)该产品计划完成情况相对指标;(2)该企业提前了多长时间完成了五年规划规定的指标。4.某企业2005-2010年规划基本建设投资总额为2500万元,实际执行情况如下,试计算:(1)2005-2010年基本建设投资总额规划完成情况相对指标;(2)该企业提前多少时间完成了五年规划规定的指标。2.结构相对指标结构相对指标,又称比重指标或结构相对数,是在统计分组的基础上,总体中某一部分的数值与总体数值的比值。计算公式:2.结构相对指标【例】2010年全社会固定资产投资278121.9亿元,其中,城镇投资额1241430.9亿元,则结构相对指标的作用:1.利用结构相对数可以反映社会经济现象在一定时间、地点条件下总体的内部结构的特征。“金砖四国”巴西(Brazil)、俄罗斯(Russia)、印度(India)中国(China)的第一个字母BRIC的发音与英文单词的砖相似。目前金砖四国的人口数占全球总人口的42%,GDP占全球的14.6%,贸易额占全球的12.8%。2.结构相对指标2.将不同时期的结构相对数比较,反映现象发展变化的过程和发展趋势。世界上第三产业占GDP比重平均水平是68%,低收入国家是48.5%,中等收入国家是54.2%,高收入国家是71.3%。美国的第三产业占GDP比重占75.3%3.比例相对指标也称比例相对数,是在统计分组的基础上,总体内不同部分指标数值的比值。它可以反映总体中各组成部分之间数量联系程度和比例关系。比例相对指标计算公式某地区某年末人口数为1000万人,其中男性514万人,女性486万人,该地区女性人口数是男性人口数的百分之多少,男女性别比是多少。3.比例相对指标该地区女性人口数是男性人口数的94.6%(486/514),男女性别比约等于106:100(514/486)。比例相对数比例相对指标可以反映总体各组成部分之间数量联系程度和比例关系。计算比例相对指标,可以考察现象的发展是否协调、符合客观规律。例性别比正常范围应在103-107。陕西出生婴儿性别比2005年达到130.7,位居全国第二,仅低于安徽;2007为121.28。2009年全国出生人口男女性别比为119.45。比较相对数,是同一时间,不同空间,同类指标对比的比值。比较相对数时间相同、性质相同分子分母可以互换4.比较相对指标4.比较相对指标比较相对数:它是同一种现象在不同地区(单位、部门)进行对比的结果。【例】2009年甲企业职工平均工资为3.52万元,乙企业为3万元。则说明甲企业职工平均工资为乙企业的117.33%。4.比较相对指标强度相对指标也称强度相对数,是同一时期两个性质不同但有联系的总量指标的比值。计算公式强度相对指标5.强度相对指标2009年年末我国人口数为133474万人,按960万平方公里土地面积计算,计算我国的人口密度是每平方公里多少人。例5.强度相对指标用复名数表示的强度相对数加拿大的土地面积约为998.5万平方公里、人口数约为3242.3万人计算人口密度。(2006年1月末)5.强度相对指标某年某地区年平均人口数为100万人,在该年度内出生的人口数为8600人。则该地区人口出生率:用﹪、‰等无名数表示的强度相对数例年平均人数是年初、年底人口数的平均数,也可以用年中人口数代替5.强度相对指标五名学生的外语成绩分别为60分、70分、80分、90分、100分,平均成绩的计算方法(60+70+80+90+100)/5=400/5=80(分)标志总量总体单位总量两指标是同一总体的标志总量和单位总量,之间的关系是依附关系性质相同。5.强度相对指标强度相对指标的作用:1.反映一个国家或一个地区的经济实力。2.反映事物的密度和普遍程度;3.反映企业经济效益的好坏。5.强度相对指标盈利能力:平均收入利润率(美国4%、中国5.44%)平均净资产收益率(美国7.79%、中国9.4%)反映一个国家或一个地区的经济实力。例如,计算人均国内生产总值、人均钢产量等等主要产品的产量反映国家的经济实力。反映事物的密度和普遍程度;例如,每百人手机拥有量、每百人图书拥有量,反映手机的普及程度和阅读书籍的保障程度。反映企业经济效益的好坏。全员劳动生产率、商品流转次数、人均利税额。5.强度相对指标练习:某地区某年人口数为100万人,医院床位总数为24700张。分析该地区的医疗保证程度。5.强度相对指标逆指标:指标数值越大事物的密度、强度、相对程度越小。每千人拥有医院床位数每张医院床位负担的人口正指标:指标数值越大事物的密度强度、相对程度越大。5.强度相对指标1.在下列相对指标中,分子、分母可以对调的有()。强度相对指标B.计划完成程度相对指标C.比较相对指标D.结构相对指标E.比例相对指标课堂练习:2.下列指标属于平均指标的有()。A.人均国内生产总值B.工人劳动生产率C.全员劳动生产率D.学生平均学习成绩E.某地区人口密度3.下列指标中属于强度相对指标的是()。A.工人劳动生产率B.人均GDPC.人口出生率 D.职工平均工资课堂练习:6.下列指标中,属于强度相对指标的有()。A.人口密度B.人均国内生产总值C.人均钢产量D.商品流通费E.每百元资金实现的利税额2.将不同时期的结构相对数比较,反映现象发展变化的过程和发展趋势。建国初期,我国农业基础薄弱、工业素质不高、服务发展滞后。在整个产业构成中,农业居主导地位。世界上第三产业占GDP比重平均水平是68%,低收入国家是48.5%,中等收入国家是54.2%,高收入国家是71.3%。美国的第三产业占GDP比重占75.3%产业结构基本实现了由以农业为主向一产、二产和三产协同发展的转变。下周见作业:课后练习计算题数据描述的数值方法数据描述的数值方法分布的形状集中趋势离散程度众数中位数均值离散系数方差和标准差峰度四分位距极差偏态4.34.44.5第二模块4.3平均指标4.3平均指标是反映总体各单位某一数量标志在一定时间、地点、条件下所达到的一般水平的综合指标。4.3.1平均指标的概念和作用1.平均指标的概念平均月生活费支出750(元)(一般水平)数量标志标志值总体单位特点:平均指标是一个代表性数值;谚语说,张家有财千百万,九个邻居穷光蛋。平均起来算一算,家家都是张百万。4.3平均指标将总体各单位标志值之间的差异抽象化了;反映了总体分布的集中趋势。(1)反映分布数列中各变量值分布的集中趋势。(2)用于同类现象在不同时空的对比。(3)利用平均指标分析现象之间的依存关系。2.平均指标的作用4.3平均指标平均数3.平均指标的种类位置平均数算术平均数调和平均数几何平均数中位数(顺序数据)众数(分类数据)数值平均数4.3平均指标1.算术平均数简单算术平均数加权算术平均数调和平均数根据掌握的资料变形为算术平均数(例子)某企业的工会随机调查了20名工人2005年6月加班的小时数,结果如下:该组数据算术平均数等于(13+18+…+12)/20=11.6(小时)。五名学生的月生活费分别为520元、600元、480元、750元、440元。标志总量单位总量简单算术平均数适用于总体资料未经分组整理、尚为原始资料的情况。(1)简单算术平均数1.算术平均数工人的日产量分组资料工人的日产量分组资料职工按收入分组资料职工按收入分组资料1.算术平均数(2)加权算术平均数适用于总体资料经过分组整理形成变量数列的情况。工人的日产量分组资料计算平均日产量(2)加权算术平均数工人的日产量分组资料计算平均日产量加权算术平均数计算平均收入加权算术平均数组中值加权算术平均数计算平均收入组中值组距式变量数列计算平均数计算组距式变量数列的平均数时,仍然采用加权算术平均数的计算公式,公式中的为各组的组中值。组中值是各组变量值一般水平的近似值,用组中值代表各组变量值一般水平,计算的平均数也是一个近似值。是各组的组中值【练习1】学生按学习成绩分组资料如下表所示,计算平均成绩。3900 -50合计47595590以上1275851580-901500752070-80650651060-70每组总成绩(分)组中值人数(人)成绩(分) 【练习2】假设某饮料公司7月份对几个零售店进行了一次调查,得到如表4-3所示数据,计算饮料销售量的均值权数:指变量数列中各组标志值出现的次数(频率)。绝对权数:即次数、频数相对权数:频率、比重权数权数权数加权算术平均数619980决定平均数的变动范围起到权衡轻重的作用决定平均数的变动范围起到权衡轻重的作用工人的日产量分组资料工人的日产量分组资料1.算术平均数职工按收入分组资料职工按收入分组资料1.算术平均数(二)调和平均数【例】在市场上购买某种蔬菜,一等2元/千克,二等1.8元/千克,三等1.5元/千克,如果每个等级的蔬菜各买3元钱、2元钱、和1元钱的,计算平均价格。2.调和平均数【例】某商品在三个市场的销售量和销售价格资料如下,求平均价格。2.调和平均数2.调和平均数【例】小张开了一个运动裤淘宝专卖店,服装品牌有kappa、nike、adidas三种,5月份成交数据如表4-5所示,计算5月份三种品牌的均销售价格。销售总量(单位总量)销售总额(标志总量)2.调和平均数【例】某商品在三个市场的销售额和销售价格资料如下,求平均价格。2.调和平均数加权调和平均数的计算公式选择公式的方法:选择公式的方法:2.找求哪些变量值的平均数,这些变量值就是。如果是分子,该已知为计算公式为:1.写原始形式:如:求平均价格是的原始形式是:3.看另外的已知条件之和是比的分子还是分母。如果是分母,该已知为计算公式为:2.调和平均数【例】某企业某日工人的日产量资料如下:计算该企业该日全部工人的平均日产量。(二)调和平均数【例】某季度某公司下属18个工业企业产值计划完成情况如下:计算该公司该季度的平均计划完成程度。f分析【练习】某集团公司30个企业的销售资料如下,计算该集团公司的平均计划完成程度。分析【练习】某集团公司30个企业的销售资料如下,计算公司的平均计划完成程度。分析2.调和平均数回顾根据掌握的资料变形为简单算术平均数加权算术平均数加权调和平均数算术平均数的性质1、所有的定量数据都有算术平均数。2、计算算术平均数时使用了所有数据。3、一组数只有一个均值。4、各变量值与均值的离差之和等于零。张村有个张千万,九个邻居穷光蛋;统计平均算资产,个个都是张百万。缺点:易受极端值的影响。严格来说无法根据有开口组的分组数据计算算术平均数。选择公式的方法:选择公式的方法:2.找求哪些变量值的平均数,这些变量值就是。如果是分子,该已知为计算公式为:1.写原始形式:如:求平均价格是的原始形式是:3.看另外的已知条件之和是比的分子还是分母。如果是分母,该已知为计算公式为:习题课17.某蔬菜在农贸市场销售资料如下,试分析哪个市场的平均价格高,说明原因。19.甲、乙、丙三个同类企业计划完成情况及一等品率如下,计算:(1)平均计划完成程度相对数。(2)平均一等品率。实际产量(件)57030020420.甲、乙、丙三个车间生产同类产品资料如下,计算(1)平均计划完成程度;(2)平均单位产品成本。总体中出现次数最多或最普遍的变量值,用表示。4.众数众数【例】10名学生的考试成绩为50分、60分、65分、70分、75分、78分、78分、78分、78分、90分。用众数说明总体的一般水平,不受极端数值的影响。求众数的方法(2)根据单项数列确定众数【例】30个银行按所属储蓄所数分组资料如下表所示。众数次数最多(1)根据原始资料确定众数(3)根据组距数列确定众数下限公式:上限公式:式中:表示众数;表示众数组的下限;表示众数组的上限;表示众数组次数与其前一组次数之差;表示众数组次数与其后一组次数之差;表示众数组的组距。【例】节能灯泡的使用时数资料如下表所示,计算使用时数的众数。1.确定众数组。2.利用上限或下限公式计算众数。【例】职工按月收入分组资料如下,求月收入的众数【例】农户按年收入分组资料如下,求年收入的众数1.确定众数组。2.利用上限或下限公式计算众数。当数据分布存在明显的集中趋势,且有显著的极端值时,适合使用众数;当数据分布的集中趋势不明显或存在两个以上分布中心时,不适合使用众数(前者无众数,后者为双众数或多众数,也等于没有众数)众数的原理及应用五名学生的月生活费分别为440元、480元、520元、600元、750元。例将总体各单位标志值按大小顺序排列后,处于数列中间位置的标志值,用表示。5.中位数中位数特点:不受极端数值的影响,在总体标志值差异很大时,具有较强的代表性。2009年,浙江城镇居民人均可支配收入的平均数24611元,人均可支配收入中位数为20985元,比平均数低3626元。居民收入中位数是全部调查家庭按户人均可支配收入排序后,位于全部调查人口数一半位置的那个家庭的人均可支配收入。中位数不受极值的影响,较好地反映了浙江城镇居民收入的一般水平。(资料来源:国家统计局浙江调查总队 2010-03-17题为:“浙江城镇居民收入平稳增长消费热点有所显现”的节选)5.中位数1.根据未分组资料(原始资料)确定中位数(1)先把总体各单位的标志值按大小顺序排列。(2)确定中位数的位置和中位数。求中位数的方法【例】某售货小组5个人,某天的销售额按从小到大的顺序排列为440元、480元、520元、600元、750元,求中位数。所以,中位数是第3个单位的标志值:因为:标志值的项数是奇数。具体方法为:①当标志值的项数为奇数项时,中位数是第(n+1)/2个标志值(n为标志值的项数);求中位数的方法②当标志值的项数为偶数项时,中位数等于第个和第个标志值的算术平均数。【例】8名工人的日产量为21件,23件,24件,26件,27件,29件,30件,33件。2.根据分组资料(组距数列)确定中位数下限公式上限公式式中:表示中位数;表示中位数所在组的下限;表示中位数所在组的上限;表示中位数所在的组以前各组次数之和;表示中位数所在的组以后各组次数之和;表示中位数所在组的次数;各组的次数;各组的组距。(1)确定中位数的位置。2.根据分组资料(组距数列)确定中位数(2)确定中位数所在的组。(3)利用上限或下限公式求中位数。(3)利用上限或下限公式求中位数。练习:节能灯泡的使用时数资料如下,计算使用时数的中位数。2.由各组的向上累计次数知第215个标志值在第四组。1.中位数是第215个标志值单项数列确定中位数30个银行按所属储蓄所数分组资料如下表所示,计算中位数。中位数一定存在;中位数与算术平均数相近;中位数不受极端值影响;中位数的作用及用法总结1.算术平均数的性质1、所有的定量数据都有算术平均数。2、计算算术平均数时使用了所有数据。3、一组数只有一个均值。4、各变量值与均值的离差之和等于零。张村有个张千万,九个邻居穷光蛋;统计平均算资产,个个都是张百万。缺点:易受极端值的影响。严格来说无法根据有开口组的分组数据计算算术平均数。2中位数(Median)一组数据按大小顺序排列后,处在数列中点位置的数值。特点:对一组数据是唯一的。不受极端值的影响。主要用于顺序数据,也可用数值型数据,但不能用于分类数据。3众数(Mode)一组数据中出现次数最多的变量值。主要特点:不受极端值的影响。有的数据无众数或有多个众数。对未分组定量资料很少使用。众数的不惟一性众数无众数众数1众数2众数、中位数和算术平均数的关系对称分布均值=中位数=众数分配为钟形、轻微不对称的经验公式:左偏分布均值中位数众数<<右偏分布众数中位数均值<<小结:平均数、中位数、众数的特点算术平均数:易受极端值影响(使用了全部数据)数学性质优良,主要用于数值型数据数据对称分布或接近对称分布时应用中位数:不受极端值影响数据分布偏斜程度较大时应用;主要用于顺序数据众数:不受极端值影响不具有惟一性数据分布偏斜程度较大时应用;主要用于分类数据四分位数(Quartile)数据按大小顺序排序后把分割成四等分的三个分割点上的数值。在实际应用中四分位数的计算方法并不统一(数据量大时这些方法差别不大)。对原始数据:SPSS中四分位数的位置为(n+1)/4,2(n+1)/4,3(n+1)/4。Excel中四分位数的位置分别为(n+3)/4,2(n+1)/4,(3n+1)/4。如果四分位数的位置不是整数,则四分位数等于前后两个数的加权平均。四分位数计算(例子)排序后的数据:2,5,6,7,8,9,10,12,15,16不能整除时需加权平均:位置22.753数值560.75×(6-5)=0.754.4标志变异指标谚语说,张家有财千百万,九个邻居穷光蛋。平均起来算一算,家家都是张百万。4.4标志变异指标1.标志变异指标的概念4.4.1标志变异指标的概念与作用平均指标将总体各单位标志值之间的差异抽象化。标志变异指标变异指标又称标志变动度,综合反映各个单位标志值差异的程度变异指标能说明总体中各单位标志值之间的差异程度或标志值分布的变异情况,它是说明总体的另一个重要指标。4.4.1标志变异指标的概念与作用1.标志变异指标的概念作用(2)反映社会经济活动过程的均衡性和稳定性。(1)衡量平均指标代表性的大小。标志变异愈大,平均数的代表性愈小;标志变异愈小,平均数的代表性大。2.标志变异指标的作用4.4.1标志变异指标的概念与作用(3)数据的离散程度离散程度反映各变量值远离其中心值的程度(离散程度),从另一个侧面说明了集中趋势测度值的代表程度。不同类型的数据有不同的离散程度测度指标。常用指标:全距(极差)四分位距方差和标准差离散系数衡量平均指标代表性的大小。那个班的成绩更好?4.4.1标志变异指标的概念与作用例:A组:65、68、72、75分B组:34、51、95、100分A组的总成绩:280分,平均成绩70分B组的总成绩:280分,平均成绩70分平均分还能说明问题吗?两个品牌的节能灯泡各抽出5只进行使用时数测定资料如下:使用时数(小时):甲品牌:3000、4000、5000、6000、7000乙品牌:4998、4999、5000、5001、5002那个品牌的质量更稳定4.4.1标志变异指标的概念与作用研究两组变量值的差异程度4.4.2标志变异指标的测定级差(全距)平均差标准差离散系数标志变异指标的测定方法测定标志变动度的相对指标(无名数)测定标志变异指标的绝对指标(有名数)五名学生的月生活费分别为520元、600元、480元、750元、440元。原始资料:计算标志变异指标常见的统计资料工人的日产量分组资料工人的日产量分组资料单项分配数列工人按月收入分组资料组距式变量数列工人按月收入分组资料是总体中各总体单位最大标志值与最小标志值之差,又称全距。用表示。1(1)级差(全距)或最高组上限或开口组假定上限最低组下限或开口组假定下限【例】五名学生的月生活费分别为520元、600元、480元、750元、440元。(二)标志变异指标的计算【例】工人按月收入分组资料如下,计算月收入的全距。最低组下限最高组的上限最低组假定下限最高组的假定上限全距的特点:优点:计算方法简单、易懂;缺点:易受极端数值的影响,不能全面反映所有标志值差异大小及分布状况。评价方法:全距值越小,标志值越集中,标志变动越小,平均数的代表性越高;全距值越大,标志值越分散,标志变动越大,平均数的代表性越低。等于上四分位数与下四分位数之差反映了中间50%数据的离散程度,数值越小说明中间的数据越集中。不受极端值的影响。可以用于衡量中位数的代表性。(2)四分位距(Inter-QuartileRange,IQR)2,5,6,7,8,9,10,12,15,16,20Q1=6,Q2=9,Q3=15(1)简单平均法平均数变量值总体单位数2.平均差是总体各单位的标志值与其平均数的离差绝对值的算术平均数,用A.D表示。【例】5名学生的成绩分别为50分、60分、70分、80分、90分,求成绩的平均差。4.4.2标志变异指标的测定企业按日产量分组资料式中:表示各组的变量值或各组的组中值;表示各组的次数。平均差的计算(2)加权平均法例:计算企业日产量的平均差。例:计算企业日产量的平均差。计算成绩的平均差。平均差的计算平均差的特点:优点:能综合反映全部单位标志值的实际差异程度;缺点:用绝对值的形式消除各标志值与算术平均数离差的正负值问题,不便于作数学处理和参与统计分析运算。评价方法:平均差愈大,标志变动程度愈大,平均数代表性越低平均差愈小,标志变动程度愈小,平均数代表性越高两个品牌的节能灯泡各抽出5只进行使用时数测定资料如下:使用时数(小时):甲品牌:3000、4000、5000、6000、7000乙品牌:4998、4999、5000、5001、5002哪个品牌的质量更稳定研究两组变量值的差异程度练习:计算月产量的平均差。方差和标准差(varianceandstandarddeviation)数据离散程度的最常用测度值反映各变量值与均值的平均差异根据总体数据计算的,称为总体方差(标准差),记为2();根据样本数据计算的,称为样本方差(标准差),记为s2(s)4.4.2标志变异指标的测定—方差与标准差总体方差和标准差(PopulationvarianceandStandarddeviation)未分组数据组距分组数据未分组数据组距分组数据方差的计算公式标准差的计算公式样本方差和标准差(samplevarianceandstandarddeviation)未分组数据组距分组数据未分组数据组距分组数据方差的计算公式标准差的计算公式注意:样本方差用自由度n-1去除!方差的计算公式样本方差用(n-1)去除,从数学角度看是因为它是总体方差σ2的无偏估计量。自由度(degreeoffreedom)自由度的概念由统计学家R.AFisher提出是指数据个数与附加给独立的观测值的约束或限制的个数之差从字面涵义来看,自由度是指一组数据中可以自由取值的个数当样本数据的个数为n时,若样本平均数确定后,则附加给n个观测值的约束个数就是1个,因此只有n-1个数据可以自由取值,其中必有一个数据不能自由取值按着这一逻辑,如果对n个观测值附加的约束个数为k个,自由度则为n-k自由度(degreeoffreedom)样本有3个数值,即x1=2,x2=4,x3=9,则x=5。当x=5确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=4,x2=9,那么x3则必然取2,而不能取其他值为什么样本方差的自由度为什么是n-1呢?因为在计算离差平方和时,必须先求出样本均值x,而x则是附加给离差平方和的一个约束,因此,计算离差平方和时只有n-1个独立的观测值,而不是n个样本方差用自由度去除,其原因可从多方面解释,从实际应用角度看,在抽样估计中,当用样本方差s2去估计总体方差σ2时,它是σ2的无偏估计量4.4.2标志变异指标的测定—3.标准差(例题分析)(1)简单平均法【例】5名学生的成绩分别为50分、60分、70分、80分、90分,求成绩的标准差。(1)简单平均法样本标准差(例题分析)【例】计算计算9名员工的月工资收入的方差和标准差15007507801080850960200012501630方差标准差统计函数—STDEV(2)加权平均法标志变异指标的测定(2)加权平均法式中:表示各组的变量值或各组的组中值;表示各组的次数。计算成绩的标准差。例(2)加权平均法标准差的特点:能综合反映全部单位标志值的实际差异程度;用平方的方法消除各标志值与算术平均数离差的正负值问题,可方便地用于数学处理和统计分析运算.练习:计算月产量的标准差。是非标志总体为研究是非标志总体的数量特征,令指总体中全部单位只具有“是”或“否”、“有”或“无”两种表现形式的标志,又叫交替标志是非标志性别:男、女(非男)产品质量:合格、不合格1010是非标志总体的指标具有某种标志表现的单位数所占的成数不具有某种标志表现的单位数所占的成数指是非标志总体中具有某种表现或不具有某种表现的单位数占全部总体单位总数的比重成数是非标志总体的指标平均数标准差是非标志总体的指标方差标准差系数【例】某厂某月份生产了400件产品,其中合格品380件,不合格品20件。求产品质量分布的集中趋势与离中趋势。是非标志总体的指标解:标准分数(扩充内容)(standardscore)1.也称标准化值2.对某一个值在一组数据中相对位置的度量3.可用于判断一组数据是否有离群点(outlier)用于对变量的标准化处理均值等于0,方差等于1计算公式为标准分数(用于数据变换)z分数只是将原始数据进行了线性变换,它并没有改变一个数据在该组数据中的位置,也没有改变该组数分布的形状,而只是使该组数据均值为0,标准差为1用SPSS对数据进行标准化第1步:选择【Analyze】下拉菜单,并选择【Descriptivestatistics-Descriptive】选项进入主对话框第2步:在主对话框中将变量选入【Variables】,然后选中【Savestandardizedvaluesasvariables】。点击【OK】(SPSS会将标准化后的变量以“Z”开头存放在原始变量工作表中)身高的差异水平:cm体重的差异水平:kg用变异系数可以相互比较可比可比变异系数指标十棵向日葵的高度(米)0.80.91.11.21.21.31.51.51.71.8十棵树木的高度(米):29.529.629.829.929.93030.230.230.430.5两组变量值的绝对水平不同,不能用、比较平均数的代表性和变量值的差异程度4.4.2标志变异指标的计算-4.离散系数标准差系数离散系数离散系数是级差、平均差和标准差与其算术平均数的比值。4.4.2标志变异指标的计算-4.离散系数特点:反映了相对于均值的相对离散程度;可用于比较计量单位不同的数据的离散程度;计量单位相同时,如果两组数据的均值相差悬殊,离散系数可能比标准差等绝对指标更有意义。离散系数:例子对30名经理人员的调查表明年平均收入=$500,000,标准差=$50,000。对30名工人的调查表明平均收入=$32,000,标准差=$5,000。离散系数:经理人员:工人:虽然经理人员收入的绝对离散程度远远大于工人,但经理人员收入的相对离散程度小于工人。4.某工业局全员劳动生产率的标准差为512元,标准差系数为8.4%。试求该工业局全员劳动生产率水平(要求列出公式和算式)。【例】甲组运动员的平均身高为184厘米,标准差为8厘米;乙组运动员按身高分组资料如表所示,比较两组运动员平均身高的代表性。乙组运动员按身高分组资料乙组运动员相关资料计算表甲组运动员的标准差系数:乙组运动员的标准差系数:计算结果表明﹥因此,乙组运动员比甲组运动员平均身高的代表性大。4.5分布形状的度量偏态与峰态(了解)偏态和峰度的类型偏态左偏分布右偏分布正态分布扁平分布峰态尖峰分布1偏态及其测定(Skewness)数据分布的不对称性称作偏态。偏态系数就是对数据分布的不对称性(即偏斜程度)的测度。偏态系数有多种计算方法,在统计软件中(如Excel等)通常采用以下公式:偏态系数的含义左偏分布(也称负偏分布):偏态系数SK<0;偏态系数的绝对值越大,偏斜越严重数据向左边延伸得更多右偏分布(也称正偏分布):偏态系数SK>0;偏态系数的绝对值越大,偏斜越严重。数据向右边延伸得更多对称分布:偏态系数=0。峰度系数的含义扁平分布尖峰分布峰度系数K<0,与正态分布相比该分布一般为扁平、瘦尾,肩部较胖。峰度系数K>0,与正态分布相比该分布一般为尖峰、肥尾,肩部较瘦。均值和方差相同的正态分布Excel中的统计函数MODE—计算众数MEDIAN—计算中位数QUARTILE—计算四分位数AVERAGE—计算平均数HARMEAN—计算简单调和平均数GEOMEAN—计算几何平均数AVEDEV—计算平均差STDEV—计算样本标准差STDEVP—计算总体标准差SKEW—计算偏态系数KURT—计算峰态系数TRIMMEAN—计算切尾均值用Excel和SPSS计算描述统计量SPSS【Analyze】【Descriptivestatistics】【Descriptives】【variables】(选入变量)【Options】(选择需要的描述统计量)【Continue】【OK】SPSSExcel【工具】【数据分析】【描述统计】【确定】【输入区域】【输出选项】【汇总统计】【确定】Excel概念计算特点数列中最大值与最小值之差1.极差(R)R=最大值-最小值优点:容易理解,计算方便缺点:不能反映全部数据分布状况2.平均差(A、D)各标志值与均值离差绝对值的算术平均简单:优点:反映全部数据分布状况缺点:取绝对值,数字上不尽合理3.标准差(σ)优点:容易理解,计算方便,能反映全部数据分布状况2.标准差系数(Vσ)各标志值与均值离差绝对值的算术*100%平均X优点:消除了绝对数的影响,使不同总体的标志变异程度直接对比。概念特点计算各标志值与算术平均数离差平方的算术平均数的平方根公式见教材Vσ=σ结束小结:本章要点(1)总量指标与相对指标:第一,能辨别;第二能熟练地计算各种相对指标集中趋势是一组数据向其中心值靠拢的倾向和程度。常用测度指标有:算术平均数、众数、中位数、分位数等。离中趋势反映的是一组数据中各观测值之间的差异或离散程度。常用测度指标包括极差,四分位距,方差和标准差,离散系数等数据分布的偏态与峰度的含义.Z分数的计算和含义统计工作第二章搜集数据第三章整理与显示数据第四章描述数据前四章小结第二章数据的搜集2.2.2统计数据的来源统计数据的来源从数据本身来看调查或试验从使用者的角度看直接调查或科学试验(直接来源)别人的调查或科学实验(间接来源)统计调查形式示意图普查全面报表抽样调查重点调查典型调查周期性调查一次性调查普查抽样调查重点调查典型调查全面调查非全面调查连续(经常性)调查不连续调查定期报表专门调查调查范围调查时间组织形式统计调查种类统计调查的种类(结构图)统计调查的方法直接观察法报告法采访法通讯法电话调查法网上调查法问卷调查法卫星遥感法问卷设计的步骤1.根据研究目的建立分析架构2.决定问卷之形式3.编拟问卷初稿4.邀请专家学者检查、修订问卷5.预试问卷6.问卷定稿并订定使用说明第3章统计数据的整理与显示☺统计数据的整理☺统计分组☺分配数列(频数分布)☺统计图与统计表分组审核编制统计图表分配数列汇总数据整理的内容统计数据整理的步骤 统计表的设计原则科学实用简练显目美观如何设计统计表?数据类型及图示数据类型品质数据数值型数据汇总表原始数据分组数据时序数据多元数据条形图饼图茎叶图箱线图直方图折线图线图散点图气泡图雷达图环形图第4章统计数据的描述总量指标相对指标平均指标标志变异指标数据分布的形态数据的描述统计量数据特征水平差异分布形状中位数和分位数众数极差和四分位差偏态系数方差或标准差峰态系数平均数离散系数
/
本文档为【统计学数据数值众数中位数平均数讲解与例题幻灯片】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索