为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

统计学——统计数据的描述(老版)

2012-05-24 50页 ppt 1MB 44阅读

用户头像

is_593555

暂无简介

举报
统计学——统计数据的描述(老版)null第三章 统计数据的描述第三章 统计数据的描述本章重点提示: 1、总量指标和相对指标的概念; 2、总体分布集中趋势(平均指标)的概念及测定; 3、总体分布离散程度(离散趋势指标)的概念及测定。 本章难点: 1、计划完成程度相对数的计算; 2、组距数列的中位数、众数计算; 3、标准差的计算及应用。 4、方差的加法定理。STAT第三章 统计数据的描述第三章 统计数据的描述第一节 总量指标(绝对水平) 一、总量指标的概念与作用 1、概念:反映客观现象总规模、总水平的指标。 2、表现形...
统计学——统计数据的描述(老版)
null第三章 统计数据的描述第三章 统计数据的描述本章重点提示: 1、总量指标和相对指标的概念; 2、总体分布集中趋势(平均指标)的概念及测定; 3、总体分布离散程度(离散趋势指标)的概念及测定。 本章难点: 1、计划完成程度相对数的计算; 2、组距数列的中位数、众数计算; 3、差的计算及应用。 4、方差的加法定理。STAT第三章 统计数据的描述第三章 统计数据的描述第一节 总量指标(绝对水平) 一、总量指标的概念与作用 1、概念:反映客观现象总规模、总水平的指标。 2、现形式:绝对数、有名数。 3、特点:总量指标的数值大小与总体范围有关  总体范围越大,总量指标数值越大,反之亦反。 4、作用 (1)认识社会经济现象总体的起点 (2)制定政策、编制计划、实行经营管理的主要依据。 (3)计算相对指标与平均指标的基础。 null二、总量指标的种类 (一)按反映现象总体的不同,可分为: 1、总体单位总量:反映总体所有单位总数的指标。 2、总体标志总量:反映总体中各单位标志值总和的指标。 (二)按指标反映的时间状况不同,可分为: 1、时期指标:反映现象在一段时期发展变化的总量指标。 2、时点指标:反映现象在某个时点所达总量的指标。 (三)按计量单位的不同,可分为: 1、实物量指标: 能直接反映现象的实物内容,但缺少综合性。 2、价值指标: 综合性能强,但不能直接反映现象的实物内容。 实物量指标应与价值量指标结合运用。 3、劳动量单位: 如工时、工日等。STAT第三章 统计数据的描述第三章 统计数据的描述 3、时期指标与时点指标的区别 (1)统计的连续性 A、时期指标具有连续统计的特点 B、时点指标不需要进行连续统计 (2)统计的可加性 A、时期指标不同时期的数值可以累计 B、时点指标不同时期的数值不能累计 (3)指标数值与时间长短有无直接关系 A、时期指标数值与时间长短有直接关系; B、时点指标数值与时间长短无直接关系。 第三章 统计数据的描述第三章 统计数据的描述第二节 相对指标(相对水平) 一、相对指标的意义及表现形式 (一)相对指标的概念 1、定义:两个相互联系的指标数值对比的比值(相对水平) 2、基本:比数/基数 A/B 3、数值表现形式:无名数或复名数。 无名数包括 (1)系数:B=1且A、B相差不大时; (2)倍数:B=1且A大于B很多; (3)成数:B=10; (4)百分数:B=100; (5)千分数:B=1000且A小于B很多。 4、作用:用一个抽象化了的数值来反映两个有联系的事物之间的数量关系第三章 统计数据的描述第三章 统计数据的描述 1、基本计算 (1)计划任务数以绝对数、平均数形式出现; [例]某年某企业工业增加值计划指标为200万元,实际该年该企业完成产值220万元,则5、类型 包括:计划完成程度相对数、结构相对数、比例相对数、比较相对数、强度相对数、动态相对数六种。 二、几种常用的相对指标 (一)计划完成程度相对指标 第三章 统计数据的描述第三章 统计数据的描述(2)计划任务数以相对数形式出现 [例]某厂计划今年的消耗比上年降5%,产值增8%。实际完成情况是:消耗降6%,产值升7%,试分别计算其计划完成程度。解:消耗计划完成程度=经济类指标可区分为逆指标:数值越小越好的指标。所以小于100%为超额完成计划。解:产值计划完成程度= 第三章 统计数据的描述第三章 统计数据的描述正指标:数值越大越好的指标,所以大于100%为超额完成计划。(3)计划执行进度=累计完成数/计划任务数***主管部门所属单位 总的计划完成情况第三章 统计数据的描述第三章 统计数据的描述 2、注意的问 (1)分子分母属于同一总体; (2)分子分母不可逆(位置不可互换); (3) 各部分所占比重之和必须等于100%。 3、作用 (1) 可以揭示总体结构特征; (2) 可以从总体结构的变动中观察现象的变化过程及发展趋势。STAT(二)结构相对指标第三章 统计数据的描述第三章 统计数据的描述 STAT(三)比例相对数2、注意的问题 (1)分子分母属于同一总体; (2)分子分母可逆。 3、作用:研究现象的比例是否协调及其规律。如新生儿性别比、积累率与消费率等。 (四) 比较相对数 第三章 统计数据的描述第三章 统计数据的描述2、注意的问题 (1)分子分母属于不同总体; (2)分子分母可逆; 3、作用:反映现象发展的不平衡程度。 (五)强度相对数 1、公式STAT2、作用 (1)反映现象发展的强度; 例:2006年人均钢产量 中国 322.22公斤/人 俄罗斯 495.68公斤/人 日本 911.18公斤/人 德国 564.25公斤/人 美国 329.31公斤/人 第三章 统计数据的描述第三章 统计数据的描述(2)反映现象分布的密度; [例]人口密度=人口数/国土面积, 2007年资料(人/平方公里) 中国:141;新加坡:6660;孟加拉国:1218;日本:351; 德国:236;美国:33;俄罗斯:9;加拿大:4;澳大利亚:3;蒙古:2; (3)反映公共设施服务的普遍程度。 [例]每千人医疗机构床位数=医疗机构床位数/人口数(千人) 2008年有关资料(单位:张/千人) 北京:6.99;上海:7.00;天津:4.73;新疆:4.65; 辽宁:4.31;安徽:2.37;江西:2.29; 贵州:2.06。 STAT第三章 统计数据的描述第三章 统计数据的描述3、注意的问题 (1)可以是复名数也可以是无名数; (2)有些强度相对数可逆(正指标与逆指标)。 例如:零售商业网密度=零售商业机构数/人口数 (正指标) 零售商业网密度=人口数/零售商业机构数 (逆指标) 人均钢产量=钢产量/人口数。(不可逆) 4、强度相对数与平均数的异同 相同点:均有平均的含义,一般均为复名数。STAT第三章 统计数据的描述第三章 统计数据的描述 (六)动态相对数 1、动态相对数=报告期水平/基期水平 [例]某厂2008年产值为2500万元,2009年为2000万元,则其动态相对数为2500/2000=125%。 2、前述相对数均为静态相对数。STAT 不同点 (1)平均数分子分母属同一总体且一一对应; (2)强度相对数分子分母属不同总体且不一一对应。 第三章 统计数据的描述第三章 统计数据的描述三、计算和运用相对指标的原则 (一)可比性原则 1、内容的可比:分子分母的经济内容应有联系,对比有意义; 2、范围的可比; 3、计量单位、价格与计算方法的可比; (二)相对数与绝对数结合运用的原则 例 粮食产量 比上年增长% 比上年增长的绝对数 甲地 1000万斤 10% 100万斤 乙地 100万斤 10% 10万斤 STAT第三章 统计数据的描述第三章 统计数据的描述第三节 集中趋势(平均水平)的测度 一、平均指标的概念与类型 次数分配数列的两个重要特征:集中趋势与离中趋势。STAT集中趋势:中中间水平或 平均水平(重心)。集中趋 势即多数单位都靠近中间水 平的两侧,越靠近中间水平, 出现的次数越多,反之亦反。 离中趋势:离开中间水平的 趋势,即出现次数分散在中 间水平的两侧,形成分散, 即离中趋势。 第三章 统计数据的描述第三章 统计数据的描述测定集中趋势的指标主要有平均指标 1、平均指标的定义:反映同类现象一般水平的统计指标。 STAT 2、特点 (1)将各单位的数量差异抽象化,即消除离差; (2)反映次数分布的集中趋势,即找出中心; (3)是总体各单位某一数量标志值的代表水平。第三章 统计数据的描述第三章 统计数据的描述3、平均指标的种类STAT第三章 统计数据的描述第三章 统计数据的描述 二、计算平均数 (一)算术平均数 1、 基本公式=总体标志总量/总体单位总量 2、算术平均数的计算 STAT 未分组资料已分组资料 注意: 加权算术平均数不仅受各组变量值大小的影响,还受各组次数多少的影响。次数因其对平均的结果有权衡轻重的作用,因此,也叫权数。第三章 统计数据的描述第三章 统计数据的描述 权数的种类 A、绝对权数(次数)  f B、相对权数(频率或比重)  f/f 只有当各组的次数不相等时, 次数才具有权数的作用。 STAT由此可见,简单算术平均数是加权算术平均数的一个特例。 第三章 统计数据的描述第三章 统计数据的描述 组距数列算术平均数的计算 [例]11人年龄:15,17,19,20,22,22,23,23,25,26,30。求平均年龄。 STAT组距数列算术平均数的计算:以组中值代替组平均数后计算。(近似值)第三章 统计数据的描述第三章 统计数据的描述 是非标志平均数的计算: A:是非标志——将总体全部单位划分为“是”或“否”两类的标志 STATB、哑变量(0—1变量)第三章 统计数据的描述第三章 统计数据的描述3、算术平均数的数学性质 (1)各变量值与其算术平均数的离差之和为零。即 STAT第三章 统计数据的描述第三章 统计数据的描述(2)各变量值与其算术平均数的离差平方和为最小值。 STATnull(二)调和平均数 调和平均数:变量值倒数的算术平均数的倒数。 1、简单调和平均数:(各变量值均为一个单位时使用) [例]某种蔬菜早上0.4元/斤,中午0.25元/斤,晚上0.20元/斤,某人各买1斤,求平均价格。(算术平均法) [例]类似地某人早、中、晚各买1元,求平均价格。 解:STAT式中:x代表各个变量值,n代表变量值项数第三章 统计数据的描述第三章 统计数据的描述2、加权调和平均数:(各变量值为不等单位时使用)STAT第三章 统计数据的描述第三章 统计数据的描述 基本公式:算术平均数=标志总量/总体总量 算术平均数与调和平均数的适用前提 A、已知基本公式母项资料用算术平均数计算;(子项资料未知) B、已知基本公式子项资料用调和平均数计算(母项资料未知)STAT 调和平均数是算术平均数的变形 第三章 统计数据的描述第三章 统计数据的描述(三)、几何平均数 1、定义:n个变量值连乘积的n次方根。 2、适用前提:总体标志总量=总体各单位标志值,宜计算比率或速度的平均数。 3、公式: 4、注意:当观察值有一项为零或负值时,不宜用几何平均数计算。 5、如用同一数据分别计算算术平均数、调和平均数和几何平均数时,则有如下关系:STAT第三章 统计数据的描述第三章 统计数据的描述三、位置平均数 (一)中位数 1、定义:将变量值按大小次序排列,处于中间位置的变量值即为中位数  Me [例]某科室由9人组成,其年龄分别为:24,25,25,26,26,27,28,29,55 2、计算 (1)当资料未分组时,中点位置=(n+1)/2; 当n为奇数时, Me =中间位置的那个变量值; 当n为偶数时,如24,25,25,26,26,27,28,29 Me =中间位置两侧的两个变量值的简单平均。 (2)当资料已分组且形成单项式变量数列时, 中点位置=f/2STAT第三章 统计数据的描述第三章 统计数据的描述[例]中位=180/2=第90个人,所以 Me 应是第90个人的年龄。所以 Me =18岁。 STAT第三章 统计数据的描述第三章 统计数据的描述(3)资料已分组且形成组距式变量数列 ( A)L为中位数所在组的下限,U为上限; (B)i为中位数所在组的组距; (C)Sm-1 为小于中位数的各组次数之和; (D)Sm+1为大于中位数的各组次数之和; (E)fm为中位数所在组的次数。STAT第三章 统计数据的描述第三章 统计数据的描述[例] 下限公式: 上限公式: 并且: STAT第三章 统计数据的描述第三章 统计数据的描述推导: 假定中位数组的变量值呈均匀分布,则采用比例插值法得 STAT 50 60 70 (L) 80(U) 90 100 xy 10 30 60 110 150 180Me= L+x=U-y(Sm-1)第90个人第三章 统计数据的描述第三章 统计数据的描述3、特点 (1)不受极端值的影响,比较稳健。 (2)中位数的取值只与中间位置的一或两个数值有关,利用信息不充分,忽略了其它数据的大小,并且不适合于代数运算。 STAT第三章 统计数据的描述第三章 统计数据的描述(二)众数 1、定义:出现次数最多的变量值。用Mo表示。 A、20,15,18,20,20,22,20,23; n=8 Mo=20 B、20,20,15,19,19,20,19,25; n=8 Mo=20 Mo=19 C、10,11,13,16,15,25,8,12; n=8,但没有众数 2、计算 (1)当资料为单项式数列时。 先确定众数组 再确定众数:Mo=18STAT第三章 统计数据的描述第三章 统计数据的描述(2)当资料为组距式数列时。 先确定众数组; 再用下述公式计算: 符号含义: (A)L为众数组的下限,U为上限; (B)i为众数组的组距; (C)1=fm-fm-1,即众数组的次数与前一组次数之差; 2=fm -fm+1,即众数组的次数与后一组次数之差。STAT第三章 统计数据的描述第三章 统计数据的描述STAT 40 50 60 70 80 90 10050 40 30 20 10A G FB CE D人数产值x y(L) (U)Mo=L+x=U-yO第三章 统计数据的描述第三章 统计数据的描述STAT 40 50 60 70 80 90 10050 40 30 20 10A G FB CE D人数产值x y(L) (U)Mo=L+x=U-yO第三章 统计数据的描述第三章 统计数据的描述众数取值的特点: 众数在众数组的位置与相邻两组 的次数有关,众数在众数组的位 置始终偏向相邻组中次数较大的组, 当相邻两组的次数相等时,众数则 是众数组的组中值。 3、特点 (1)优点:不受极端值的影响。 (2)缺点:未利用所有信息, 缺乏敏感性和不适合代数运算 STAT第三章 统计数据的描述第三章 统计数据的描述四、算术平均数、中位数、众数的比较 (一)三者间的关系 1、数量关系 (1)对称分布: 此处三者均等于35。 STAT第三章 统计数据的描述第三章 统计数据的描述(2)偏态分布 A、右(正)偏: STAT第三章 统计数据的描述第三章 统计数据的描述B、左(负)偏: STAT第三章 统计数据的描述第三章 统计数据的描述2、卡尔•皮尔逊经验公式:适度偏斜情况下,众数与中位数之间的距离,大约为中位数到算术平均数之间距离的两倍。 STAT第三章 统计数据的描述第三章 统计数据的描述STAT(二)众数、中位数和算术平均数的特点和应用场合 众数是一组数据分布的峰值,不受极端值影响,其缺点是不具有唯一性(有时有多个众数,有时没有)。当数据的分布具有明显的集中趋势时,尤其对于偏态分布时,众数的代表性比均值好; 中位数是一组数据中间位置上的代表值,不受极端值影响。对于偏态分布的数据,中位数的代表性比均值好; 算术平均数是就全部数据计算的,具有优良的数学性质,是应用最为广泛的集中趋势测度值,其主要缺点是易受极端值影响。算术平均数适用于数据呈对称分布或接近于对称分布。第三章 统计数据的描述第三章 统计数据的描述 五、计算和应用平均数的原则 1、注意观察总体的同质性; 2、应用组平均数补充说明总体平均数; 3、注意极端值的影响。 STAT第三章 统计数据的描述第三章 统计数据的描述第四节 离散趋势的测度 平均指标只能反映现象的集中趋势而不能反映总体各单位标志值的差异程度。例 STAT集中趋势和离散程度是总体分布的两个重要特征。 一、离散趋势指标的概念与作用 1、概念: 离散趋势指标是反映总体各单位标志值差异(离散)程度的指标。又称标志变动指标、离散程度指标等。 平均指标与离散趋势指标的区别: 平均指标考虑的是如何消除离差,显示集中趋势。而离散趋势指标考虑的是如何计算离差,反映离散的程度及离差的大小。 第三章 统计数据的描述第三章 统计数据的描述 2、作用 (1)衡量平均数代表性的大小。 STAT(2)反映变量值分布的离中趋势和离散程度。 第三章 统计数据的描述第三章 统计数据的描述(3)反映社会经济现象的均衡性和稳定性。 如甲、乙两工厂某年四个季度的产量资料如下(单位:万件): 甲:65、68、72、75,平均每季产量为70万件; 乙:34,51,95,100,平均每季产量为70万件。 二、离散趋势指标的种类 (一)全距(极差) STAT特点1、优点:意义明确,简单方便。 2、缺点:比较粗略,未考虑中间变量值的离散情况。 第三章 统计数据的描述第三章 统计数据的描述(二)平均差(A.D) 1、概念:平均差是总体各单位标志值与其算术平均数离差绝对值的算术平均数。 2、计算: 简单平均差:A.D= STAT 加权平均差: A.D=(适用未分组资料)(适用已分组资料)第三章 统计数据的描述第三章 统计数据的描述 简单平均差计算举例:STAT第三章 统计数据的描述第三章 统计数据的描述 加权平均差计算举例:STAT第三章 统计数据的描述第三章 统计数据的描述 判定准则: STAT 3、特点 (1)充分考虑了每一数值的离中情况,在反映离中趋势方面比较 灵敏,计算方法亦比较简单。 (2)绝对值运算给数学处理带来很多不便。 第三章 统计数据的描述第三章 统计数据的描述(三)方差与标准差 1、概念: 方差( ):总体各单位标志值与其算术平均数离差平方的算术平均数; 标准差( ):总体各单位标志值与其算术平均数离差平方的算术平均数的平方根。 2、基本计算: STAT(简单标准差)(加权标准差)第三章 统计数据的描述第三章 统计数据的描述 简单方差与简单标准差计算举例:STAT第三章 统计数据的描述第三章 统计数据的描述 加权式方差与加权标准差计算举例:STAT第三章 统计数据的描述第三章 统计数据的描述STAT3、是非标志标准差的计算: 4、判定原则和特点:根据同一资料计算:第三章 统计数据的描述第三章 统计数据的描述 特点:充分考虑了每一数值的离中情况,且避免了取绝对值不方便数学处理的缺点,故运用广泛。 5、方差、标准差的简捷计算法STAT=同理,则有第三章 统计数据的描述第三章 统计数据的描述[例] STAT第三章 统计数据的描述第三章 统计数据的描述 6、方差的数学性质:总体各单位标志值与其算术平均数的方差 最小。 STAT第三章 统计数据的描述第三章 统计数据的描述[例]已知各变量值与任意数的方差为500,而这个任意数与变量值平均数之差为12,试确定变量值的方差。 STAT第三章 统计数据的描述第三章 统计数据的描述7、方差加法定理及计算STAT[例]11人日产量(件)如下:15,17,19,20,22,22,23,23,25,26,30。试求其总方差。第三章 统计数据的描述第三章 统计数据的描述 STAT[例]11人日产量(件):15,17,19,20,22,22,23,23,25,26,30。null(4)平均组内方差:各组内方差的平均数。(分组条件下)第三章 统计数据的描述第三章 统计数据的描述[例]11人日产量(件)如下15,17,19,20,22,22,23,23,25,26,30。STAT结论:原始资料是计算总方差;分组资料情况下,组内方差无法计算,因此,根据分组资料计算的方差实际上是组间方差。第三章 统计数据的描述第三章 统计数据的描述(四)离散系数(相对离中趋势) 1、 前述离散趋势指标的特点: A、均带有与原资料相同的计量单位属绝对数和平均数离散指标; B、只有当两总体性质相同、平均数相同时才可用来比较平均数的 代表性。 例:不同性质的绝对量不可直接对比 例: 体重 举重 相对水平 某人 120斤 50斤 50/120=42% 某只蚂蚁 1克 6克 6/1=600% 2、离散系数的特点: A、可用于两个总体平均水平不同时; B、可用于两个总体性质不同或计量单位不同时。STAT第三章 统计数据的描述第三章 统计数据的描述3、计算公式 STAT第三章 统计数据的描述第三章 统计数据的描述 判定原则: STAT越大,说明数据越分散,的代表性越小; 越小,说明数据越集中, 的代表性越大。同理: 越大,说明数据越分散, 的代表性越小; 越小,说明数据越集中, 的代表性越大。null 第五节 相对位置测度及异常值的检测 一、Z分数 z分数通常被称为标准化数值。z可以解释为观察值偏离平均数的标准差个数。 STAT第三章 统计数据的描述null 二、切贝谢夫定理 在任何数据集中,出现在算术平均数左右Z倍范围之内的数据比例至少为(1–1/Z2),Z是大于1的任意数值。 [例]有一组顾客购物付款时等候时间的资料,已知等候时间的均值为4分钟,标准差为0.9分钟,则STAT至少为0 至少为75 至少为89特点:具有普遍性但比较保守。第三章 统计数据的描述null 三、 经验法则 当资料呈对称分布时,则有 STAT-3 -2 -1 1 2 3第三章 统计数据的描述null 四、 异常值检测 异常值:非正常大或非正常小的数值。 检测:计算标准化数值(Z分数),Z分数小于-3或大于+3的数据为异常值。STAT第三章 统计数据的描述
/
本文档为【统计学——统计数据的描述(老版)】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索