[汇总]新建 四分位数
第三章 集中趋势
(Central Tendency)
内容 ,均值 (mean)
,中数 (median)
,众数 (mode)
,选择适当的集中量数
,集中趋势与分布形状
学习目标 ,学会计算均值,中数和众数
,对于给定的分数分布,确定如何选用适宜的集中量数
集中趋势 ,目的:选择一个最能代
整个分布的数值
三种集中趋势量数
1(均值 (Mean) ,算术平均数(arithmetic average) ,总体的均值公式:
μ = X/ N
,样本的均值公式:
x = X /n
,如何计算分布的均值:
公式: , = ,X / N =
,均值具有下列特征:
1) 如果改变一个给定的分数,增加一个被试, 或减少一个被试, 均值应当有
变化.
2) 如果对每一个分数都加上 (或减去) 一个常数, 均值也会加上 (或减去)
这个常数。
3) 如果对每一个分数都乘以 (或除以) 一个常数, 均值也会加上 (或减去)
这个常数。
2(中数(median)
中数(median) 是将分数分布均分为两部分的那个分数. 分布有50% 的
个体等于或小于中数. 中数等价于百分位数(percentile)是50.
如何计算中数?
1)如果分数的个数是奇数个,将其按从小到大的顺序排列.
找出中间的分数
2)如果分数的个数是偶数个,将其按从小到大的顺序排列.
然后找出中间的两个分数。将其相加后再除以2
3)当分布的中间分数有相等的分数时,用中间分数的精确
上下限作插值法
例:计算下列连续型变量的中数
a) 8, 10, 12, 15, 18, 19, 60
b) 8, 10, 12, 15, 16, 18, 19, 60
c) 8, 10, 12, 15, 15, 15, 18, 18, 19, 60
________________________________________ X f % c%
60 1 10 100
19 1 10 80
18 2 20 70
15 3 30 60
, 50 12 1 10 30
10 1 10 20
8 1 10 10
3. 众数 (mode)
在次数分布中, 众数是具有最多次数的那个分数或类目。
众数是 5
注意:一个次数分布可能有多个众数.
众数是2
和 8
如何选择适当的集中量数,
均值:是首选, 它考虑了分布中的每一个分数, 与分布的变异性也有关系。 但在下列情况它未必适合:
众数:对于命名型量表无法计算均值和中数, 只能用众数作集中量数。
中数:在下列情况中数最为适合:
1) 在分布中有少数极端值 (有长尾的偏态分布)
2) 有未确定的值
3) 所考察分布是 'open-ended' - (如. 问卷中有个选项 '5个或
更多')
4) 如果数据是顺序量表.
分布形状与集中趋势量数的关系
对称分布,
正偏态分布,
负偏态分布,
对称的双峰分布,
第四章 差异量数(Variability) 分布的第三个特征 ----变异性(Variability).
变异数是对于分布的延伸和聚类状态程度的定量化描述
变异数越高,表明分数间的差别大, 变异数越高,表明分数间越
近似.
三种变异数: 全距 (range),
差 (standard deviation), 和四分位距(interquartile range). 1. 全距 (range)
-全距是分布分数最大值(maximum) X的精确上限与分布分数最小
值(minimum) X 的精确下限的差值。
注意:如果分数是连续型,必须用精确上下限。
__X f cf c% 若 X是离 10 2 25 100 散型: 9 8 23 92 range =, 8 4 15 60 若 X是连 7 6 11 44 续型: 6 4 5 20 range =, 5 1 1 4
, 用全距描述分数变异性的局限:
- 该统计量只依据分布中的两个极端值,未利用到分布的大部分信息.
2. 四分位距(interquartile range) 度量变异数的另一种方法.
- 50%,25%和75%的百分位数代表什么,
- 用50%,25%和75%的百分位数分布被分成4部分
_X f % c%
7 4
12.5 100
6 4
12.5 87.5
5 4
12.5 75 4 8
25 62.5
3 4
12.5 37.5
2 4
12.5 25
1 4
12.5 12.5
四分位距就是75%百分位数与25%百分位数间的距离. 它代表分布中间50%的距离.
如果上例是连续型变量,
median = Q2 = 4.0 -> 用插入法
25%tile = Q1 = 2.5 -> 区间2 的精确上限
75%tile = Q3 = 5.5 -> 区间5 的精确上限
四分位距 (IQR) = 5.5 - 2.5 = 3.0 semi-interquartile range:四分位距的一半(interquartile range).
SIQR = (Q3 - Q1)
2