第 第6 6章 章
数理统计的基本概念 数理统计的基本概念
第 第6 6章 章 数理统计的基本概念 数理统计的基本概念
数理统计概述 数理统计概述
• • 研究的问题:利用 研究的问题:利用对随机现象的试验观测 对随机现象的试验观测数据 数据推 推
断 断随机现象的统计 随机现象的统计规律及有关结果 规律及有关结果。 。
• • 理论构成: 理论构成:统计抽样、统计推断、应用数理统计 统计抽样、统计推断、应用数理统计
• • 统计推断的基本内容: 统计推断的基本内容:对随机变量的 对随机变量的分布形式 分布形式或 或
分布
分布参数作 作估计 估计或 或假设检验 假设检验。 。
本章内容及其意义 本章内容及其意义
• • 内容: 内容:几个基本概念;几个重要分布;几个基本 几个基本概念;几个重要分布;几个基本
定理 定理
• • 意义: 意义:本章内容构成数理统计理论与
的基础 本章内容构成数理统计理论与方法的基础
6.1 6.1 总体与样本 总体与样本
本节建立数理统计的若干基本概念 本节建立数理统计的若干基本概念. .
6.1.1 6.1.1 总体与个体 总体与个体
§ § 总体 总体: :研究对象的全体所成的集合 研究对象的全体所成的集合. .
§ § 个体 个体: :组成总体的每一个元素 组成总体的每一个元素. .
通常用 通常用随机 随机
变量 变量X X表示 表示
6.1.2 6.1.2 简单随机样本 简单随机样本
§ §简单随机抽样 简单随机抽样: :随机地 随机地, ,独立地从总体中抽取个体 独立地从总体中抽取个体. .
§ §简单随机样本 简单随机样本: :一组相互独立且与总体 一组相互独立且与总体X X同分布 同分布
的随机变量 的随机变量( (X X 1 1 , , X X 2 2 , , ∙∙∙ ∙∙∙, , X X n n ) )称为总 称为总 体 体X X的 的容量 容量为 为n n
的 的简单随机样本 简单随机样本. .
§ § 样本观测值 样本观测值: :总体 总体X X的样本 的样本( (X X 1 1 , , X X 2 2 , , ∙∙∙ ∙∙∙, , X X n n ) )的一组 的一组
观测值 观测值( (x x 1 1 ,x ,x 2 2 , ,∙∙∙ ∙∙∙, ,x x n n ) ) 称为总体 称为总体X X的一组 的一组样本观测值 样本观测值. .
§ § 样本联合分布 样本联合分布
(1) (1)若总体 若总体X X的分布函数为 的分布函数为F F( (x x), ),则其 则其样本 样本( (X X 1 1 , , X X 2 2 , , ∙∙∙ ∙∙∙, ,
X X n n ) )的联合分布函数为 的联合分布函数为
. ) ( ) , , , (
1
2 1 Õ =
=
n
i
i n x F x x x F L
(2) (2)若连续总体 若连续总体X X的概率密度函数为 的概率密度函数为f f( (x x), ),则其 则其样本 样本
( (X X 1 1 , , X X 2 2 , , ∙∙∙ ∙∙∙, ,X X n n ) )的联合密度函数为 的联合密度函数为
. ) ( ) , , , (
1
2 1 Õ =
=
n
i
i n x f x x x f L
(3) (3)若离散总体 若离散总体X X的分布列为 的分布列为
则其 则其样本 样本( (X X 1 1 , , X X 2 2 , , ∙∙∙ ∙∙∙, ,X X n n ) )的联合分布列为 的联合分布列为
. ) ( ) ( ) , , , (
1 1
2 2 1 1 Õ Õ
= =
= = = = = =
n
i
n
i
i i i n n x f x X P x X x X x X P L
例 例1 1 设总体 设总体X X服从 服从B B(1, (1,p p) )两点分布 两点分布, ,求其样本 求其样本( (X X 1 1 , , X X 2 2 , ,
∙∙∙ ∙∙∙, ,X X n n ) )的联合分布列 的联合分布列. .
6.1.3 6.1.3 经验分布函数 经验分布函数
问题 问题: :如何由总体的一组样本观察值 如何由总体的一组样本观察值( (x x 1 1 ,x ,x 2 2 , ,∙∙∙ ∙∙∙, ,x x n n ) )求 求
总体分布函数 总体分布函数F F( (x x) )的近似 的近似? ?
思想 思想: :视 视( (x x 1 1 ,x ,x 2 2 , ,∙∙∙ ∙∙∙, ,x x n n ) )为 为n n次试验结果 次试验结果, , 作近似 作近似
F F( (x x) )= =P P( (X X≤ ≤x x) )≈ ≈f f n n ( (X X≤ ≤x x) )
), ( ˆ ) ( x f x X P = =
§ §定义 定义6.2 6.2 设 设( (X X 1 1 , , X X 2 2 , , ∙∙∙ ∙∙∙, ,X X n n ) )为总体 为总体X X的样本 的样本, ,将其观 将其观
察值 察值( (x x 1 1 ,x ,x 2 2 , ,∙∙∙ ∙∙∙, ,x x n n ) )按从小到大的顺序排列为 按从小到大的顺序排列为
x x 1 1 * * ≤ ≤x x 2 2 * * ≤ ≤∙∙∙ ∙∙∙ ≤ ≤ x x n n * * . .
令 令
ï
ï
î
ï ï
í
ì
³
< £
<
=
*
*
+
*
*
, , 1
, ,
, , 0
) ( 1
1
n
k k n
x x
x x x
n
k
x x
x F
称 称F F n n ( (x x) )为总体 为总体X X的 的经验分布函数 经验分布函数. .
注 注: :称总体 称总体X X的分布函数 的分布函数F F( (x x) )为其 为其理论分布函数 理论分布函数. .
§ § 经验分布函数 经验分布函数F F n n ( (x x) )的收敛性 的收敛性
(1) (1)对任一给定的实数 对任一给定的实数x, x,由 由Bernoulli Bernoulli大数定律 大数定律, ,有 有
). ( ) ( ) ( lim p x F x F n n = ¥ ®
逐点收敛 逐点收敛
(2) (2)格列汶科 格列汶科( (W. W. Glivenko Glivenko) )定理 定理
定理 定理6.1 6.1 设 设 总体 总体X X的分布函数为 的分布函数为F F( (x x), ),经验分布函数 经验分布函数
为 为F F n n ( (x x), ),则 则F F n n ( (x x) )以概率 以概率1 1关于 关于x x均匀 均匀收敛于 收敛于F F( (x x), ),即 即
. 1 } 0 | ) ( ) ( | sup lim { = = -
+¥ < < ¥ - ¥ ®
x F x F P n
x n
认识 认识: :抽样分布 抽样分布F F n n ( (x x) )收敛于总体分布 收敛于总体分布F F( (x x) )这一结果 这一结果, ,
① ①表明 表明F F n n ( (x x) )是 是F F( (x x) )的很好的近似 的很好的近似; ;
②为数理统计的基本思想方法 ②为数理统计的基本思想方法“ “用样本推断总体 用样本推断总体” ”
提供了理论依据 提供了理论依据.
6.1.4 6.1.4 统计量和样本矩 统计量和样本矩
§ § 定义 定义6.3 6.3 设 设( (X X 1 1 , ,∙∙∙ ∙∙∙, ,X X n n ) )为总体 为总体X X的样本 的样本, , g g( (X X 1 1 , ,∙∙∙ ∙∙∙, ,X X n n ) )
为一连续函数 为一连续函数. .若 若g g( (X X 1 1 , ,∙∙∙ ∙∙∙, ,X X n n ) )中不含任何未知参数 中不含任何未知参数, ,
则称 则称g g( (X X 1 1 , ,∙∙∙ ∙∙∙, ,X X n n ) )是一个 是一个统计量 统计量; ; 若 若( (x x 1 1 , ,∙∙∙ ∙∙∙, ,x x n n ) )为样本 为样本
( (X X 1 1 , , ∙∙∙ ∙∙∙, ,X X n n ) )的一组观察值 的一组观察值, ,则称 则称g g( (x x 1 1 , ,∙∙∙ ∙∙∙, ,x x n n ) )为 为统计量 统计量
g g( (X X 1 1 , ,∙∙∙ ∙∙∙, ,X X n n ) )的一个观察值 的一个观察值. .
; ) 1 ( 1 n X X + ; ) ( ) 2 ( 1
2 1 å = -
n
i i n
X m
; ) 3 (
1 å =
n
i
i X
s . } { min ) 4 ( 1 i n i X £ £
例 例2 2 设 设X X 1 1 , ,X X 2 2 , ,… …, ,X X n n 为来自总体 为来自总体N N( (m m, ,s s 2 2 ) )的样本 的样本, ,其 其
中 中m m已知 已知, ,s s 2 2 未知 未知, ,试判断 试判断(1) (1)到 到(4) (4)中哪些是统计量 中哪些是统计量: :
§ § 常用统计量和样本矩 常用统计量和样本矩
(1) (1)样本均值 样本均值: :
(2) (2)样本方差 样本方差: :
样本
差 样本标准差: :
(3) (3)样本 样本k k阶原点矩 阶原点矩: :
(4) (4)样本 样本k k阶中心矩 阶中心矩: :
å
=
=
n
i
i X n
X
1
1
) (X E ®
å
=
-
-
=
n
i
i X X n
S
1
2 2 ) (
1
1
) (X D ®
2 S S =
å
=
=
n
i
k
i k X n
A
1
1
) ( k X E ®
å
=
- =
n
i
k
i k X X n
B
1
) (
1 k EX X E ) ( - ®
X A = 1
2 2
2
~ 1
S S
n
n
B =
-
=
(5) (5)顺序统计量 顺序统计量: :
其中 其中第 第k k位顺序统计量 位顺序统计量 X X k k * * 取样本观测值 取样本观测值( (x x 1 1 ,x ,x 2 2 , ,∙∙∙ ∙∙∙, ,x x n n ) )
中第 中第k k小的值 小的值, , k=1,2, k=1,2,∙∙∙ ∙∙∙,n. ,n.
X X 1 1 * * =min =min{ {X X 1 1 , , X X 2 2 , , ∙∙∙ ∙∙∙, ,X X n n }, }, X X n n * * =max =max{ {X X 1 1 , , X X 2 2 , , ∙∙∙ ∙∙∙, ,X X n n } }
分别称为最小统计量和最大统计量.
(6) (6)样本中位数 样本中位数: :
* *
2
*
1 2 1 , , , n n X X X X X X £ £ £ ® L L
ï î
ï
í
ì
= +
+ =
=
+
+
m n X X
m n X
X
m m
m
2 ) (
2
1
1 2 ~
*
1
*
*
1
(7) (7)样本极差 样本极差: : * 1 * X X R n - =
6.2 6.2 抽样分布 抽样分布
6.2.1 6.2.1 数理统计中的常用分布 数理统计中的常用分布
(1) (1) N N(0,1) (0,1)分布 分布
§ § 定义 定义 设随机变量 设随机变量X X服从 服从N N(0,1) (0,1)分布 分布. .对于给定的 对于给定的
α α (0< (0< α α <1), <1),称满足条件 称满足条件
P P( (X X > > u u α α )= )= α α
的值 的值u u α α 为 为N N(0,1) (0,1)分布的上 分布的上α α分位数 分位数或 或上 上α α分位 分位
点 点. .
( (查表 查表: :依据 依据P P( (X X≤ ≤u u α α )= 1 )= 1- -α α) )
双侧分位数(对称情形): ±u u α α/2 /2 满足 满足
P P( (︱ ︱X X ︱ ︱> > u u α α/2 /2 )= )= α α
( (其中 其中- - u u α α/2 /2 = = u u 1 1 α α/2 /2 ) )
(2) (2) χ χ 2 2 分布 分布
§ 定义6.4设(X X 1 1 , , X X 2 2 , , ∙∙∙ ∙∙∙, ,X X n n ) )是正态总体N(0,1)的样
本.称
2 2
2
2
1
2
n X X X + + + = L c
服从的分布为自由度是 服从的分布为自由度是n n的 的χ χ 2 2 分布 分布, ,记为 记为χ χ 2 2 ~ ~χ χ 2 2 ( (n n). ).
§ § 密度函数 密度函数: :
ï
ï
î
ï ï
í
ì
<
³
G
=
- -
0 , 0
0 ,
) ( 2
) (
2
2
2
1
2
x
x
e x
x f
n
n
x n
dx e x x ò
+¥ - - = G
0
1 ) ( a a 其中 其中
§ § 性质 性质
① ① 数字特征 数字特征: :若 若χ χ 2 2 ~ ~ χ χ 2 2 ( (n n), ),则
E E( (χ χ 2 2 )= )=n, D n, D( (χ χ 2 2 )=2 )=2n n
② ② 可加性 可加性: :设 设X X 1 1 ~ ~ χ χ 2 2 ( (n n 1 1 ), ), X X 2 2 ~ ~ χ χ 2 2 ( (n n 2 2 ), ),且 且X X 1 1 与 与X X 2 2 相 相
互独立 互独立, ,则 则X X 1 1 + +X X 2 2 ~ ~ χ χ 2 2 ( (n n 1 1 + + n n 2 2 ). ).
§ § 上 上α α分位数 分位数 : ) ( 2 n a c
a c c a = > )) ( ) ( (
2 2 n n P
双侧分位数 双侧分位数 : ) ( ), ( 2
2
2
2
1
n n a a c c
-
a c c c c a a = > <
-
)}) ( ) ( { )} ( ) ( ({ 2
2
2 2
2
1
2 n n n n P U
§ § 正态近似 正态近似: : ) 1 , 1 2 ( ~ ) ( 2 2 - n N n & c
当 当n> n>45 45时 时, ,可有 可有 . ) 1 2 (2
1
) ( 2 2 - + » n u n a a c
(3) (3) t t分布 分布
§ § 定义 定义6.5 6.5 设 设X~N X~N(0,1), (0,1),Y Y~ ~ χ χ 2 2 ( (n n), ),且 且X X与 与Y Y独立 独立, ,则 则
随机变量 随机变量
n Y
X
t =
服从的分布称为自由度为 服从的分布称为自由度为n n的 的t t分布 分布, ,记为 记为t~t t~t( (n n). ).
§ § 密度函数 密度函数: :
2
1 2
2
1
2
1
) 1 (
) (
) (
) (
+ - +
+
G
G
=
n n
n
x
n
x f
p
§ §上 上α α分位数 分位数t t α α ( (n n): ): P P( (t t( (n n)> )> t t α α ( (n n))= ))=α α
双侧分位数 双侧分位数: : ) (
2
n t a ±
当 当n> n>45 45时 时, ,可有 可有 a a u n t » ) (
(4) (4)F F分布 分布
§ § 定义 定义6.6 6.6 设 设X~ X~ χ χ 2 2 ( (n n 1 1 ), ), Y~ Y~ χ χ 2 2 ( (n n 2 2 ), ),且 且X X与 与Y Y独立 独立, ,
则随机变量 则随机变量
2
1
n Y
n X
F =
服从的分布称为自由度为 服从的分布称为自由度为n n 1 1 , ,n n 2 2 的 的F分布 分布, ,记为 记为
F~F F~F( (n n 1 1 , ,n n 2 2 ). ).
§ § 密度函数 密度函数: :
ï
ï
î
ï ï
í
ì
<
³
+
G G
G
= +
-
+
0 , 0
0 ,
) 1 (
) )( (
) ( ) (
) (
) (
2
1
2
2 2
2
2 1
2
1
1
2
1
2
1
2 1
2 1
x
x
x
x
x f n n
n
n
n
n
n
n
n
n n
n n
§ §上 上α α分位数 分位数F F α α ( (n n 1 1 , ,n n 2 2 ): ):
P P( (F F( (n n 1 1 , ,n n 2 2 )> )> F F α α ( (n n 1 1 , ,n n 2 2 ))= ))=α α
双侧分位数 双侧分位数: : ). , ( ), , ( 2 1
2
2 1
2 1
n n F n n F a a -
§ § 性质 性质: :
) , (
1
) , (
1 2
2 1 1 n n F
n n F
a
a = -
满足 满足
P P({ ({F F( (n n 1 1 , ,n n 2 2 )< )
)>F F α α/2 /2 ( (n n 1 1 , ,n n 2 2 ) } ) } )= )=α α
6.2.2 6.2.2 正态总体的抽样分布 正态总体的抽样分布
㈠单个正态总体 ㈠单个正态总体
§ § 定理 定理6.2 6.2 设 设( (X X 1 1 , , X X 2 2 , , ∙∙∙ ∙∙∙, ,X X n n ) )是取自正态总体 是取自正态总体N N( (μ μ, ,σ σ 2 2 ) )
的一个样本 的一个样本, , 则 方差 分别为样本均值和样本 和 , 2 S X
); , ( ~ ) 1 (
2
n
N X s m ; ) 2 ( 2 相互独立 与S X
). 1 ( ~
) 1 (
) 3 ( 2
2
2
- - n S n c
s
§ § 推论 推论1 1 设 设( (X X 1 1 , , X X 2 2 , , ∙∙∙ ∙∙∙, ,X X n n ) )正态总体 正态总体N N( (μ μ, ,σ σ 2 2 ) )的样本 的样本, ,
则 则
); 1 , 0 ( ~ ) 1 ( N
n
X
s
m -
). 1 ( ~ ) 2 ( -
-
n t
n S
X m
㈡两正态总体 ㈡两正态总体
§ § 推论 推论2 2
的两个相互独立 和 自正态总体 ) , ( ) , ( 2 2 2 2 1 1 s m s m N N
均 分别为各样本下的样本 与 和 与 的样本 2 2 2 1 , S Y S X
); 1 , 1 ( ~ ) 1 ( 2 1 2
2
2
1
2
2
2
1 - - n n F
S S
s s
); , ( ~ ) (
1
) (
1
) 2 ( 2 1
2
1 2
2
2 1
2
1
1
1
2 1
n n F
Y
n
X
n
n
i
i
n
i
i å å
= =
- -
s
m
s
m
分别是取 和 设 ) , , , ( ) , , , (
2 1 2 1 2 1 n n
Y Y Y X X X L L
则 值与样本方差,
). 2 ( ~
) 2 (
) 1 ( ) 1 (
) (
) 3 (
2 1
2 1
2 1 2 1
2
2 2
2
1 1
2 1
2 2
2
2
1
- +
+
- +
- + -
- - -
= =
n n t
n n
n n n n
S n S n
Y X m m
s s s 时, 当
举例 举例
例 例2 2 设总体 设总体X X服从 服从N N( (m m,6 ,6) )分布 分布, , ( (X X 1 1 , , X X 2 2 , , ∙∙∙ ∙∙∙, ,X X 25 25 ) )为 为X X
的容量为 的容量为25 25的样本 的样本, ,S S 2 2 为样本方差 为样本方差, ,求 求P P( (S S 2 2 <9.1). <9.1).
例3设 (X 11 ,X 12 ,…,X 1n )和(X 21 ,X 22 ,…,X 2n )
分别是取自正态总体N(m,s 2 )的容量为n的两个样
本.试确定n使两个样本均值之差的绝对值超过s
的概率大于0.01。