1
第六章
估计
习题 6.1
1. 设 X1, X2, X3是取自某总体容量为 3 的样本,试证下列统计量都是该总体均值µ 的无偏估计,在方差存
在时指出哪一个估计的有效性最差?
(1) 3211 6
1
3
1
2
1ˆ XXX ++=µ ; (2) 3212 3
1
3
1
3
1ˆ XXX ++=µ ; (3) 3213 3
2
6
1
6
1ˆ XXX ++=µ .
证:因 µµµµµ =++=++=
6
1
3
1
2
1)(
6
1)(
3
1)(
2
1)ˆ( 3211 XEXEXEE ,
µµµµµ =++=++=
3
1
3
1
3
1)(
3
1)(
3
1)(
3
1)ˆ( 3212 XEXEXEE ,
µµµµµ =++=++=
3
2
6
1
6
1)(
3
2)(
6
1)(
6
1)ˆ( 3213 XEXEXEE ,
故 321 ˆ,ˆ,ˆ µµµ 都是总体均值µ 的无偏估计;
因 22223211 36
14
36
1
9
1
4
1)Var(
36
1)Var(
9
1)Var(
4
1)ˆVar( σσσσµ =++=++= XXX ,
2222
3212 3
1
9
1
9
1
9
1)Var(
9
1)Var(
9
1)Var(
9
1)ˆVar( σσσσµ =++=++= XXX ,
2222
3213 2
1
9
4
36
1
36
1)Var(
9
4)Var(
36
1)Var(
36
1)ˆVar( σσσσµ =++=++= XXX ,
故 )ˆVar()ˆVar()ˆVar( 312 µµµ << ,即 2µˆ 有效性最好, 1µˆ 其次, 3µˆ 最差.
2. 设 X1, X2, …, Xn 是来自 Exp(λ)的样本,已知 X 为 1/λ的无偏估计,试
X/1 是否为λ的无偏估计.
解:因 X1, X2, …, Xn 相互独立且都服从指数分布 Exp(λ),即都服从伽玛分布 Ga(1, λ),
由伽玛分布的可加性知 ∑
=
=
n
i
iXY
1
服从伽玛分布 Ga(n, λ),密度函数为
0
1 e
)(
)( >
−− ΙΓ= y
yn
n
Y yn
yp λλ ,
则 λλ
λλλ λλ
1
)1(
)(
e
)(
e
)(
1
10
2
0
1
−=
−Γ⋅Γ=Γ=Γ⋅=⎟⎠
⎞⎜⎝
⎛=⎟⎠
⎞⎜⎝
⎛
−
∞+ −−∞+ −− ∫∫ nnnnndyynndyynynYnEXE n
n
yn
n
yn
n
,
故 X/1 不是λ的无偏估计.
3. 设θˆ 是参数θ 的无偏估计,且有 0)ˆ(Var >θ ,试证 2)ˆ(θ 不是θ 2 的无偏估计.
证:因 θθ =)ˆ(E ,有 2222 )ˆVar()]ˆ([)ˆVar(])ˆ[( θθθθθθ >+=+= EE ,故 2)ˆ(θ 不是θ 2的无偏估计.
4. 设总体 X ~ N (µ , σ 2),X1, …, Xn 是来自该总体的一个样本.试确定常数 c 使 ∑
=
+ −
n
i
ii XXc
1
2
1 )( 为σ 2 的无
偏估计.
解:因 E[(Xi + 1 − Xi )2 ] = Var (Xi + 1 − Xi ) + [E(Xi + 1 − Xi )]2 = Var (Xi + 1) + Var (Xi ) + [E(Xi + 1) − E(Xi )]2 = 2σ 2,
2
则 22
1
1
2
1
1
1
2
1 )1(22)1(])[()( σσ −=⋅−⋅=−=⎥⎦
⎤⎢⎣
⎡ − ∑∑ −
=
+
−
=
+ ncncXXEcXXcE
n
i
ii
n
i
ii ,
故当
)1(2
1
−= nc 时,
2
1
1
2
1 )( σ=⎥⎦
⎤⎢⎣
⎡ −∑−
=
+
n
i
ii XXcE ,即 ∑−
=
+ −
1
1
2
1 )(
n
i
ii XXc 是σ 2 的无偏估计.
5. 设 X1, X2, …, Xn 是来自下列总体中抽取的简单样本,
⎪⎩
⎪⎨
⎧ +≤≤−=
.,0
;
2
1
2
1,1);(
其他
θθθ xxp
证明样本均值 X 及 )(
2
1
)()1( nXX + 都是θ 的无偏估计,问何者更有效?
证:因总体 ⎟⎠
⎞⎜⎝
⎛ +−
2
1,
2
1~ θθUX ,有 )1,0(~
2
1 UXY +−= θ ,
则
2
1−+= θYX ,
2
1
)1()1( −+= θYX , 2
1
)()( −+= θnn YX ,即 2
1)(
2
1)(
2
1
)()1()()1( −++=+ θnn YYXX ,
可得 θθθ =−+=−+=
2
1)(
2
1)()( YEYEXE ,
n
Y
n
YX
12
1)Var(1)Var()Var( === ,
因 Y 的密度函数与分布函数分别为
pY ( y) = I0
1 时,
)2)(1(2
1)(
2
1Var
12
1)Var( )()1( ++=⎥⎦
⎤⎢⎣
⎡ +>=
nn
XX
n
X n ,
故 )(
2
1
)()1( nXX + 比样本均值 X 更有效.
6. 设 X1, X2, X3服从均匀分布 U (0, θ ),试证 )3(3
4 X 及 4X (1)都是θ 的无偏估计量,哪个更有效?
解:因总体 X 的密度函数与分布函数分别为
θθ <<Ι= xxp 0
1)( ,
⎪⎩
⎪⎨
⎧
≥
<≤
<
=
.,1
;0,
;0,0
)(
θ
θθ
x
xx
x
xF
有 X (1)与 X (3)的密度函数分别为
θθ
θ
<<Ι−=−= xxxpxFxp 03
2
2
1
)(3)()](1[3)( , θθ <<Ι== x
xxpxFxp 03
2
2
3
3)()]([3)( ,
则
443
2
2
3)(3)(
0
432
2
30 3
2
)1(
θθθθθ
θ θθ =⎟⎟⎠
⎞
⎜⎜⎝
⎛ +⋅−⋅=−⋅= ∫ xxxdxxxXE ,
4
3
4
33)(
0
4
30 3
2
)3(
θ
θθ
θθ =⋅=⋅= ∫ xdyxxXE ,
1054
2
3
3)(3)(
2
0
543
2
30 3
2
22
)1(
θθθθθ
θ θθ =⎟⎟⎠
⎞
⎜⎜⎝
⎛ +⋅−⋅=−⋅= ∫ xxxdxxxXE ,
5
3
5
33)(
2
0
5
30 3
2
22
)3(
θ
θθ
θθ =⋅=⋅= ∫ xdyxxXE ,
即
80
3
410
)Var(
222
)1(
θθθ =⎟⎠
⎞⎜⎝
⎛−=X ,
80
3
4
3
5
3)Var(
222
)3(
θθθ =⎟⎠
⎞⎜⎝
⎛−=X ,
因 θθ =⋅=
4
4)4( )1(XE , θθ =⋅=⎟⎠
⎞⎜⎝
⎛
4
3
3
4
3
4
)3(XE ,
4
故 4X (1)及 )3(3
4 X 都是θ 的无偏估计;
因
5
3
80
316)4Var(
22
)1(
θθ =⋅=X ,
1580
3
9
16
3
4Var
22
)3(
θθ =⋅=⎟⎠
⎞⎜⎝
⎛ X ,有 ⎟⎠
⎞⎜⎝
⎛> )3()1( 3
4Var)4Var( XX ,
故 )3(3
4 X 比 4X (1)更有效.
7. 设从均值为µ ,方差为σ 2 > 0 的总体中,分别抽取容量为 n1和 n2 的两独立样本, 1X 和 2X 分别是这
两个样本的均值.试证,对于任意常数 a, b(a + b = 1), 21 XbXaY += 都是µ 的无偏估计,并确定常
数 a, b 使 Var (Y ) 达到最小.
解:因 µµµµ =+=+=+= )()()()( 21 babaXbEXaEYE ,
故 Y 是µ 的无偏估计;
因 2
22
2
21
21
2
2
2
1
2
2
2
2
1
2 12)1()(Var)(Var)(Var σσσ ⎟⎟⎠
⎞
⎜⎜⎝
⎛ +−+=⋅−+⋅=+=
n
a
n
a
nn
nn
n
a
n
aXbXaY ,
令 022)(Var 2
221
21 =⎟⎟⎠
⎞
⎜⎜⎝
⎛ −⋅+= σ
n
a
nn
nnY
da
d ,得
21
1
nn
n
a += ,且 02)(Var
2
21
21
2
2
>⋅+= σ
nn
nnY
ad
d ,
故当
21
1
nn
n
a += , 21
21
nn
n
ab +=−= 时,Var
(Y ) 达到最小 2
21
1 σ
nn + .
8. 设总体 X 的均值为µ ,方差为σ 2,X1, …, Xn 是来自该总体的一个样本,T (X1, …, Xn)为µ 的任一线性
无偏估计量.证明: X 与 T 的相关系数为 )Var()Var( TX .
证:因 T (X1, …, Xn)为µ 的任一线性无偏估计量,设 ∑
=
=
n
i
iin XaXXT
1
1 ),,( L ,
则 µµ === ∑∑
==
n
i
i
n
i
ii aXEaTE
11
)()( ,即 1
1
=∑
=
n
i
ia ,
因 X1, …, Xn相互独立,当 i ≠ j 时,有 Cov (Xi, Xj) = 0,
则
n
a
n
XX
n
aXaX
n
XaX
n
TX
n
i
i
n
i
ii
i
n
i
iii
n
i
ii
n
i
i
2
1
2
1111
),Cov(,1Cov,1Cov),Cov( σσ ===⎟⎠
⎞⎜⎝
⎛=⎟⎟⎠
⎞⎜⎜⎝
⎛= ∑∑∑∑∑
=====
,
因 ),Cov()Var(1)Var(
2
TX
n
X
n
X === σ ,
故 X 与 T 的相关系数为
)Var(
)Var(
)Var()Var(
)Var(
)Var()Var(
),Cov(),Corr(
T
X
TX
X
TX
TXTX === .
9. 设有 k 台仪器,已知用第 i 台仪器测量时,测定值总体的标准差为σ i(i = 1, …, k).用这些仪器独立
地对某一物理量θ 各观察一次,分别得到 X1, …, Xk ,设仪器都没有系统误差.问 a1, …, ak应取何值,
方能使 ∑
=
=
k
i
ii Xa
1
θˆ 成为θ 的无偏估计,且方差达到最小?
5
解:因 θθθ ⎟⎟⎠
⎞⎜⎜⎝
⎛===⎟⎟⎠
⎞⎜⎜⎝
⎛= ∑∑∑∑
====
k
i
i
k
i
i
k
i
ii
k
i
ii aaxEaxaEE
1111
)()ˆ( ,
则当 1
1
=∑
=
k
i
ia 时, ∑
=
=
k
i
ii xa
1
θˆ 是θ 的无偏估计,
因 ∑∑∑
===
==⎟⎟⎠
⎞⎜⎜⎝
⎛=
k
i
ii
k
i
ii
k
i
ii axaxa
1
22
1
2
1
)(VarVar)ˆ(Var σθ ,
讨论在 1
1
=∑
=
k
i
ia 时,∑
=
k
i
iia
1
22σ 的条件极值,
设拉格朗日函数 ⎟⎟⎠
⎞⎜⎜⎝
⎛ −+= ∑∑
==
1),,,(
11
22
1
k
i
i
k
i
iik aaaaL λσλL ,
令
⎪⎪
⎪⎪
⎩
⎪⎪
⎪⎪
⎨
⎧
=−=∂
∂
=+=∂
∂
=+=∂
∂
∑
=
,01
,02
,02
1
2
2
11
1
k
i
i
kk
k
aL
a
a
L
a
a
L
λ
λσ
λσ
LLLLL
得 22
1
2
−− ++−= kσσλ L , 221
2
−−
−
++= k
i
ia σσ
σ
L ,i = 1, …, k,
故当 22
1
2
−−
−
++= k
i
ia σσ
σ
L ,i = 1, …, k 时, ∑==
k
i
ii xa
1
θˆ 是θ 的无偏估计,且方差达到最小.
10.设 X1, X2, …, Xn 是来自 N (θ, 1)的样本,证明 g(θ ) = |θ | 没有无偏估计(提示:利用 g(θ )在θ = 0 处不可
导).
证:反证法:假设 T = T (X1, X2, …, Xn)是 g(θ ) = |θ | 的任一无偏估计,
因 ∑
=
=
n
i
iXn
X
1
1 是θ 的一个充分统计量,即在取定 xX = 条件下,样本条件分布与参数θ 无关,
则 )|( XTES = 与参数θ 无关,且 S 是关于 X 的函数, ||)()()]|([)( θθ ==== gTEXTEESE ,
可得 )(XSS = 是 g(θ ) = |θ | 的无偏估计,
因 X1, X2, …, Xn 是来自 N (θ, 1)的样本,由正态分布可加性知 X 服从正态分布 ⎟⎠
⎞⎜⎝
⎛
n
N 1,θ ,
则 ∫∫ ∞+∞− +−−∞+∞− −− ⋅⋅=⋅= dxxSndxnxSSE xnx
nnxn θθθ 222
22
)(
2 e)(e
π2
e
π2
)()( ,
因 E(S) = |θ |,可知对任意的θ,反常积分 ∫ ∞+∞− +−⋅ dxxS xnx
n θ2
2e)( 收敛,
6
则由参数θ 的任意性以及该反常积分在−∞与+∞两个方向的收敛性知 ∫ ∞+∞− ⋅⋅+−⋅ dxxS xnx
n ||||
2
2
e)(
θ 收敛,
因 xnxSxS xnx
nxnxn ⋅⋅=⎥⎥⎦
⎤
⎢⎢⎣
⎡ ⋅∂
∂ +−+− θθ
θ
22
22 e)(e)( ,且| y | ≤ e | y |,有 ||)1||(22
22
ee
xnxnxnxn
xn
⋅+⋅+−+− ≤⋅ θθ ,
则由 ∫ ∞+∞− ⋅+⋅+−⋅ dxxS xnx
n ||)1|(|
2
2
e)(
θ 的收敛性知 ∫ ∞+∞− +− ⎥⎥⎦
⎤
⎢⎢⎣
⎡ ⋅∂
∂ dxxS xnx
n θ
θ
2
2e)( 一致收敛,
可得 ∫ ∞+∞− +−− ⋅⋅= dxxSnSE xnx
nn θθ 22
22 e)(e
π2
)( 关于参数θ 可导,与 E(S) = |θ |在θ = 0 处不可导矛盾,
故 g(θ ) = |θ | 没有无偏估计.
11.设总体 X 服从正态分布 N (µ , σ 2),X1, X2, …, Xn 为来自总体 X 的样本,为了得到标准差σ 的估计量,
考虑统计量:
∑
=
−=
n
i
i XXn
Y
1
1 ||
1 , ∑
=
=
n
i
iXn
X
1
1 ,n ≥ 2,
∑∑
= =
−−=
n
i
n
j
ji XXnn
Y
1 1
2 ||)1(
1 ,n ≥ 2,
求常数 C1 与 C2,使得 C1Y1 与 C2Y2 都是σ 的无偏估计.
解:设 ),0(~ 2θNY ,有
θθθθ
θθθ
π
2e
π2
2e
π2
12e
π2
1|||][|
0
2
0
22 2
2
2
2
2
2
=−=⋅=⋅=
+∞
−∞+ −∞+
∞−
⋅− ∫∫
yyy
dyydyyYE ,
因 XX i − 是独立正态变量 X1, X2, …, Xn 的线性组合,
且 0)()()( =−=−=− µµXEXEXXE ii ,
222 11,Cov21),Cov(2)Var()Var()Var( σσσ
n
nX
n
X
n
XXXXXX iiiii
−=⎟⎠
⎞⎜⎝
⎛−+=−+=− ,
则 ⎟⎠
⎞⎜⎝
⎛ −− 21,0~ σ
n
nNXX i , σσ π
)1(21
π
2|][|
n
n
n
nXXE i
−=−⋅=− ,
可得 σσ
π
)1(2
π
)1(21|][|1)()( 11
1
11111 n
nC
n
nn
n
CXXE
n
CYECYCE
n
i
i
−=−⋅⋅⋅=−⋅== ∑
=
,
故当
)1(2
π
1 −= n
nC 时,E[C1Y1] = σ,C1Y1 是σ 的无偏估计;
当 i ≠ j 时,Xi 与 Xj 相互独立,都服从正态分布 N (µ , σ 2),
有 E(Xi − Xj) = E(Xi) − E(Xj) = µ − µ = 0,Var(Xi − Xj) = Var(Xi) + Var(Xj) = σ 2 + σ 2 = 2σ 2,
7
则 Xi − Xj ~ N (0, 2σ 2), σσ
π
22
π
2|][| =⋅=− ji XXE ,
当 i = j 时,Xi − Xj = 0,E[| Xi − Xj |] = 0,
可得 σσ
π
2
π
2)(
)1(
1|][|
)1(
1)()( 2
2
2
1 1
22222 Cnnnn
CXXE
nn
CYECYCE
n
i
n
j
ji =−⋅−⋅=−−⋅== ∑∑= = ,
故当
2
π
2 =C 时,E[C2Y2] = σ,C2Y2 是σ 的无偏估计.
习题 6.2
1. 从一批电子元件中抽取 8 个进行寿命测试,得到如下数据(单位:h):
1050,1100,1130,1040,1250,1300,1200,1080,
试对这批元件的平均寿命以及寿命分布的标准差给出矩估计.
解:平均寿命µ 的矩估计 75.1143ˆ == xµ ;标准差σ 的矩估计 8523.89*ˆ == sµ .
2. 设总体 X ~ U (0, θ ),现从该总体中抽取容量为 10 的样本,样本值为:
0.5,1.3,0.6,1.7,2.2,1.2,0.8,1.5,2.0,1.6,
试对参数θ 给出矩估计.
解:因 X ~ U (0, θ ),有
2
)( θ=XE ,即θ = 2 E (X ),故θ 的矩估计 68.234.122ˆ =×== xθ .
3. 设总体分布列如下,X1, …, Xn 是样本,试求未知参数的矩估计.
(1)
N
kXP 1}{ == ,k = 0, 1, 2, …, N − 1,N(正整数)是未知参数;
(2)P{X = k} = (k − 1)θ 2 (1 − θ )k − 2,k = 2, 3, …,0 < θ < 1.
解:(1)因
2
1)]1(10[1)( −=−+++= NN
N
XE L ,即 N = 2 E (X ) + 1,故 N 的矩估计 12ˆ += XN ;
(2)因 ⎥⎦
⎤⎢⎣
⎡ −=−=−−⋅= ∑∑∑ +∞
=
+∞
=
+∞
=
−
2
2
2
2
2
2
2
2
2
22 )1()1()1()1()(
k
k
k
k
k
k
d
d
d
dkkXE θθθθθθθθ
θθθθθθθθ
θ
θθ
2221
)1(1
)1(
3
2
2
2
2
2
2
2
2 =⋅=⎟⎠
⎞⎜⎝
⎛ +−=⎥⎦
⎤⎢⎣
⎡
−−
−=
d
d
d
d ,
则
)(
2
XE
=θ ,
故θ 的矩估计
X
2ˆ =θ .
4. 设总体密度函数如下,X1, …, Xn 是样本,试求未知参数的矩估计.
(1) )(2);( 2 xxp −= θθθ ,0 < x < θ ,θ > 0;
(2)p (x;θ ) = (θ + 1) xθ,0 < x < 1,θ > 0;
(3) 1);( −= θθθ xxp ,0 < x < 1,θ > 0;
(4) θ
µ
θµθ
−−=
x
xp e1),;( ,x > µ ,θ > 0.
8
解:(1)因
332
2)(2)(
0
32
20 2
θθθθθ
θ
θ =⎟⎟⎠
⎞
⎜⎜⎝
⎛ −⋅=−⋅= ∫ xxdxxxXE ,即θ = 3 E (X ),故θ 的矩估计 X3ˆ =θ ;
(2)因
2
1
2
)1()1()(
1
0
21
0 +
+=+⋅+=+⋅=
+∫ θθθθθ
θθ xdxxxXE ,即
)(1
1)(2
XE
XE
−
−=θ ,
故θ 的矩估计
X
X
−
−=
1
12θˆ ;
(3)因
11
)(
1
0
11
0
1
+=+⋅=⋅=
+
−∫ θθθθθ
θθ xdxxxXE ,即
2
)(1
)( ⎥⎦
⎤⎢⎣
⎡
−= XE
XEθ ,
故θ 的矩估计
2
1
ˆ ⎟⎟⎠
⎞⎜⎜⎝
⎛
−= X
Xθ ;
(4)因 θµθµθ µ
θ
µ
µ
θ
µ
µ
θ
µ
µ
θ
µ
µ
θ
µ
+=−=+−=−⋅=⋅=
+∞−−∞+ −−
+∞−−∞+ −−∞+ −− ∫∫∫
xxxxx
dxxdxdxxXE eeee)1(e1)( ,
)(2e2ee)1(e1)( 22222 XEdxxxdxdxxXE
xxxx
θµθ µ
θ
µ
µ
θ
µ
µ
θ
µ
µ
θ
µ
+=+−=−⋅=⋅= ∫∫∫ ∞+
−−
+∞−−∞+ −−∞+ −−
= µ 2 + 2µθ + 2θ 2,
则 Var (X ) = E(X 2 ) − [E(X )]2 = θ 2,即 )Var(X=θ , )Var()( XXE −=µ ,
故θ 的矩估计 *ˆ S=θ , *ˆ SX −=µ .
5. 设总体为 N (µ , 1),现对该总体观测 n 次,发现有 k 次观测值为正,使用频率替换方法求µ 的估计.
解:因 p = P{X > 0} = P{X − µ > −µ} = 1 − Φ (−µ) = Φ (µ),即µ = Φ −1 ( p),
故µ 的矩估计 ⎟⎠
⎞⎜⎝
⎛Φ=Φ= −−
n
kp 11 )ˆ(µˆ .
6. 甲、乙两个校对员彼此独立对同一本书的样稿进行校对,校完后,甲发现 a 个错字,乙发现 b 个错字,
其中共同发现的错字有 c 个,试用矩法给出如下两个未知参数的估计:
(1)该书样稿的总错字个数;
(2)未被发现的错字数.
解:(1)设 N 为该书样稿总错别字个数,且 A、B 分别示甲、乙发现错别字,有 A 与 B 相互独立,
则 P (AB ) = P (A ) P (B ),使用频率替换方法,即
N
b
N
app
N
cp BAAB ⋅=== ˆˆˆ ,得 c
abN = ,
故总错字个数 N 的矩估计
c
abN =ˆ ;
(2)设 k 为未被发现的错字数,因 )()()(1)(1)( ABPBPAPBAPBAP +−−=−= U ,
使用频率替换方法,即
N
c
N
b
N
appp
N
kp ABBABA +−−=+−−== 1ˆˆˆ1ˆ ,即 k = N − a − b + c,
故未被发现的错字数 k 的矩估计 cba
c
abcbaNk +−−=+−−= ˆˆ .
7. 设总体 X 服从二项分布 b(m, p),其中 m, p 为未知参数,X1, …, Xn为 X 的一个样本,求 m 与 p 的矩估
9
计.
解:因 E(X ) = mp,Var (X ) = mp(1 − p),有
)(
)Var(1
XE
Xp =− ,
则
)(
)Var(1
XE
Xp −= ,
)Var()(
)]([)( 2
XXE
XE
p
XEm −== ,
故 m 的矩估计 2
2
*
ˆ
SX
Xm −= ,p 的矩估计 X
Sp
2*1ˆ −= .
习题 6.3
1. 设总体概率函数如下,X1, …, Xn 是样本,试求未知参数的最大似然估计.
(1) 1);( −= θθθ xxp ,0 < x < 1,θ > 0;
(2)p (x;θ ) = θ cθ x − (θ + 1) ,x > c,c > 0 已知,θ > 1.
解:(1)因 1,,,01212
1
10
1
21
)()( <<
−
=
<<
− Ι=Ι=∏ ni xxxn
nn
i
xi xxxxL LL θθ θθθ ,
当 0 < x1, x2, …, xn < 1 时, )ln()1(ln2)(ln 21 nxxx
nL L−+= θθθ ,
令 0)ln(
2
1
2
)(ln
21 =+= nxxxnd
Ld Lθθθ
θ ,得
)ln( 21 nxxx
n
L−=θ ,即
2
21 )ln(
⎥⎦
⎤⎢⎣
⎡=
nxxx
n
Lθ ,
故θ 的最大似然估计
2
21 )ln(
ˆ ⎥⎦
⎤⎢⎣
⎡=
nXXX
n
Lθ ;
(2)因 cxxxnnn
n
i
cxi ni
xxxcxcL >
+−
=
>
+− Ι=Ι=∏ ,,,)1(21
1
)1(
21
)()( LL θθθθ θθθ ,
当 x1, x2, …, xn > c 时,ln L (θ ) = n lnθ + nθ ln c − (θ + 1) ln (x1 x2 …x n),
令 0)ln(ln)(ln 21 =−+= nxxxcnnd
Ld Lθθ
θ ,得
cnxxx
n
n ln)ln( 21 −
= Lθ ,
故θ 的最大似然估计
cnXXX
n
n ln)ln(
ˆ
21 −
= Lθ .
2. 设总体概率函数如下,X1, …, Xn 是样本,试求未知参数的最大似然估计.
(1)p (x;θ ) = cθ c x − (c + 1) ,x > θ ,θ > 0,c > 0 已知;
(2) θ
µ
θµθ
−−=
x
xp e1),;( ,x > µ ,θ > 0;
(3)p (x;θ ) = (kθ )−1,θ < x < (k + 1)θ ,θ > 0.
解:(1)因 θθ θθθ >+−
=
>
+− Ι=Ι=∏ ni xxxcnncnn
i
x
c
i
c xxxcxcL ,,,
)1(
21
1
)1(
21
)()( LL ,
显然θ 越大, ncθ 越大,但只有 x1 , x2 , …, xn > θ 时,才有 L (θ ) > 0,
即θ = min {x1, x2, …, xn} 时,L (θ ) 达到最大,
故θ 的最大似然估计 },,,min{ˆ 21)1( nXXXX L==θ ;
10
(2)因 µ
µθ
µθ
µ
θθµθ >
⎟⎟⎠
⎞
⎜⎜⎝
⎛ −−
=
>
−− Ι∑=Ι= =∏ n
n
i
i
i
i
xxx
nx
n
n
i
x
x
L ,,,
1
1
21
1e1e1),( L ,
当 x1, x2, …, xn > µ 时, ⎟⎟⎠
⎞⎜⎜⎝
⎛ −−−= ∑
=
µθθµθ nxnL
n
i
i
1
1ln),(ln ,
令 01),(ln
1
2 =⎟⎟⎠
⎞⎜⎜⎝
⎛ −+−= ∑
=
µθθθ
µθ nxn
d
Ld n
i
i ,解得 µµθ −=⎟⎟⎠
⎞⎜⎜⎝
⎛ −= ∑
=
xnx
n
n
i
i
1
1 ,
且显然µ 越大, ⎟
⎟
⎠
⎞
⎜⎜⎝
⎛ −− ∑
=
µθ nx
n
i
i
1
1
e 越大,但只有 x1 , x2 , …, xn > µ 时,才有 L (θ, µ) > 0,
即µ = min {x1, x2, …, xn} 时,L (θ, µ) 才能达到最大,
故µ 的最大似然估计 },,,min{ˆ 21)1( nXXXX L==µ ,θ 的最大似然估计 )1(ˆˆ XXX −=−= µθ ;
(3)因 θθθθ θθθ )1(,,,
1
)1(
1
21
)()()( +<<
−
=
+<<
− Ι=Ι=∏ kxxxnn
i
kx ni
kkL L ,
显然θ 越小,(kθ )−n 越大,但只有θ < x1 , x2 , …, xn < (k + 1)θ 时,才有 L (θ ) > 0,
即 },,,max{
1
1
21 nxxxk
L+=θ 时,L
(θ ) 达到最大,
故θ 的最大似然估计为 },,,max{
1
1
1
ˆ
21
)(
n
n XXX
kk
X L+=+=θ .
3. 设总体概率函数如下,X1, …, Xn 是样本,试求未知参数的最大似然估计.
(1) θθθ
||e
2
1);( xxp −= ,θ > 0;
(2)p (x;θ ) = 1,θ − 1/2 < x < θ + 1/2;
(3)
12
21
1),;( θθθθ −=xp ,θ1 < x < θ2.
解:(1)因
∑== =
−
=
−∏
n
i
i
i
x
nn
n
i
xL 1
||1
1
|| e
2
1e
2
1)( θθ θθθ ,有 ∑=−−−=
n
i
ixnnL
1
||1ln2ln)(ln θθθ ,
令 ∑
=
+⋅−=
n
i
ixnd
Ld
1
2 ||
11)(ln
θθθ
θ ,得 ∑
=
=
n
i
ixn 1
||1θ ,
故θ 的最大似然估计 ∑
=
=
n
i
iXn 1
||1θˆ ;
(2)因 2/1,,,2/1
1
2/12/1 21
)( +<<−
=
+<<− Ι=Ι=∏ θθθθθ ni xxxn
i
xL L ,
即θ − 1/2 < x (1) ≤ x (n) < θ + 1/2,可得当 x (n) − 1/2 < θ < x (1) + 1/2 时,都有 L (θ ) = 1,
故θ 的最大似然估计θˆ 是 (x (n) − 1/2, x (1) + 1/2) 中任何一个值;
(3)因
221121 ,,,
121 12
21 )(
11),( θθθθ θθθθθθ <<= << Ι−=Ι−=∏ ni xxxn
n
i
xL L ,
11
显然θ 1 越大且θ 2 越小时,L (θ1, θ 2) 越大,但只有θ1 < x1 , x2 , …, xn < θ 2 时,才有 L (θ1, θ 2) > 0,
即θ 1 = min {x1, x2, …, xn}且θ 2 = max {x1, x2, …, xn}时,L (θ1, θ 2)达到最大,
故θ 1 的最大似然估计 },,,min{ˆ 21)1(1 nXXXX L==θ ,
θ 2 的最大似然估计 },,,max{ˆ 21)(2 nn XXXX L==θ .
4. 一地质学家为研究密歇根湖的湖滩地区的岩石成分,随机地自该地区取 100 个样品,每个样品有 10
块石子,记录了每个样品中属石灰石的石子数.假设这 100 次观察相互独立,求这地区石子中石灰石
的比例 p 的最大似然估计.该地质学家所得的数据如下:
样本中的石子数 0 1 2 3 4 5 6 7 8 9 10
样品个数 0 1 6 7 23 26 21 12 3 1 0
解:总体 X 为样品的 10 块石子中属石灰石的石子数,即 X 服从二项分布 B (10, p),其概率函数为
xx pp
x
xp −−⎟⎟⎠
⎞
⎜⎜⎝
⎛= 10)1(10)( ,x = 1, 2, …, 10,
因
∑−∑⋅⎟⎟⎠
⎞
⎜⎜⎝
⎛=−⎟⎟⎠
⎞
⎜⎜⎝
⎛= ==
−
==
− ∏∏
100
1
100
1
1000100
11
10 )1(
10
)1(
10
)( i
i
i
i
ii
xx
i i
n
i
xx
i
pp
x
pp
x
pL ,
即 )1ln(1000ln10ln)(ln
100
1
100
1
100
1
pxpx
x
pL
i
i
i
i
i i
−⋅⎟⎟⎠
⎞⎜⎜⎝
⎛ −+⋅+⎟⎟⎠
⎞
⎜⎜⎝
⎛= ∑∑∑
===
,
令 0
1
110001)(ln
100
1
100
1
=−⋅⎟⎟⎠
⎞⎜⎜⎝
⎛ −−⋅= ∑∑
== p
x
p
x
dp
pLd
i
i
i
i ,得 ∑
=
=
100
11000
1
i
ixp ,即 ∑
=
=
100
11000
1ˆ
i
iXp
由于 4990913726110
100
1
=+×+×+×+×+=∑
=i
ix ,
故比例 p 的最大似然估计 499.0499
1000
1ˆ =×=p .
5. 在遗传学研究中经常要从截尾二项分布中抽样,其总体概率函数为
mk
p
pp
k
m
pkXP m
kmk
,,2,1,
)1(1
)1(
};{ L=−−
−⎟⎟⎠
⎞
⎜⎜⎝
⎛
==
−
.
若已知 m = 2,X1, …, Xn是样本,试求 p 的最大似然估计.
解:当 m = 2 时,X 只能取值 1 或 2,且
p
p
p
ppXP −
−=−−
−==
2
22
)1(1
)1(2}1{ 2 , p
p
p
pXP −=−−== 2)1(1}2{ 2
2
,
即
p
pp
p
p
p
ppxXP
xxxx
−
−=⎟⎟⎠
⎞
⎜⎜⎝
⎛
−⎟⎟⎠
⎞
⎜⎜⎝
⎛
−
−==
−−−−
2
)22(
22
22};{
1212
,x = 1, 2,
因 n
nxxn
n
i
xx
p
pp
p
pppL
n
i
i
n
i
i
ii
)2(
)22(
2
)22()(
11
2
1
12
−
∑∑−=−
−=
−−
=
−− ==∏ ,
即 )2ln(ln)22ln(2)(ln
11
pnpnxpxnpL
n
i
i
n
i
i −−⋅⎟⎟⎠
⎞⎜⎜⎝
⎛ −+−⋅⎟⎟⎠
⎞⎜⎜⎝
⎛ −= ∑∑
==
,
12
令 0
2
11
22
22)(ln
11
=−
−⋅−⋅⎟⎟⎠
⎞⎜⎜⎝
⎛ −+−
−⋅⎟⎟⎠
⎞⎜⎜⎝
⎛ −= ∑∑
== p
n
p
nx
p
xn
dp
pLd n
i
i
n
i
i ,得 xx
np n
i
i
2222
1
−=−=
∑
=
,
故 p 的最大似然估计
X
p 22ˆ −= .
6. 已知在文学家萧伯纳的“An Intelligent Woman’s Guide to Socialism”一书中,一个句子的单词数 X 近
似地服从对数正态分布,即 Z = ln X ~ N (µ , σ 2 ).今从该书中随机地取 20 个句子,这些句子中的单词
数分别为
52, 24, 15, 67, 15, 22, 63, 26, 16, 32, 7, 33, 28, 14, 7, 29, 10, 6, 59, 30,
求该书中一个句子单词数均值 22e)( σµ+=XE 的最大似然估计.
解:因 Z = ln X ~ N (µ , σ 2 ),
则µ 的最大似然估计 09.3)30ln24ln52(ln
20
1ln11ˆ
11
=+++==== ∑∑
==
L
n
i
i
n
i
i xn
z
n
zµ ,
σ 2 的最大似然估计
51.0])09.330(ln)09.324(ln)09.352[(ln
20
1)(1 222
1
222 =−++−+−=−== ∑
=
∗
∧
L
n
i
iz zzn
sσ ,
故由最大似然估计的不变性知 22e)( σµ+=XE 的最大似然估计 31.28ee)( 251.009.322* === ++∧ zszXE .
7. 总体 X ~ U (θ , 2θ ),其中θ > 0 是未知参数,又 X1, …, Xn 为取自该总体的样本, X 为样本均值.
(1)证明 X
3
2ˆ =θ 是参数θ 的无偏估计和相合估计;
(2)求θ 的最大似然估计,它是无偏估计吗?是相合估计吗?
解:(1)因 X ~ U (θ , 2θ ),有 θθθ 2
3
2
2)( =+=XE , 2
2
12
1
12
)2()Var( θθθ =−=X ,
故 θθθ =⋅===
2
3
3
2)(
3
2)(
3
2)ˆ( XEXEE ,即 X
3
2ˆ =θ 是参数θ 的无偏估计;
因
nn
X
n
X
2712
1
9
4)Var(
9
4)Var(
9
4)ˆVar(
2
2 θθθ =⋅=== ,有 θθ =→∞ )ˆ(lim En , 0)ˆVar(lim =∞→ θn ,
故 X
3
2ˆ =θ 是参数θ 的相合估计;
(2)因 θθθθ θθθ 2,,,1 2 21
11)( <<
=
<< Ι=Ι=∏ ni xxxnn
i
xL L ,
显然θ 越小, nθ
1 越大,但只有θ < x1 , x2 , …, xn < 2θ 时,才有 L (θ ) > 0,
即 },,,max{
2
1
21 nxxx L=θ 时,L (θ ) 达到最大,
故θ 的最大似然估计为 },,,max{
2
1
2
1*ˆ 21)( nn XXXX L==θ ;
13
因 X 的密度函数为
⎪⎩
⎪⎨
⎧ <<=
.,0
;2,1)(
其他
θθθ xxp ,分布函数为 ⎪⎩
⎪⎨
⎧
≥
<≤−
<
=
.2,1
;2,
;,0
)(
θ
θθθ
θ
θ
x
xx
x
xF
则 X (n) 的密度函数 ⎪⎩
⎪⎨
⎧ <<−==
−
−
.,0
;2,)()()]([)(
1
1
其他
θθθ
θ xxnxpxFnxp n
n
n
n
因 θθθθ
θθθ
θ
θ
θ
θ 11
)()()()(
212 1
)( +=+
−⋅=−⋅−=−
+−∫ n nnxndxxnxXE
n
nn
n
n ,有 θ1
12)( )( +
+=
n
nXE n ,
且 2
222 122
)( 22
)()()(])[( θθθθ
θθθ
θ
θ
θ
θ +=+
−⋅=−⋅−=−
+−∫ n nnxndxxnxXE
n
nn
n
n ,
则 22
2
2
)()( )2()1(12
)Var()Var( θθθθ ++=⎟⎠
⎞⎜⎝
⎛
+−+=−= nn
n
n
n
n
nXX nn ,
因 θθθ ≠+
+==
)1(2
12)(
2
1*)ˆ( )( n
nXEE n , 22)( )2()1(4)Var(4
1*)ˆVar( θθ ++== nn
nX n ,
故 )(2
1*ˆ nX=θ 不是参数θ 的无偏估计,应该修偏为 )(12
1ˆ
nXn
n
+
+=θ 才是θ 的无偏估计,
因 θθθ =+
+= →∞→∞ )1(2
12lim*)ˆ(lim
n
nE
nn
, 0
)2()1(4
lim*)ˆVar(lim 22 =++= ∞→∞→ θθ nn
n
nn
,
故θ 的最大似然估计 )(2
1*ˆ nX=θ 是参数θ 的相合估计.
8. 设 X1, …, Xn是来自密度函数为 p(x;θ ) = e − (x − θ), x >θ 的样本.
(1)求θ 的最大似然估计 1ˆθ ,它是否是相合估计?是否是无偏估计?
(2)求θ 的矩估计 2θˆ ,它是否是相合估计?是否是无偏估计?
解:(1)似然函数 θ
θ
θ
θθ >
+−
=
>
−− Ι∑=Ι= =∏ n
n
i
i
i
i
xxx
nxn
i
x
xL ,,,
1
)(
21
1ee)( L ,
显然θ 越大,
θnx
n
i
i+−∑
=1e 越大,但只有 x1 , x2 , …, xn > θ 时,才有 L (θ ) > 0,
即θ = min {x1, x2, …, xn} 时,L (θ ) 达到最大,
故θ 的最大似然估计 },,,min{ˆ 21)1(1 nXXXX L==θ ;
因 X 的密度函数与分布函数分别为
⎩⎨
⎧
≤
>=
−−
.,0
;,e
)(
)(
θ
θθ
x
xxp
x
⎩⎨
⎧
≤
>−=
−−
.,0
;,e1
)(
)(
θ
θθ
x
xxF
x
则 X (1) 的密度函数为
⎩⎨
⎧
≤
>=−=
−−
−
.,0
;,e
)()](1[)(
)(
1
1 θ
θθ
x
xnxpxFnxp
xn
n
可得 X (1) − θ 服从指数分布 Exp(n),
14
因
n
XE 1)( )1( =−θ , 2)1( 1)Var( nX =−θ ,
则 θθθ ≠+==
n
XEE 1)()ˆ( )1(1 , 2)1()1(1
1)Var()Var()ˆVar(
n
XX =−== θθ ,
故 )1(1ˆ X=θ 不是θ 的无偏估计;
因 θθθ =⎟⎠
⎞⎜⎝
⎛ += →∞→∞ nE nn
1lim)ˆ(lim 1 , 0
1lim)ˆVar(lim 21 == →∞→∞ nnn θ ,
故 )1(1ˆ X=θ 是θ 的相合估计;
(2)因总体 X 的密度函数为 p(x;θ ) = e − (x − θ), x >θ ,有 X − θ 服从指数分布 Exp(1),
则 E(X − θ ) = E(X) − θ = 1,即θ = E(X) − 1,
故θ 的矩估计 12ˆ −= Xθ ;
因 E(X) = θ + 1,Var(X) = Var(X − θ) = θ 2,
则 θθ =−=−= 1)(1)()ˆ( 2 XEXEE , nXnX
2
2 )Var(
1)Var()ˆVar( θθ === ,
故 1ˆ2 −= Xθ 是θ 的无偏估计;
因 θθ =∞→ )ˆ(lim 2En , 0lim)ˆVar(lim
2
2 == →∞→∞ nnn
θθ ,
故 12ˆ −= Xθ 是θ 的相合估计.
9. 设总体 X ~ Exp (1/θ ),X1, …, Xn 是样本,θ 的矩估计和最大似然估计都是 X ,它也是θ 的相合估计和
无偏估计,试证明在均方误差准则下存在优于 X 的估计(提示:考虑 Xaa =θˆ ,找均方误差最小者).
证:因 X ~ Exp (1/θ ),有 E(X) = θ ,Var(X) = θ 2,且 X 的密度函数为
⎪⎩
⎪⎨
⎧
≤
>=
−
.0,0
;0,e1)(
x
xxp
x
θ
θ
故θ = E(X),即θ 的矩估计为 X=θˆ ;
因似然函数 0,,,
1
1
0 21
1e1e1)( >
−
=
>
− Ι∑=Ι= =∏ n
n
i
i
i
i
xxx
x
n
n
i
x
x
L L
θθ
θθθ ,
当 x1, x2, …, xn > 0 时, ∑
=
−−=
n
i
ixnL
1
1ln)(ln θθθ ,
令 01)(ln
1
2 =+−= ∑
=
n
i
ix
n
d
Ld
θθθ
θ ,得 xx
n
n
i
i == ∑
=1
1θ ,
故θ 的最大似然估计也为 X=θˆ ;
因 θ== )()( XEXE ,
n
X
n
X
2
)Var(1)Var( θ== ,
15
故 X 是θ 的无偏估计;
因 θ=
→∞
)(lim XE
n
, 0lim)Var(lim
2
==
∞→∞→ n
X
nn
θ ,
故 X 是θ 的相合估计;
设 Xaa =θˆ ,有 θθ aXaEE a == )()ˆ( , n
aXaa
22
2 )Var()ˆVar( θθ == ,
则
nn
XEXX
2
2
2
2 )(])([)Var()MSE( θθθθθ =−+=−+= ,
22
2
2
22
2 12)(])ˆ([)ˆVar()ˆMSE( θθθθθθθθ ⎟⎟⎠
⎞
⎜⎜⎝
⎛ +−+=−+=−+= aa
n
aa
n
aE aaa
2
2
22
1
1
1
1
1
1
1
21 θθ
⎥⎥⎦
⎤
⎢⎢⎣
⎡
++⎟⎠
⎞⎜⎝
⎛
+−
+=⎟⎠
⎞⎜⎝
⎛
++++−
+=
nn
na
n
n
nn
naa
n
n ,
故当
1+= n
na 时, X
n
n
a 1
ˆ
+=θ 的均方误差 1)
ˆMSE(
2
+= na
θθ 小于 X 的均方误差
n
X
2
)MSE( θ= .
10.为了估计湖中有多少条鱼,从中捞出 1000 条,标上记号后放回湖中,然后再捞出 150 条鱼,发现其
中有 10 条鱼有记号.问湖中有多少条鱼,才能使 150 条鱼中出现 10 条带记号的鱼的概率最大?
解:设湖中有 N 条鱼,有湖中每条鱼带记号的概率为
N
p 1000= ,
看作总体 X 服从两点分布 b(1, p),从中抽取容量为 150 的样本 X1, X2, …, X150,有 10
150
1
=∑
=i
ix ,
似然函数
∑−∑=−= ==
−
=
−∏
n
i
i
n
i
i
ii
xnxn
i
xx pppppL 11 )1()1()(
1
1 ,有 )1ln(ln)(ln
11
pxnpxpL
n
i
i
n
i
i −⋅⎟⎟⎠
⎞⎜⎜⎝
⎛ −+⋅= ∑∑
==
,
令 0
1
11)(ln
11
=−
−⋅⎟⎟⎠
⎞⎜⎜⎝
⎛ −+⋅= ∑∑
== p
xn
p
x
dp
pLd n
i
i
n
i
i ,得 xxnp
n
i
i == ∑
=1
1 ,即 p 的最大似然估计为 Xp =ˆ ,
因
p
N 1000= ,由最大似然估计的不变性知
X
N 1000ˆ = ,
故湖中有 15000
10
150
1
1000ˆ =
×
=N 条鱼时,才能使 150 条鱼中出现 10 条带记号的鱼的概率最大.
11.证明:对正态分布 N (µ , σ 2 ),若只有一个观测值,则µ , σ 2 的最大似然估计不存在.
证:若只有一个观测值,似然函数 2
2
2
)(
2 e
π2
1),( σ
µ
σσµ
−−=
x
L ,
对于任一固定的σ,当µ = x 时,L(µ)取得最大值 σπ2
1 ,
但显然σ 越小, σπ2
1 越大,且σ 可任意接近于 0,即 σπ2
1 不存在最大值,
故µ , σ 2 的最大似然估计不存在.
习题 6.4
1. 设总体概率函数是 p (x;θ ),X1, …, Xn是其样本,T = T (X1, …, Xn )是θ 的充分统计量,则对 g (θ )的任一
16
估计 gˆ ,令 )|ˆ(~ TgEg = ,证明: )ˆMSE()~MSE( gg ≤ .这说明,在均方误差准则下,人们只需要考虑
基于充分估计量的估计.
解:因 )|ˆ(~ TgEg = ,由 Rao-Blackwell 定理知 )ˆ()~( gEgE = , )ˆVar()~Var( gg ≤ ,
故 )ˆMSE()]()ˆ([)ˆVar()]()~([)~Var()~MSE( 22 gggEgggEgg =−+≤−+= θθ .
2. 设 T1 , T2 分别是θ 1 , θ 2 的 UMVUE,证明:对任意的(非零)常数 a, b,aT1 + bT2 是 aθ 1 + bθ 2的 UMVUE.
证:因 T1 , T2 分别是θ 1 , θ 2 的 UMVUE,
有 E(T1) = θ 1 ,E(T2) = θ 2 ,且对任意的满足 E(ϕ) = 0 的ϕ 都有 Cov (T1 , ϕ) = Cov (T2 , ϕ) = 0,
则E (aT1 + bT2) = a E(T1) + b E(T2) = aθ 1 + bθ 2 ,且Cov (aT1 + bT2 , ϕ) = a Cov (T1 , ϕ) + b Cov (T2 , ϕ) = 0,
故 aT1 + bT2是 aθ 1 + bθ 2的 UMVUE.
3. 设 T 是 g (θ ) 的 UMVUE, gˆ 是 g (θ ) 的无偏估计,证明,若 +∞<)ˆ(Var g ,则 0)ˆ,Cov( ≥gT .
证:因 gˆ 和 T 都是 g (θ ) 的无偏估计,有 )()()ˆ( θgTEgE == ,即 0)ˆ( =−TgE ,
又因 T 是 g (θ ) 的 UMVUE,有 0)ˆ,(Cov =−TgT ,即 0),Cov()ˆ,Cov( =− TTgT ,
故 0),Cov()ˆ,Cov( ≥= TTgT .
4. 设总体 X ~ N (µ , σ 2 ),X1 , …, X n 为样本,证明, ∑
=
= n
i
iXn
X
1
1 , ∑
=
−−=
n
i
i XXn
S
1
22 )(
1
1 分别为µ , σ 2
的 UMVUE.
证:因 X ~ N (µ , σ 2 ),有 X 是µ 的无偏估计,S 2 是σ 2 的无偏估计,且样本 X1 , …, X n 的联合密度函数为
∑== =
−−
=
−−∏
n
i
ii x
n
n
i
x
nxxp 1
2
22
2
)(
2
1
1
2
)(
2
1 e)π2(
1e
π2
1),;,,(
µσσ
µ
σσσµL ,
对任意的满足 E(ϕ) = 0 的ϕ (x1 , …, x n),有 0e
)π2(
1)( 1
)(
2
1
1
2
2 =∑⋅= ∫ ∫∞+∞− ∞+∞−
−−
=
n
x
n
dxdxE
n
i
i
LL
µσϕσϕ ,
对 E(ϕ) = 0 两端关于µ 求偏导数,得
∫ ∫ ∑∞+∞− ∞+∞−
−−
=
∑⋅−⋅==∂
∂ =
n
xn
i
in
dxdxxE
n
i
i
LL 1
)(
2
1
1
2
1
2
2
e)(1
)π2(
10)(
µσµσϕσµ
ϕ
∫ ∫∞+∞− ∞+∞−
−− ∑⋅−⋅= = n
x
n
dxdxnxn
n
i
i
LL 1
)(
2
1
2
1
2
2
e)(1
)π2(
1 µσµσϕσ
)()]()([])[( 222 ϕσϕµϕσϕµσ XE
nEXEnXEn =−=−= ,
则 0)( =ϕXE , 0)()()(),Cov( =⋅−= ϕϕϕ EXEXEX ,
故 ∑
=
=
n
i
iXn
X
1
1 是µ 的 UMVUE;
对 0)( =ϕXE 两端再关于µ 求偏导数,得
17
∫ ∫ ∑∞+∞− ∞+∞−
−−
=
∑⋅−⋅==∂
∂ =
n
xn
i
in
dxdxxxXE
n
i
i
LL 1
)(
2
1
1
2
1
2
2
e)(1
)π2(
10)(
µσµσϕσµ
ϕ
∫ ∫∞+∞− ∞+∞−
−− ∑⋅−⋅= = n
x
n
dxdxnxnx
n
i
i
LL 1
)(
2
1
2
1
2
2
e)(1
)π2(
1 µσµσϕσ
)()]()([])[( 22
2
22 ϕσϕµϕσϕµσ XE
nXEXEnXXEn =−=−= ,
则 0)( 2 =ϕXE ,
对 0)()π2( =ϕσ En 两端关于σ 2 求偏导数,得
∫ ∫ ∑∞+∞− ∞+∞−
−−
=
∑⋅−⋅==∂
∂ =
n
xn
i
i
n
dxdxxE
n
i
i
LL 1
)(
2
1
1
2
42
1
2
2
e)(
2
10)]()π2[(
µσµσϕσ
ϕσ
∫ ∫ ∑∞+∞− ∞+∞−
−−
=
∑⋅⎟⎟⎠
⎞⎜⎜⎝
⎛ +−⋅= = n
xn
i
i dxdxnxnx
n
i
i
LL 1
)(
2
1
2
1
2
4
1
2
2
e2
2
1 µσµµσϕ
⎥⎦
⎤⎢⎣
⎡
⎟⎟⎠
⎞⎜⎜⎝
⎛ +−= ∑
=
ϕµµσ
σ 2
1
2
4 22
)π2( nXnXE
n
i
i
n
⎟⎟⎠
⎞⎜⎜⎝
⎛=⎥⎦
⎤⎢⎣
⎡ +−⎟⎟⎠
⎞⎜⎜⎝
⎛= ∑∑
==
n
i
i
nn
i
i
n
XEEnXEnXE
1
2
4
2
1
2
4 2
)π2()()(2
2
)π2( ϕσ
σϕµϕµϕσ
σ ,
则 0
1
2 =⎟⎟⎠
⎞⎜⎜⎝
⎛ ∑
=
n
i
iXE ϕ ,
因 ⎟⎟⎠
⎞⎜⎜⎝
⎛ −−=−−= ∑∑ ==
2
1
2
1
22
1
1)(
1
1 XnX
n
XX
n
S
n
i
i
n
i
i ,有 0)(1
1)( 2
1
22 =⎥⎦
⎤⎢⎣
⎡ −⎟⎟⎠
⎞⎜⎜⎝
⎛
−= ∑= ϕϕϕ XnEXEnSE
n
i
i ,
则 Cov (S 2, ϕ ) = E(S 2ϕ ) − E(S 2) ⋅ E(ϕ) = 0,
故 ∑
=
−−=
n
i
i XXn
S
1
22 )(
1
1 是σ 2的 UMVUE.
5. 设总体的概率函数为 p (x;θ ),满足定义 6.4.2 的条件,若二阶导数 );(2
2
θθ xp∂
∂ 对一切的θ ∈ Θ 存在,
证明费希尔信息量 ⎟⎟⎠
⎞
⎜⎜⎝
⎛
∂
∂−= );(ln)( 2
2
θθθ XpEI .
证:因 θθ ∂
∂⋅=∂
∂ p
p
p 1ln , 2
22
2
22
22
2 1ln111ln θθθθθθθ ∂
∂⋅+⎟⎠
⎞⎜⎝
⎛
∂
∂−=∂
∂⋅+⎟⎠
⎞⎜⎝
⎛
∂
∂⋅−=⎟⎟⎠
⎞
⎜⎜⎝
⎛
∂
∂⋅∂
∂=∂
∂ p
p
pp
p
p
p
p
p
p ,
故 ∫∫ ∞+∞−∞+∞− ∂∂+−=⋅∂∂⋅+−=⎟⎟⎠
⎞
⎜⎜⎝
⎛
∂
∂⋅+⎟⎠
⎞⎜⎝
⎛
∂
∂−=⎟⎟⎠
⎞
⎜⎜⎝
⎛
∂
∂ dxpIpdxp
p
Ip
p
EpEpE 2
2
2
2
2
22
2
2
)(1)(1lnln θθθθθθθ
18
)()()( 2
2
θθθ IdxxpI −=⎟⎠
⎞⎜⎝
⎛
∂
∂+−= ∫ ∞+∞− .
6. 设总体密度函数为 p (x;θ ) = θ xθ − 1, 0 < x < 1, θ > 0,X1 , …, X n 是样本.
(1)求 g (θ ) = 1/θ 的最大似然估计;
(2)求 g (θ )的有效估计.
解:(1)似然函数 1,,,0121
1
10
1
21
)()( <<
−
=
<<
− Ι=Ι=∏ ni xxxnnn
i
xi xxxxL LL θθ θθθ ,
当 0 < x1, x2, …, xn < 1 时,ln L(θ ) = n lnθ + (θ − 1) ln (x1x2…xn),
令 0)ln()(ln 21 =+= nxxxnd
Ld Lθθ
θ ,得
∑
=
−=−= n
i
i
n x
n
xxx
n
1
21 ln)ln( L
θ ,即
∑
=
−= n
i
iX
n
1
ln
θˆ ,
故 g (θ ) = 1/θ 的最大似然估计为 ∑
=
−==
n
i
iXn
g
1
ln1ˆ/1ˆ θ ;
(2)因 θθθ
θθθθθ 1101ln)(lnln)(ln
1
0
1
0
1
0
1
0
1
0
1 −=−=⋅−=⋅=⋅= ∫∫∫ − xdxxxxxxdxdxxxXE ,
2
1
0
1
0
21
0
21
0
122 2)(ln2ln2)(ln)()(ln)(ln)(ln θθθ
θθθθ =−=⋅−==⋅= ∫∫∫ − XEdxx xxxxxdxdxxxXE ,
则 2
2
2
22 112)](ln[)(ln)Var(ln θθθ =⎟⎠
⎞⎜⎝
⎛−−=−= XEXEX ,
可得 )(111)(ln1)ˆ(
1
θθθ gnnXEngE
n
i
i ==⎟⎠
⎞⎜⎝
⎛−⋅⋅−=−= ∑
=
,即 ∑
=
−=
n
i
iXn
g
1
ln1ˆ 是 g (θ )的无偏估计,
且 222
1
2
111)Var(ln1)ˆ(Var θθ nnnXng
n
i
i =⋅⋅== ∑
=
,
因 p (x; θ ) = θ xθ − 1 I 0 < x < 1,当 0 < x < 1 时,ln p (x; θ ) = lnθ + (θ − 1) lnx ,
则 xxp ln1);(ln +=∂
∂
θθθ , 22
2 1);(ln θθθ −=∂
∂ xp ,即 22
2 1);(ln)( θθθθ =⎥⎦
⎤⎢⎣
⎡
∂
∂−= XpEI ,
可得 g (θ ) = 1/θ 无偏估计方差的 C-R 下界为 )ˆ(Var11
1
)(
)]([
2
2
2
22
g
nnnI
g ==
⋅
⎟⎠
⎞⎜⎝
⎛−
=′ θ
θ
θ
θ
θ ,
故 ∑
=
−=
n
i
iXn
g
1
ln1ˆ 是 g (θ ) = 1/θ 的有效估计.
7. 设总体密度函数为 2e2);( 3 xxxp
θθθ −= , x > 0, θ > 0,求θ 的费希尔信息量 I (θ ).
解:因 03
2e2);( >
− Ι= xxxxp
θθθ ,当 x > 0 时, 2ln3ln2ln);(ln xxxp
θθθ −−+= ,
19
则 2
11);(ln
x
xp −=∂
∂
θθθ , 22
2 1);(ln θθθ −=∂
∂ xp ,
故 22
2 1);(ln)( θθθθ =⎥⎦
⎤⎢⎣
⎡
∂
∂−= XpEI .
8. 设总体密度函数为 p (x; θ ) = θ cθ x − (θ + 1), x > c, c > 0 已知, θ > 0,求θ 的费希尔信息量 I (θ ).
解:因 p (x; θ ) = θ cθ x − (θ + 1) I x > c,当 x > c 时,ln p (x; θ ) = lnθ + θ ln c − (θ + 1) lnx ,
则 xcxp lnln1);(ln −+=∂
∂
θθθ , 22
2 1);(ln θθθ −=∂
∂ xp ,
故 22
2 1);(ln)( θθθθ =⎥⎦
⎤⎢⎣
⎡
∂
∂−= XpEI .
9. 设总体分布列为 P{X = x} = (x − 1) θ 2 (1 − θ )x − 2, x = 2, 3, …, 0 < θ < 1,求θ 的费希尔信息量 I (θ ).
解:因 p (x; θ ) = (x − 1) θ 2 (1 − θ )x − 2,有 ln p (x; θ ) = ln (x − 1) + 2 lnθ + (x − 2) ln (1 − θ ),
则 θθθθ −
−−=∂
∂
1
22);(ln xxp , 222
2
)1(
22);(ln θθθθ −
−−−=∂
∂ xxp ,
可得 ]2)([
)1(
12
)1(
22);(ln)( 22222
2
−−+=⎟⎟⎠
⎞
⎜⎜⎝
⎛
−
−−−−=⎥⎦
⎤⎢⎣
⎡
∂
∂−= XEXEXpEI θθθθθθθ ,
因 ⎥⎦
⎤⎢⎣
⎡ −=−=−−⋅= ∑∑∑ +∞
=
+∞
=
+∞
=
−
2
2
2
2
2
2
2
2
2
22 )1()1()1()1()(
k
k
k
k
k
k
d
d
d
dkkXE θθθθθθθθ
θθθθθθθθ
θ
θθ
2221
)1(1
)1(
3
2
2
2
2
2
2
2
2 =⋅=⎟⎠
⎞⎜⎝
⎛ +−=⎥⎦
⎤⎢⎣
⎡
−−
−=
d
d
d
d ,
故
)1(
222
)1(
12)( 222 θθθθθθ −=⎟⎠
⎞⎜⎝
⎛ −−+=I .
10.设 X1 , …, X n是来自 Ga (α, λ )的样本,α > 0 已知,试证明, α/X 是 g (λ ) = 1/λ 的有效估计,从而也
是 UMVUE.
证:因总体 X ~ Ga (α, λ ),有 λ
α=)(XE , 2)Var( λ
α=X ,
则 )(11)(1)(1 λλλ
α
αααα gXEXE
XE ==⋅===⎟⎟⎠
⎞⎜⎜⎝
⎛ ,即 α
X 是 λλ
1)( =g 的无偏估计,
且 22222
111)Var(11)Var(1Var αλλ
α
αααα nnXnX
X =⋅⋅=⋅==⎟⎟⎠
⎞⎜⎜⎝
⎛ ,
因 01 e)();( >
−− ΙΓ= x
xxxp λα
α
α
λλ ,当 x > 0 时,ln p (x; λ ) = α lnλ − ln Γ (α) + (α − 1) ln x − λ x,
则 xxp −=∂
∂
λ
αλλ );(ln , 22
2
);(ln λ
αλλ −=∂
∂ xp ,即 22
2
);(ln)( λ
αλλλ =⎥⎦
⎤⎢⎣
⎡
∂
∂−= XpEI ,
20
可得 g (λ ) = 1/λ 无偏估计方差的 C-R 下界为 ⎟⎟⎠
⎞⎜⎜⎝
⎛==
⋅
⎟⎠
⎞⎜⎝
⎛−
=′ ααλ
λ
α
λ
λ
λ X
nnnI
g Var1
1
)(
)]([
2
2
2
22
,
故 α
X 是 λλ
1)( =g 的有效估计,从而也是 UMVUE.
11.设 X1 , …, X m i.i.d. ~ N (a, σ 2),Y1 , …, Y n i.i.d. ~ N (a, 2σ 2),求 a 和σ 2 的 UMVUE.
解:根据充分性原则,UMVUE 必为充分统计量,先求参数(a, σ 2)的充分统计量
因样本 X1 , …, X m, Y1 , …, Yn 的联合密度函数为
∏∏
=
−−
=
−−
⋅⋅=
n
j
aym
i
ax
nm
ji
ayyxxp
1
4
)(
1
2
)(
2
11
2
2
2
2
e
2π2
1e
π2
1),;,,,,,( σσ σσσLL
⎥⎥⎦
⎤
⎢⎢⎣
⎡
−+−−
++
∑∑
⋅=
==
n
j
j
m
i
i ayax
nmnm
1
2
1
2
2 )(2
1)(
2
1
2
e
)π()2(
1 σ
σ
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢
⎣
⎡
⎟⎠
⎞⎜⎝
⎛ ++⎟⎟
⎟
⎠
⎞
⎜⎜
⎜
⎝
⎛
+−+−
++
∑∑∑∑
⋅=
====
2
111
2
1
2
2 22
12
2
1
2
1
2
e
)π()2(
1
anmyxayx
nmnm
n
j
j
m
i
i
n
j
j
m
i
iσ
σ ,
令 ⎟⎟⎠
⎞
⎜⎜⎝
⎛ ++= ∑∑∑∑
====
n
j
j
m
i
i
n
j
j
m
i
i YXYXTT
1
2
1
2
11
21 2
1,
2
1),( ,有 ⎟⎟⎠
⎞
⎜⎜⎝
⎛ ++= ∑∑∑∑
====
n
j
j
m
i
i
n
j
j
m
i
i yxyxtt
1
2
1
2
11
21 2
1,
2
1),( ,
则
])5.0(2[
2
1
2
2
11
2
122e
)π()2(
1),;,,,,,(
anmatt
nmnmnm
ayyxxp
++−−
++ ⋅=
σ
σσLL ,
取
])5.0(2[
2
1
2
2
21
2
122e
)π()2(
1),;,(
anmatt
nmnm
attg
++−−
++= σσσ ,h(x1, …, xm, y1, …, yn) = 1 与参数 a, σ
2 无关,
可得 ⎟⎟⎠
⎞
⎜⎜⎝
⎛ ++= ∑∑∑∑
====
n
j
j
m
i
i
n
j
j
m
i
i YXYXTT
1
2
1
2
11
21 2
1,
2
1),( 是参数(a, σ 2)的充分统计量;
因 anmYEXETE
n
j
j
m
i
i )5.0()(2
1)()(
11
1 +=+= ∑∑
==
,有 a
nm
YnXmE
nm
TE =⎟⎟⎠
⎞⎜⎜⎝
⎛
+
+=⎟⎠
⎞⎜⎝
⎛
+ 5.0
5.0
5.0
1 ,
则
nm
YnXma
5.0
5.0ˆ +
+= 是参数 a 的无偏估计,
对任意的满足 E(ϕ) = 0 的统计量ϕ (x1 , …, xm, y1, …, yn),
有 0ee
)π()2(
1)( 11
)5.0(
2
1)2(
2
1
2
2
2122 =⋅⋅⋅= ∫ ∫
∞+
∞−
∞+
∞−
+−−−
++ nm
anmatt
nmnm
dydydxdxE LLL σσϕσϕ ,
则 0e 11
)2(
2
1
122 =⋅∫ ∫∞+∞− ∞+∞− −− nmatt dydydxdx LLL σϕ ,
两端关于 a 求偏导数,得 02
2
1e 1112
)2(
2
1
122 =⋅⋅⋅∫ ∫∞+∞− ∞+∞− −− nmatt dydydxdxt LLL σϕ σ ,
即 0e 11
)2(
2
1
1
122 =⋅∫ ∫∞+∞− ∞+∞− −− nmatt dydydxdxt LLL σϕ ,
21
则 E(T1ϕ) = 0,有 0)(5.0
1)ˆ( 1 =+= ϕϕ TEnmaE ,即 0)()ˆ()ˆ(),ˆCov( =−= ϕϕϕ EaEaEa ,
故
nm
YnXma
5.0
5.0ˆ +
+= 是参数 a 的 UMVUE;
因 22
1
22
1
22
1
2
1
2
2 )5.0()()2(2
1)()(
2
1)()( anmnmaaYEXETE
n
j
m
i
n
j
j
m
i
i +++=+++=+= ∑∑∑∑
====
σσσ ,
且 2
11
2
11
2
1 ])5.0[()Var(4
1)Var()]([)Var()( anmYXTETTE
n
j
j
m
i
i +++=+= ∑∑
==
= (m + 0.5n)σ 2 + (m + 0.5n)2a 2,
则 2
2
1
2 )1(5.0
σ−+=⎟⎟⎠
⎞
⎜⎜⎝
⎛
+− nmnm
TTE ,即 2
2
1
2 5.01
1 σ=⎥⎥⎦
⎤
⎢⎢⎣
⎡
⎟⎟⎠
⎞
⎜⎜⎝
⎛
+−−+ nm
TT
nm
E ,
取 ⎥⎥⎦
⎤
⎢⎢⎣
⎡
⎟⎟⎠
⎞
⎜⎜⎝
⎛ ++−+−+=⎟⎟⎠
⎞
⎜⎜⎝
⎛
+−−+= ∑∑∑∑ ====
2
111
2
1
2
2
1
2
2
2
1
5.0
1
2
1
1
1
5.01
1ˆ
n
j
j
m
i
i
n
j
j
m
i
i YXnm
YX
nmnm
TT
nm
σ ,
可知 2σˆ 是参数σ 2 的无偏估计,
因 0e 11
)2(
2
1
122 =⋅∫ ∫∞+∞− ∞+∞− −− nmatt dydydxdx LLL σϕ ,
两端关于σ 2求偏导数,得 0)2(
2
1e 11124
)2(
2
1
122 =−⋅⋅⋅∫ ∫∞+∞− ∞+∞− −− nmatt dydydxdxatt LLL σϕ σ ,
即 0e)2( 11
)2(
2
1
12
122 =⋅−∫ ∫∞+∞− ∞+∞− −− nmatt dydydxdxatt LLL σϕ
则 E[(T2 − 2aT1)ϕ] = 0,有 E(T2ϕ) − 2a E(T1ϕ) = 0,可得 E(T2ϕ) = 0,
又因 0e 11
)2(
2
1
1
122 =⋅∫ ∫∞+∞− ∞+∞− −− nmatt dydydxdxt LLL σϕ ,
两端关于 a 求偏导数,得 02
2
1e 1112
)2(
2
1
1
122 =⋅⋅⋅∫ ∫∞+∞− ∞+∞− −− nmatt dydydxdxatt LLL σϕ σ ,
即 0e 11
)2(
2
1
2
1
122 =⋅∫ ∫∞+∞− ∞+∞− −− nmatt dydydxdxt LLL σϕ ,
则 0)( 21 =ϕTE ,有 05.0
)()(
1
1)ˆ(
2
1
2
2 =⎥⎦
⎤⎢⎣
⎡
+−−+= nm
TETE
nm
E ϕϕϕσ ,
即 0)()ˆ()ˆ(),ˆCov( 222 =−= ϕσϕσϕσ EEE ,
故 ⎥⎥⎦
⎤
⎢⎢⎣
⎡
⎟⎟⎠
⎞
⎜⎜⎝
⎛ ++−+−+= ∑∑∑∑ ====
2
111
2
1
22
2
1
5.0
1
2
1
1
1ˆ
n
j
j
m
i
i
n
j
j
m
i
i YXnm
YX
nm
σ 是参数σ 2的 UMVUE.
12.设 X1 , …, X n i.i.d. ~ N (µ, 1),求µ 2 的 UMVUE.证明此 UMVUE 达不到 C-R 不等式的下界,即它不是
有效估计.
解:根据充分性原则,UMVUE 必为充分统计量,先求参数µ 2 的充分统计量,
因样本 X1 , …, Xn 的联合密度函数为
22
⎟⎟⎠
⎞
⎜⎜⎝
⎛ +−−+−−
=
−− ∑∑=∑== ===∏
2
11
2
1
222 2
2
1
)2(
2
1
1
2
)(
1 e)π2(
1e
)π2(
1e
π2
1);,,(
µµµµµ
µ
nxx
n
xx
n
n
i
x
n
n
i
i
n
i
i
n
i
iii
xxp L
∑⋅= =
−−
n
i
ixnxn
n
1
22
2
1
2
1
ee
)π2(
1 µµ ,
令 XT = ,有 xt = ,即 ∑⋅= =
−−
n
i
ixntn
nn
xxp 1
22
2
1
2
1
1 ee)π2(
1);,,(
µµµL ,
取
2
2
1
e
)π2(
1);(
µµµ ntn
n
tg
−= , ∑= =
−
n
i
ix
nxxxh 1
2
2
1
21 e),,,( L 与参数µ 无关,
可得 XT = 是参数µ 的充分统计量;
因 2222 1)]([)Var(1)]([)Var()( µ+=+=+=
n
XEX
n
XEXXE ,即 22 1 µ=⎟⎠
⎞⎜⎝
⎛ −
n
XE ,
可知
n
X 1ˆ 22 −=µ 是参数µ 2 的无偏估计,
对任意的满足 E(ϕ) = 0 的统计量ϕ (x1 , …, xn),
有 0e
)π2(
1)( 1
2
1
2
1 2
1
2
=∑⋅= ∫ ∫∞+∞− ∞+∞−
−+−
=
n
nxnx
n
dxdxE
n
i
i
LL
µµ
ϕϕ ,
则 0e 1
2
1
1
2
=∑⋅∫ ∫∞+∞− ∞+∞−
+−
=
n
xnx
dxdx
n
i
i
LL
µ
ϕ ,
两端关于µ 求偏导数,得 0e 12
1
1
2
=⋅∑⋅∫ ∫∞+∞− ∞+∞−
+−
=
n
xnx
dxdxxn
n
i
i
LL
µ
ϕ ,
两端关于µ 再求偏导数,得 0)(e 122
1
1
2
=⋅∑⋅∫ ∫∞+∞− ∞+∞−
+−
=
n
xnx
dxdxxn
n
i
i
LL
µ
ϕ ,
即 0e 1
2
1
2 1
2
=∑⋅∫ ∫∞+∞− ∞+∞−
+−
=
n
xnx
dxdxx
n
i
i
LL
µ
ϕ ,
则 0)( 2 =ϕXE ,有 0)(1)()ˆ( 22 =−= ϕϕϕµ E
n
XEE ,即 0)()ˆ()ˆ(),ˆCov( 222 =−= ϕµϕµϕµ EEE ,
故
n
X 1ˆ 22 −=µ 是参数µ 2 的 UMVUE;
因 ⎟⎠
⎞⎜⎝
⎛
n
NX 1,~ µ ,有 µ=)(XE ,
n
XEX 1])[()Var( 2 =−= µ , 0])[( 3 =− µXE , 24 3])[( nXE =− µ ,
则 43223444 )(4])[(6])[(4])[(])[()( µµµµµµµµµµ +−+−+−+−=+−= XEXEXEXEXEXE
4
2
2
63 µµ ++=
nn
,
23
可得
nnnnn
XEXEX
2
2
2
24
2
2
22422 42163)]([)()Var()ˆVar( µµµµµ +=⎟⎠
⎞⎜⎝
⎛ +−++=−== ,
因总体密度函数 2
)( 2
e
π2
1);(
µ
µ
−−=
x
xp ,有
2
)(π2ln);(ln
2µµ −−−= xxp ,
则 µµµ −=∂
∂ xxp );(ln ,即 1)();(ln)( 2
2
=−=⎟⎟⎠
⎞⎜⎜⎝
⎛
∂
∂= µµµµ XEXpEI ,
可得 g (µ) = µ 2 无偏估计方差的 C-R 下界为 )ˆ(Var4)2(
)(
)]([ 2222 µµµµ
µ <==′
nnnI
g ,
故
n
X 1ˆ 22 −=µ 不是参数µ 2 的有效估计.
13.对泊松分布 P(θ ).
(1)求 ⎟⎠
⎞⎜⎝
⎛
θ
1I ;
(2)找一个函数 g(⋅),使 g(θ )的费希尔信息与θ 无关.
解:因总体概率函数为 θθα −= e
!
);(
x
xp
x
,有 ln p(x; θ ) = x lnθ − ln x! − θ,
则 θ
θ
θθθ
−=−⋅=∂
∂ xxxp 11);(ln ,即 θθθθθθθ
1)Var(1)(1);(ln)( 2
2
2
2
==−=⎥⎦
⎤⎢⎣
⎡
∂
∂= XXEXpEI ,
令α = g(θ )可导,有 pg
d
dpp ln)(lnln αθθ
α
αθ ∂
∂⋅′=⋅∂
∂=∂
∂ ,
则 )]([)]([)()]([ln)]([ln)( 22
2
2
2
θθαθαθθθ gIgIgpEgpEI ′=′=⎥⎦
⎤⎢⎣
⎡
∂
∂′=⎥⎦
⎤⎢⎣
⎡
∂
∂= ,即 2)]([
)()]([ θ
θθ
g
IgI ′= ,
(1)因 θθ
1)( =g ,有 21)( θθ −=′g ,
故 3222 )1(
1
)]([
)(1 θθ
θ
θ
θ
θ =−=′=⎟⎠
⎞⎜⎝
⎛
g
II ;
(2)要使得 c
gg
IgI =′=′= 22 )]([
1
)]([
)()]([ θθθ
θθ 为常数与θ 无关,
则 θθ cg
1)]([ 2 =′ , θθ cg
1)( =′ ,即 θθ
c
g 2)( = ,
取 θθ =)(g ,有 θθ 2
1)( =′g ,
故 4
])2(1[
1
)]([
)()]([
22
==′= θ
θ
θ
θθ
g
IgI 与θ 无关.
14.设 X1, …, Xn为独立同分布变量,0 < θ < 1,
2
}1{,
2
1}0{,
2
1}1{ 111
θθ ====−=−= XPXPXP .
24
(1)求θ 的 MLE 1ˆθ ,并问 1ˆθ 是否无偏的;
(2)求θ 的矩估计 2ˆθ ;
(3)计算θ 的无偏估计的方差的 C-R 下界.
解:(1)方法一:设 X1, …, Xn 中取值−1, 0, 1 分别有 n−1, n0, n1次,有 n−1 + n0 + n1 = n,
则似然函数 n
nnnnn
L
2
)1(
22
1
2
1)(
11101 θθθθθ −
− −=⎟⎠
⎞⎜⎝
⎛⎟⎠
⎞⎜⎝
⎛⎟⎠
⎞⎜⎝
⎛ −= ,有 ln L(θ ) = n−1 ln (1 − θ ) + n1 ln θ − n ln 2,
令 01
1
1)(ln
11 =⋅+−
−⋅= − θθθ
θ nn
d
Ld ,得
11
1
nn
n
+= −
θ ,
故θ 的 MLE
11
1
1ˆ nn
n
+= −
θ ;
方法二:总体 X 概率函数为
22
2
)1()1)(1(
2
)1( 22
)1(
2
1
22
1
2
1);(
xxxx
xxxxxx
xp
+−+−+−−
−=⎟⎠
⎞⎜⎝
⎛⎟⎠
⎞⎜⎝
⎛⎟⎠
⎞⎜⎝
⎛ −= θθθθθ ,x = −1, 0, 1,
则似然函数 ⎟
⎟
⎠
⎞
⎜⎜⎝
⎛ +⎟⎟⎠
⎞
⎜⎜⎝
⎛ −
=
+− ∑∑∑∑−=−= ====∏
n
i
i
n
i
i
n
i
i
n
i
iiiii xxxx
n
n
i
xxxx
L 11
2
11
222
2
1
2
1
1
22 )1(
2
1)1(
2
1)( θθθθθ ,
有 2lnln
2
1)1ln(
2
1)(ln
11
2
11
2 nxxxxL
n
i
i
n
i
i
n
i
i
n
i
i −⎟⎟⎠
⎞⎜⎜⎝
⎛ ++−⎟⎟⎠
⎞⎜⎜⎝
⎛ −= ∑∑∑∑
====
θθθ ,
令 01
2
1
1
1
2
1)(ln
11
2
11
2 =⋅⎟⎟⎠
⎞⎜⎜⎝
⎛ ++−
−⋅⎟⎟⎠
⎞⎜⎜⎝
⎛ −= ∑∑∑∑
==== θθθ
θ n
i
i
n
i
i
n
i
i
n
i
i xxxxd
Ld ,得
∑
∑
∑
∑∑
=
=
=
== +=
+
= n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
x
x
x
xx
1
2
1
1
2
11
2
22
1
2
θ ,
故θ 的 MLE
∑
∑
=
=+= n
i
i
n
i
i
X
X
1
2
1
1
22
1θˆ ;
(注:因 Xi全部可能取值−1, 0, 1,有 11
1
2 nnX
n
i
i += −
=
∑ , 11
1
−
=
−=∑ nnXn
i
i ,即以上两个结果一致)
因
⎥⎥⎦
⎤
⎢⎢⎣
⎡
⎟⎟⎠
⎞
⎜⎜⎝
⎛ ++=⎟⎟⎠
⎞
⎜⎜⎝
⎛
+= −−− 1111
1
11
1
1)ˆ( nnnn
nEE
nn
nEE θ ,
且 θθθ
θ
=
+−
==−=
===−==
22
1
2
}11{
}1{}11|1{
XXP
XPXXXP 或或 ,
则在 n−1 + n1 = m 的条件下,n1 服从二项分布 b(m, θ ),E(n1 | n−1 + n1 = m) = mθ,
可得 θ==+=⎟⎟⎠
⎞
⎜⎜⎝
⎛ =++ −−−
)(1 11111
11
1 mnnnE
m
mnn
nn
nE ,即 θ=⎟⎟⎠
⎞
⎜⎜⎝
⎛ ++ −− 1111
1 nn
nn
nE ,
25
故 θθθ ==
⎥⎥⎦
⎤
⎢⎢⎣
⎡
⎟⎟⎠
⎞
⎜⎜⎝
⎛ ++= −−
)()ˆ( 11
11
1
1 Ennnn
nEEE , 1ˆθ 是θ 的无偏估计;
(2)因
2
1
2
1
2
10
2
1)1()( −=×+×+−×−= θθθXE ,有
2
1)( += XEθ ,
故θ 的矩估计
2
1
2ˆ −= Xθ ;
(3)因总体 X 概率函数为 22
22
)1(
2
1);(
xxxx
xp
+−
−= θθθ ,x = −1, 0, 1,
有 2lnln
2
)1ln(
2
);(ln
22
−++−−= θθθ xxxxxp ,
则 θθθθ
1
21
1
2
);(ln
22
⋅++−
−⋅−=∂
∂ xxxxxp ,
即 22
22222
2
2
2
2
2
2
)1(2
])1[(])1[(1
2)1(
1
2
);(ln θθ
θθθθ
θθθθ −
−−++−−=⋅+−−
−⋅−=∂
∂ xxxxxxxp ,
可得费希尔信息量 22
22222
2
2
)1(2
)(])1[()(])1[();(ln)( θθ
θθθθθθθ −
−−++−=⎥⎦
⎤⎢⎣
⎡
∂
∂−= XEXEXpEI ,
因
2
1
2
1
2
10
2
1)1()( −=×+×+−×−= θθθXE ,
2
1
2
1
2
10
2
1)1()( 2222 =×+×+−×−= θθXE ,
则
)1(2
1
)1(2)1(2
2
1)21(
2
1)122(
)( 22
2
22
2
θθθθ
θθ
θθ
θθθθ
θ −=−
−=−
⎟⎠
⎞⎜⎝
⎛ −⋅−+⋅+−
=I ,
故θ 的 C-R 下界为
nnI
)1(2
)(
1 θθ
θ
−= .
15.设总体 X ~ Exp (1/θ ),X1, …, Xn 是样本,θ 的矩估计和最大似然估计都是 X ,它也是θ 的相合估计和
无偏估计,试证明在均方误差准则下存在优于 X 的估计(提示:考虑 Xaa =θˆ ,找均方误差最小者).
注:此题与习题 6.3 第 9 题相同,这里省略.
习题 6.5
1. 设一页书上的错别字个数服从泊松分布 P (λ ),有两个可能取值:1.5 和 1.8,且先验分布为
P{λ = 1.5} = 0.45, P{λ = 1.8} = 0.55,
现检查了一页,发现有 3 个错别字,试求λ 的后验分布.
解:总体 X 表示一页书上的错别字个数,X ~ P (λ ),样本为 X1 = 3,有 L,2,1,0,e!}{ 1 ===
− k
k
kXP
k λλ ,
则 P{X1 = 3} = P{λ = 1.5}P{X1 = 3 | λ = 1.5} + P{λ = 1.8}P{X1 = 3 | λ = 1.8}
1449.00884.00565.0e
6
8.155.0e
6
5.145.0 8.1
3
5.1
3
=+=⋅×+⋅×= −− ,
故参数λ 的后验分布为 3899.0
1449.0
0565.0
}3{
}5.1|3{}5.1{}3|5.1{
1
1
1 ===
======
XP
XPPXP λλλ ,
26
6101.0
1449.0
0884.0
}3{
}8.1|3{}8.1{}3|8.1{
1
1
1 ===
======
XP
XPPXP λλλ .
2. 设总体为均匀分布U (θ, θ +1),θ 的先验分布是均匀分布U (10, 16).现有三个观测值:11.7, 12.1, 12.0.求
θ 的后验分布.
解:参数θ 的先验分布为 16106
1)( <<Ι= θθπ ,
总体 X 的条件分布为 p (x |θ ) = Iθ < x < θ + 1,
有样本 X1 , X 2 , X 3 的联合条件分布为 1,,321 321)|,,( +<<Ι= θθθ xxxxxxp ,
则样本 X1 , X 2 , X 3 和参数θ 的联合分布为
1610,11610,1,,321 )1()3(321 6
1
6
1),,,( <<<<−<<+<< Ι=Ι= θθθθθθ xxxxxxxxh ,
可得样本 X1 , X 2 , X 3 的边际分布为 1.06
1
6
1),,(
7.11
1.111610,1321 )1()3(
==Ι= ∫∫+∞∞− <<<<− θθθθ ddxxxm xx ,
故参数θ 的后验分布为 7.111.11
321
321
321 3
5
),,(
),,,(),,|( <<Ι== θθθπ xxxm
xxxhxxx .
3. 设 X1 , …, X n是来自几何分布的样本,总体分布列为
P{X = k | θ } = θ (1 − θ )k, k = 0, 1, 2, …,
θ 的先验分布是均匀分布 U (0, 1).
(1)求θ 的后验分布;
(2)若 4 次观测值为 4, 3, 1, 6,求θ 的贝叶斯估计.
解:(1)参数θ 的先验分布为π (θ ) = I0 < θ < 1,
因样本 X1 , …, X n 的联合条件分布为
ni xxn
n
i
x
nxxp
++
=
−=−=∏ LL 1)1()1()|,,(
1
1 θθθθθ ,x1 , …, x n = 0, 1, 2, …,
则样本 X1 , …, X n 和参数θ 的联合分布为
101
1)1(),,,( <<
++ Ι−= θθθθ nxxnnxxh LL ,x1 , …, x n = 0, 1, 2, …,
样本 X1 , …, X n 的边际分布为
)2(
)1()1()1(),,(
1
11
01
1
++++Γ
+++Γ+Γ=−= ∫ ++
n
nxxn
n xxn
xxndxxm n L
LL L θθθ ,x1 , …, x n = 0, 1, 2, …,
故参数θ 的后验分布为
10
1
1
1
1
1
1)1(
)1()1(
)2(
),,(
),,,(),,|( <<
++ Ι−+++Γ+Γ
++++Γ== θθθθθπ nxxn
n
n
n
n
n xxn
xxn
xxm
xxhxx LL
L
L
LL ;
(2)因 ∫∫ +++ −+++Γ+Γ ++++Γ=⋅=
1
0
1
1
11
0 11
1)1(
)1()1(
)2(),,|(),,|( θθθθθπθθ d
xxn
xxndxxxxE nxxn
n
n
nn
L
L
LLL
2
1
)3(
)1()2(
)1()1(
)2(
11
1
1
1
++++
+=++++Γ
+++Γ+Γ⋅+++Γ+Γ
++++Γ=
nn
n
n
n
xxn
n
xxn
xxn
xxn
xxn
LL
L
L
L ,
27
则贝叶斯估计
2
1),,|(ˆ
1
1 ++++
+==
n
nB XXn
nXXE LLθθ ,
因样本观测值为 4, 3, 1, 6,即 x1 + … + x n = 15,n = 4,
故
4
1
2144
14ˆ =++
+=Bθ .
4. 验证:泊松分布的均值λ 的共轭先验分布是伽玛分布.
证:设参数λ 的先验分布是伽玛分布 Ga (α , β ),密度函数为 01 e)()( >
−− ΙΓ= λ
βλαα λα
βλπ ,
因样本 X1 , …, X n 的联合条件分布为
λλ λλλ n
n
xxn
i i
x
n xxx
xxp
ni −
++
=
− ==∏ e!!e!)|,,( 111
1
LL
L
,x1 , …, x n = 0, 1, 2, …,
则样本 X1 , …, X n 和参数λ 的联合分布为
0
)(
1
1
1 e!!)(
),,,(
1
>
+−
−+++
ΙΓ= λ
λβαα
α
λβλ n
n
xx
n xx
xxh
n
LL
L
,x1 , …, x n = 0, 1, 2, …,
样本 X1 , …, X n 的边际分布为
∫∫ ∞+ +−−+++∞+ +−−+++ Γ=Γ= 0 )(110 )(1
1
1 e!!)(
e
!!)(
),,( 1
1 λλα
βλα
λβ λβααλβαα d
xx
d
xx
xxm nxx
n
n
n
xx
n
n
n L
L
LLL
α
α
β
α
α
β
++++
+++Γ⋅Γ= nxx
n
n n
xx
xx L
L
L 1)(
)(
!!)(
1
1
,x1 , …, x n = 0, 1, 2, …,
即参数λ 的后验分布为
0
)(1
11
1
1 e)(
)(
),,(
),,,(),,|( 1
1
>
+−−+++
+++
Ι+++Γ
+== λλβα
α
λα
βλλπ nxx
n
xx
n
n
n
n
n
xx
n
xxm
xxhxx L
L
LL
LL ,
后验分布仍为伽玛分布 Ga (x1 + … + x n + α , n + β ),
故伽玛分布是泊松分布的均值λ 的共轭先验分布.
5. 验证:正态总体方差(均值已知)的共轭先验分布是倒伽玛分布.
证:设参数σ 2 的先验分布是倒伽玛分布 IGa (α , λ ),密度函数为 2e1
)(
)(
1
2
2 σ
λαα
σα
λσπ −
+
⎟⎠
⎞⎜⎝
⎛
Γ= ,
又设总体分布为 N (µ 0 , σ 2),其中µ 0 已知,密度函数为 2
2
0
2
)(
2 e
π2
1)|( σ
µ
σσ
−−=
x
xp ,
有样本 X1 , …, X n 的联合条件分布为
∑== =
−−
=
−−∏
n
i
ii x
nn
n
i
x
nxxp 1
2
022
2
0 )(
2
1
1
2
)(
2
1 e)π2(
1e
π2
1)|,,(
µσσ
µ
σσσL ,
则样本 X1 , …, X n 和参数σ 2 的联合分布为
⎥⎥⎦
⎤
⎢⎢⎣
⎡ −+−++ ∑
⎟⎠
⎞⎜⎝
⎛⋅Γ=
=
n
i
ix
n
nn
xxh 1
2
02 )(2
111
2
2
2
1 e
1
)()π2(
),,,(
µλσ
αα
σα
λσL ,
28
样本 X1 , …, X n 的边际分布为
∫ ∞+ ⎥
⎥
⎦
⎤
⎢⎢⎣
⎡ −+−++ ∑
⎟⎠
⎞⎜⎝
⎛⋅Γ=
=
0
2
)(
2
111
2
21 )(e
1
)()π2(
),,( 1
2
02 σσα
λ µλσαα dxxm
n
i
ix
n
nn
L
∫ ∞+ ⎥
⎥
⎦
⎤
⎢⎢⎣
⎡ −+−++ ⎟⎠
⎞⎜⎝
⎛−∑⋅Γ=
=0
2
)(
2
1
1
2 1e
)()π2(
1
2
0
dt
t
t
n
i
ixtn
n
µλαα
α
λ
α
αµλαα
µλ
α
α
λ
α
λ
+
=
∞+ ⎥⎥⎦
⎤
⎢⎢⎣
⎡ −+−−+
⎥⎦
⎤⎢⎣
⎡ −+
⎟⎠
⎞⎜⎝
⎛ +Γ
⋅Γ=
∑⋅Γ= ∑
∫ =
2
1
2
0
0
)(
2
1
1
2
)(
2
1
2
)()π2(
e
)()π2(
1
2
0
n
n
i
i
n
xtn
n
x
n
dtt
n
i
i
,
即参数σ 2 的后验分布为
⎥⎦
⎤⎢⎣
⎡ ∑ −+−++
+
= =⎟⎠
⎞⎜⎝
⎛
⎟⎠
⎞⎜⎝
⎛ +Γ
⎥⎦
⎤⎢⎣
⎡ −+
=
∑ n
i
ix
n
n
n
i
i
n n
x
xx 1
2
02 )(2
111
2
2
2
1
2
0
1
2 e1
2
)(
2
1
),,|(
µλσ
α
α
σα
µλ
σπ L ,
后验分布仍为倒伽玛分布 ⎟⎟⎠
⎞⎜⎜⎝
⎛ −++ ∑
=
n
i
ix
nIGa
1
2
0 )(2
1,
2
µλα ,
故倒伽玛分布是参数σ 2的共轭先验分布.
6. 设 X1 , …, X n是来自如下总体的一个样本,
θθθ <<= x
xxp 0,2)|( 2 .
(1)若θ 的先验分布为均匀分布 U (0, 1),求θ 的后验分布;
(2)若θ 的先验分布为π (θ ) = 3θ 2,0 < θ < 1,求θ 的后验分布.
解:样本 X1 , …, X n 的联合条件分布为
θθ θθθ <<= << Ι=Ι=∏ ni xxn n
nn
i
x
i
n
xxxxxp ,,02
1
1
021 1
22)|,,( L
LL ,
(1)因参数θ 的先验分布为π (θ ) = I0 < θ < 1,
则样本 X1 , …, X n 和参数θ 的联合分布为
1,0,,2
1
1,,02
1
1 )(11
22),,,( <<><<< Ι=Ι= θθ θθθ nnn xxxn
n
n
xxn
n
n
n
xxxxxxh LL
LLL ,
样本 X1 , …, X n 的边际分布为
0,,
)12(
)(
11
0,,2
1
1 1)( 1
]1[
12
22),,( >
−−
> Ι⋅−−=Ι= ∫ nn n xxnnn
n
x xxn
n
n
n xn
xxdxxxxm LL
LLL θθ ,
故参数θ 的后验分布为
1)12(
)(
2
1
1
1 )(]1[
12
),,(
),,,(),,|( <<−− Ι−
−== θθ
θθπ
nxn
n
n
n
n
n x
n
xxm
xxhxx L
LL ;
(2)因参数θ 的先验分布为π (θ ) = 3θ 2 I0 < θ < 1,
则样本 X1 , …, X n 和参数θ 的联合分布为
1,0,,22
1
1,,022
1
1 )(11
2323),,,( <<>−<<<− Ι⋅=Ι⋅= θθ θθθ nnn xxxn
n
n
xxn
n
n
n
xxxxxxh LL
LLL ,
29
样本 X1 , …, X n 的边际分布为
0,,
)32(
)(
11
0,,22
1
1 1)( 1
]1[
32
2323),,( >
−−
>− Ι⋅−−
⋅=Ι⋅= ∫ nn n xxnnn
n
x xxn
n
n
n xn
xxdxxxxm LL
LLL θθ ,
故参数θ 的后验分布为
1)32(
)(
22
1
1
1 )(]1[
32
),,(
),,,(),,|( <<−−− Ι−
−== θθ
θθπ
nxn
n
n
n
n
n x
n
xxm
xxhxx L
LL .
7. 设 X1 , …, X n是来自如下总体的一个样本,
p (x | θ ) = θ x θ − 1,0 < x < 1.
若取θ 的先验分布为伽玛分布,即θ ~ Ga (α , λ ),求θ 的后验期望估计.
解:参数θ 的先验分布为 Ga (α , λ ),密度函数为 01 e)()( >
−− ΙΓ= θ
λθαα θα
λθπ ,
因样本 X1 , …, X n 的联合条件分布为
1,,0
)ln()1(
1,,0
1
1
1
10
1
1 1
1
1
e)()|,,( <<
−
<<
−
=
<<
− Ι=Ι=Ι=∏ nnni xxxxnxxnnn
i
xin xxxxxp L
L
LLL θθθ θθθθ ,
则样本 X1 , …, X n 和参数θ 的联合分布为
0,1,,0
)]ln([1
1
1 1
1e
)()(
),,,( ><<
−−−+ Ι⋅Γ= θ
θλαα θα
λθ
n
n
xx
xxn
n
n xx
xxh L
L
LL ,
样本 X1 , …, X n 的边际分布为
∫ ∞+ <<−−−+ Ι⋅Γ= 0 1,,0)]ln([111 11e)()(),,( θθα
λ θλαα d
xx
xxm
n
n
xx
xxn
n
n L
L
LL
1,,0
11
1)]ln([
)(
)()( <<+
Ι−
+Γ⋅⋅Γ= nxxnnn xx
n
xx LLL α
α
λ
α
α
λ ,
即参数θ 的后验分布为
0
)]ln([11
1
1
1
1e
)(
)]ln([
),,(
),,,(),,|( >
−−−+
+
Ι+Γ
−== θθλα
α
θα
λθθπ nxxn
n
n
n
n
n n
xx
xxm
xxhxx LLL
LL ,
后验分布仍为伽玛分布 Ga (n + α , λ − ln (x1…x n)),
因 ∫∫ −−+++Γ−=⋅=
1
0
)]ln([11
0 11
1e
)(
)]ln([),,|(),,|( θθα
λθθπθθ θλα
α
d
n
xxdxxxxE nxxn
n
n
nn
LLLL
)ln()]ln([
)1(
)(
)]ln([
1
1
1
1
n
n
n
n
n
xx
n
xx
n
n
xx
LL
L
−
+=−
++Γ⋅+Γ
−= ++
+
λ
α
λ
α
α
λ
α
α
,
故参数θ 的后验期望估计
)ln(
ˆ
1 n
B XX
n
L−
+= λ
αθ .
8. 设 X1 , …, X n 是来自均匀分布 U (0, θ ) 的样本,θ 的先验分布是帕雷托(Pareto)分布,密度函数为
1
0)( += β
β
θ
βθθπ ,θ > θ 0 ,其中β , θ 0 是两个已知的常数.
(1)验证:帕雷托分布是θ 的共轭先验分布;
30
(2)求θ 的贝叶斯估计.
解:(1)参数θ 的先验分布是帕雷托分布,密度函数为
01
0)( θθβ
β
θ
βθθπ >+ Ι= ,
因样本 X1 , …, X n 的联合条件分布为
θθ θθθ <<= << Ι=Ι=∏ ni xxn
n
i
xnxxp ,,0
1
01 1
11)|,,( LL ,
则样本 X1 , …, X n 和参数θ 的联合分布为
},,,max{,0,,1
0
,,,01
0
1 01101
),,,( θθβ
β
θθθβ
β
θ
βθ
θ
βθθ
nnn xxxxnxxnn
xxh LLLL >>++><<++ Ι=Ι= ,
样本 X1 , …, X n 的边际分布为
0,,
01
0},,,max{ 0,,1
0
1 101 1 }],,,)[max{(
1),,( >+
∞+
>++ Ι+⋅=Ι= ∫ nn n xxnnxx xxnn xxndxxm LL L LL ββθ β
β
θββθθθ
βθ ,
即参数θ 的后验分布为
},,,max{1
01
1 01
}],,,)[max{(),,|( θθβ
β
θ
θβθπ
nxxn
n
n
n
xxnxx L
LL >++
+
Ι+= ,
后验分布仍为帕雷托分布,其参数为 n + β 和 max{x1 , …, xn , θ 0},
故帕雷托分布是参数θ 的共轭先验分布;
(2)因 ∫+∞ ⋅= },,,max{ 11 01 ),,|(),,|( θ θθπθθ nxx nn dxxxxE L LL
∫ ∞+ + ++= },,,max{ 0101 }],,,)[max{(θ β
β
θθ
θβ
nxx n
n
n dxxn
L
L
},,,max{
11
}],,,[max{}],,,)[max{( 01
1)(
01
01 θβ
β
β
θθβ
ββ
n
n
nn
n xxn
n
n
xxxxn LLL −+
+=−+⋅+=
++−
+ ,
故θ 的贝叶斯估计 },,,max{
1
ˆ
01 θβ
βθ nB XXn
n L−+
+= .
9. 设指数分布 Exp (θ ) 中未知参数θ 的先验分布为伽玛分布 Ga (α , λ ),现从先验信息得知:先验均值为
0.0002,先验标准差为 0.01,试确定先验分布.
解:因伽玛分布 Ga (α , λ ) 密度函数为 01 e)()( >
−− ΙΓ= θ
λθαα θα
λθπ ,
则由 0002.0)( == λ
αθE , 0001.0)01.0()Var( 22 === λ
αθ ,解得λ = 2,α = 0.0004,
故参数θ 的先验分布为伽玛分布 Ga (0.0004, 2).
10.设 X1, …, Xn为来自如下幂级数分布的样本,总体分布密度为
)0,0(),;(
10
1
11 >>Ι= ≤≤−− θθθ θ ccxcxp xcc ,
(1)证明:若 c 已知,则θ 的共轭先验分布为帕雷托分布;
(2)若θ 已知,则 c 的共轭先验分布为伽玛分布.
证:样本 X1 , …, X n 的联合条件分布为
θθ θθθ <<−−
=
<<
−− Ι=Ι=∏ ni xxnccnnn
i
x
cc
in xxccxxxp ,,0
1
1
1
0
1
1 1
)()|,,( LLL ,
31
(1)设参数θ 的先验分布是帕雷托分布,密度函数为
01
0)( θθβ
β
θ
βθθπ >+ Ι= ,
则样本 X1 , …, X n 和参数θ 的联合分布为
},,,max{,0,,1
1
10
,,,01
1
10
1 01101
)()(),,,( θθβ
β
θθβ
β
θ
βθ
θ
βθθ
nnn xxxxnc
c
n
n
xxnc
c
n
n
n
xxcxxcxxh LLL
LLL >>++
−
<<++
−
Ι=Ι= ,
样本 X1 , …, X n 的边际分布为
∫ ∞+ >++ − Ι= },,,max{ 0,,1
1
10
1
01 1
)(),,( θ β
β
θθ
βθ
n nxx
xxnc
c
n
n
n d
xxcxxm
L L
LL
0,,
)(
011
10 1
}],,,[max{)( >
+−
− Ι+= nxx
nc
nc
n
n
nc
xxxxc L
LL β
θβθ
ββ ,
即参数θ 的后验分布为
},,,max{1
01
1 01
}],,,)[max{(),,|( θθβ
β
θ
θβθπ
nxxnc
nc
n
n
xxncxx L
LL >++
+
Ι+= ,
后验分布仍为帕雷托分布,其参数为 nc + β 和 max{x1 , …, xn , θ0},
故帕雷托分布是参数θ 的共轭先验分布;
(2)设参数 c 的先验分布为伽玛分布 Ga (α , λ ),密度函数为 01 e)()( >
−− ΙΓ= c
ccc λα
α
α
λπ ,
则样本 X1 , …, X n 和参数θ 的联合分布为
0,,,0
1
1
1
1 1
e)(
)(
),,,( ><<
−−−−+ ΙΓ= cxx
nccc
n
n
n n
xxccxxh θ
λαα θα
λ
LLL
0,,,0
)]ln(ln[1
1
1
1e
)()( ><<
−+−−+ Ι⋅Γ= cxx
cxxnn
n
n
nc
xx θ
θλαα
α
λ
L
L
L ,
样本 X1 , …, X n 的边际分布为
∫ ∞+ <<−+−−+ Ι⋅Γ= 0 ,,0)]ln(ln[111 11e)()(),,( θα
λ
θ
θλαα dc
xx
xxm
n
n
xx
cxxnn
n
n L
L
LL
θα
α
θλ
α
α
λ
<<+ Ι−+
+Γ⋅⋅Γ= nxxnnn xxn
n
xx ,,011 1)]ln(ln[
)(
)()( LLL ,
即参数θ 的后验分布为
0
)]ln(ln[11
1
1e
)(
)]ln(ln[),,|( >
−+−−+
+
Ι+Γ
−+= ccxxnn
n
n
n
nc
n
xxnxxc LLL θλα
α
α
θλπ ,
后验分布仍为伽玛分布,其参数为 n + α 和λ + n lnθ − ln (x1…xn),
故伽玛分布是参数 c 的共轭先验分布.
11.某人每天早上在汽车站等公共汽车的时间(单位:min)服从均匀分布 U (0, θ ),其中θ 未知,假设θ 的
先验分布为
⎪⎩
⎪⎨
⎧
<
≥=
.4,0
;4,192)( 4
θ
θθθπ
假如此人在三个早上等车的时间分别为 5, 3, 8 分钟,求θ 后验分布.
32
解:参数θ 的先验分布为 44192)( >Ι= θθθπ ,
因样本 X1 , …, X n 的联合条件分布为
θθ θθθ <<= << Ι=Ι=∏ ni xxn
n
i
xnxxp ,,0
1
01 1
11)|,,( LL ,
则样本 X1 , …, X n 和参数θ 的联合分布为
}4,,,max{,0,,44,,,041 111
192192),,,(
nnn xxxxnxxnn
xxh LLLL >>+><<+ Ι=Ι= θθθ θθθ ,
样本 X1 , …, X n 的边际分布为
0,,3
1
}4,,,max{ 0,,41 11 1 }]4,,,)[max{3(
192192),,( >+
+∞
>+ Ι+=Ι= ∫ nn n xxnnxx xxnn xxndxxm LL L LL θθ ,
即参数θ 的后验分布为
}4,,,max{4
3
1
1 1
}]4,,,)[max{3(),,|(
nxxn
n
n
n
xxnxx L
LL >+
+
Ι+= θθθπ ,
后验分布仍为帕雷托分布,其参数为 n + 3 和 max{x1 , …, xn , 4},
因样本观测值为 5, 3, 8,即 max{x1, …, x n, 4} = 8,n = 3,
故参数θ 的后验分布为帕雷托分布,其参数为 6 和 8,密度函数为
87
6
321
86),,|( >Ι×= θθθπ xxx .
12.从正态分布 N (θ, 22)中随机抽取容量为 100 的样本,又设θ 的先验分布为正态分布,证明:不管先验
分布的标准差为多少,后验分布的标准差一定小于 1/5.
解:设θ 的先验分布为正态分布 N (µ, σ 2),根据书上 P336 例 6.5.3 的结论可知,θ 的后验分布为
⎟⎟⎠
⎞
⎜⎜⎝
⎛
++
+=⎟⎟⎠
⎞
⎜⎜⎝
⎛
++
+
−−
−
−−−−
−−
22
2
2222
22
25
1,
25
25
2
1,
2
2
σσ
µσ
σσ
µσ XN
nn
XnN ,
故后验分布的标准差为
5
1
25
1
2 <+ −σ .
13.设随机变量 X 服从负二项分布,其概率分布为
L,1,,)1(
1
1
)|( +=−⎟⎟⎠
⎞
⎜⎜⎝
⎛
−
−= − kkxpp
k
x
pxf kxk ,
证明其成功概率 p 共轭先验分布族为贝塔分布族.
证:设参数 p 的先验分布是贝塔分布 Be(a, b),密度函数为 1011 )1()()(
)()( <<
−− Ι−ΓΓ
+Γ= pba ppba
bapπ ,
因样本 X1 , …, X n 的联合条件分布为
nkx
nk
n
i
i
n
i
kxki
n
n
i
i
i pp
k
x
pp
k
x
pxxp
−
==
− ∑−⋅⎟⎟⎠
⎞
⎜⎜⎝
⎛
−
−=−⎟⎟⎠
⎞
⎜⎜⎝
⎛
−
−= =∏∏ 1)1(11)1(11)|,,( 111 L ,
则样本 X1 , …, X n 和参数 p 的联合分布为
10
1
1
1
1
1)1(
)()(
)(
1
1
),,,( <<
−+−
−+
=
Ι∑−ΓΓ
+Γ⋅⎟⎟⎠
⎞
⎜⎜⎝
⎛
−
−= =∏ pbnkxankn
i
i
n
n
i
i
pp
ba
ba
k
x
pxxh L ,
样本 X1 , …, X n 的边际分布为
33
∫ ∏ −+−−+
=
∑−ΓΓ
+Γ⋅⎟⎟⎠
⎞
⎜⎜⎝
⎛
−
−= =1
0
1
1
1
1
1)1(
)()(
)(
1
1
),,( dppp
ba
ba
k
x
xxm
bnkx
ank
n
i
i
n
n
i
i
L
⎟⎟⎠
⎞
⎜⎜⎝
⎛ ++Γ
⎟⎟⎠
⎞⎜⎜⎝
⎛ +−Γ⋅+Γ
⋅ΓΓ
+Γ⋅⎟⎟⎠
⎞
⎜⎜⎝
⎛
−
−=
∑
∑∏
=
=
= bax
bnkxank
ba
ba
k
x
n
i
i
n
i
in
i
i
1
1
1
)(
)()(
)(
1
1 ,
即参数 p 的后验分布为
10
1
1
1
1
1
1)1(
)(
),,|( <<
−+−
−+
=
= Ι∑−
⎟⎟⎠
⎞
⎜⎜⎝
⎛ +−Γ⋅+Γ
⎟⎟⎠
⎞⎜⎜⎝
⎛ ++Γ
= =
∑
∑
p
bnkx
ank
n
i
i
n
i
i
n
n
i
i
pp
bnkxank
bax
xxp Lπ ,
后验分布仍为贝塔分布,其参数为 nk + a 和 bnkx
n
i
i +−∑
=1
,
故贝塔分布是参数 p 的共轭先验分布.
14.从一批产品中抽检 100 个,发现 3 个不合格,假定该产品不合格率θ 的先验分布为贝塔分布 Be(2, 200),
求θ 的后验分布.
解:参数θ 的先验分布是贝塔分布 Be(2, 200),密度函数为 10199)1()200()2(
)202()( <<Ι−ΓΓ
Γ= θθθθπ ,
因样本 X1 , …, X n 的联合条件分布为
∑−∑=−= ==
−
=
−∏
n
i
i
n
i
i
ii
xnxn
i
xx
nxxp 11 )1()1()|,,(
1
1
1 θθθθθL ,
则样本 X1 , …, X n 和参数θ 的联合分布为
10
1991
1
11 )1(
)200()2(
)202(),,,( <<
−++
Ι∑−∑ΓΓ
Γ= == θθθθ
n
i
i
n
i
i xnx
nxxh L ,
样本 X1 , …, X n 的边际分布为
∫ ∑−∑ΓΓ Γ= ==
−++1
0
1991
1
11 )1(
)200()2(
)202(),,( θθθ dxxm
n
i
i
n
i
i xnx
nL
)202(
2002
)200()2(
)202( 11
+Γ
⎟⎟⎠
⎞⎜⎜⎝
⎛ −+Γ⎟⎟⎠
⎞⎜⎜⎝
⎛ +Γ
⋅ΓΓ
Γ=
∑∑
==
n
xnx
n
i
i
n
i
i
,
即参数θ 的后验分布为
10
1991
11
1
11 )1(
2002
)202(),,|( <<
−++
==
Ι∑−∑
⎟⎟⎠
⎞⎜⎜⎝
⎛ −+Γ⎟⎟⎠
⎞⎜⎜⎝
⎛ +Γ
+Γ= ==
∑∑ θ
θθθπ
n
i
i
n
i
i xnx
n
i
i
n
i
i
n
xnx
nxx L ,
后验分布仍为贝塔分布,其参数为 ∑
=
+
n
i
ix
1
2 和 ∑
=
−+
n
i
ixn
1
200 ,
34
因 n = 100, 3
1
=∑
=
n
i
ix ,
故参数θ 的后验分布为贝塔分布 Be(5, 297),密度函数为
10
2964
1 )1()297()5(
)302(),,|( <<Ι−ΓΓ
Γ= θθθθπ nxx L .
习题 6.6
1. 某厂生产的化纤强度服从正态分布,长期以来其标准差稳定在σ = 0.85,现抽取了一个容量为 n = 25
的样本,测定其强度,算得平均值为 25.2=x ,试求这批化纤平均强度的置信水平为 0.95 的置信区间.
解:已知σ 2,估计µ ,选取枢轴量 )1,0(~ N
n
XU σ
µ−= ,置信区间为 ⎥⎦
⎤⎢⎣
⎡ ± − nuX
σ
α 2/1 ,
置信度 1 − α = 0.95,u1 − α /2 = u 0.975 = 1.96, 25.2=x ,σ = 0.85,n = 25,
故µ 的 0.95 置信区间为 ]5832.2,9168.1[
25
85.096.125.22/1 =⎥⎦
⎤⎢⎣
⎡ ×±=⎥⎦
⎤⎢⎣
⎡ ± − nux
σ
α .
2. 总体 X ~ N (µ , σ 2),σ 2 已知,问样本容量 n 取多大时才能保证µ 的置信水平为 95%的置信区间的长度
不大于 k.
解:已知σ 2,估计µ ,选取枢轴量 )1,0(~ N
n
XU σ
µ−= ,置信区间为 ⎥⎦
⎤⎢⎣
⎡ ± − nuX
σ
α 2/1 ,长度为 n
u σα 2/12 − ,
置信度 1 − α = 0.95,u1 − α /2 = u 0.975 = 1.96,有置信区间的长度 k
nn
u ≤××=− σσα 96.122 2/1 ,
故
k
n σ×≥ 92.3 ,即 2
23664.15
k
n σ≥ .
3. 0.50, 1.25, 0.80, 2.00 是取自总体 X 的样本,已知 Y = ln X 服从正态分布 N (µ , 1).
(1)求µ 的置信水平为 95%的置信区间;
(2)求 X 的数学期望的置信水平为 95%的置信区间.
解:(1)已知σ 2,估计µ ,选取枢轴量 )1,0(~ N
n
YU σ
µ−= ,置信区间为 ⎥⎦
⎤⎢⎣
⎡ ± − nuY
σ
α 2/1 ,
置信度 1 − α = 0.95,u1 − α /2 = u 0.975 = 1.96,σ = 1,n = 4,
0)00.2ln80.0ln25.1ln50.0(ln
4
1 =+++=y ,
故µ 的 95%置信区间为 ]98.0,98.0[
4
196.102/1 −=⎥⎦
⎤⎢⎣
⎡ ×±=⎥⎦
⎤⎢⎣
⎡ ± − nuy
σ
α ;
(2)因 Y = ln X 服从正态分布 N (µ , 1),有 X = e Y,且 Y 的密度函数为 2
)( 2
e
π2
1)(
µ−−=
y
yp ,
则 ∫∫ ∞+∞−
−+−−∞+
∞−
−− =⋅= dydyXE
yyyy
y 2
22
2
)( 222
e
π2
1e
π2
1e)(
µµµ
35
2
1
2
)1(
2
1
2
12)1()1(2
ee
π2
1ee
π2
1
222
+∞+
∞−
−−−+∞+
∞−
−−+++−− === ∫∫ µ
µµµµµ
dydy
yyy
,
故 E(X ) 的 95%置信区间为 [e −0.98 + 0.5, e 0.98 + 0.5] = [0.6188, 4.3929].
4. 用一个仪表测量某一物理量 9 次,得样本均值 32.56=x ,样本标准差 s = 0.22.
(1)测量标准差σ 大小反映了测量仪表的精度,试求σ 的置信水平为 0.95 置信区间;
(2)求该物理量真值的置信水平为 0.99 的置信区间.
解:(1)估计 σ 2,选取枢轴量 )1(~)1( 22
2
2 −−= nSn χσχ ,置信区间为 ⎥⎦
⎤⎢⎣
⎡
−
⋅−
−
⋅−
− )1(
)1(,
)1(
)1(
2
2/
2
2
2/1
2
n
Sn
n
Sn
αα χχ ,
置信度 1 − α = 0.95,n = 9, 1797.2)8()1( 2025.02 2/ ==− χχα n , 5345.17)8()1( 2975.02 2/1 ==−− χχ α n ,
s = 0.22,
故 σ 2 的 0.95 置信区间为 ]1776.0,0221.0[
1797.2
22.08,
5345.17
22.08
)1(
)1(,
)1(
)1( 22
2
2/
2
2
2/1
2
=⎥⎦
⎤⎢⎣
⎡ ××=⎥⎦
⎤⎢⎣
⎡
−
⋅−
−
⋅−
− n
sn
n
sn
αα χχ ,
即 σ 的 0.95 置信区间为 ]4215.0,1486.0[]1776.0,0221.0[ = .
(2)未知 σ 2 ,估计µ ,选取枢轴量 )1(~ −−= nt
nS
XT µ ,置信区间为 ⎥⎦
⎤⎢⎣
⎡ −± − n
SntX )1(2/1 α ,
置信度 1 − α = 0.99,n = 9,t1 − α /2 (n − 1) = t 0.995 (8) = 3.3554, 32.56=x ,s = 0.22,
故µ 的 0.99 置信区间为 ]5661.56,0739.56[
9
22.03554.332.56)1(2/1 =⎥⎦
⎤⎢⎣
⎡ ×±=⎥⎦
⎤⎢⎣
⎡ −± − n
sntx α .
5. 已知某种的抗压强度 X ~ N (µ , σ 2),现随机地抽取 10 个试件进行抗压试验,测得数据如下:
482 493 457 471 510 446 435 418 394 469
(1)求平均抗压强度µ 的置信水平为 95%的置信区间;
(2)若已知σ = 30,求平均抗压强度µ 的置信水平为 95%的置信区间;
(3)求σ 的置信水平为 95%的置信区间.
解:(1)未知 σ 2 ,估计µ ,选取枢轴量 )1(~ −−= nt
nS
XT µ ,置信区间为 ⎥⎦
⎤⎢⎣
⎡ −± − n
SntX )1(2/1 α ,
置信度 1 − α = 0.95,n = 10,t1 − α /2 (n − 1) = t 0.975 (9) = 2.2622, 5.457=x ,s = 35.2176,
故µ 的 95%置信区间 ]6936.482,3064.432[
10
2176.352622.25.457)1(2/1 =⎥⎦
⎤⎢⎣
⎡ ×±=⎥⎦
⎤⎢⎣
⎡ −± − n
sntx α ;
(2)已知σ 2,估计µ ,选取枢轴量 )1,0(~ N
n
XU σ
µ−= ,置信区间为 ⎥⎦
⎤⎢⎣
⎡ ± − nuX
σ
α 2/1 ,
置信度 1 − α = 0.95,u1 − α /2 = u 0.975 = 1.96, 5.457=x ,σ = 30,n = 10,
故µ 的 95%置信区间为 ]0942.476,9058.438[
10
3096.15.4572/1 =⎥⎦
⎤⎢⎣
⎡ ×±=⎥⎦
⎤⎢⎣
⎡ ± − nux
σ
α ;
(3)估计 σ 2,选取枢轴量 )1(~)1( 22
2
2 −−= nSn χσχ ,置信区间为 ⎥⎦
⎤⎢⎣
⎡
−
⋅−
−
⋅−
− )1(
)1(,
)1(
)1(
2
2/
2
2
2/1
2
n
Sn
n
Sn
αα χχ ,
36
置信度 1 − α = 0.95,n = 10, 7004.2)9()1( 2025.02 2/ ==− χχα n , 0228.19)9()1( 2975.02 2/1 ==−− χχ α n ,
s = 35.2176,
故 σ 2 的 0.95 置信区间为
]6469.4133,7958.586[
7004.2
2176.359,
0228.19
2176.359
)1(
)1(,
)1(
)1( 22
2
2/
2
2
2/1
2
=⎥⎦
⎤⎢⎣
⎡ ××=⎥⎦
⎤⎢⎣
⎡
−
⋅−
−
⋅−
− n
sn
n
sn
αα χχ ,
即 σ 的 0.95 置信区间为 ]2934.64,2239.24[]6469.4133,7958.586[ = .
6. 在一批货物中随机抽取 80 件,发现有 11 件不合格品,试求这批货物的不合格品率的置信水平为 0.90
的置信区间.
解:大样本,估计概率 p,选取枢轴量 )1,0(~
)1(
N
n
pp
pXU &−
−= ,
置信区间为 ⎥⎥⎦
⎤
⎢⎢⎣
⎡ +−±++
−
−
−
−
2
2
2/1
2/1
2
2/1
2
2/1 4
)1(
21
1
n
u
n
XXu
n
uX
nu
ααα
α
,
置信度 1 − α = 0.90,u1 − α /2 = u 0.95 = 1.645,n = 80, 1375.080
11 ==x ,
故 p 的 0.90 置信区间
⎥⎥⎦
⎤
⎢⎢⎣
⎡ +−±++
−
−
−
−
2
2
2/1
2/1
2
2/1
2
2/1 4
)1(
21
1
n
u
n
xxu
n
ux
nu
ααα
α
]2128.0,0859.0[
804
645.1
80
8625.01375.0645.1
160
645.11375.0
80645.11
1
2
22
2 =⎥⎥⎦
⎤
⎢⎢⎣
⎡
×+
××±++= .
注:p 的 0.90 近似置信区间
]2008.0,0742.0[
80
8625.01375.0645.11375.0)1(2/1 =⎥⎥⎦
⎤
⎢⎢⎣
⎡ ××±=⎥⎥⎦
⎤
⎢⎢⎣
⎡ −± − n
xxux α ;
p 的 0.90 修正置信区间(修正频率 1548.0
480
211* =+
+=x )
]2197.0,0898.0[
84
8452.01548.0645.11548.0
4
*)1(** 2/1 =⎥⎥⎦
⎤
⎢⎢⎣
⎡ ××±=⎥⎥⎦
⎤
⎢⎢⎣
⎡
+
−± − n
xxux α .
7. 设 X1 , …, X n是来自泊松分布 P (λ ) 的样本,证明:λ 的近似 1 − α 置信区间为
⎥⎥
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢⎢
⎢
⎣
⎡
−⎟⎠
⎞⎜⎝
⎛ +++−⎟⎠
⎞⎜⎝
⎛ +−+ −−−−
2
41212
,
2
41212 2
2
2
2/1
2
2/1
2
2
2
2/1
2
2/1 Xun
Xu
n
XXu
n
Xu
n
X αααα
.
证:总体 X ~ P (λ ),有 )(~1 λnPXXXn n++= L , λ=)(XE , nX
λ=)Var( ,当 n 很大时, ⎟⎠
⎞⎜⎝
⎛
n
NX λλ,~& ,
37
选取枢轴量 )1,0(~ N
n
XU &λ
λ−= ,置信度为 1 − α ,即 αλ
λ
αα −=⎪⎭
⎪⎬
⎫
⎪⎩
⎪⎨
⎧ ≤−≤− −− 12/12/1 un
XuP ,
则
n
uX
n
u λλλ αα 2/12/1 −− ≤−≤− ,即 nuX
λλ α ⋅≤− −2 2/12)( , 012 22 2/12 ≤+⎟⎠
⎞⎜⎝
⎛ +− − XunX λλ α ,
解得
2
41212
2
41212 2
2
2
2/1
2
2/1
2
2
2
2/1
2
2/1 Xun
Xu
n
XXu
n
Xu
n
X −⎟⎠
⎞⎜⎝
⎛ +++
≤≤
−⎟⎠
⎞⎜⎝
⎛ +−+ −−−− αααα
λ ,
置信区间为
⎥⎥
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢⎢
⎢
⎣
⎡
−⎟⎠
⎞⎜⎝
⎛ +++−⎟⎠
⎞⎜⎝
⎛ +−+ −−−−
2
41212
,
2
41212 2
2
2
2/1
2
2/1
2
2
2
2/1
2
2/1 Xun
Xu
n
XXu
n
Xu
n
X αααα
.
8. 某商店某种商品的月销售量服从泊松分布,为合理进货,必须了解销售情况.现记录了该商店过去的
一些销售量,数据如下:
月销售量 9 10 11 12 13 14 15 16
月份数 1 6 13 12 9 4 2 1
试求平均月销售量的置信水平为 0.95 的置信区间.
解:估计泊松分布的参数λ,由第 7 题的结论可知λ 的近似 1 − α 置信区间为
⎥⎥⎦
⎤
⎢⎢⎣
⎡
−⎟⎠
⎞⎜⎝
⎛ +±+=
⎥⎥
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢⎢
⎢
⎣
⎡
−⎟⎠
⎞⎜⎝
⎛ +±+
−−
−−
2
2
2
2/1
2
2/1
2
2
2
2/1
2
2/1
2
1
2
1
2
41212
Xu
n
Xu
n
X
Xu
n
Xu
n
X
αα
αα
,
置信度 1 − α = 0.95,u1 − α /2 = u 0.975 = 1.96, 9792.11=x ,n = 48,
故λ 的 0.95 置信区间
⎥⎥⎦
⎤
⎢⎢⎣
⎡
−⎟⎠
⎞⎜⎝
⎛ +±+ −− 2
2
2
2/1
2
2/1 2
1
2
1 xu
n
xu
n
x αα
]9992.12,0392.11[9792.11
482
96.19792.11
482
96.19792.11 2
222
=⎥⎥⎦
⎤
⎢⎢⎣
⎡
−⎟⎟⎠
⎞
⎜⎜⎝
⎛
×+±×+= .
9. 设从总体 ),(~ 211 σµNX 和总体 ),(~ 222 σµNY 中分别抽取容量为 n1 = 10, n 2 = 15 的独立样本,可计算
得 4.52,76,5.56,82 22 ==== yx sysx .
(1)若已知 49,64 2221 == σσ ,求µ 1 − µ 2 的置信水平为 95%的置信区间;
(2)若已知 2221 σσ = ,求µ 1 − µ 2 的置信水平为 95%的置信区间;
(3)若对 2221 ,σσ 一无所知,求µ 1 − µ 2 的置信水平为 95%的近似置信区间;
(4)求 2221 σσ 的置信水平为 95%的置信区间.
38
解:(1)已知 2221 ,σσ ,估计µ 1 − µ 2 ,选取枢轴量 )1,0(~)()(
2
2
2
1
2
1
21 N
nn
YXU σσ
µµ
+
−−−= ,
置信区间为 ⎥⎥⎦
⎤
⎢⎢⎣
⎡ +⋅±− −
2
2
2
1
2
1
2/1 nn
uYX σσα ,
置信度 1 − α = 0.95,u1 − α /2 = u 0.975 = 1.96, 49,64,76,82 2221 ==== σσyx ,n1 = 10,n 2 = 15,
故µ 1 − µ 2 的 95%置信区间为
]0939.12,0939.0[
15
49
10
6496.17682
2
2
2
1
2
1
2/1 −=⎥⎥⎦
⎤
⎢⎢⎣
⎡ +×±−=⎥⎥⎦
⎤
⎢⎢⎣
⎡ +⋅±− − nnuyx
σσ
α ;
(2)未知 2221 ,σσ ,但 2221 σσ = ,估计µ 1 − µ 2 ,选取枢轴量 )2(~11
)()(
21
21
21 −+
+
−−−= nnt
nn
S
YXT
w
µµ ,
置信区间为 ⎥⎥⎦
⎤
⎢⎢⎣
⎡ +⋅−+±− −
21
212/1
11)2(
nn
SnntYX wα ,
置信度 1 − α = 0.95,n1 = 10,n 2 = 15,t1 − α /2 (n1 + n 2 − 2) = t 0.975 (23) = 2.0687,
4.52,76,5.56,82 22 ==== yx sysx ,有 3488.723
4.52145.569 =×+×=ws ,
故µ 1 − µ 2 的 95%置信区间为
⎥⎥⎦
⎤
⎢⎢⎣
⎡ +××±−=⎥⎥⎦
⎤
⎢⎢⎣
⎡ +⋅−+±− − 15
1
10
13488.70687.2768211)2(
21
212/1 nn
snntyx wα
= [−0.2063, 12.2063];
(3)未知 2221 ,σσ ,估计µ 1 − µ 2 ,
选取枢轴量 )(~)()( 0
2
2
1
2
21 lt
n
S
n
S
YXT
yx
&
+
−−−= µµ ,l0 是最接近
)1()1( 2
2
2
4
1
2
1
4
2
2
2
1
2
−+−
⎟⎟⎠
⎞
⎜⎜⎝
⎛ +
=
nn
S
nn
S
n
S
n
S
l
yx
yx
的整数,
近似置信区间为 ⎥⎥⎦
⎤
⎢⎢⎣
⎡
+⋅±−∈− −
2
2
1
2
02/121 )( n
S
n
SltYX yxαµµ ,
因 n1 = 10,n 2 = 15, 4.52,5.56 22 == yx ss ,有 9201.18
1415
4.52
910
5.56
15
4.52
10
5.56
2
2
2
2
2
=
×+×
⎟⎠
⎞⎜⎝
⎛ +
=l ,即取 l0 = 19,
置信度为 1 − α = 0.95,t1 − α /2 (l0) = t 0.975 (19) = 2.0930, 4.52,76,5.56,82 22 ==== yx sysx ,
故µ 1 − µ 2 的 95%置信区间为
39
]3288.12,3288.0[
15
4.52
10
5.560930.27682)(
2
2
1
2
02/1 −=⎥⎥⎦
⎤
⎢⎢⎣
⎡ +×±−=⎥⎥⎦
⎤
⎢⎢⎣
⎡
+⋅±− − n
s
n
sltyx yxα ;
(4)估计方差比 2
2
2
1
σ
σ ,选取枢轴量 )1,1(~ 212
2
2
2
1
2
−−= nnF
S
SF
y
x
σ
σ ,
置信区间为 ⎥⎥⎦
⎤
⎢⎢⎣
⎡
−−⋅−−⋅ − )1,1(
1,
)1,1(
1
212/
2
2
212/1
2
2
nnFS
S
nnFS
S
y
x
y
x
αα
,
置信度 1 − α = 0.95,n1 = 10,n 2 = 15,F1 − α /2 (n1 − 1, n 2 − 1) = F 0.975 (9, 14) = 3.21,
80.3
1
)9,14(
1)14,9()1,1(
975.0
025.0212/ ===−− FFnnFα , 4.52,5.56
22 == yx ss ,
故 2
2
2
1
σ
σ 的 95%置信区间为
]0973.4,3359.0[80.3
4.52
50.56,
21.3
1
4.52
50.56
)14,9(
1,
)14,9(
1
025.0
2
2
975.0
2
2
=⎥⎦
⎤⎢⎣
⎡ ××=⎥⎥⎦
⎤
⎢⎢⎣
⎡ ⋅⋅
Fs
s
Fs
s
y
x
y
x .
10.假设人体身高服从正态分布,今抽测甲、乙两地区 18 岁~25 岁女青年身高得数据如下:甲地区抽取
10 名,样本均值 1.64 m,样本标准差 0.2 m;乙地区抽取 10 名,样本均值 1.62 m,样本标准差 0.4 m.
(1)两正态总体方差比的置信水平为 95%的置信区间;
(2)两正态总体均值差的置信水平为 95%的置信区间.
解:(1)估计方差比 2
2
2
1
σ
σ ,选取枢轴量 )1,1(~ 212
2
2
2
1
2
−−= nnF
S
SF
y
x
σ
σ ,
置信区间为 ⎥⎥⎦
⎤
⎢⎢⎣
⎡
−−⋅−−⋅ − )1,1(
1,
)1,1(
1
212/
2
2
212/1
2
2
nnFS
S
nnFS
S
y
x
y
x
αα
,
置信度 1 − α = 0.95,n1 = 10,n 2 = 10,F1 − α /2 (n1 − 1, n 2 − 1) = F 0.975 (9, 9) = 4.03,
sx = 0.2,sy = 0.4,
故 2
2
2
1
σ
σ 的 95%置信区间为
]0075.1,0620.0[03.4
4.0
2.0,
03.4
1
4.0
2.0
)9,9(
1,
)9,9(
1
2
2
2
2
025.0
2
2
975.0
2
2
=⎥⎦
⎤⎢⎣
⎡ ××=⎥⎥⎦
⎤
⎢⎢⎣
⎡ ⋅⋅
Fs
s
Fs
s
y
x
y
x ;
(2)未知 2221 ,σσ ,估计µ 1 − µ 2 ,
选取枢轴量 )(~)()( 0
2
2
1
2
21 lt
n
S
n
S
YXT
yx
&
+
−−−= µµ ,l0 是最接近
)1()1( 2
2
2
4
1
2
1
4
2
2
2
1
2
−+−
⎟⎟⎠
⎞
⎜⎜⎝
⎛ +
=
nn
S
nn
S
n
S
n
S
l
yx
yx
的整数,
40
近似置信区间为 ⎥⎥⎦
⎤
⎢⎢⎣
⎡
+⋅±−∈− −
2
2
1
2
02/121 )( n
S
n
SltYX yxαµµ ,
因 n1 = 10,n 2 = 10,sx = 0.2,sy = 0.4,有 2353.13
910
4.0
910
2.0
10
4.0
10
2.0
2
4
2
4
222
=
×+×
⎟⎟⎠
⎞
⎜⎜⎝
⎛ +
=l ,即取 l0 = 13,
置信度为 1 − α = 0.95,t1 − α /2 (l0) = t 0.975 (13) = 2.1604, 4.0,62.1,2.0,64.1 ==== yx sysx ,
故µ 1 − µ 2 的 95%置信区间为
]3255.0,2855.0[
10
4.0
10
2.01604.262.164.1)(
22
2
2
1
2
02/1 −=⎥⎥⎦
⎤
⎢⎢⎣
⎡ +×±−=⎥⎥⎦
⎤
⎢⎢⎣
⎡
+⋅±− − n
s
n
sltyx yxα .
11.设总体 X 的密度函数为 0e >− Ι xxλλ ,其中λ > 0 为未知参数,X1 , …, X n为抽自此总体的简单随机样本,
求λ 的置信水平为 1 − α 的置信区间.
解:总体 X 服从指数分布 Exp(λ),有 )2(
2
1,1
2
1~2 2χλ =⎟⎠
⎞⎜⎝
⎛=⎟⎠
⎞⎜⎝
⎛= GaExpXY , )2(~ 21 nYYYn n χ++= L ,
选取枢轴量 )2(~2 22 nXn χλχ = ,置信度为 1 − α ,即 αχλχ αα −=≤≤ − 1)}2(2)2({ 2 2/12 2/ nXnnP ,
则 )2(2)2( 2 2/12 2/ nXnn αα χλχ −≤≤ ,即 Xn
n
Xn
n
2
)2(
2
)2( 2 2/1
2
2/ αα χλχ −≤≤ ,
故λ 的置信水平为 1 − α 的置信区间为 ⎥⎦
⎤⎢⎣
⎡ −
Xn
n
Xn
n
2
)2(,
2
)2( 2 2/1
2
2/ αα χχ .
12.设某电子产品的寿命服从指数分布,其密度函数为 0e >− Ι xxλλ ,现从此批产品中抽取容量为 9 的样本,
测得寿命为(单位:千小时)
15,45,50,53,60,65,70,83,90,
求平均寿命 1/λ 的置信水平为 0.9 的置信区间和置信上、下限.
解:估计指数分布的参数λ,由第 11 题的结论可知λ 的 1 − α 置信区间为 ⎥⎦
⎤⎢⎣
⎡ −
Xn
n
Xn
n
2
)2(,
2
)2( 2 2/1
2
2/ αα χχ ,
则平均寿命 1/λ 的 1 − α 置信区间为 ⎥⎦
⎤⎢⎣
⎡
− )2(
2,
)2(
2
2
2/
2
2/1 n
Xn
n
Xn
αα χχ ,
单侧置信上、下限分别为
)2(
2
2 n
Xn
αχ 、 )2(
2
2
1 n
Xn
αχ − ,
置信度 1 − α = 0.9,n = 9, 3905.9)18()2( 205.02 2/ == χχα n , 8693.28)18()2( 295.02 2/1 ==− χχ α n , 59=x ,
8649.10)18()2( 21.0
2 == χχα n , 9894.25)18()2( 29.021 ==− χχ α n ,
故平均寿命 1/λ 的 0.9 置信区间为
41
]0930.113,7865.36[
3905.9
5992,
8693.28
5992
)2(
2,
)2(
2
2
2/
2
2/1
=⎥⎦
⎤⎢⎣
⎡ ××××=⎥⎦
⎤⎢⎣
⎡
− n
Xn
n
Xn
αα χχ ;
单侧置信上、下限分别为
7460.97
8649.10
5992
)2(
2
2 =××=n
Xn
αχ , 8628.408649.10
5992
)2(
2
2
1
=××=
− n
Xn
αχ .
13.设总体 X 的密度函数为
+∞<<∞−+∞<<∞−−+= θθθ ,,])(1π[
1);( 2 xx
xp ,
X1 , …, X n 为抽自此总体的简单随机样本,求位置参数θ 的置信水平近似为 1 − α 的置信区间.
解:总体 X 服从柯西分布,根据书上 P276 例 5.3.10 的结论可知,样本中位数 ⎟⎟⎠
⎞
⎜⎜⎝
⎛
n
Nm
4
π,~
2
5.0 θ ,
选取枢轴量 )1,0(~
)2(π
5.0 N
n
mU &θ−= ,置信度为 1 − α ,即 αθ αα −=⎭⎬
⎫
⎩⎨
⎧ ≤−≤− −− 1)2(π 2/1
5.0
2/1 un
muP ,
则 2/15.02/1 )2(π αα
θ
−− ≤−≤− un
mu ,即
n
um
n
um
2
π
2
π
2/15.02/15.0 αα θ −− +≤≤− ,
故θ 的置信水平为 1 − α 的近似置信区间为 ⎥⎦
⎤⎢⎣
⎡ +− −− numnum 2
π,
2
π
2/15.02/15.0 αα .
注:因柯西分布数学期望不存在,由样本均值构造枢轴量得到的置信区间不是一个好的估计,
总体 X 服从柯西分布 Ch(1, θ ),根据书上习题 4.2 第 11 题的结论可知,柯西分布具有可加性,
则 ),(~1 θnnChXXXn n++= L ,有 )0,(~ nChnXnY θ−= ,其密度函数与分布函数分别为
)π(
)( 22 yn
nypY += , n
y
n
t
tn
nyF
y
y
Y arctanπ
1
2
1arctan
π
1
)π(
)( 22 +==+= ∞−∞−∫ ,
可得其 p 分位数 yp 满足 pn
y
yF ppY =+= arctanπ
1
2
1)( ,即 ⎟⎠
⎞⎜⎝
⎛ −=
2
ππtan pnyp ,
选取枢轴量 )0,(~ nChnXnY θ−= ,置信度为 1 − α ,即 { } αθ αα −=≤−≤ − 12/12/ ynXnyP ,
则
2
)1π(tan
2
)1π(tan 2/12/
αθα αα −=≤−≤−−= − nynXnny ,即 2
)1π(tan
2
)1π(tan αθα −+≤≤−− XX ,
故θ 的置信水平为 1 − α 的置信区间为 ⎥⎦
⎤⎢⎣
⎡ −+−−
2
)1π(tan,
2
)1π(tan αα XX .
但是该置信区间长度
2
)1π(tan2 α− 与样本容量 n 无关,不会随 n 的增加而缩短,不是一个好的估计.
14.设 X1 , …, X n为抽自正态总体 N (µ , 16)的简单随机样本,为使得µ 的置信水平为 1 − α 的置信区间的长
度不大于给定的 L,试问样本容量 n 至少要多少?
解:已知σ 2,估计µ ,选取枢轴量 )1,0(~ N
n
XU σ
µ−= ,置信区间为 ⎥⎦
⎤⎢⎣
⎡ ± − nuX
σ
α 2/1 ,长度为 n
u σα 2/12 − ,
42
因σ 2 = 16,有 L
n
u ≤− 42 2/1 α ,
故
L
un 2/18 α−≥ ,即 2
2
2/164
L
un α−≥ .
15.设 X1 , …, X n为抽自正态总体 N (µ , σ 2)的简单随机样本.试证
2/1
1
2)()]([ ⎥⎦
⎤⎢⎣
⎡ −+− ∑
=
n
i
i XXkX σµ
为枢轴量,其中 k 为已知常数.
证:因 2/1
2
22/122/122/1
1
2 )1(
)1(
])1[(1])1[(
)(
)(
)(
⎥⎦
⎤⎢⎣
⎡ −
−−−=−−−
−=−
+−=
⎥⎦
⎤⎢⎣
⎡ −
+−
∑
= σ
µσµσµσµ
Sn
k
nS
Xnn
Sn
k
nS
X
Sn
kX
XX
kX
n
i
i
,
且 )1(~ −− nt
nS
X µ , )1(~)1( 22
2
−− nSn χσ ,分布都与未知参数µ , σ
2 无关,
故
2/1
1
2)()]([ ⎥⎦
⎤⎢⎣
⎡ −+− ∑
=
n
i
i XXkX σµ 的分布与未知参数µ , σ 2 无关,即为枢轴量.
16.设 X1 , …, X n 是来自 U (θ − 1/2, θ + 1/2)的样本,求θ 的置信水平为 1 − α 的置信区间(提示:证明
θ−+
2
)1()( XX n 为枢轴量,并求出对应的密度函数).
证:因总体 X 的密度函数与分布函数分别为
p(x) = Iθ − 0.5 < x < θ + 0.5, ⎪⎩
⎪⎨
⎧
+≥
+<≤−+−
−<
=
.5.0,1
;5.05.0,5.0
;5.0,0
)(
θ
θθθ
θ
x
xx
x
xF
则(X(1), X(n))的联合密度函数为
)()1(
)()()]()()[1(),( )()1(
2
)1()()()1(1 nxxn
n
nnn xpxpxFxFnnxxp ≤
− Ι⋅−−=
5.05.0
2
)1()( )()1(
))(1( +<≤<−
− Ι−−= θθ nxxnn xxnn ,
由卷积公式得 U = X(1) + X(n)的密度函数,
当 2θ − 1 < u < 2θ 时,
12
2
1
1
)1(
2
2
1 )1(
2
)1()1( )12(2
)2(
2
]))[(1()( −
−
−
−
− +−=−−=−−−= ∫ n
u
n
u
n
U u
nxundxxxunnup θθθ ,
当 2θ ≤ u < 2θ + 1 时,
12
2
1
1
)1(
2
2
1 )1(
2
)1()1( )12(2
)2(
2
]))[(1()( −
−−
−
−−
− −+=−−=−−−= ∫ n
u
u
n
u
u
n
U u
nxundxxxunnup θθθ ,
当 u ≤ 2θ − 1 或 u ≥ 2θ + 1 时,pU (u) = 0,
令 θθ −+=−=
22
)1()( XXUY n ,Y 的密度函数与分布函数分别为
x(1)
x(n)
0 θ − 0.5
θ − 0.5
θ + 0.5
θ + 0.5
43
⎪⎩
⎪⎨
⎧
<≤−
<<−+
=+= −
−
.,0
;5.00,)21(
;05.0,)21(
)22(2)( 1
1
其他
yyn
yyn
ypyp n
n
UY θ
⎪⎪
⎪
⎩
⎪⎪
⎪
⎨
⎧
≥
<≤−−
<≤−+
−<
=
.5.0,1
;5.00,)21(
2
11
;05.0,)21(
2
1
;5.0,0
)(
y
yy
yy
y
yF
n
n
Y
分布与未知参数θ 无关,Y 为枢轴量,
当 p < 0.5 时,其 p 分位数 yp 满足 pyyF nppY =+= )21(2
1)( ,即
2
1)2(
1
−= np py ,
当 p ≥ 0.5 时,其 p 分位数 yp 满足 pyyF nppY =−−= )21(2
11)( ,即
2
)]1(2[1
1
n
p
py −−= ,
选取枢轴量 θ−+=
2
)1()( XXY n ,置信度为 1 − α ,即 αθ αα −=⎭⎬
⎫
⎩⎨
⎧ ≤−+≤ − 12 2/1
)1()(
2/ y
XX
yP n ,
则
2
1
22
1
1
2/1
)1()(
1
2/
n
n
n
y
XX
y αθα αα −=≤−+≤−= − ,即 2
1
22
1
2
1
)1()(
1
)1()(
n
n
n
n XXXX αθα −++≤≤−−+ ,
故θ 的置信水平为 1 − α 的置信区间为
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢
⎣
⎡ −++−−+
2
1
2
,
2
1
2
1
)1()(
1
)1()(
n
n
n
n XXXX αα .
17.设 X1 , …, X n为抽自均匀分布 U (θ1, θ2)的简单随机样本,记 X(1) ≤ X(2) ≤ … ≤ X(n)为其次序统计量.求:
(1)θ2 − θ1的置信水平为 1 − α 的置信区间;
(2)求
2
12 θθ + 的置信水平为 1 − α 的置信区间.
解:因总体 X 的密度函数与分布函数分别为
21
12
1)( θθθθ <<Ι−= xxp ,
⎪⎪⎩
⎪⎪⎨
⎧
≥
<≤−
−
<
=
.,1
;,
;,0
)(
2
21
12
1
1
θ
θθθθ
θ
θ
x
xx
x
xF
则(X(1), X(n))的联合密度函数为
)()1(
)()()]()()[1(),( )()1(
2
)1()()()1(1 nxxn
n
nnn xpxpxFxFnnxxp ≤
− Ι⋅−−=
2)()1(1)(
))(1(
12
2
)1()(
θθθθ <≤<
−
Ι−
−−=
nxxn
n
n xxnn ,
(1)由增补变量法得 U = X(n) − X(1)的密度函数,
当 0 < u < θ2 − θ1 时,
n
nu
n
n
U
uunndx
xxunn
up
)(
)()1(
)(
]))[(1(
)(
12
12
2
)1(
12
2
)1()1(2
1 θθ
θθ
θθ
θ
θ −
−−−=−
−+−=
−− −∫ ,
当 u ≤ 0 或 u ≥ θ2 − θ1 时,pU (u) = 0,
令
12
)1()(
12 θθθθ −
−=−=
XXUY n ,Y 的密度函数与分布函数分别为
x(1)
x(n)
0
θ2
θ2θ1
θ1
44
⎩⎨
⎧ <<−−=−−=
−
.,0
;10),1()1(
))(()()(
2
1212 其他
yyynnypyp
n
UY θθθθ
⎪⎩
⎪⎨
⎧
≥
<≤−−
<
= −
.1,1
;10,)1(
;0,0
)( 1
y
yynny
y
yF nnY
可得 Y 服从贝塔分布 Be(n − 1, 2),其分布与未知参数θ1, θ2 无关,Y 为枢轴量,
其 p 分位数 yp = Bep(n − 1, 2)满足方程 pynnyyF npnppY =−−= − )1()( 1 ,
选取枢轴量
12
)1()(
θθ −
−= XXY n ,置信度为 1 − α ,即
αθθ αα −=⎭⎬
⎫
⎩⎨
⎧ −≤−
−≤− − 1)2,1()2,1( 2/1
12
)1()(
2/ nBe
XX
nBeP n ,
则 )2,1()2,1( 2/1
12
)1()(
2/ −≤−
−≤− − nBeXXnBe n αα θθ ,即 )2,1()2,1( 2/
)1()(
12
2/1
)1()(
−
−≤−≤−
−
− nBe
XX
nBe
XX nn
αα
θθ ,
故θ2 − θ1 的置信水平为 1 − α 的置信区间为 ⎥⎦
⎤⎢⎣
⎡
−
−
−
−
− )2,1(
,
)2,1( 2/
)1()(
2/1
)1()(
nBe
XX
nBe
XX nn
αα
;
(2)由变量替换公式得(U, V ) = (X(n) − X(1), X(n) + X(1))的联合密度函数,有 2,2 )()1(
UVXUVX n
+=−= ,
雅可比行列式为
2
1
2
1
2
1
2
1
2
1
−=
−
=J ,
根据θ1 < x(1) < x(n) < θ2,可得 2θ1 < v − u < v + u < 2θ2,
即 0 < u < θ2 − θ1,2θ1 + u < v < 2θ2 − u,有
uvuun
n
nUV
unnJuvuvpvup −<<+−<<
−
Ι⋅−
−=⋅⎟⎠
⎞⎜⎝
⎛ +−=
2112 22,0
12
2
1 )(2
)1(||
2
,
2
),( θθθθθθ ,
令 V* = V − (θ2 + θ1),有(U, V*)的联合密度函数为
uvuun
n
UVUV
unnvupvup −−<<−−−<<
−
Ι⋅−
−=++= )()(,0
12
2
12* 121212)(2
)1())(*,(*),( θθθθθθθθθθ ,
由增补变量法得
)(2
)()(
2
*
)1()(
12)1()(
XX
XX
U
VZ
n
n
−
+−+== θθ 的密度函数,
当 z < 0 时, n
z
n
n
z
n
n
Z z
nunduuunnzp
)21(
1
)(
)1(2
)(2
)1()(
21
012
21
0
12
2
12
12
−
−=−
−=⋅⋅−
−= −
−
−
− −∫
θθθθ
θθθθ ,
当 z ≥ 0 时, n
z
n
n
z
n
n
Z z
nunduuunnzp
)21(
1
)(
)1(2
)(2
)1()(
21
012
21
0
12
2
12
12
+
−=−
−=⋅⋅−
−= +
−
+
− −∫
θθθθ
θθθθ ,
u
v
0
2θ2
2θ1
θ2 − θ1
u
v*
0 θ2 − θ1
θ2 − θ1
θ1 − θ2
45
则 Z 的分布函数为
⎪⎩
⎪⎨
⎧
≥+−
<−
=
−
−
.0,)21(
2
11
;0,)21(
2
1
)(
1
1
zz
zz
zF
n
n
Z
分布与未知参数θ1, θ2 无关,Z 为枢轴量,
当 p < 0.5 时,其 p 分位数 zp 满足 pzzF nppZ =−= −1)21(2
1)( ,即
2
)2(1 1
1
n
p
pz
−−= ,
当 p ≥ 0.5 时,其 p 分位数 zp 满足 pzzF nppZ =+−= −1)21(2
11)( ,即
2
1)]1(2[ 1
1
−−= −np pz ,
选取枢轴量
)(2
)()(
)1()(
12)1()(
XX
XX
Z
n
n
−
+−+= θθ ,置信度为 1 − α ,即
αθθ αα −=⎪⎭
⎪⎬⎫⎪⎩
⎪⎨⎧ ≤−
+−+≤ − 1)(2
)()(
2/1
)1()(
12)1()(
2/ zXX
XX
zP
n
n ,
则
2
1
)(2
)()(
2
1 1
1
2/1
)1()(
12)1()(
1
1
2/
−=≤−
+−+≤−−= −−
− n
n
n
n
z
XX
XX
z αθθα αα ,
即 )(
2
1
22
)(
2
1
2 )1()(
1
1
)1()(12
)1()(
1
1
)1()( XX
XX
XX
XX
n
n
n
n
n
n −−++≤+≤−−−+ −− αθθα ,
故
2
12 θθ + 的置信水平为 1 − α 的置信区间为
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢
⎣
⎡
−−++−−−+ −− )(
2
1
2
),(
2
1
2 )1()(
1
1
)1()(
)1()(
1
1
)1()( XX
XX
XX
XX
n
n
n
n
n
n αα .
18.设 X1 , …, Xm i.i.d. ~ U (0, θ1),Y1 , …, Yn i.i.d. ~ U (0, θ2),θ1 > 0,θ2 > 0 皆未知,且两样本独立,求
2
1
θ
θ
的一个置信水平为 1 − α 的置信区间(提示:令 T1 = X(m),T2 = Y(n),证明
2
1
1
2
θ
θ⋅
T
T 的分布与θ1, θ2无关,
并求出对应的密度函数)
证:令 T1 = X(m),T2 = Y(n),有 T1 与 T2相互独立,其联合密度函数为
22112211 0,0
21
1
2
1
1
0
2
1
2
0
1
1
1
2121 )()(),( θθθθ θθθθ <<<<
−−
<<
−
<<
−
Ι=Ι⋅Ι== ttnm
nm
tn
n
tm
m
nm
tmntntmttptpttp ,
由增补变量法得
1
2
T
TU = 的密度函数,
当
1
20 θ
θ<< u 时,
t10
θ2
θ1
t2
46
n
n
nm
nm
n
nm
nm
U unm
mn
nm
tmnudttutmntup ⎟⎟⎠
⎞
⎜⎜⎝
⎛⋅+=+⋅=⋅⋅=
−
+−−−∫
2
11
0
1
21
1
0 11
21
1
1
1
1
1
1 )()( θ
θ
θθθθ
θθ ,
当
1
2
θ
θ≥u 时,
m
m
unm
nm
n
u
nm
nm
U unm
mn
nm
tmnudttutmntup ⎟⎟⎠
⎞
⎜⎜⎝
⎛⋅+=+⋅=⋅⋅=
−−
+−−−∫
1
21
0
1
21
1
0 11
21
1
1
1
1
2
2 )()( θ
θ
θθθθ
θθ
,
当 u ≤ 0 时,pU (u) = 0,
令
2
1
)(
)(
2
1
1
2
2
1
θ
θ
θ
θ
θ
θ ⋅=⋅=⋅=
m
n
X
Y
T
TUY ,Y 的密度函数与分布函数分别为
⎪⎪
⎪
⎩
⎪⎪
⎪
⎨
⎧
≥+
<<+
≤
=⎟⎟⎠
⎞
⎜⎜⎝
⎛=
−−
−
.1,
;10,
;0,0
)(
1
1
1
2
1
2
yy
nm
mn
yy
nm
mn
y
ypyp
m
n
UY θ
θ
θ
θ
⎪⎪
⎪
⎩
⎪⎪
⎪
⎨
⎧
≥+−
<≤+
<
=
− .1,1
;10,
;0,0
)(
yy
nm
n
yy
nm
m
y
yF
m
n
Y
分布与未知参数θ1, θ2 无关,Y 为枢轴量,
当
nm
mp +< 时,其 p 分位数 yp 满足 pynm
myF nppY =+=)( ,即
n
p m
pnmy
1
)(
⎥⎦
⎤⎢⎣
⎡ += ,
当
nm
mp +≥ 时,其 p 分位数 yp 满足 pynm
nyF mppY =+−=
−1)( ,即
m
p pnm
nz
1
)1)(( ⎥⎦
⎤⎢⎣
⎡
−+= ,
选取枢轴量
2
1
)(
)(
θ
θ⋅=
m
n
X
Y
Y ,置信度为 1 − α ,即 αθ
θ
αα −=⎪⎭
⎪⎬⎫⎪⎩
⎪⎨⎧ ≤⋅≤ − 12/1
2
1
)(
)(
2/ yX
Y
yP
m
n ,
则
m
m
nn
nm
ny
X
Y
m
nmy
1
2/1
2
1
)(
)(
1
2/ )(
2
2
)( ⎥⎦
⎤⎢⎣
⎡
+=≤⋅≤⎥⎦
⎤⎢⎣
⎡ += − αθ
θα
αα ,
即
m
n
mn
n
m
nm
n
Y
X
m
nm
Y
X
1
)(
)(
2
1
1
)(
)(
)(
2
2
)( ⎥⎦
⎤⎢⎣
⎡
+≤≤⎥⎦
⎤⎢⎣
⎡ +
αθ
θα ,
故
2
1
θ
θ 的置信水平为 1 − α 的置信区间为
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢
⎣
⎡
⎥⎦
⎤⎢⎣
⎡
+⎥⎦
⎤⎢⎣
⎡ + m
n
mn
n
m
nm
n
Y
X
m
nm
Y
X
1
)(
)(
1
)(
)(
)(
2,
2
)(
α
α .
19.设总体 X 的密度函数为
∞<<∞−Ι= >−− θθ θθ ,e);( )( xxxp
X1 , …, X n 为抽自此总体的简单随机样本.
(1)证明:X(1) − θ 的分布与θ 无关,并求出此分布;
(2)求θ 的置信水平为 1 − α 的置信区间.
解:(1)总体 X 的分布函数为
47
θ
θθ >−− Ι⋅−= xxxF ]e1[);( )( ,
则 X(1)的密度函数为
θ
θ
>
−−− Ι=−= xxnn nxpxFnxp )(11 e)()](1[)( ,
可得 Y = X(1) − θ 的密度函数为
01 e)()( >
− Ι=+= ynyY nypyp θ ,
故 Y = X(1) − θ 的分布与θ 无关,服从指数分布 Exp(n);
(2)因 Y = X(1) − θ 的分布函数为
0)e1()( >
− Ι−= ynyY yF ,
其 p 分位数 yp 满足 pyF pnypY =−= −e1)( ,即 )1ln(1 pnyp −−= ,
选取枢轴量 Y = X(1) − θ,置信度为 1 − α ,即 P{ yα /2 ≤ X(1) − θ ≤ y1 − α /2} = 1 − α,
则
2
ln1
2
1ln1 2/1)1(2/
αθα αα nyXny −=≤−≤⎟⎠
⎞⎜⎝
⎛ −−= − ,即 ⎟⎠
⎞⎜⎝
⎛ −+≤≤+
2
1ln1
2
ln1 )1()1(
αθα
n
X
n
X ,
故θ 的置信水平为 1 − α 的置信区间为 ⎥⎦
⎤⎢⎣
⎡ ⎟⎠
⎞⎜⎝
⎛ −++
2
1ln1,
2
ln1 )1()1(
αα
n
X
n
X .