[策划书]二项分布中方差的计算
二项分布中方差的计算
kkn,k假设ξ~B(n,p), 即 P{,,k},Cpqn
2考虑E[ξ(ξ-1)]=Eξ-Eξ 而
nnn!,,kknkknkE[(,1)],k(k,1)Cpq,k(k,1)pq,,,,nk!(n,k)!,0,2kk nnn,(n,1),(n,2)!,2,2,2,knkkknk,pq,n(n,1)pCpq,,,2n(k,2)![n,2,(k,2)]!,2,2kk
i,k,2令
2n,222222iin,i,上式= n(n,1)pCpq,n(n,1)p,np,np,2n,0i,
2222即, E,,E,,np,np
222222再将Eξ=np代入上式,得 E,,np,np,np,np,np(1,p)
22222最后得 D,,E,,(E,),np,np(1,p),(np),npq
例1的分布图
0.4
0.35
0.3
0.25
0.2P0.15
0.1
0.05
00123456
例2的分布图
0.3
0.25
0.2
0.15P
0.1
0.05
0012345678910
4.2 超几何分布 例1的图形:
0.5
0.4
0.3
P0.2
0.1
001234
例2的图形:
0.5
0.4
0.3
P0.2
0.1
00123
定义4.2 设N个元素分为两类, 有N个属于第一类, N个属于第二类(N+N=N). 从中不重1212
复抽样取n个, 令ξ表示这n个中第一类元素的个数, 则ξ的分布称为超几何分布,
,mnmCCNN12 P(,,m),(m,0,1,....,n)nCN
r规定: 如n
方法 第一种, 按定义
mnm,nnCCNN12E,mP(,m),m,,,,,nCmm,0,0N
nN!N!112 ,m,,,nm!(N,m)!(n,m)!(N,n,m)!Cm,112N
nN(N,1)!N!112,,,n(m,1)!(N,1,m,1)!(n,1,m,1)!(N,n,1,m,1)!Cm,112N
令k=m-1, 则
n,1NNNN(1)!N,kn,,kn,111111上式=CC,C,,,n,,np,N,1NN,1nn12!N(1)!()!n,N,nNCCk,0NN
!()!nN,n
N1,p其中为只抽一次抽到元素N的概率 1N
因此放回抽样(二项分布)与不放回抽样(超几何分布)的数学期望是一样的.
mnm,nnCCNN12EmmPmmm[(,1)],(,1)(,),(,1),,,,,nCmm,0,2N
nN!1nm,1,,C,Nn2(m,2)!(N,m)!Cm,21N nNNN(,1)(,2)!nm,111,,C,Nn2mNm(,2)!(,2,,2)!Cm,21N
nN(N,1)mnm,2(,2),(,2)11,CC,NN,2n12Cm,2N
令k=m-2,
n,2NN,NN,(1)(1)k(n,2),kn,21111CC,,C上式= ,N,2NN,2nn12CCk,0NN
N(N,1)N(N,1)n(n,1)(N,2)!1111,,, N!(n,2)!(N,n)!N(N,1)
n!(N,n)!
因此
N(N,1)n(n,1)nN2111E,E[(,1)],E,, ,,,,N(N,1)N
22N(N,1)n(n,1)nNnN221111D,E,(E),,,,,,,2N(N,1)NN
22N(N,1)n(n,1)N,nNN(N,1),nN(N,1)1111,,2N(N,1)
nN[(N,1)(n,1)N,N(N,1),nN(N,1)]111,2N(N,1)
2nN[NnN,NN,nN,N,N,N,nNN,nN]11111 ,,2N(N,1)
2nN[,NN,nN,N,nN]111,,2N(N,1)
nN[N(N,N),n(N,N)]nN(N,N)(N,n)11111,,22N(N,1)N(N,1)
NNN,nN,n12,n,,,,npqNNN,1N,1
其中q=1-p
另有一种办法计算ξ的数学期望,假设ξ是第i次抽到第一类元素的个数,因为只是1次,i
当然不是1就是0,因此服从0-1分布,且有
NN12P,(,1),,p,P(,,0),,q,(i,1,2,...,n), iiNN
N1E,,,p(i,1,2,...,n)则 iN
,,,,,,,E,E,,,,E,E,,E(?)?nn1212
因此 N1,nE,,n,,npiN
整个方法同二项分布时的相应方法一样,只是各ξ间并非相互独立,但和的期望等于期望i
的和这条性质并不要求和中各项的随机变量相互独立。 当N非常大时,远大于抽样数n时,记作N>>n超几何分布可以用二项分布来近似。
为说明这一点,首先给出一个近似式如下:
nNnC,当N>>n时,有 Nn!
N(N1)(N2)(Nn1),,?,,nC,Nn!这是因为当N很大时,后面每个括号的值近似为1,nN12n,1(1)(1)(1),,,?,n!NNN
因此上面近似式成立,N越大越准确,当N趋于无穷时,约等于可以变为等于。
而当超几何分布中总元素的个数N非常大时,N>>n, 在保持N/N不变的情况下N和N也112会很大,也有N>>m, N>>n-m, 因此有 12
mn,mNN12,mn,mmn,mCCNNnmn,m!!()!,,,,NN1212P,m,,,(),,,,,nn mn,mNNCN!()!,,,,N
n!
mmn,m,Cpqn
当N趋于无穷时,近似式就成为准确式。
4.3 普哇松分布
普哇松分布的来源是这样, 有时候要在一个单位长的时间段内进行大量的二项分布试验, 但希望在这个单位长的时间段内事件A发生的平均数量为指定值λ, 因此将单位长度的时间段平均划分为n段, 在每一段做一次独立试验, 使事件A发生的概率为p, 而因为单位时间长度内, 即n次试验中A平均要发生给定值λ次, 而二项分布的均值已知为np, 也就是满足
λ=np,
或者说在给定试验次数n和均值λ的情况下,
p=λ/n
那么, 当n很大时, p必然很小, 这时候的二项分布就很接近普哇松分布, 当n趋向于无穷大时, 必有p趋向于无穷小, 即在每个"无穷小"的时间段内都做一次独立试验, 事件A发生的概率也是"无穷小", 但积累起来, 单位时间内A发生的平均数量还是λ. 在推导时, 要用到近似公式
,,,x e,(1,x)
当x趋向于无穷小时等式严格成立.
当给定λ=np, 且n很大, p=λ/n很小时
kkn,k P(,,k),Cpqn
knk,C假设k<
0, 则称ξ服从普哇松(Poisson)分布.
利用级数
k,,xx e,,k!k0,
m,,,,,,,,可得 P(m),e,ee,1,,,m!m0m0,,
数学期望与方差的计算
mm1,,,,,,,,,,, ,,Emee,,,!(,1)!mmm0m1,,
k,m,1令则
k,,,, E,,,e,,,!kk0,
,其数学期望与二项分布的数学期望是一致的。当用普阿松分布来近似二项分布时,,,np
因为
m2m2,,,,,,,2,,,, (,1),,,(,1),,,EEEmmee,,,,,,!(,2)!mmm0m2,,
令k=m-2,则
k,,2,2,[(1)] E,,,,,e,,,!k0k,
222 E,,,,E,,,,,
最后得
2222 D,,E,,(E,),,,,,,,,
,因此,普阿松分布的期望和方差都是λ,差为,这给统计带来方便。因为,通常情况下是知道一随机变量服从普阿松分布,但是未知参数是λ,此参数正好是数学期望,因此就统计一段时间,看单位时间内某事件出现的次数的平均值,即事件发生总数除以时间。得到的统计值λ就是单位时间内发生次数ξ服从的普阿松分布的参数。 当用普阿松分布近似表示二项分布时,因为λ=np且n一定要很大,即p一定非常小,则二项分布的方差npq=np(1-p)?np=λ, 还是一致的。