参数估计及其在实际生活中的应用论文[策划]
参数估计的若干方法及应用
陈茜瑶 2012级数学一班 060112041 摘要: 参数估计是统计理论的一种基本形式,是数理统计学的一种重要分支,其中最常见的估计方法是点估计和区间估计。本文将对矩估计,极大似然估计,区间估计法等三种参数估计方法进行推广分析。对它们的范围进行比较讨论,最后我们对其各自的重要性及其在实际中的应用作一介绍。
关键词: 参数估计;矩估计 ;极大似然估计;区间估计 引言: 随着数理统计的应用更加广泛,参数估计在医疗,交通,市场消费,甚至是自然灾害的预测等实际生活中都有着举足轻重的作用,它科学且精确地让我们预测一个参数的值,以达到避免灾害或是获取利益等作用。参数估计已不知不觉渗透到生活的各个方面,它对人们的生活带来的很大的方便。但是对于参数估计方法,好多人却不是很了解,所以,为了人们能更好的利用参数估计为生产生活服务,本文将在论文中对参数估计的具体方法做一个较为系统细致的讲解。参数估计方法在人们生活中的应用,便于人们能更了解参数估计,接触参数估计,很好把它应用到生活之中。这样,就会避免不必要的盲目性,对事物的发展有个相对明确的判断和把握,为生活带来方便和效益。 1.参数估计
参数估计(parameter estimation)是根据从总体中抽取的样本估计总体分布中包含的未知参数的方法。人们常常需要根据手中的数据,分析或推断数据反映的本质规律。即根据样本数据选择统计量去推断总体的分布或数字特征等。统计推断是数理统计研究的核心问题。所谓统计推断是指根据样本对总体分布或分布的数字特征等作出合理的推断。它是统计推断的一种基本形式,它是数理统计学中的一个重要分支,分为点估计和区间估计两部分。也就是当在已知系统模型结构时,用系统的输入和输出数据计算系统模型参数的过程。18世纪末德国数学家C.F.高斯首先提出参数估计的方法,20世纪60年代,随着电子计算机的普及,参数估计有了飞速的发展。
,,,,这里的参数是指如下参数.如:二点分布b(1,p)中的概率p,正态分布N()中的,和,。
2,N,,,分布中所含的未知参数的函数。如:服从正态分布的的变量X不超过某给定值,,
a,,PXa()(),,,,,,a的概率是未知参数 的函数; ,
分布的各种特征数也都是未知参数。如:均值EX(),方差VarX()分布位数等。
,,,一般情况下,常用表示参数,参数所有可能取值组成的集合称为称为参数空间,用表示。
2.参数估计的常用方法
,定义2.1 设是来自总体的一个样本,用来估计未知参数的统计量xx,,?1n,,
,,,,,xx,,?称为的估计量,或称为的点估计,简称估计。点估计分为矩估计和极,,1n
大似然估计。
点估计的优越性:
无偏性——体现了一种频率思想,只有在大量重复使用时,无偏性才有意义。
ˆ,有效性——意义是:用估计时,除无系统偏差外,还要求估计精度更高。若有的,,
ˆˆˆˆˆˆ,,,,,,XXX,,,,,,XXX(,,,)(,,,)两个无偏估计与,如果var()<=var(),,,1112n2212n12
ˆˆ则称比有效。 ,,12
相合性——和样本的容量有关,是在极限的意义下引进的,适用于大样本情形,当样本容量n越大时,总体的信息量增加,该估计也越精确越可靠,特别是当 样本容量趋于无穷大时,估计值将与参数真值几乎完全一致。相合性能在兼顾无偏性和离散性(方差的大小)两者的情况下建立“最优估计量”。
点估计的优点是能较准确地给出未知参数大致值,缺点是不能反映出未知参数估计值的可信程度。参数点估计常用的三种方法是:矩法、极大似然方法和最小二乘法。
2.1矩估计
T总体X分布函数的未知参数为如果总体的k阶原点矩,,,,,,,,(,,,),12m
k存在,我们设总体的k阶原点矩与它的样本的kEXkm()(,,,),1,2,,,,,,,,,,,,,,12km
阶原点矩相等
n1kAXkm,,,,,,1,2,, ,kin,1i
n1kk即从上面式子可得到关于未知量,,,,,,,,,,,,,,EXXAkm(,,,)(),1,2,,,12kmikn,1i
ˆˆTˆˆˆˆ,,,,,,,,,,,XXXim(,,,),1,2,,的解,取作为,,,,,,,,(,,,)in1212m
Tˆ,,,,,,,,,,(,,,)的估计,就称为的矩估计。 12m
2.2 最大似然估计
,,,,定义2.2.1设总体的概率函数为Px(;),,,其中是一个未知参数或几个未知
,xx,,?参数组成的参数向量,是参数空间,是来自该总体的一个样本,将样本的联合1n
,Lxx(;,,),?L(),概率函数看成的函数,用表示,简记为, 1n
LLxxpxpxpx()(;,,)(;)(;)(;),,,,,,,??1122n
,,
称为样本的似然函数,如果某统计量,,,xx,,?满足 L(),,,1n
,,
,, 则称是的最大似然估计,简称为MLE LL()max(),,,,,,
2.3 最小二乘法
2 最小二乘法是常用的估计方法,最用于线性模型在中,若(,,)YXI,,n
ˆˆ,, (2-3)YXYXYXYX,,,,,,,,,()()()()min,
ˆ就称为的最小二乘估计。 ,,
2.4 派生估计法
设,已知X的样本为:,求参数的派XFx~(;,,,),,,,,,XXX,,,,,,,,,,,,,,,xl1212n12l生估计量。
令,已知Y的常用的分布函数为。YgX,,,,(;,,,),,,Fyaaa(;,,,),,,12lYl12
记,把看成是来自Y的样本,假设 YgXin,,,,,,,,(;,,,),1,2,,,,,YYY,,,,,,aiil1212nk~~
ˆ的某种类型估计量是:其中。aTYkl,,,,,,,,(;,,,),1,2,,,,,YYYY,,,,(,,,)kkln1212
再次假设是已知参数,我们可以记为对应的该种类型的派生估aaa,,,,,,,,,,,,,,,12l12l
ˆˆˆˆˆˆ计量为,那么就是是下列方程组的解: ,,,,,,,,,,,,,,,,,,12l12l~ˆˆˆaTYkl,,,,,,,,,,, (;,,,),1,2,,kkl12
ˆˆˆ从而我们就可以得到的值,就可以得到,,,,,,,,,的派生估计量。在得到,,,,,,,,,12l12l
上面的值时,我们必须要先了解下面两条定理: ~~
xxx,,,,(,,)XXX,,,,(,,)定理1、为来自总体的样本观测值,若估计量nn11~ˆˆ,,nNa以概率收敛于aHxa(,);那么对,是关于t的连续函数,那么也将以Hxt(,)~
Hxa(,)概率收敛于。 ~
xxx,,,,(,,)FX(),,YgXFxa,(;)~(;),定理2、总体X服从分布,而,为nXY1~~ˆˆ,,XXX,,,,(,,)aaTx的估计,(;),来自总体的样本观测值,而,的派生估计值满足n1~~ˆˆˆaaTx,(;),,,Hxa(;)条件,通过化简可以解得存在并且关于a连续,如果原估计量以
ˆ,,a概率收敛于,那么派生估计量也以概率收敛于。 2.5 参数的区间估计
点估计是用一个确定的值去估计未知参数,但不知其精确程度。在实际中,我们需要求出未知参数的近似值,还要度量点估计的精确度。其方法就是给未
,知参数一个区间,使其盖住概率尽可能大,这就是参数区间。
2.5.1 置信区
,,定义2.5.1设是总体的一个参数,其参数空间为,是来自该总体的样本,对xx,,?1n
,,
给定的一个,,,xx,,?(0<<1),假设有两个统计量和,,,,LLn1
,,,,
,,,,,,xx,,?,若对任意的,有()1,,,,,,,,,,puun1Lu,
,,,,
,1,,1,, 则称随机区间 是的的置信区间,和分别称为的置信下限和置信上[,],,,,LuLu
限。
3. 参数估计的应用
3.1. 矩法估计的应用
,,例1 母体均值E与方差D为矩法估计。
,,,,,解 :设,,„,是母体的子样。母体具有均值和方差En12
22,,, D=E-(E )
222,,,,,,,,按照(,)式得方程式组= E= = E=(E+ D=)12
n122ˆˆE,,D,,,,,,,,(,) 解这一方程组得E和D的矩法估计, ,,ini,1
注 基于矩估计的特点,日常生活中大多在样本量大的情况下,使用矩估计。
3.2 最大似然估计的应用
例8 基因问题,一个基因有两个不同的染色体,一个给定的总体中的每个个体都必须有三个可能基因类型中的一种,如果从父母那里继承染色体是独立的,且每对父母将第一染色
pp,p体传给子女的概率是相同的,那么三种不同的基因概率 和可以用以下形式表示: 123
2201,,,,ppp,,0,ppp,,,,,,,,,,2(1),(1) ,其中,,为未知参数,而 ,123123
ppp,,,1NNN,,且 .(1)基于一个随机样本中拥有每种基因个体的观察数值 123123,,NNN求的 MLE;(2) 特别当,,,,,,,,,,, 时,求的,,,。123
NNN22312 解 (,)其似然函数为:L()()[2(1)][(1)],,,,,,,,
ln()2lnln2lnln(1)2ln(1)LNNNNN,,,,,,,,,,,,12223
,,,,,,NNNNNln2(2)ln(2)ln(1),,21223
NN,22NN,dLln(),2312 ,,d1,,,,
NN,2dLln(),2NN,2312令,,的如下方程: 0,,0,,d1,,
3,2NN,12,从中解得: 其中为样本容量,又,nN,,i2n,i1
2,NN,22NN,2NN,dLln(),122312,,由此参数的MLE为:,|0,,,,,,22,,,,2nd2,(1),,,
,2053,,,,0.335(2)特别地,当时,此时。NNN,,,10,53,46n,109,123218
3.3 区间估计法的应用
区间估计同样应用广泛,以下介绍其在为社会保险的评估,日常花费的评估,销售业绩的评估等方面的应用实例。
例9 假设参加某种寿险投保人的年龄服从正态分布,
差为σ=7.77岁。从中抽取36人组成一个简单随机样本(重复抽样),其平均年龄为39.5岁,试建立投保人平均年龄μ的90 %的置信区间。
解: 假设用随机变量X表示某种寿险投保人的年龄,则由已知条件有
2 ,n=36。 XNX~(,7.77),39.5,,
ZZ,,1.645与置信度90%相对应的α=0.10,查表,得到 0.100.052
,XZ,由公式,得,总体均值μ的置信度为90%的置信区间为 ,2n
,7.77,,,,, XZ39.51.645(37.37,41.63),2n36
于是可以说,我们有90%的把握确信,寿险投保人总体的平均年龄介于37.37到 41.63岁之间。
结束语:
通过这次论题的研究除了让我
并巩固了以前的知识,对其进行查缺补漏,研究的过程中遇到不少的困难,但通老师的指导和查阅相关的文献很多问题都渐渐地明朗起来。通
过深入学习,我才认识到参数估计这方面的知识还很博大精深,这次我仅是在较为简单通俗的方面对参数估计有关问题进行了讨论。通过这次论文的撰写,希望能引起大家对参数估计更多的了解和更大的兴趣。这次研究也培养了我自学的能力,认识到交流的重要性。
我觉得在学习新知识的过程中,遇到很多困难是很常见的事情,但重要的是摆正心态去看待问题,然后迎刃而上,去解决问题,不论是自己想办法查阅资料还是向老师讨问,都要实际行动起来,去解决问题,千万不敢拖沓。
【参考文献】
[1]茆诗松、程依明、濮晓龙主编,概率论与数理统计教程,高等教育出版社,2010年,第二版.
[2]王容华等主编,概率论与数理统计教程(习题精选),北京大学出版社,2010年3月,第一版.
[3]苏军和主编,概率论与数理统计教程,上海财经大学出版社,1991年,第一版.
[4]唐生强主编:概率论与数理统计复习指导,科学出版社(1999年,第一版.
[5]魏宗舒(概率论与数理统计教程[M].北京:高等教育出版社.1983年,第一版.
[6]孙祝岭.点估计的一种新方法.统计与决策[J].2010,11:163-164 [7]茅宁.Bootstrap 方法及其应用[J].国防科技大学学报.1985,(4):1-6
[8]陈峰,陆守曾,杨珉.Bootstrap估计及其应用[J].中国卫生统计.1997,14(5):5-7
[9]何明星,李春,赵茂.非正态总体均值区间估计方法的模拟比较[J].云南师范大学数学学院.2009,(35):971-972
[10]姚源果,夏开萍,落朝晖.Bootstrap 方法下的Possion 分布置信区间估计[J].广西民族大学学报.2008,14(2):1-3
[11]曾羽中,万建平.基于Bootstrap方法的Var区间估计[J].经济数学.2009,26(1):58-63
[12]朱成莲,熊加兵.两个均匀分布总体标准差比的区间估计[J].数学的实践与认识.2010,40(21):130-137