为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

标准偏差

2017-09-25 22页 doc 291KB 38阅读

用户头像

is_654168

暂无简介

举报
标准偏差标准偏差从Wikipedia,自由的百科全书情节一个正态分布(或钟形曲线)。每个彩色带,有1个标准差的宽度。更多:经验法则与预期值0,标准偏差为1的正态分布的累积概率一个数据集平均50(蓝色所示)和20个标准偏差(σ)。例如,两个相同的均值和不同的标准偏差的样本人群。红色的人口意味着100和SD10;蓝色人口平均100和SD50。标准差是一种广泛使用的变异性或多样性中使用测量统计和概率论。它显示了多大变化从平均(或“分散“的存在意味着,或预期值)。低标准差表示,数据点往往是非常接近的平均,而...
标准偏差
标准偏差从Wikipedia,自由的百科全书情节一个正态分布(或钟形曲线)。每个彩色带,有1个标准差的宽度。更多:经验法则与预期值0,标准偏差为1的正态分布的累积概率一个数据集平均50(蓝色所示)和20个标准偏差(σ)。例如,两个相同的均值和不同的标准偏差的样本人群。红色的人口意味着100和SD10;蓝色人口平均100和SD50。标准差是一种广泛使用的变异性或多样性中使用测量统计和概率论。它显示了多大变化从平均(或“分散“的存在意味着,或预期值)。低标准差表示,数据点往往是非常接近的平均,而高标准的偏差表明数据点分布在大范围的价值观。一个随机变量,统计人口数据集,或概率分布的标准偏差是其方差的平[1][2]方根。虽然几乎比平均绝对偏差少强劲,这是代数简单。一个有用的属性是标准差,方差不同,它的数据相同的单位表示。此外,以表达对人口的变化,标准差通常用来衡量在统计结论的信心。例如,投票数据误差在确定预期结果的标准偏差计算,如果进行多次相同的调查。报道保证金的错误通常是约两倍的标准差-半径95,的置信区间。在科学,研究人员通常报告的实验数据的标准偏差,只影响,远远超出标准差的范围内被认为是统计学意义-从因果关系的变化区分这是正常的随机误差或测量的变化。标准偏差也很重要,在金融,地方上的投资回报率上的标准差是衡量的波动,投资。当只有一个样品从人口数据是可用的,总体标准偏差,可以通过修改后的数量称为样本标准差估计,解释如下。内容[hide]1基本的例子2人口值的定义2.1离散随机变量2.2连续型随机变量3估计3.1样品的标准偏差3.2样本的标准偏差3.3其他估计3.4取样的标准差的置信区间4身份和数学性质5释义及适用范围5.1应用实例5.1.1气候5.1.2体育5.1.3财务5.2几何解释5.3切比雪夫不等式5.4正态分布的数据规则6标准差与平均值之间的关系7快速计算方法7.1加权计算8相结合的标准偏差8.1人口的统计数据8.2样品的统计数据9历史10参见11参考文献12外部链接[编辑]基本的例子考虑人口以下八个值组成:这8个数据点的平均值(平均值)5:计算总体标准偏差,首先从平均计算每个数据点的差异,每平方米的结果:下一步计算这些值的平均值,并采取平方根:这个数量是人口的标准差,它等于方差的平方根。公式是有效的,只八个值,我们开始形成完整的人口。如果他们,而不是随机抽样,得有出一些较大的,“父”人口,那么我们应该使用7而不是8(这是N-1)(N),在最后一个公式的分母,然后由此获得的数量将被称为样本标准差。看到下面的部分估计更多的细节。一个稍微复杂的现实生活的例子,在美国成年男子平均身高大约是70“的标准差约3”。这意味着,大多数男人(约68,,假设正态分布)“的平均高度在3(67”-73“)-一个标准差-几乎所有的人(约95,)有高度在6“平均(64”-76“)-两个标准差。如果标准偏差为零,那么所有的人正是70“高。如果标准偏差分别为20”,那么男人会多变量高峰,一个约50“-90”的典型范围。三个标准偏差为99.7,的样本人口研究,假设分布是正常的(钟形)。[编辑]人口值的定义设X是一个随机变量与平均值μ:在这里,运营商E为X的平均预期值。X的标准差是数量也就是说,标准偏差σ(西格玛),即X的方差的平方根,它是平均值的平方根(x-μ)2。该分布的随机变量的标准偏差的(单因素)的概率分布是相同。并非所有随机变量有一个标准的偏差,因为这些预期值不存在。例如,一个随机变量,如下标准偏差柯西分布是不确定的,因为它是不确定的预期值μ。[编辑]离散型随机变量其中X从有限的数据与每个值具有相同的概率N的随机值的情况,,,×1×2...x下,标准差为或者,利用求和符号,值,而不是有平等的概率,如果有不同的概率,让×1概率为p1,×2概的的为p2,...,N有概率N。在这种情况下,将标准偏差P率[编辑]连续随机变量一个标准差,连续实值随机变量X的概率密度函数P(X)积分定积分的多组随机变量X的可能值范围x。在一个分布参数的家庭的情况下,标准差,可以在参数方面表示。例如,在对数正态分布参数μ和σ2的情况下,标准差为([EXP(σ2)-1)EXP(2μ+σ2)]。1/2[编辑]估计一个能找到的情况下,整个人口(如标准偏差标准化测试),其中每一个成员的人口进行采样。在哪里不能做的情况下,标准差σ估计,通过检查从人口采取随机抽样。一些估计如下:[编辑]随着样本的标准偏差有时用一个Σ的估计是样本的标准偏差N表示,定义如下:的这估计有均匀小均方误差比样本的标准偏差(见下文),是人口正态分。[]布的最大似然估计需要的引证但是,这种估计,适用于小型或中等大小的样品时,往往是太低:它是一种有偏估计。样本的标准偏差是随着人口的标准偏差的离散随机变量,可以假设正是从数据集,其中每个值的概率是成正比,其在数据集的多重价值。[编辑]随着样本的标准偏差最常见的估计,用于为Σ是一个调整后的版本,样本标准差,由和记定义为如下:哪里样本项目的观测值,这些意见的平均值。此更2正(N-1N)被称为贝塞尔修正。这种修正的原因是,使用的第σ2是一个无偏估计的方差的底层人口,如果这种变异存在和更换独立样本值绘制。此外,如果N=1,那么有没有偏离平均值的指示,和标准偏差,因此应该是不确定的。然而,s是不是一个标准偏差σ的无偏估计,它往。[3]往低估了人口标准偏差长期样本标准差,用于裸估计(用N),而长期的样本标准差,用于校正估计(用N-1)。分母N-1个自由度的数量在矢量残差,。[编辑]其他估计进一步的信息:无偏估计的标准偏差和一个估计的偏差虽然被称为是正态分布的随机变量时,对σ的无偏估计公式是复杂和金额。[轻微修正。此外,无偏(在这个意义上的字)并不总是可取的需要的引]证[编辑]一个采样的标准差的置信区间获得通过抽样分布的标准偏差,我们本身并非绝对准确。如果样本数非常低,这是特别真实。这种效应可以被描述的置信区间或CI。例如对于N=2的SD95,CI为0.45*SD31.9*的SD。换句话说,在95,的病例分布的标准偏差可以达到了31倍,较大或最多的一个因素2小~对于N=10的区间为0.69*SD1.83支持SD,实际SD仍然可以几乎是一个因素2比采样的SD高。对于N=100,这是下降到0.88*SD到1.16*SD。因此,为了确保采样SD是接近实际的SD,我们需要大量采样点。[编辑]认同和数学性质标准差是不变的,根据变化的位置,规模,直接与随机变量的规模。因此,为常数c和随机变量X和Y:标准差的两个随机变量的总和,可以与他们个人的标准偏差以及它们之间的协方差:哪里和站在方差和协方差,分别。计算偏差平方和可以时刻直接从数据计算。样本标准差,可以计算为:样本标准差,可以计算为:对于与平等的概率在所有点有限的人口,我们有因此,标准差是相等的平方根(平均平方少的平均平方)。看到这一事实,类似的结果为样本标准差为方差的计算公式。[编辑]释义及应用一个大的标准差表示,数据点远离平均值和标准偏差小,表明他们聚集各地的平均密切。例如,每三个种群{0,0,14,14},{0,6,8,14}和{6,6,8,8}有平均7。其标准偏差为7,5,1,分别。三分之一的人口有一个比其他两个标准差小得多,因为它的值都接近700。在一个松散的感觉,标准偏差告诉我们多远意味着数据点往往是。数据点本身,这将有相同的单位。例如,如果数据集{0,6,8,14}代表的四个兄弟姐妹在多年的人口的年龄,标准差为5年。另一个例子是,人口{1000,1006,1008,1014}代表由四名运动员,以米为单位测量走过的距离。它的平均1007米,5米的标准偏差。标准差,可作为衡量的不确定性。例如,在物理科学,应给予报道的一组重复的标准偏差测量,这些测量精度。当决定是否测量与理论预测一致,这些测量标准偏差是至关重要的:如果测量的平均值太远的预测(测量距离在标准偏差),然后被测试的理论可能需要加以修订。这是有道理的,因为他们属于,可以合理地预期发生,如果预测是正确的,适当的量化标准偏差值的范围之外。见预测区间。[编辑]应用实例了解的一组值的标准偏差的实用价值,是在欣赏从“平均”(意思)是有多大变化。[编辑]气候作为一个简单的例子,考虑两个城市,一个内陆和沿海的每日平均最高气温。这是有助于了解海岸附近的城市范围内每天的最高气温是比城市的内陆小。因此,而这两个城市可能每个人都有相同的平均最高气温,沿海城市的日最高气温的标准差,将是比内陆城市,在任何特定的一天,作为实际最高温度更容易是远从平均最高温度比沿海的内陆城市。[编辑]体育看到它的另一种方法是考虑运动队。在任何类别中,会有球队,利率高一些事情和别人不善。机会是,球队在积分榜上导致不会显示这种差距,但在大多数类别执行。越低,他们的收视率在每个类别的标准偏差,更平衡和一致的,他们往往会是。以更高的标准差的球队,但是,将更加难以预测。例如,一个团队,一直是坏,在大多数类别,将有一个低标准的偏差。一直是在大多数类别的一个团队,也将有一个低的标准偏差。然而,一队一个高标准的偏差可能是团队分数了很多强大的罪行,但也承认了很多(弱国防),或反之亦然,可能有一个贫穷的罪行,但难以补偿上得分。试图预测哪支球队,在任何一天,将赢得,可能包括在各队的“统计”的评分标准偏差,在这种异常可以匹配的长处与短处,试图了解哪些因素可能较强的指标为准最终的评分结果。在赛车中,一名司机在连续圈计时。较低的单圈时间的标准偏差的驱动程序是多用更高的标准偏差的驱动程序相一致。这个信息可以用来帮助理解其中的机会可能会发现,以减少单圈时间。[编辑]金融在金融,标准差是一个给定的资产(股票,债券,房地产等),或资产组([4]合的风险价格波动所带来的风险表示积极管理的共同基金,指数相互资金,或交易所买卖基金)。风险是一个重要因素,决定如何有效地管理投资组合,因为它决定在资产和/或投资组合回报的变化,使投资者的投资决策(被称为均值-方差优化)的数学基础。风险的基本概念是,因为它增加,预期的投资回报应该增加以及增加,被称为“风险溢价”。换句话说,投资者应预期上的投资回报率较高的投资时,进行更高层次的风险或不确定性。评估投资价值时,投资者应估计预期收益和未来收益的不确定性。标准差提供了量化的估计未来收益的不确定性。例如,让我们假设一个投资者有两股之间做出选择。股票一个超过过去20年有10,的平均回报,标准偏差20个百分点(PP)和B股,在同一时期,有12,的平均回报,而是一个更高的标准偏差30页风险和回报的基础上,投资者可能会决定股票是安全的选择,因为B股的额外两个百分点的回报是不值得的额外10页的标准差(更大的风险或不确定性的预期回报)。B股很可能属于一个相同的情况下,初始投资(但也超过最初的投资),往往比股票短,估计返回上平均只有两个,以上。在这个例子中,股票A有望获得10,左右,再加上或减去20页(30,-10,的范围内),约三分之二在未来的一年回报。考虑更极端的可能回报或未来的结果时,投资者应该想到结果从70,-50,,其中包括三个标准差的结果,从平均回报高达10,,加上或减去60页,或范围(可能回报率约99.7,)。安全返回在给定的期限内平均(算术平均数)计算,将产生该资产的预期回报。对于每一个时期,减去平均差异的实际回报结果的预期回报。现蕾在每个时期的差异,并取平均值,使整体资产的回报差异。差异较大的,更大的风险进行安全。寻找这种差异的平方根会给问的投资工具的标准偏差。总体标准差是用来设置的宽度,广泛采用的技术分析工具布林。例如,上布林带定为Xn的最常用的值是2。有大约5,的机会外出,假设回+nσx报正态分布。[编辑]几何解释获得一些几何的见解和澄清,我们将开始与三个值X1X2X人口。这,,,的3。3定义了一个点,P=(X1,X2,X在R考虑线L={(R,R,R):)3RR}这是“主对角线”经历的起源。如果我们的三个定值均相等,?,。那么标准偏差将是零和P就趴在L。所以它不是不合理的假设标准差与P的距离为L。,这是事实确实如此。动议正交从L到P点,一开始点:它的坐标是我们开始的值的平均值。一个小代数表明,P和M(这是P和直线L之间的正交距离相同)之间的距离等于平方根乘以向量x1,X2,X标准偏差向量的维数(在这种情况下,3。),3[编辑]切比雪夫不等式主要文章:切比雪夫不等式观察是很少比远离平均值的标准偏差。切比雪夫不等式的保证,为所有分布的标准偏差的定义,平均值的标准偏差内的数据量至少在以下表中给出。最低人从平均距口离50,?275,289,394,496,597,6[5][编辑]正态分布的数据规则深蓝色是低于平均值的标准偏差。为正态分布,户口本集为68.27,;而两个标准偏差平均(中等和深蓝色)占95.45,;三个标准差(轻型,中型和深蓝色)占99.73,;4个标准偏差,占99.994,。曲线的两个点,是一个平均值的标准偏差也转折点。中央极限定理说,许多独立,同分布随机变量的平均分布趋于向著名的钟形正态分布的概率密度函数的:,1/2n其中,μ为随机变量的预期值,σ等于其分布的标准差除以N是随机变量的数目。因此,标准偏差是一个简单的缩放变量,调整曲线将是多么广阔,但它也出现在正常化常数。如果数据分布是平均的Z标准偏差内的数据值的比例大致正常,那么被定义为:比例=哪里是错误的功能。如果数据分布大约是正常的,则数据值的约68,是在一个平均值的标准偏差(数学,μ?σ,其中μ是算术平均数),大约95,是在两个标准差(μ?2σ),并在三个标准差(μ?3σ)约99.7,的谎言。这被称为68-95-99.7规则,或经验法则。对于不同的z值,预期值的百分比在于对称区间外,CI=(-zσ,zσ),如下:在CI为百分比外CI为百分比分数以外CI为?Σ0.674450,50,1/290Σ0.994468,32,1/3.12558Σ68.2689492,31.7310508,1σ1/3.15148721.281580,20,1/552Σ1.644890,10,1/1054Σ1.959995,5,1/2064Σ2σ95.4499736,4.5500264,1/21.9778952.575899,1,1/10029Σ99.7300204,0.2699796,3σ1/370.3983.290599.9,0.1,1/100027Σ3.890599.99,0.01,1/1000092Σ4σ99.993666,0.006334,1/157874.417199.999,0.001,1/10万73Σ4.891699.9999,0.0001,1/1,000,00038Σ99.9999426697,0.0000573303,5σ1/17442785.326799.99999,0.00001,1/10,000,00024Σ5.730799.999999,0.000001,1/100,000,00029Σ6σ99.9999998027,0.0000001973,1/5067973466.109499.9999999,0.0000001,1/1,000,000,00010Σ6.46691/99.99999999,0.00000001,51Σ10,000,000,0006.80651/99.999999999,0.000000001,02Σ100,000,000,00099.9999999997σ0.000000000256,1/3906822154457440,[编辑]标准差与平均值之间的关系一组数据的均值和标准差通常是一起报告。在一定意义上,标准偏差是“自然”的措施,统计分散,如果数据中心的平均测量。这是因为从平均值的标准偏差小于从任何其他点。精确的语句如下:假设N个实数,定,,×1...x义函数:使用微积分或完成正方形,它可以表明,σ(R),有一个独特的平均最低:也可以变异系数的变化,这是平均值的标准偏差的比例来衡量。这是一个无量纲数。我们经常想一些有关信息,我们得到的平均精度。我们可以通过确定的样本均值的标准偏差。分布的标准偏差与平均值的标准偏差:其中N是用来估计样本的平均数量的观察。这可以很容易地被证明:故结果如下:[编辑]快速计算方法另见:计算方差的算法下面两个公式可以代表一个磨合(连续)的标准偏差。一个第第,,012组三个功率总和分别计算了一组N值的N的表示,,,x×1...x0请注意,S提高X到零功率,因为x始终是1,S计算结果为N。的00鉴于这三个运行求和的结果,值S0,S1,S可用于在任何时间来计算,目2运行的标准偏差值:前同样,对于样本的标准偏差,在一台计算机执行,作为三J款项变大,我们需要考虑舍入误差,算术的溢出,和算术溢。下面的方法计算舍入误差减少运行款项的方法。[6]如果n个样本时间的一部分,这是“一通”之前的数据存储在计算过程中(无需计算n个样本的方差算法系列,然而,单次的计算,必须重新启动重新更新方差,到达每一个新的样本,所以过去的数据必须存储)。对于k=0,...,N:其中A是平均值。样本方差:标准方差:[编辑]加权计算当我是不平等的权重I,电源金额第第分别计算加权值x:,,条W012和标准偏差方程保持不变。请注意,S是现在的重量,而不是样本数的0总和,列印。减少舍入误差的增量方法也可以应用,一些额外的复杂性。计算运行总和的重量必须为每一个从1到nK表:和上面使用其中的1/n的地方,必须更换由WI/N:W在最后的分裂,和其中,n是元素的总数,n'是非零权重的元素的数量。上述公式成为等于上述如果权重等于一体的简单公式。[编辑]相结合的标准偏差本节不举任何参考或来源。请协助改善本节加入引用可靠的消息来(2011年6月可挑战和删除。)源。黔东南苗族侗族自治州[编辑]人口为基础的统计集的人群,可能会重叠,可直接计算如下:非重叠的标准偏差(?Y=?)的大小(实际的或彼此相对)和每个被称为亚群可汇总如下:例如,假设它是已知的美国男子平均有70英寸的一个三英寸的标准偏差和平均身高,平均每个美国女人有一个65英寸的两英寸的标准偏差的平均身高。也认为男性的数量,N是平等的妇女人数。然后可以计算平均值和标准偏差的美国成年人的高度:M非重叠的人群通过M总人口为更一般的情况:,,X1X哪里如果大小(实际的或彼此相对),平均值和标准差两个重叠的人口的人口,以及它们的交点,然后总人口的标准偏差仍然可以被计算如下:如果两个或两个以上的数据集,正在加在一起由DataPoint数据点,如果每个数据集的标准偏差和一双每个数据集之间的协方差已知结果的标准差,可以计算:对于特殊情况下,任何对数据集之间没有相关性存在,那么关系减少的根均方:[编辑]基于采样统计非重叠的标准偏差?Y=?)的实际大小和每手段被称为子样本可汇总如(下:为更一般的情况下,M非重叠的数据集通过M并汇总数据集,,X1X:其中:如果大小,意思是说,两个重叠样本的标准偏差的样本以及它们的交点,然后汇总样本的标准偏差仍然可以进行计算。一般情况下:[编辑]历史首次使用术语标准差[7]在写卡尔?皮尔逊[8]在1894年后,他在课堂上使用它。这是因为更换了同样的想法的早期替代名称:例如,高斯平均误。[9]差[编辑]参见统计门户网站?准确度和精密度?切比雪夫不等式的一个不等式上的位置和规模参数?累积?偏差(统计)?距离相关距离的标准偏差?误差棒?几何标准偏差?一般化的平均标准偏差数的马氏距离?平均绝对误差?汇集汇集方差标准偏差?原始分数?均方根?样本大小?萨缪尔森的不等式?标准误差?波幅(金融)?yamartino方法计算风向的标准偏差[编辑]参考本文包括一个引用的列表,但其来源仍不清楚,因为它有足够的内联引用。(2010年1月),请帮助改善本文引入更精确的引用。1.^卡尔?弗里德里希?高斯(1816)。“BestimmungDERGenauigkeitDERBeobachtungen”杂志献给Astronomie和verwandt学问1:187-197。2.^步行者,海伦(1931年)。在历史的统计方法的研究。马里兰州巴尔的摩:威廉斯,威尔金斯有限公司第24-25页。3.^古尔兰J和:特里帕蒂钢筋混凝土。1971年。一个简单的近似无偏估计的标准偏差。阿米尔。统计25:30-324.^“什么是标准差”。精粹。检索2011年10月29日。5.^的概率Ghahramani,赛义德(2000)。基础(第二版)。普伦蒂斯霍尔:新泽西。页。438。6.^。威尔福特,BP(1962年8月)“注意方法Technometrics4(3):计算平方和产品修正的款项“。7.^道奇,Yadolah(2003)统计术语的牛津词典。牛津大学出版社书号0-19-920613-9。8.皮尔逊,卡尔(1894年)。“在解剖不对称的频率曲线”。菲尔。反。罗SOC。伦敦,A系列185:719-810。伊。^米勒,杰夫。“数学的一些词已知最早的用途”。
/
本文档为【标准偏差】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索