为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

气象统计方法第一章气象资料及其表示方法ppt课件

2021-02-25 126页 ppt 3MB 13阅读

用户头像 机构认证

爱赢

公司经营范围:网络软件设计、制作、图文设计、影视制作(编辑)

举报
气象统计方法第一章气象资料及其表示方法ppt课件气象统计方法2015年3月本课件主要参考南信大李丽平老师课件要求:1、掌握气象上常用的一些统计方法,运用这些方法进行资料分析,在此基础上作一些简单的气候预测等2、了解其它方法在业务和科研中的应用,对后期学习起引导作用气象统计方法:利用统计方法对气象资料样本进行分析来估计和推测总体的规律性,为气象预报提供依据。课时安排总学时:48学时(1-16周)讲授为主,课堂练习考核方式平时成绩(出勤、课堂作业)期末考试参考书目:1、李湘阁等《气象统计方法》,2、黄嘉佑著《气象统计分析与预报方法》,气象出版社,2004.33、施能著《气象统计...
气象统计方法第一章气象资料及其表示方法ppt课件
气象统计方法2015年3月本课件主要参考南信大李丽平老师课件要求:1、掌握气象上常用的一些统计方法,运用这些方法进行资料分析,在此基础上作一些简单的气候预测等2、了解其它方法在业务和科研中的应用,对后期学习起引导作用气象统计方法:利用统计方法对气象资料样本进行分析来估计和推测总体的规律性,为气象预报提供依据。课时安排总学时:48学时(1-16周)讲授为主,课堂练习考核方式平时成绩(出勤、课堂作业)期末考试参考书目:1、李湘阁等《气象统计方法》,2、黄嘉佑著《气象统计分析与预报方法》,气象出版社,2004.33、施能著《气象统计预报》,气象出版社,2009.114、吴洪宝等著《气候变率诊断和预测方法》,气象出版社,2010.65、魏凤英著《现代气候统计诊断与预测技术》,气象出版社,2009.9教学内容第一章气象资料及其表示方法第二章气候稳定性检验第三章选择最大信息的预报因子第四章一元线性回归分析第五章多元线性回归分析第六章气候趋势分析第七章主分量分析第八章聚类分析第一章气象资料及其表示方法1.气象要素大气温度、压力、空气湿度、风向和风速、降水、云、雾、雷暴、辐射、能见度等还有土壤、陆面植被、海洋等监测要素一、气象资料(研究对象)2.气象监测ARGO气象监测意义:记录天气、气候的实际情况了解气候的基本状况分析研究气候变化规律气候预测(第一张天气图的诞生)拉萨站(29N,91E)气温观测数据江苏省(116-122E,30-36N)月平均气温数据(1958-2007)江苏省(116-122E,30-36N)月平均气温数据(1958-2007)气象中单个或多个要素可看成为统计学中单个或多个变量。二、气象资料的表示第一节单个要素的气象资料1、数据的表示:某要素x有n次观测值,其向量表达形式为或者n样本容量时间序列概念数据是随时间变化的序列,习惯称为时间序列。例如:取某要素月平均值的n年资料几何意义:(1)n维空间中的一个点(2)一维空间(单坐标)中的n个点举例:1.某站点1958至2007年的气温2.某站点1960至2010年一月份的气温3.某站点某时段冬季/夏季降水2、数据资料的统计特征要素样本中资料分布的特点---用一些统计量表征。1)平均值含义:平均值是要素总体数学期望的一个估计。反映了该要素的平均(气候)状况。平均值概念在气象上的应用:气象上的月平均气温、年平均气温及某要素多年平均值就是这种统计量。例如:某地气候状态(对于逐月资料,一般分别求各月多年的平均值,所以会有12个月平均值场;逐日资料也是类似)。气象研究中,不同时间分辨率气象资料的使用(逐日资料、月资料、年资料等)举例:江苏气候?江苏省1958-2007年月平均气温江苏省各月气温平均值(气候态)江苏省1958-2007年冬季月平均气温2)距平含义:反映数据偏离平均值的状况,也是通常所说的异常。距平序列:单要素样本中每个样本资料点的距平值组成的序列称为距平序列,也可以记为距平向量。气象上的应用:中心化的概念:把资料处理为距平的方法叫中心化。气象上常用距平值代替原样本中的资料值作为研究对象。中心化的必要性:因为气象要素的年变化周期影响很大,各月的平均值不一样,为了使之能在同一水平下比较,常使用距平值(比如之前的举例)。特性:距平值的平均值为0,使用方便;直接作为预报值,比较直观(偏高/偏低)。举例:某地气温的变化情况?(气温偏高、偏低是相对于它的平均值而言)江苏省冬季气温的异常(1958-2007)如何正确计算异常场?不可取江苏省气温异常(1958-2007)3)方差和均方差(差)对气象要素x,资料长度n,其表达式:含义:是均方差(标准差),描述样本中资料与平均值差异的平均状况,反映变量围绕平均值的平均变化程度(离散程度),是方差。方差向量表示形式:气象上的应用:1)如果12月份气温标准差比1月份大,反映了12月份气温随时间变化幅度比1月大。2)对于同一个月(例如12月),如果南京气温的标准差比拉萨小,表明拉萨冬季气温的变化幅度比较大。(内陆日变化较沿海大,这个日变化大小的比较使用的是标准差的比较)江苏省各月气温标准差3)均方差小的要素预报比大的困难还是容易?原因?4)变量减去某常数后均方差相同。5)标准差与变量值同量纲,一般用标准差表示变量取值变化的大小。数据的标准化对气象要素x,资料长度n,其表达式:特征:1)标准化变量的平均值为0。2)标准化变量的方差为1。为何要进行标准化?各要素单位不同、平均值和标准差也不同。为使它们在同一水平上比较,采用标准化方法,使它们变成同一水平的无单位的变量----标准化变量。江苏省气温异常及其标准化降水距平百分率距平/平均值*100%1)计算降水距平,即观测值减去平均值2)1步骤所得结果除以该平均值,乘以100%,即为降水距平百分比注意:当观测值序列时间比较长,超过30年,可以选择1980-2009的平均值,作为步骤1中的平均值4)变率和变差系数1)意义:说明变量值变化的大小。2)变率绝对变率:距平绝对值的平均。相对变率:绝对变率与平均值之比3)变差系数标准差与平均值之比(%)表示变量的相对变化,注意:绝对变率和标准差的数量级与变量平均值的量级有关。有些同类型变量,彼此之间平均值差别大,若要比较它们的变化性用绝对变率和标准差不恰当,应当利用相对变率或变差系数。5)频率分布累积频率概念的引入:平均值和均方差相同,但取值很大区别,区别其特征,就需要引入新的统计量------累积频率。累积频率:变量小于某上限的次数与总次数之比。(样本特征—直方图)总体(母体):统计分析对象的全体。样本:总体中的一部分。三、总体和样本理解与应用:总体的特征是客观存在的样本的特征随样本而变,与其有关的变量均称为随机变量,如平均值、均方差等选取有代表性的样本很重要样本量n>=30,根据数理统计中的大数定理推断得到。气象上的总体指无限总体,一组气象资料就是无限总体的样本。总体与样本关系的相对性。大数定律大数定律又称大数法则、大数率。在一个随机事件中,随着试验次数的增加,事件发生的频率趋于一个稳定值;同时,在对物理量的测量实践中,大量测定值的算术平均也具有稳定性。在数理统计中,根据贝努利定理\辛钦定理:当n很大时,算术平均值接近数学期望;频率以概率收敛于事件的概率。1)分布函数无限总体的累积频率称为概率密度函数,其最常见的形式是正态分布和分别是总体平均值(期望)和标准差,可以用样本平均值和均方差去估计。,正态分布曲线标准化变量的平均值为0、方差为1。特点:1)标准化正态分布随机变量的绝对值大于2.58(1.96)的概率仅为0.01(0.05)2)不同要素变量作图3)标准化变量值的取值范围(+/-3之间),大于3的概率仅为0.0027世界气象组织(WMO)旱涝年确定标准:距平达到或者大于2倍均方差,出现概率不到5%年份。江苏省月平均气温标准化数据P(|T|>=2)=0.0483;P(|T|>=3)=0.005江苏省冬季气温数据分布图2)正态分布的统计检验大多数气候诊断方法和预测模型是在气候变量呈正态分布假定前提下进行的,所以对气候变量是否呈正态分布形态的检验是十分必要的。正态分布检验不仅可以判断原始变量是否遵从正态分布,还可以检验那些原本不遵从正态分布,但经过数学变换后的变量是否已成为正态分布形式。(1)概念峰度系数与偏度系数是用来衡量随机变量概率密度分布曲线形状的数字特征,描述了气候变量的分布特征。偏度系数:表征曲线峰点对期望值(平均值)偏离的程度。峰度系数:表征曲线分布形态顶峰的凸平度(即渐进于横轴的陡度)。(2)标准偏度系数和峰度系数的计算公式为:其中,和s分别为样本均值和标准差。g2=g1=偏度系数:峰度系数:标准偏度系数的意义测量数据分布的不对称性情况,刻画以平均值为中心的偏向情况,g1<0,表示负偏,即均值在峰值的左边;g1>0,表示正偏,即均值在峰值的右边;g1=0,表示对称分布标准峰度系数的意义测量分布图像坡度的缓急程度g2<0,表明图形坡度平缓g2=0,表明图形坡度刚好g2>0,表明图形坡度偏陡若g1=0,g2=0时,表明研究变量为理想的正态分布变量(3)显著性检验(4)资料的正态化1、正态化的必要性各类统计预报模型和统计检验方法(F\t\u\检验)要求资料是符合正态分布。年\月平均气温\气压\多雨地区的月降水量符合!日降水和少雨地区月降水通常偏态。旬\候降水不一定!2、资料正态化处理方法1.立方根或四次方根;2.双曲正切转换(纠正课本公式)--旬降水;3.化为有序数后的正态化转换(标准化和正态化)。江苏省全年月降水数据分布图*也可以理解为同一要素多个格点(站点)的资料,下面慢慢体会。第二节多要素的气象资料一、数据矩阵多个气象要素的样本如何表示?---矩阵。设有m个气象要素,每个要素有n次观测值,则数据矩阵为:(2.1)第t个样本的资料向量为(2.2)两个方面来研究问题()“R型分析”:研究不同要素或变量(如同一要素不同格点之间)的关系。(列)“Q型分析”:研究样本之间的关系(行)。二、数据的两种空间表示(几何意义)1、n维空间中的m个点(列)m个变量(格点、站点)确定了n维空间中的m个点;用来研究变量(或者不同格点、站点)之间的关系。------相关关系,如两个变量之间的相关系数2、m维空间中的n个点(行)--空间点聚图一个样本对应m维空间中的一个点;分析样本之间的关系时用到,如寻找相似个例。三、均值向量m个变量的样本平均值组成的向量。m维空间中的n个点的重心(各部分受到的重力作用集中于一点,这一点就是重心)。(2.3)多年平均1月气温(1971~2010年)多年平均7月气温(1971~2010年)多年平均1月降水量(1971~2010年)多年平均7月降水量(1971~2010年)四、距平向量其表达式为:五、协方差和协方差矩阵1.协方差衡量任意两个气象要素(变量)之间关系的统计量(正、负相关关系),另外一个统计量叫相关系数(以后讲解)。表达式:(2.4)距平的内积协方差气象意义的进一步理解:1)反映了两个气象要素异常关系的平均状况,或者两个变量的正、负相关关系。两变量关系越密切,其协方差的绝对值越大,如理解(气温为例):前冬气温负距平(冷)、后冬正距平(暖)---协方差负值----反相关前冬气温正距平(暖)、后冬正距平(暖)----协方差正值----正相关2)变量自身的协方差就是方差。距平的乘积X1与x2的距平符号相同率高,有相同的变化趋势,x2与x3的距平符号相反率高,有相反的变化趋势;两组变量均有良好的相关关系。问题:协方差带单位,不同要素之间不好比较,以后学习相关系数可解决这个问题。2.协方差矩阵m阶对称矩阵,对角线元素是第i个变量的方差,撇号代表距平。(2.6)协方差的另一种表示:用离差积表示,构成离差矩阵。总体协方差矩阵的无偏估计(2.7)(2.8)1月气温标准差7月气温标准差1月降水标准差7月降水标准差状态资料和统计特征1、状态资料表征气象要素的各种状态,观测结果无法用数据表示。如雾、冰雹、霜-------用“有”、“无”、“强”、“弱”等表示。雨的强度------等级表示,如大暴雨、大雨等。风的强度等级---1级、2、。。。122、频率表、分布列如何描述状态资料的统计特征?列出各个状态出现的频率。对样本而言是频率表,总体而言就是分布列。3、多维频率表、多维分布列针对气象要素的状态资料;概念:统计多个气象要素(现象)的各种情况下的频率,组成一张多维频率表。优点:对预报有参考价值。7月份某气象站24小时内(08时到次日08时)降雨量与08时绝对湿度关系重要天气气候事件及其影响1、台风  2012年8月我省先后受到5个近海和登陆台风的直接或外围环流系统影响,台风影响个数偏多。5个热带气旋分别是9号台风“苏拉”、10号台风“达维”、11号强台风“海葵”、14号台风“天秤”和15号超强台风“布拉万”。其中,“海葵”对我省的影响特别严重,其风雨程度超过2005年的台风“麦莎”,是1991年以来影响江苏最严重的台风。2、强对流天气据不完全统计,2012年8月江苏省因强对流天气过程共造成多人伤死,房屋损坏,农田受灾。  8月苏州出现8个强对流天气日,其中出现雷雨大风短时强降水,冰雹,龙卷风袭击, 8月26日17:30左右,江苏洪泽湖上出现了难得一见的“龙吸水”现象,巨大的水柱连接水天。灰色水柱从远处的乌云中垂落湖面,像吊在空中晃晃悠悠的一条巨蟒,这时候的天空依然可见蓝天白云,拖着水柱的那片乌云分外显眼。3、暴雨洪涝4、高温  8月苏南大部地区出现2~6天高温天气常州出现高温6天。因高温引发头痛的病人频频增加,其中感冒、发烧引发头痛者最多。5、雾霾  8月连云港市共出现区域性大雾天气2次,全市大部分地区出现能见度低于500米的浓雾,最强时段能见度低于200米,对交通运输和旅客出行造成了一定影响。  课堂练习利用该资料,计算相关统计量和分析数据特征江苏省夏季降水的气候态及变化特征?1958-2007年海温(x)和降水(y)资料序列时间原始资料中心化标准化txyx'y'x*y*195827.3122.70.5050.540.482.07…………………200627.657.70.73-14.580.70-0.60200725.158.7-1.68-13.58-1.61-0.56平均值      均方差      协方差 12.6 第三节气候资料的审查与订正1、什么叫资料均匀或均一2、什么是可靠的观测序列3、资料的订正插补、纠正、延长资料的订正(插补、延长)资料订正问题的发展史空间均一性*在统计各种气候指标、进行气候分析之前,对气候资料的质量应该进行审查。(一)气候资料的误差从统计意义上讲,各种气象要素观测值都可以看作随机变量。一地的气候状态可以用各种要素的统计特征值来表示,如算术平均值、均方差等实质上是要素总体数字特征的样本值。气候指标是否反映真实的气候状态,取决于:数字特征样本值对总体值的抽样误差如样本平均值的抽样误差一般的,样本容量越大,特征值的抽样误差越小。m为真实平均数.2)要素观测值对真值的观测误差*系统误差:由于仪器不良、观测方法不完善,在各次观测中的大小和符号保持不变。通过校正仪器和改善观测方法可基本消除。温度不超过0.05C,气压不超过0.05百帕,降水量不超过0.05mm(根据规定进行器差订正后的观测值对真值的系统误差)如果在整个记录时期,误差无改变,则由N次观测求得的算术平均值对真值的系统误差等于每次观测中的系统误差。而N次观测值总和的系统误差将是每次观测的系统误差的N倍。,*偶然误差(过失误差):操作不慎等,如读错数、计算错误。一般通过对资料的仔细审核、校对.*随机误差:随机因素造成,如四舍五入的小数位数的取舍、仪器刻度的限制。随机误差各次观测值是相互独立的;所以,旬、月、年平均气温的随机误差一般可以忽略不计;(二)气候资料的质量要求和审查1、质量要求(1)准确性和精确性精确性:指测量得到数据的精确程度准确性:指观测值与真值的符合程度对准确性的审查:主要检查资料中有无明显过失误差,如发现有,应将其改正或订正,无法改正的,则不参加统计分析;精确性的审查:主要看其记录是否达到规定的精度,如降水观测应达到0.1mm。精度不够会影响分析结果,但对观测随机误差较大的一些项目,过高的记录精度也没有实际意义。(2)均一性:如果测站气象记录序列仅仅是气候变化的反映,那么资料是均一的。测站位置的迁移,周围环境的改变,观测仪器和安装方法的更新,观测时制的改变都可能破坏资料的均一性。分析时应注意。(3)代表性测站所在位置是否对周围一定区域范围内的气候具有代表性,如山谷的测站代表性差。一般说,由于地理环境的差异各个测站所能代表的范围是很不一样的。气候记录的代表性是指某个测站记录能否反映我们研究地区范围内的气候状况。在不同目的、不同尺度的气候分析中,测站代表性当然可以是不同的。如河谷中的测站.由于地形对降水的影响,常偏大,大范围气候分析中无代表性,但研究地形影响时就有代表性.只要观测场地的设置符合规范要求,气象站的记录都可代表类似地理环境下相当大范围的气候状况。(4)比较性不同测站进行气候时空变化分析时,资料要有可比性。如不同测站气候变化的空间比较时,要求各测站的资料都在同一时期;另外是否相同的观测制式,仪器性能等,如城郊对比观测时,最好观测同时段,使用相同的设备。2、气候资料的质量审查气候资料的审查是—项复杂而细致的工作。需要具备一定的气象学、天气学、气候学和气象观测知识,更需要有相当丰富的气候资料工作经验审查工作类别通常将审查工作分为两类,一类:技术性检查另一类:合理性检查技术性检查主要从下列几方面进行:(1)查阅测站历史沿革和资料说明,分析是否存在因测站迁移、仪器和观测方法更新、观测时制改革等引起的非均一性。(2)根据观测规范、统计规定、检查观测记录和统计结果是否符合规定、校对统计计算有否错误。(3)检查同一要素的各个统计项目之间是否协调。合理性检查主要是以天气学、气候学知识为依据,从气象要素的时、空变化规律和各要素问的相互联系规律出发,分析气候资料是否合理。主要采用以下几种方法:(1)本站前后期资料比审法。气候变化是缓慢的、连续的。因此虽然逐年的观测值不一样,但它们应在一个大致的水平上随机波动。如果通过前后资料的对比,发现资料序列中存在明显的不连续变化,则可能存在非均一性,应配合测站历史沿革情况作进一步的分析判断。(2)区域资料比审法。相邻测站由于受同一天气系统的影响,常常有相当好的一致性和相关性。相邻测站气象要素之间的相互联系规律,可以成为我们发现和订正错误记录的重要依据。(3)气象要素相关法。各种不同的气象要素从不同的测面描写了一地的天气气候特征以及它们之间存在着各种不同程度的相关。在实际工作中,常常用同一测站或者若干个地理环境相似测站的相关密切的两个要索的观测值作成相关图进行审查。当资料符合要求时,所有点子应密集地落在一根曲线或直线附近。如果个别点子明显偏离相关线,则这个点子的观测值可能有明显的误差。(三)订正方法1)回归订正方法(关系密切的站)两站同一要素:先计算相关系数,再建立一元线性回归方程对周围的基本站进行逐步筛选来建立多元回归订正公式,是一个较好的途径。屠先生提出:用基本站不同要素值作为逐步回归因子建立与订正站某一要素的联系方程。他用上海站为基本站,用逐步回归方法对7个因子筛选,建立南京1月平均气温多元回归插补公式,因此公式插补抗日战争期间南京缺测资料。这7个因子是上海1月平均气压、平均气温、平均最高气温、平均最低气温、月降水量、降水数和日照百分率。2)差值订正法(地理环境近似一致的站点,站与站之间差值基本为常数---气温、气压)3)比值订正法两台站降水比值为准常数*订正适当性的论证*只有在基本站与订正站距离不很远,两站气象要素相关相当密切,且平行观测时期比较长时才用回归订正法进行序列延长。如果平行观测时期不长,通常还是以采用计算简便的差值订正法或比值订正法为好。复习思考题1.理解并掌握统计量平均值、距平、标准差、协方差、变率、变差系数的概念,特别是其在气象上的意义。2.思考如何求出北半球1980-2010年逐月850hPa纬向风场的气候场、异常场和均方差场?3.理解总体、样本、频率表、分布列的概念。4.何谓中心化、标准化、正态化,这样做资料处理的必要性为何?如何处理?5.如何整理区域资料。此课件下载可自行编辑修改,供参考!感谢您的支持,我们努力做得更好!
/
本文档为【气象统计方法第一章气象资料及其表示方法ppt课件】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索