一次移动平均法、一次指数平滑预测模型、预测精确性的
一、一次移动平均法、一次指数平滑预测模型
一次移动平均法
一次移动平均法是在算术平均法的基础上加以改进的。其基本思想是,每次取一定数量周期的数据平均,按时间顺序逐次推进。每推进一个周期时,舍去前一个周期的数据,增加一个新周期的数据,再进行平均。设X为t周期的实际值,一次移动平均值 t
N,1(1)MN()=(X+X+……+X)/N= (4.2.1) XN,,tt1tN+1t,ti,i,0
其中N为计算移动平均值所选定的数据个数。t+1期的预测值取为
(1)ˆ (4.2.2) XM,tt,1
ˆˆ如果将作为第t+1期的实际值,于是就可用(4.2.2)式计算第t+2期的预测值,XXt,1t,2一般地,可相应地求得以后各期的预测值。但由于误差的积累,使得对越远时期的预测,误差越大,因此一次移动平均法一般只应用于一个时期后的预测(即预测第t+1期)。
例4.1 某市汽车配件销售公司某年1月—12月的化油器销售量(只)的统计数据如表4.1中第二行所示,试用一次移动平均法,预测下一年一月的销售量。
解 分别取N=3和N=5,按预测公式
(1)ˆ=(X+X+X)/3 XNM,,(3)(3),,tt1t2tt,1
和
(1)ˆ=(X+X+ X+ X+X)/5 XNM,,(5)(5),,,,tt1t2t3t4tt,1
计算3个月和5个月移动平均预测值。见表4.1,预测图如图4.1。
表4.1 化油器销售量及移动平均预测值表
1 2 3 4 5 6 7 8 9 10 11 12 1 月 份
X 423 358 434 445 527 429 426 502 480 384 427 446 t
ˆ 405 412 467 461 452 469 456 430 419 XN,(3)469 t,1
ˆ 437 439 452 466 473 444 444 452 XN,(5)t,1
由图4.1可以看出,实际
销售量的随机波动较大,经过
实际销售量 B移动平均法计算后,随机波动 C三期移动平均预测 D五期移动平均预测5.2显著减少,而且求取平均值所
用的月数越多,即N越大,修只)24.8
匀的程度越强,波动也越小。4.4但是在这种情况下,对实际销
4.0售量的变化趋势反应也越迟
销 售 量(单位:103.6
024681012
月份
图4.1 化油器销售量及移动平均预测值
钝。反之,如果N取得越小,对销售量的变化趋势反应越灵敏,但修匀性越差,容易把随机干扰作为趋势反映出来。因此,N的选择甚为重要,N应该取多大,应根据具体情况做出抉择。当N等于周期变动的周期时,则可消除周期变化的影响。
在实用上,一般用对过去数据预测的均方误差S来作为选取N的准则。
当N=3时,
122889321S,== 3210.33 ()Xs,,tt9t,49
当N=5时,
122111431== 1591.86 S,()X,,stt77t,6
计算结果表明:N=5时,S较小,所以选取N=5。预测下年一月的化油器销售量为452只。
在使用一次移动平均法时,应注意如下两点:
第一,一次移动平均法一般只适应于平稳模式,当被预测的变量的基本模式发生变化时,一次移动平均法的适应性比较差。
第二,一次移动平均法一般只适用于下一时期的预测。典型例子之一是生产经理要根据某一品类中的几百种不同产品的需求预测来安排生产。在许多这样的情况下,所需要的是一种很容易使用到每一个项目上去并能提供良好预测值的方法,移动平均法就是这样一种方法。当然这在本质上的必然前提是所要预测的变量在一个较短的时间范围之内表现为一个相当平稳的时间序列
指数平滑法
移动平均法计算简单易行,但存在明显的不足。第一,每计算一次移动平均值,需要存储最近N个观察数据,当需要经常预测时有不便之处。第二,移动平均实际上是对最近的N个观察值等权看待,而对t,N期以前的数据则完全不考虑,即最近N个观察值的权系数都是,而t,N以前的权系数都为0。但在实际经济活动中,最新的观察值往往包含1N
着最多的关于未来情况的信息。所以,更为切合实际的方法是对各期观察值依时间顺序加权。指数平滑法正是适应于这种要求,通过某种平均方式,消除历史统计序列中的随机波动,找出其中的主要发展趋势。根据平滑次数的不同,有一次指数平滑、二次指数平滑、三次指数平滑和高次指数平滑之分,但高次很少用。指数平滑法最适合用于进行简单的时间序列分析和中、短期预测。
4.3.1 一次指数平滑法
(1)(1)(1)SSS,,...,XXX,,...,设为时间序列观察值,为时间t的观察值的指数平滑值。则12n01n
一次指数平滑值为
(1)2SXXX,,,,,,,,,,,(1)(1)... (4.3.1) tttt,,12
式中为平滑系数,。 11,,,,
2,,(1),XXX,,(1),观察上式,实际值、、的权系数分别为、、.依次类推,,tt,1t,2
离现在时刻越远的数据,其权系数越小。指数平滑法就是用平滑系数来实现不同时间的数,
据的非等权处理的。因为权系数是指数几何级数,指数平滑法也由此而得名。
上式略加变换,得
(1) SXXX,,,,,,,,,,,(1)(1)...,,tttt,,12
(1),,,,,XS(1) (4.3.2) tt,1式(4.3.2)可改写为
(1)(1)(1) (4.3.3) SSXS,,,,()tttt,,11
预测公式:
(1)ˆ (4.3.4) XS,tt,1或
ˆˆˆ= (4.3.5) XX,,XX,()t,1ttt
(1)(1)下面我们来比对移动平均值和指数平滑值。 {}S{}Mtt
1(1)MXXX,,,,(...)ttttN,,,11N 1,,,,,,XXXXX(...)tttNtNtN,,,,,11N
XX,(1)ttN, ,,Mt,1N
(1)假定样本序列具有水平趋势,将用代替,则 MX,tN,t1
11(1)(1)(1)MXMM,,,tttt,,11NN (4.3.6) 11(1),,,XM(1)tt,1NN
将用替换,式(4.3.6)即为式(4.3.2)的形式。 1/N,
由式(4.3.2),
(1)(1) SXS,,,,,(1)ttt,1
(1)(1) SXS,,,,,(1)ttt,,,112
… …
(1)(1) SXS,,,,,(1)110
(1)其中为指数平滑的初始值。逐项代入,得 S0
(1)1(1)tt, (4.3.7) SXXXS,,,,,,,,,,,,,,(1)...(1)(1)ttt,110
指数平滑法克服了移动平均法的缺点,它具有“厚今薄古”的特点。在算术平均中,所
有数据的权重相等,均为1/N;一次移动平均中,最近N期数据的权重均为1/N,其它为0;
而在指数平滑中,一次指数平滑值与所有的数据都有关,权重衰减,距离现在越远的数据权系数越小。权重衰减的速度取决于的大小,越大,衰减越快,越小,衰减越慢。 ,,,
从式(4.3.5)我们可以看到,指数平滑法解决了移动平均法所存在的一个问题,即不
ˆ再需要存贮过去N期的历史数据,而只需最近期观察值X,最近期的预测值和权系数,X,tt用这三个数即可计算出一个新的预测值,在进行连续预测时,计算量大大减小。
移动平均法中有N的选择问题,同样,在指数平滑法中也有参数的选择问题。 ,
式(4.3.5)可以给指数平滑法提供进一步的解释:
ˆˆˆ= XX,,XX,()t,1ttt
ˆˆ在这个公式中,新预测值仅仅是原预测值加上权系数 与前次预测值误差XX,t,1t
ˆ 的乘积。新预测值是在原预测值的基础上利用误差进行调整,这与控制论中利用XX,()tt
误差反馈进行控制的原理有些类似。很明显,当趋近于1时,新预测值将包括一个较大的,
调整;相反,当趋近于0时,调整就很小。因此的大小对预测效果的影响与在移动平,,
均法中使用的平均期数N对预测效果的影响相同。
我们再来看一下式(4.3.7),不难发现的大小实际上控制了时间序列在预测计算中的有,
10效位数。如当,0.3时,前10期观察值X的权系数,亦即前10期,(1,,),0.008,,t10
的观察值对预测的影响已经很小,这时预测模型中所包含的时间序列的有效位数很短。当,,0.1,前10期的加权系数为0.035,说明数X在预测中仍起着一定作用。因此当值较,,t10
小时预测模型中所包含的时间序列的有效位数就较大。
综合上述分析可以知道:较大表示较倚重近期数据所承载的信息,修正的幅度也较大,,
采用的数据序列也较短;较小表示修正的幅度也较小,采用的数据序列也较长。由此我们,
可以得到选择的一些准则: ,
?如果预测误差是由某些随机因素造成的,即预测目标的时间序列虽有不规则起伏波动,但基本发展趋势比较稳定,只是由于某些偶然变动使预测产生或大或小的偏差,这时,应取小一点,以减小修正幅度,使预测模型能包含较长的时间序列的信息。 ,
?如果预测目标的基本趋势已经发生了系统的变化,也就是说,预测误差是由于系统变化造成的,则的取值应该大一点,这样,就可以根据当前的预测误差对原预测模型进行较,
大幅度的修正,使模型迅速跟上预测目标的变化。不过,取值过大,容易对随机波动反应,
过度。
?如果原始资料不足,初始值选取比较粗糙,的取值也应大一点。这样,可以使模型,
加重对以后逐步得到的近期资料的依赖,提高模型的自适应能力,以便经过最初几个周期的校正后,迅速逼近实际过程。
?假如有理由相信用以描述时间序列的预测模型仅在某一段时间内能较好地表达这个时间序列,则应选择较大的值,以减低对早期资料地依赖程度 ,
的选取范围一般以0.01,0.3为宜,注意到在(4.3.6)的推导中,是用 代替的。1N,,但在早期阶段,选择较大的往往是有益的,因为此时观察数较少,加大,给当前观察,,
值的权数就大,从而减少了由于初始值S选择不当而引起的偏差。 0
选取的一种比较有效的方法是:将已知时间序列分成两段,选取一系列值,用前,,一段数据建立模型,对后一段进行事后预测,以事后预测误差为
标准,从中选取最优的
值,再建立真正的预测模型。例如,已有某产品三年的月销售量统计序列,通常可取,,,0.05,0.1,0.2,0.3,用前两年的统计数据建立平滑预测模型,对第三年的月销售量进行事后预测,然后对预测值与实际值进行比较,选取预测误差最小的值作为实际预测时的平滑,
系数。
显然,上述方法仅仅当已有的历史观察数据很多时才适用。对观察数据不是太多的情况下,我们可以用指数平滑法进行预测,然后选择均方误差最小的值作为正式进行预测时,
的平滑系数,如下例所示。
)要用指数平滑法预测这一年例4.2 现有某年1月至11月对餐刀的需求量(见表4.2
(1)12月份的需求量。在表中我们选择,0.1,0.5,0.9三个值进行比较,由于在(4.3.7)中,S0
(1)(1)未知,从而也未知,表中将X=2000作为初始值(初始值的选取将在4.3.2节中作进SS010
一步讨论),当,0.1时均方误差最小,因此我们在进行预测时的平滑系数选为0.1。 ,,
表4.2指数平滑法预测误差的比较
α,0.1时的预测值 α,0.5时的预测值 α,0.9时的预测值
需时观 需绝误需绝误需绝误求预预预察求误对差求误对差求误对差量测测测期值 量差误平量差误平量差误平 的 值值值 的差方的差方的差方 0 , , , , , , , , , , , , 2000
1 2000 -650 650 422500 2000 -650 650 422500 2000 -650 650 422500 1350
2 1935 15 15 225 1675 275 275 75625 1415 535 535 286225 1950
3 1937 38 38 1444 1813 162 162 26244 1897 78 78 6084 1975
4 1940 1160 1160 1345600 1894 1206 1206 1454436 1967 1133 1133 1283689 3100
5 2056 -306 306 93636 2497 -747 747 558009 2987 -1237 1237 1530169 1750
6 2026 -476 476 226576 2123 -573 573 328329 1874 -324 324 104976 1550
7 1978 -678 678 459684 1837 -537 537 288369 1582 -282 282 79524 1300
8 1910 290 290 84100 1558 642 642 412164 1328 872 872 760384 2200
9 1939 831 831 690561 1884 886 886 784996 2113 657 657 431649 2770
10 2023 327 327 106929 2330 20 20 400 2709 -359 359 122881 2350
11 2056 … … … 2340 … … … 2386 … … … …
总计 461 4681 3431255 684 5698 4351072 423 6127 5028081
均值(取整数) 46.1 468 343126 68 570 435107 42 613 502808预测精确性的衡量指标
预测误差就是预测结果与实际结果的偏差,决定了预测精确性。定量预测方法的精确性有很多衡量的指标,主要的有以下几种:
1) 预测点的绝对误差
ˆˆˆyyy记为预测对象的实际观测值,,,…,为预测值,则: yyy,,,12n12n
ayytn,,,,1,2,, ttt
即为在点的绝对误差。显然是预测结果误差最直接地衡量,但其大小受预测对象计量aattt
单位的影响,不适于作为预测精确性的最终的衡量指标。
2) 预测点的相对误差
yy,attt ,1,2,,atn,,,tyytt
常常用百分比表示,衡量了预测点上预测值相对于观测值的准确程度。如taa,2%tt说明预测值比实际值偏低了2%,也可不严格的说预测的精度就是2%。
上述两个指标均只表示了预测点上预测的误差,而要衡量整体预测模型的精确性,我们还必须考虑所有预测点上总的误差量。
3) 平均绝对误差MAD与相对平均绝对误差AARE
对于绝对误差的存在,其累积值将会因正负误差相互抵消而减弱总的误差量,但绝对误差的绝对值的累积则能避免正负误差的相互抵消。记
nn11MADyya,,,|||| ,,tttnn,,11tt
为平均绝对误差。
但平均绝对误差依然受预测对象计量单位大小的影响,所以记
nnyy,11tt AAREa,,||||t,,nyn,,11ttt
AARE即为相对平均绝对误差,它比较好地衡量了预测模型的精确性。但绝对值运算在数学上不好处理,所以我们又有以下两个衡量的指标。
24) 预测误差的方差与标准差S S
nnnn111122222Syya,,,(), Syya,,,(),,,,ttttttnnnn,,11tt,,11tt
2方差与标准差S在数学上易于处理,也比较好地反映了预测结果的精确性。显然,S
它们越大,则表示预测结果越不准确。它们与平均绝对误差的区别在于,方差和标准差对较大的预测点的误差更为敏感,采用它们作精确性的衡量标准时,宁可有多个较小的点误差,而不愿有少量的较大的点误差。
S当预测误差按正态分布时,平均绝对误差与标准差之间有如下的关系:
,S,,MAD,1.25MAD 2
例8.1 预测精确性的衡量指标的比较
(1)ˆ假设我们选取一次预测中的一段数据,记观测值为,及其三个预测结果(分别用,yytt
(2)(3)(3)t,0,2,,15ˆˆˆ,表示),预测区间为。其中为假设的与y呈完全相反方向发展yyytttt
的序列,数据如下表8.2所示,同时我们将数据的走势画在图8.1中。
表8.1 预测精确性的衡量
(1)(2)(3) ˆˆˆytyyytttt
0 -0.2 -0.44 1.08 0.2 1 0.34 0.26 -0.83 -0.34 2 0.83 0.82 0.09 -0.83 3 1.03 0.83 0.80 -1.03 4 1.35 1.80 1.22 -1.35 5 1.51 1.53 2.66 -1.51 6 1.45 1.96 1.78 -1.45 7 1.47 1.05 0.99 -1.47 8 1.56 1.57 1.43 -1.56 9 1.64 1.70 1.80 -1.64 10 1.52 2.03 0.55 -1.52 11 1.67 1.95 2.69 -1.67 12 1.96 2.16 3.30 -1.96 13 2.25 2.16 2.51 -2.25 14 2.68 2.73 1.18 -2.68 15 3.01 3.30 3.94 -3.01
15
()/an -0.0845 -0.0693 3.0099 ,t0t,
15
(||)/an 0.2138 0.7373 3.0599 ,tt,0
n
(|()/|)/yyyn, 0.2136 0.9664 2.00 ,ttt,1t
20.0761 0.7653 11.4170 S
, 0.0785 0.2390 1.00
图8.1 预测精确性的衡量
(1)(2)ˆ与ˆ相比,预测更为精确,在图像中两条曲线走势基本从图中可以直观的看到,yytt
(2)(3)(1)(2)(3)ˆˆˆˆˆ相同。而波动较大,则与呈完全相反的走势。所以预测序列与显然存在yyyyyttttt一定的问题,需要改进。
我们计算了三个预测序列的各种精确性指标,将其同时列在表8.2中,显然数据结果得
出的结论与我们在图中直观的观察相符。
另外,各种衡量指标之间的横向比较验证了我们前面的分析。对直接求平均值时,at
(1)(2)ˆˆ由于正负相互抵消而使得其结果没有体现出与之间明显的精确性的差距。其余几个yytt
指标则比较好地体现了三个预测序列之间的不同,特别的,对于走势与实际观测值完全相反
(3)ˆAARE,2的序列,相对平均绝对误差,而泰尔不等系数,,1。 yt
七、农作物单产变异系数\
(1)单产变异系数(X)的计量经济学模型 1
,,将各省市历年某种农作物单产对时间趋势t做回归,并记录残差,则 YitYf(t),i
Y表示i地区某作物的单产水平;t,1,2,3,......,T; (公式 1) i
f(t)为作物单产与时间趋势的二项式函数关系式
,,ˆ为剔除了时间趋势(Detrending)的产量,利用其计算各种作物单产的波动Y,Y,Yititit
水平,即变异系数(CV,Coefficient of Variation)。
CV(YYTYYTYˆ)/(1)(1)/22ititit,,,,,,,,,
Y为实际单产;Y为趋势单产;ˆ (公式 2) itit
Y为平均单产,T为年数。