为了正常的体验网站,请在浏览器设置里面开启Javascript功能!
首页 > 随机逼近算法简介

随机逼近算法简介

2019-09-18 3页 doc 14KB 45阅读

用户头像

is_598372

暂无简介

举报
随机逼近算法简介随机逼近算法简介随机逼近的研究目的在许多理论课题或实际应用中,经常要求一个函数的零点或极值,如果函数有已知的解析表达式,那么在理论上解决这个问题并不困难;如果虽不知函数的表达式,但它在任一点的取值可以无误差的测量到,那么有不少行之有效的数值方法可供选用;当既不知函数的表达式,又不能无误差的测量到函数值时,如何求函数的零点或极值,正是随机逼近要解决的问题。随机逼近理论的发展随机逼近创始于50年代初,Robbins-Monrn[1]首先提出了求未知函数f(•)零点x0的一个递推算法。在Robbins-Monro的奠基性...
随机逼近算法简介
随机逼近算法简介随机逼近的研究目的在许多理论课或实际应用中,经常要求一个函数的零点或极值,如果函数有已知的解析表达式,那么在理论上解决这个问题并不困难;如果虽不知函数的表达式,但它在任一点的取值可以无误差的测量到,那么有不少行之有效的数值方法可供选用;当既不知函数的表达式,又不能无误差的测量到函数值时,如何求函数的零点或极值,正是随机逼近要解决的问题。随机逼近理论的发展随机逼近创始于50年代初,Robbins-Monrn[1]首先提出了求未知函数f(•)零点x0的一个递推算法。在Robbins-Monro的奠基性工作后,随机逼近取得蓬勃发展。主要的研究目标是考察各种相关的测量噪声[2]及拓广可适用的回归函数范围,[3]而收敛类型,除了最初的均方收敛,更多的是研究概率1收敛及弱收敛。从研究方法讲,文献[2]是用鞅收敛方法研究随机逼近算法概率1收敛的有代表性的专著,其基本特点是讨论独立噪声,它对20世纪70年代以前的工作做了一个很好的总结,之后,文件[3]把递推算法的收敛性和微分方程的稳定性建立了联系,从而使得考察的测量误差的范围有实质性的扩大。但这种方法要事先假定算法给出的估计值有界。经过半个多世纪的发展历程,随机逼近思想已经得到了不断的进步和完善。到目前为止,随机逼近控制方法有RM法、KW法o其中基于KW方法上的变形情况有:有限微分随机逼近算法(FDSA)、随机方向的随机逼近算法(RDSA)和同时扰动随机逼近算法(SPSA)o随机逼近算法简介3.1随机逼近问题对许多实际问题和理论问题的研究,常常归结为一个非线性方程组的求根问题,长期以来,人们发展了不少逐次逼近的数值解法。但是,在很多实际问题中,人们并不知道方程中非线性函数的形式,只可以对给定的自变量值,带随机误差地测量到函数值。在这种情况下,怎样去求这个未知的非线性函数的零点,是一个从实践到理论都很重要的问题。设未知函数为,它的零点为x0,即h(x0)=0(1)对h(•)可以在任意点x进行测量,但测量带有误差,若xn为第n次测量时所取定的自变量值,则函数的观测值为:yn+1=h(xn)+Zn+1(2){Zn}是测量误差序列,可以依赖于xnoh(•)称为回归函数。用实际得到的序列{xn}和{yn},去求回归函数的根x0,这就是随机逼近问题。下面用朱允文所举的一个例子说明随机逼近的实际性。假设发明了一种新药,必须确定它的最佳剂量,设剂量为x,人服药后的反应为f(X),而人们希望达到的最佳反应为a,定义h(x)=f(x)-a。显然,这里的f(•)和h(•)都只是一种形式上的写法,人们无法精确的知道药物剂量与药物反应之间的对应关系h(•),但是可以带随机误差地测量它,得到:yn+1=h(xn)-a+Zn+1解决这一实际问题就要求助于某种随机逼近算法。3.2RM算法的提出1951年,Robbins和Monro首次提出并研究了一种随机逼近算法,[1]他们取数列{ai}为增益系数:(3)对x0的第n+1次逼近为:xn+1=xn+anyn+1(4)其中yn如式(2)所定义,这就是著名的Robbins-Monro(RM)算法。当时,他们讨论了Zn为相互独立的情况,并且ℓ=1,在h(•)严格单调的时候,他们证明了xn对x0的平方收敛性:显然上面的结果是在比较强条件下得到的,但这标志着人们找到了对理论和实际都很重要的这类问题的一种处理方法。3.3KW算法的提出在RM算法提出后的第二年,出现了Kiefer-Wolfowitz(KW)算法,[4]也就是求h(x)极值的算法。如果能直接测量h(•)的导数,那么问题就归结为上面的RM算法。但有时只能测量h(•)本身,只好利用h(•)的测量值的差商去估计h(•)的导数值,这就是KW算法的基本思想。因此,KW算法与RM算法比较,除了在测量点上有一些变化外,算法的基本形式以及理论研究的基本思想都是一致的。增益系数{a1}又称步长因子,它所具有的性质(3),对随机逼近算法和其他某些随机逼近递推算法都是必要的。条件的实质是ai必须趋于0,也就是每步的修正量越来越小,直到把测量误差的影响慢慢压制下去,使aiyi中的。但是又说明,ai趋于0的速度不能太快。因为如果,这时即使,h(•)一致有界,?Uh(•)?U分析
,还没有合适的方法。究其原因,人们主要用鞅差收敛定理来证明算法的收敛性,而当测量误差无穷相关时就破坏了应用鞅收敛性的前提。此外,很多学者都认为随机收敛性问题自然应采用概率方法,没有意识到可以借助随机收敛性以外的数学方法。1977年,瑞典学者LjungL在对随机递推算法作收敛性分析时,想到形式如(4)一类的算法的收敛性,与下面的常微分方程的稳定性有关。(6)粗略地说,记,把算法(4)写成:(7)由于随an趋于0,en的作用被压制下去,于是得到方程(6).Ljung提出的利用常微分方程稳定性定理来证明算法收敛性的方法,简称为常微分方程(ODE)方法。[6]对随机逼近算法的进一步研究表明,证明算法收敛的本质不在于把数据内插成连续函数,也不在于寻找这些函数的“尾函数”所满足的微分方程,而在于存在和h(•)相应的Lyapunov函数v(•),不必做数据的内插函数,可以证明v(xn)不可能无穷次穿越任一非零区间,从而可简洁的证明算法的大范围收敛性,同时,还可得到稳健型结果。我们称这种方法为“Lyapunov函数”方法。3.5SPSA算法同时扰动随机逼近算法简称(SPSA),这个算法是Spall根据Kiefer-Wolforwitz随机逼近算法于1987年改进而成。Kiefer-Wolforwitz算法是以有限差分梯度逼近为基础的,它在每次梯度逼近中需要利用目标函数的2P个测量值(其中P为向量的维数)。Spall改进后的SPSA算法在每次梯度逼近中只利用了目标函数的2个测量值,这与Kiefer-Wolforwitz算法形成明显的对比。1992年,Spall又对SPSA算法进行了全面深入的分析与论证。[9]他证明了虽然SPSA算法在每次迭代的梯度逼近中仅利用了Kiefer-Wolforwitz随机逼近算法的1/p倍的目标函数的估计值,但在一般情况下,当迭代次数相同时,两种算法可以达到同样的精度。因而,SPSA算法在解决多变量的问题中,有其独特的优越性。此后,SPSA算法引起了著名科学家Cauwenberghs、Chin、Maeda等的关注,并被广泛研究与应用于排队系统、模式识别、神经网络训练、动态系统的自适应控制等方面。正是由于上面的这些特性,SPSA算法现已成为一个新的学科分支。SPSA算法特别适用于多维变量系统,同其他随机优化方法(如遗传算法)比较,更易于实现,不但适用于连续系统也适合离散系统。小结从Robbins.H与Monro.S的RM算法到KieferJ和WolfowitzJ的KW算法,接着由KW算法发展而来的SPSA算法无不显示出工程实践及社会、经济实践将越来越多地需要用到随机逼近。对随机逼近算法理论与应用的研究,近年来已成为工程领域的一个重要课题。与大部分的自适应算法一样,随机逼近算法是大规模的线性系统,但又具有随机系统的特性。可用于动态系统控制、统计参数估计等。而动态系统控制则需要引进具有噪声的估计值。可以预计随机逼近算法能迅速地用于动态系统等随机运算领域,特别是在对于随机性要求很高的控制领域,将有极为广阔的应用前景。[10]
/
本文档为【随机逼近算法简介】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索