为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

最大值原理

2013-04-25 14页 pdf 185KB 87阅读

用户头像

is_230919

暂无简介

举报
最大值原理 庞特里亚金最大值原理 一 回顾带控制项的常微分方程 二 最大值原理及简单直观解释 三 最大值原理应用实例 目 录 索 引 第三章 最优控制理论 一 回顾带控制项的常微分方程 我们已熟悉普通的常微分方程: x,(t) =f(t,x(t))), 知道当初值条件x(t0)= x0给定, 且f满足一定条件时, 由x(t)值决定f(t,x(t)))值而决定x,(t), 以此驱动方式, 会跑出唯一确定的x(t)曲线.(这是直观解释,精确驱动请看压缩映像证明) 第三章 最优控制理论 对带控制项u的常微分方程: x,(t...
最大值原理
庞特里亚金最大值原理 一 回顾带控制项的常微分方程 二 最大值原理及简单直观解释 三 最大值原理应用实例 目 录 索 引 第三章 最优控制理论 一 回顾带控制项的常微分方程 我们已熟悉普通的常微分方程: x,(t) =f(t,x(t))), 知道当初值条件x(t0)= x0给定, 且f满足一定条件时, 由x(t)值决定f(t,x(t)))值而决定x,(t), 以此驱动方式, 会跑出唯一确定的x(t)曲线.(这是直观解释,精确驱动请看压缩映像) 第三章 最优控制理论 对带控制项u的常微分方程: x,(t) =f(t,x(t), u(t)), 仅x(t)值无法确定f(t,x(t) u(t))值, 从而无法决定x,(t), 故不知u(·)时, 从初值x(t0)=x0不能跑出唯一唯一确定的 t0时刻之后的曲线x(t),t≥t0 . 第三章 最优控制理论 反之,对带控制项u的常微分方程: x,(t) =f(t,x(t), u(t)), 若已知x(t), u(t),则x,(t) =f(t,x(t), u(t))已知, t时驱动已知, 故若初值条件x(t0)= x0 及之后的控制项 u(t), t≥t0已知, 则t≥t0方程驱动已知, 若f满足一定条件时, 方程解唯一. 当然这只是结构性的,具体证明需压缩映像原理。 从x(·)与u(·)互相确定的关系上看,当 xx((tt00)= )= xx00已知时已知时,, uu((tt), ), tt≥≥tt00完全确定完全确定xx((tt), ), tt≥≥tt00,这是控制理论一最基本常识. 下面最大值原理的简单解释需此结论。 第三章 最优控制理论 uu对对xx的确定关系的确定关系,可参考下例得直观解释: 加速方程:x1为位移,x2为速度,u为控制是加速度. 繁衍方程:x是t时刻某物种量,u是t时刻其繁衍率. ).()()( txtutx ⋅=& ⎩⎨ ⎧ = = .)()( ),()( 2 21 tutx txtx & & 二 最大值原理及简单直观解释 上章用带等式约束的泛函极值问题, 简单推导了 控制项u的取值范围无约束时, 最大值原理的形式: 但绝大多数控制问题绝大多数控制问题,,控制项控制项uu的取值范围带约束的取值范围带约束, 故此形式不是形式,此推导也非严格推导。此形式不是标准形式,此推导也非严格推导。 下给出严格形式,以及直观解释: 第三章 最优控制理论 ,),,(][)(),,,( 1 0 最小的控制为使指标 dtuxtFuJuuxtfx t t∫=⋅=& ),,,(),,(),,,(],,[),( 10 uxtfuxtFxutHtttt T •+=∈∃ λλλ 令则 .;;0,, λλλ ∂∂=∂∂−==∂∂ HxxHuHux &&满足方程组: 第三章 最优控制理论 ,),,(][)(),,,( 1 0 最小的控制为使指标 dtuxtFuJuuxtfx t t∫=⋅=& ),,,(),,(),,,(],,[),( 0100 uxtfuxtFxutHtttt T •+=∈∃ λλλλλ 令及则 必满足下方程组:和控制最小的状态则使 ,, λuxJ .0],[)(,0 1000 不会同时为在任意及且 tttt ∈≤ λλλ ⎪⎩ ⎪⎨ ⎧ ));(,,),(,(max))(,),(),(,( 00 tvtxtHttutxtH Uv λλλλ ∈= 同维数与注即 )()(:;)()( txtxHtxHt iTiT λλλ ∂∂−=∂∂−= && 即控制方程注 :).,,(: uxtfxHx =∂∂= && λ 请参考最优控制教材。此处略还有相应边界条件 ,状态值等不同边界约束对固定时间、固定终止 ,, 最大值原理结论: 第三章 最优控制理论 ,),,(][ 1 0 udtuxtFuJ t t 最小的控制使指标最大值原理主要是寻找 ∫= 不难算出。则相应的状态找到最小的控制因为如果使指标 xuJ , 最大化:的取值会使哈密顿函数时刻任一第一个方程 主要是的方程在最大值原理中寻找 Hut u : , ));(,,),(,(max))(,),(),(,( 00 tvtxtHttutxtH Uv λλλλ ∈= 同维数与注即 )()(:;)()( txtxHtxHt iTiT λλλ ∂∂−=∂∂−= && 即控制方程注 :).,,(: uxtfxHx =∂∂= && λ 最大值原理简单直观解释: 看做辅助:没列出的终端条件可以余下两个方程以及我们 第三章 最优控制理论 ,),,(][ 1 0 udtuxtFuJ t t 最小的控制标下主要直观解释,使指 ∫= 最大化:的取值会使哈密顿函数每时刻为何会满足方程 Hu :1 ));(,,),(,(max))(,),(),(,( 00 tvtxtHttutxtH Uv λλλλ ∈= 最大值原理简单直观解释(续): 这个角度乍看,是一积分若仅从指标 ,),,(][ 1 0 dtuxtFuJ t t∫= 最小化:值应使函数的每时刻最小,要使 ))(),(,( tutxtFutJ ;,,0, 00 最大就是一回事最小与使则使由于若 HFFH ≤= λλ ?)(,)(,)( 00 ftHftFftFH λλλλλ 中为何多了多出了但 ≠+= 下详释: 第三章 最优控制理论 ,,,),,(][, 1 0 xudtuxtFuJ t t 还有不仅有取值产生影响的对关键在 ∫= ∫ ∫Δ+Δ+ Δ+ tt t t t dtuxtFdtuxtFttt utttt ,外值而影响上积分 除了会直接影响到值的附近每时刻 1 0 ),,(),,(],[ ,],[ 这部分也要考虑到。 进而再影响再影响 的值上进而影响整个 还会影响取值在 .),,( ,),,( ,)(],[ ),(,],[ 1 0 1 1 ∫ ∫ Δ+ Δ+ Δ+Δ+ t t t tt dtuxtF dtuxtF txttt ttxtttu 。线性倍数记为的影响进而对对 自然有线性关系比例与的影响对 λ,],[)()( ,,)()( 1 Jtttttxttx fttxtu Δ+∈Δ+ Δ+ 最大值原理简单直观解释(续): 三 最大值原理实例 下面用最大值原理(没有终端条件)解决一下: 最早最有代表性的电梯快速升降最优控制问题—— t时刻位移x1和速度x2是两个状态,加速度u是控制量, 加速度u值有上下限,控制的目的是1楼到2楼停住。 最优化的指标是1楼开始到2楼结束所用时间。 故给出如下最优控制问题: 第三章 最优控制理论 ⎪⎪⎩ ⎪⎪⎨ ⎧ );()(),()(: 221 tutxtxtx == &&状态和控制方程 ;0)(,1)(;0)0(,0)0(:21: 2121 ==== TxTxxx楼停楼始状态终端条件 1)(: ≤tu控制值受限 .)(),()()]([ 21 值及及状态最小化的求使指标 TxxuTuJ ⋅⋅⋅=⋅ 最大值原理大体计算步骤 最大值原理计算(无终端条件)大体分如下4步: 1.写出F(t,x,u)和f (t,x,u)→写出哈密顿函数H (t,x,u,λ). 2.在固定(t,x(t),λ(t))时, 最优控制u (t)是取值范围内, 使H取最大值的那个量;由此方程求最优控制u (t)。 3.由上方程解最优控制u (t)时引出的x(t),λ(t)的问题, 由原理中关于x(t)的状态方程,λ(t)的方程,各自求解。 4.如果还不能解决,则需要考察终端条件及引入一些 专门的控制方程等额外的工具,来求解。 第三章 最优控制理论 电梯最快升降问题的最大值原理解法(简略版) 按上面的最大值原理计算步骤分步求解如下: 第三章 最优控制理论 ,,);()(),()(::.1 221221 ufxftutxtxtxH ==== 知由状态方程求 && ,11][ 0 =⋅== ∫ FdtTuJ T 知再由 .),( 22100 uxftFH λλλλλ ++=+=故 :.2 uHu 求最优控制最大化的不等式方程,使由 :,,1.2210 故最大化使HuuuxH ≤++= λλλ ⎪⎩ ⎪⎨ ⎧ < = > == ,0)(,1 ,0)(, ,0)(,1 ))(sgn()( 2 2 2 2 t t t ttu λ λ λ λ - 若 若任意值都可 若 第三章 最优控制理论 :,.3 之间的互动影响及其结果与求 uxλ ,)(0)( 1111 ctxHt ≡⇒=∂∂−= λλ& ,故这不允许 由于 0)(,,0 00 0 0))(),(),(,( 00 2 12 0 12 ≠≡⇒ ⎪⎭ ⎪⎬ ⎫ ≡⇒≡ =⇒ ⎭⎬ ⎫ = ≡⇒≡ tHTTuTxTH λ λλ λλ λλ ,)()()( 212122 ctcttxHt +−=⇒−=∂∂−= λλλ& 知:退化为不能在以及 条件由这种终态固定的终端 ,0],0[ ,0))(),(),(,( TH TTuTxTH =λ 有:故反馈到又直线段是一非故 uttut )),(sgn()(,0)( 22 λλ = 最多改变一次值。上,且在 )(],0[1)( tuTtu ±= 第三章 最优控制理论 的精确解:的相平面法求另引入状态 且最多变化一次及终端条件由 Tuxx ux ,, ,1,.4 ±= 二元点的运行轨迹:时,考察分别对 ),(1,1 21 xxuu −== .),(,,1)( 212 2 1 运行轨迹由此易画出由状态方程可得 xxx dx dxtu == .),(,,1)( 212 2 1 运行轨迹由此易画出由状态方程可得 xxx dx dxtu −=−= 完成。态、指标。读者可自行易于求出最优控制、状 值与终值,运行轨迹,结合状态初由此两族 ),( 21 xx
/
本文档为【最大值原理】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
热门搜索

历史搜索

    清空历史搜索