庞特里亚金最大值原理
一 回顾带控制项的常微分方程
二 最大值原理及简单直观解释
三 最大值原理应用实例
目 录 索 引
第三章 最优控制理论
一 回顾带控制项的常微分方程
我们已熟悉普通的常微分方程: x,(t) =f(t,x(t))),
知道当初值条件x(t0)= x0给定, 且f满足一定条件时,
由x(t)值决定f(t,x(t)))值而决定x,(t), 以此驱动方式,
会跑出唯一确定的x(t)曲线.(这是直观解释,精确驱动请看压缩映像
)
第三章 最优控制理论
对带控制项u的常微分方程: x,(t) =f(t,x(t), u(t)),
仅x(t)值无法确定f(t,x(t) u(t))值, 从而无法决定x,(t),
故不知u(·)时, 从初值x(t0)=x0不能跑出唯一唯一确定的
t0时刻之后的曲线x(t),t≥t0 .
第三章 最优控制理论
反之,对带控制项u的常微分方程: x,(t) =f(t,x(t), u(t)),
若已知x(t), u(t),则x,(t) =f(t,x(t), u(t))已知, t时驱动已知,
故若初值条件x(t0)= x0 及之后的控制项 u(t), t≥t0已知,
则t≥t0方程驱动已知, 若f满足一定条件时, 方程解唯一.
当然这只是结构性的
,具体证明需压缩映像原理。
从x(·)与u(·)互相确定的关系上看,当 xx((tt00)= )= xx00已知时已知时,,
uu((tt), ), tt≥≥tt00完全确定完全确定xx((tt), ), tt≥≥tt00,这是控制理论一最基本常识.
下面最大值原理的简单解释需此结论。
第三章 最优控制理论
uu对对xx的确定关系的确定关系,可参考下例得直观解释:
加速方程:x1为位移,x2为速度,u为控制是加速度.
繁衍方程:x是t时刻某物种量,u是t时刻其繁衍率.
).()()( txtutx ⋅=&
⎩⎨
⎧
=
=
.)()(
),()(
2
21
tutx
txtx
&
&
二 最大值原理及简单直观解释
上章用带等式约束的泛函极值问题, 简单推导了
控制项u的取值范围无约束时, 最大值原理的形式:
但绝大多数控制问题绝大多数控制问题,,控制项控制项uu的取值范围带约束的取值范围带约束,
故此形式不是
形式,此推导也非严格推导。此形式不是标准形式,此推导也非严格推导。
下给出严格形式,以及直观解释:
第三章 最优控制理论
,),,(][)(),,,( 1
0
最小的控制为使指标 dtuxtFuJuuxtfx t
t∫=⋅=&
),,,(),,(),,,(],,[),( 10 uxtfuxtFxutHtttt
T •+=∈∃ λλλ 令则
.;;0,, λλλ ∂∂=∂∂−==∂∂ HxxHuHux &&满足方程组:
第三章 最优控制理论
,),,(][)(),,,( 1
0
最小的控制为使指标 dtuxtFuJuuxtfx t
t∫=⋅=&
),,,(),,(),,,(],,[),( 0100 uxtfuxtFxutHtttt
T •+=∈∃ λλλλλ 令及则
必满足下方程组:和控制最小的状态则使 ,, λuxJ
.0],[)(,0 1000 不会同时为在任意及且 tttt ∈≤ λλλ
⎪⎩
⎪⎨
⎧ ));(,,),(,(max))(,),(),(,( 00 tvtxtHttutxtH Uv λλλλ ∈=
同维数与注即 )()(:;)()( txtxHtxHt iTiT λλλ ∂∂−=∂∂−= &&
即控制方程注 :).,,(: uxtfxHx =∂∂= && λ
请参考最优控制教材。此处略还有相应边界条件
,状态值等不同边界约束对固定时间、固定终止
,,
最大值原理结论:
第三章 最优控制理论
,),,(][ 1
0
udtuxtFuJ
t
t
最小的控制使指标最大值原理主要是寻找 ∫=
不难算出。则相应的状态找到最小的控制因为如果使指标 xuJ ,
最大化:的取值会使哈密顿函数时刻任一第一个方程
主要是的方程在最大值原理中寻找
Hut
u
:
,
));(,,),(,(max))(,),(),(,( 00 tvtxtHttutxtH Uv λλλλ ∈=
同维数与注即 )()(:;)()( txtxHtxHt iTiT λλλ ∂∂−=∂∂−= &&
即控制方程注 :).,,(: uxtfxHx =∂∂= && λ
最大值原理简单直观解释:
看做辅助:没列出的终端条件可以余下两个方程以及我们
第三章 最优控制理论
,),,(][ 1
0
udtuxtFuJ
t
t
最小的控制标下主要直观解释,使指 ∫=
最大化:的取值会使哈密顿函数每时刻为何会满足方程 Hu :1
));(,,),(,(max))(,),(),(,( 00 tvtxtHttutxtH Uv λλλλ ∈=
最大值原理简单直观解释(续):
这个角度乍看,是一积分若仅从指标 ,),,(][ 1
0
dtuxtFuJ
t
t∫=
最小化:值应使函数的每时刻最小,要使 ))(),(,( tutxtFutJ
;,,0, 00 最大就是一回事最小与使则使由于若 HFFH ≤= λλ
?)(,)(,)( 00 ftHftFftFH λλλλλ 中为何多了多出了但 ≠+=
下详释:
第三章 最优控制理论
,,,),,(][, 1
0
xudtuxtFuJ
t
t
还有不仅有取值产生影响的对关键在 ∫=
∫ ∫Δ+Δ+
Δ+
tt
t
t
t
dtuxtFdtuxtFttt
utttt
,外值而影响上积分
除了会直接影响到值的附近每时刻
1
0
),,(),,(],[
,],[
这部分也要考虑到。
进而再影响再影响
的值上进而影响整个
还会影响取值在
.),,(
,),,(
,)(],[
),(,],[
1
0
1
1
∫
∫ Δ+
Δ+
Δ+Δ+
t
t
t
tt
dtuxtF
dtuxtF
txttt
ttxtttu
。线性倍数记为的影响进而对对
自然有线性关系比例与的影响对
λ,],[)()(
,,)()(
1 Jtttttxttx
fttxtu
Δ+∈Δ+
Δ+
最大值原理简单直观解释(续):
三 最大值原理实例
下面用最大值原理(没有终端条件)解决一下:
最早最有代表性的电梯快速升降最优控制问题——
t时刻位移x1和速度x2是两个状态,加速度u是控制量,
加速度u值有上下限,控制的目的是1楼到2楼停住。
最优化的指标是1楼开始到2楼结束所用时间。
故给出如下最优控制问题:
第三章 最优控制理论
⎪⎪⎩
⎪⎪⎨
⎧ );()(),()(: 221 tutxtxtx == &&状态和控制方程
;0)(,1)(;0)0(,0)0(:21: 2121 ==== TxTxxx楼停楼始状态终端条件
1)(: ≤tu控制值受限
.)(),()()]([ 21 值及及状态最小化的求使指标 TxxuTuJ ⋅⋅⋅=⋅
最大值原理大体计算步骤
最大值原理计算(无终端条件)大体分如下4步:
1.写出F(t,x,u)和f (t,x,u)→写出哈密顿函数H (t,x,u,λ).
2.在固定(t,x(t),λ(t))时, 最优控制u (t)是取值范围内,
使H取最大值的那个量;由此方程求最优控制u (t)。
3.由上方程解最优控制u (t)时引出的x(t),λ(t)的问题,
由原理中关于x(t)的状态方程,λ(t)的方程,各自求解。
4.如果还不能解决,则需要考察终端条件及引入一些
专门的控制方程等额外的工具,来求解。
第三章 最优控制理论
电梯最快升降问题的最大值原理解法(简略版)
按上面
的最大值原理计算步骤分步求解如下:
第三章 最优控制理论
,,);()(),()(::.1 221221 ufxftutxtxtxH ==== 知由状态方程求 &&
,11][
0
=⋅== ∫ FdtTuJ T 知再由
.),( 22100 uxftFH λλλλλ ++=+=故
:.2 uHu 求最优控制最大化的不等式方程,使由
:,,1.2210 故最大化使HuuuxH ≤++= λλλ
⎪⎩
⎪⎨
⎧
<
=
>
==
,0)(,1
,0)(,
,0)(,1
))(sgn()(
2
2
2
2
t
t
t
ttu
λ
λ
λ
λ
-
若
若任意值都可
若
第三章 最优控制理论
:,.3 之间的互动影响及其结果与求 uxλ
,)(0)( 1111 ctxHt ≡⇒=∂∂−= λλ&
,故这不允许
由于
0)(,,0
00
0
0))(),(),(,(
00
2
12
0
12
≠≡⇒
⎪⎭
⎪⎬
⎫
≡⇒≡
=⇒
⎭⎬
⎫
=
≡⇒≡
tHTTuTxTH λ
λλ
λλ
λλ
,)()()( 212122 ctcttxHt +−=⇒−=∂∂−= λλλ&
知:退化为不能在以及
条件由这种终态固定的终端
,0],0[
,0))(),(),(,(
TH
TTuTxTH =λ
有:故反馈到又直线段是一非故 uttut )),(sgn()(,0)( 22 λλ =
最多改变一次值。上,且在 )(],0[1)( tuTtu ±=
第三章 最优控制理论
的精确解:的相平面法求另引入状态
且最多变化一次及终端条件由
Tuxx
ux
,,
,1,.4 ±=
二元点的运行轨迹:时,考察分别对 ),(1,1 21 xxuu −==
.),(,,1)( 212
2
1 运行轨迹由此易画出由状态方程可得 xxx
dx
dxtu ==
.),(,,1)( 212
2
1 运行轨迹由此易画出由状态方程可得 xxx
dx
dxtu −=−=
完成。态、指标。读者可自行易于求出最优控制、状
值与终值,运行轨迹,结合状态初由此两族 ),( 21 xx