TD4 Corr
TD4 Corr
TD4 Corr
Le système linéaire-quadratique
Correction: Il s'agit d'un problème linéaire-quadratique (LQ) avec cible ξ(t) ≡ 0, i.e., en re-
prenant les notations du cours, on a bien ẋ (t) = Ax (t) + Bu(t) et J(u) = R (u(t) Ru(t) + 1 T †
(théorème 4.5), le contrôle optimal est donné par u(t) = −R B p(t) = −p(t), et on obtient
u u 2 u u
−1 †
Il reste à déterminer p(0). Pour cela, on utilise le fait que p(T ) = 0. Il vient 0 = p(T ) =
−x sinh(T ) + p(0) cosh(T ). Ainsi, p(0) = x tanh(T ). Finalement,
0 0
1
Résoudre l'equation de Riccati, écrire le contrôle optimal comme un feedback et
déterminer (à nouveau) la valeur minimale atteinte par le critère.
Question 2.
On obtient
1 + P (t)
log = 2(T − t),
1 − P (t)
d'où e2T − e2t
P (t) = = tanh(T − t).
e2T + e2t
On en déduit le contrôle optimal sous forme de feedback :
e2T − e2t
u(t) = − x(t),
e2T + e2t
et la valeur minimale atteinte par le critère
1 2 e2T − 1 1
J(u) = x = x20 tanh(T ),
2 0 e2T + 1 2
qui correspond bien à la réponse trouvée à la question précédente.
Z T
1
J(u) = u(t)2 dt − f (xu (T )),
2 0
2
où f est une fonction de classe C , concave et croissante.
1
ailleurs, l'application u 7→ x (T ) est linéaire, si bien que par concavité de la fonction f , l'ap-
Correction:
2 0
application convexe étant 1-convexe, on en déduit que J est 1-convexe sur V . Enn, la fonction f
u
étant continue, on déduit facilement que la fonctionnelle J est continue. Le théorème 3.8 permet
de conclure à l'existence et unicité du minimiseur de J sur V .
On introduit l'état adjoint p = (p , p ) : [0,T ] → R tel que ṗ(t) = −A p(t) et 2 †
Z T
1
J(u + δv) = (u(t) + δv(t))2 dt − f (Xu+δv,1 (T ))
2 0
Z T
= J(u) + u(t)δv(t)dt − f 0 (Xu,1 (T ))Yδv,1 (T ) + o(δv).
0
On trouve donc
Z T
J(u + δv) = J(u) + (u(t) − B † p(t))† δv(t)dt + o(δv),
0
et le deuxième terme du membre de droite dénit bien une forme linéaire continue sur V . On
a donc ∇J(u) = u(t) − B p(t), ou encore en utilisant la forme de B, ∇J(u) = u(t) − p (t).
†
L'équation d'Euler implique nalement que u(t) = p (t) pour tout t ∈ [0,T ].
2
2
p (t) = (T − t). La trajectoire optimale est donnée par ẍ (t) = (T − t), donc x (t) = T t /2 − t /6
1 2
2 3
3
Exercice III. Oscillateur harmonique
Ce système décrit le mouvement rectiligne d'un point matériel (de masse unité) sous l'action
d'une force de rappel, −x(t), et d'une force extérieure donnée par le contrôle, u(t).
Écrire le problème comme un système diérentiel d'ordre un (on notera X(t) =
(x(t), v(t)) le vecteur d'état). Ce système est-il contrôlable? Par la suite, il sera commode de
Question 1.
travailler en variables complexesR en posant z(t) = x(t) + iv(t) (i.e., on identie le plan (x, v) à
C). Vérier que z(t) = e z + ie u(s) ds où z = x + iv .
−it t i(s−t)
0 0 0 0 0
est de rang 2, ce qui montre que le système est contrôlable. Enn, l'expression de z résulte de la
formule de Duhamel car on a ż(t) = −iz(t) + iu(t).
Pour la suite de l'exercice, on xe T = π. On souhaite minimiser dans V
le critère
Question 2. =
L2 ([0,T ]; R)
Z T
1 1
J(u) = u(t)2 dt + x(T )2 + v(T )2 .
2 2
Formuler ce problème sous forme de système LQ. A-t-on existence et unicité du contrôle optimal
0
d'après le cours, le contrôle optimal est donné par u (t) = −R B p(t) = −p (t). D'où u (t) =
∗
−1 †
− (q(t) − q(t)).
∗ v ∗
1
2i
D'après le cours, l'état adjoint p(t) est tel que ṗ(t) = −A p(t) = Ap(t) sur [0,T ] et †
p(T ) = X(T ). En utilisant la représentation complexe, on obtient q̇(t) = −iq(t) et q(T ) = z(T ),
Correction:
d'où
q(t) = e −i(t−T )
z(T ) = −e z(T ) car T = π.
−it
4
Concernant la trajectoire optimale, on a
Z t
z(t) = e−it z0 + iei(s−t) u∗ (s) ds
0
Z t
−it
= e z0 − 2i 1
iei(s−t) (q(s) − q(s)) ds
0
Z t
= e−it z0 − 2i
1
iei(s−t) (−e−is z(T ) + eis z(T )) ds
0
Z t
−it 1 −it 1 −it
= e z0 + 2 e tz(T ) − 2i e z(T ) ie2is ds
0
= e−it z0 + 21 e−it tz(T ) − 1
2 sin(t)z(T ).
En t = T = π, il vient 1
z(T ) = − π z0 .
1+ 2
Pour z 0 ,
= 1 z(T ) est réel et on obtient
1 + 12 (π − t) 1
2 sin(t)
z(t) = e−it 1 + ,
1 + 2π 1 + 12 π
La trajectoire optimale est esquissée ci-dessous; noter que la vitesse v est minimale en t ∈ ]0, [ π
tel que tan(t ) = 2(1+ (π−t )) et que x s'annule en t ∈ ] , π[ tel que tan(t ) = −2(1+ (π−t )).
1 2
1 π 1
1 2 1 2 2 2 2 2
−(1 + 12 π)−1 1
x
déduire l'expression de la matrice P (t) ∈ R telle que p(t) = P (t)X(t) et écrire le contrôle
[0,T ] 2 2
2×2
optimal en boucle fermée. Écrire l'équation de Riccati satisfaite par P et en déduire les équations
diérentielles satisfaites par les fonctions a, c et d.
Correction: On exprime d'abord z(t) en fonction de z(T ) et de z(T ) :
z(t) = −e−it α(t)z(T ) − β(t)z(T ),
5
où on a posé comme suggéré α(t) = 1 + 1
2 (π − t) et β(t) = 1
2 sin(t) . En conjuguant, il vient
z(t) = −eit α(t)z(T ) − β(t)z(T ).
a+c d
P (t) = (t).
d a−c
On notera que cette matrice est bien symétrique. Le contrôle optimal en boucle fermée s'écrit
u∗ (t) = −d(t)x(t) − (a − c)(t)v(t).