Введение в оптимальное управление

реклама
Московский государственный технический университет
имени Н.Э. Баумана
Факультет «Фундаментальные науки»
Кафедра «Вычислительная математика и математическая физика»
А.Ю. Бушуев
Введение в оптимальное управление
Электронное учебное издание
Методические указания к выполнению индивидуальных домашних заданий
по дисциплине «Оптимальное управление»
Москва
(С) 2013 МГТУ им. Н.Э. БАУМАНА
2
УДК 517.97;519.85
Рецензент: проф., д.т.н. Сидняев Н.И.
Бушуев А.Ю
Б Введение в оптимальное управление. Электронное учебное издание. - М.: МГТУ имени
Н.Э. Баумана, 2014. 23 с.
Методические указания призваны помочь студентам по направлению подготовки
«Математика и компьютерные науки» при выполнении индивидуальных домашних заданий по
дисциплине «Оптимальное управление». Приведены краткие теоретические сведения по
аналитическим методам решения задачи Лагранжа с использованием принципа Лагранжа и
принципа максимума Понтрягина и примеры решения задач оптимального управления.
Рассматривается линеаризованный принцип максимума, на основе которого строятся
градиентные методы решения задач оптимального управления. Приведены
варианты
индивидуальных домашних заданий.
Для студентов направления подготовки "Математика и компьютерные науки",
специальности "Прикладная математика", а также студентов машиностроительных
специальностей.
Рекомендовано
учебно-методической
комиссией
«Фундаментальные науки» МГТУ им. Н.Э. Баумана
факультета
Электронное учебное издание
Бушуев Александр Юрьевич
ВВЕДЕНИЕ В ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ.
© 2013 МГТУ имени Н.Э. Баумана
Введение в оптимальное управление. Бушуев А.Ю.
3
Оглавление
ВВЕДЕНИЕ.................................................................................................................................................. 4
1. Вариационный метод в оптимальном управлении .............................................................................. 4
2. Принцип максимума Понтрягина .......................................................................................................... 7
3. Пример решения задачи Лагранжа. .....................................................................................................11
4. Пример решения задачи оптимального быстродействия ..................................................................15
5. Градиентные методы решения задач оптимального управления, использующие
линеаризованный принцип максимума ...................................................................................................18
6.Вопросы для самоконтроля ...................................................................................................................24
ПРИЛОЖЕНИЕ. ........................................................................................................................................24
Список литературы ...................................................................................................................................30
Введение в оптимальное управление. Бушуев А.Ю.
4
ВВЕДЕНИЕ
Методические указания призваны помочь студентам по направлению подготовки
«Математика и компьютерные науки» при выполнении индивидуальных домашних
заданий по дисциплине «Оптимальное управление».
Целью выполнения работы является приобретение начальных навыков по
аналитическому решению задач оптимального управления с использованием принципов
Лагранжа и максимума Понтрягина и освоение градиентных методов на основе
линеаризованного принципа максимума.
1. Вариационный метод в оптимальном управлении
Задача Лагранжа в форме Понтрягина [1].
Рассмотрим задачу вида:
Ф  x, u  
t1
F  t, x, u 
0
dt  min
(1)
t0
где x   x1 ,, xn  , u   u1 ,, ur  x  f  t , x, u 
T
T
(2)
С граничными условиями:
ξ  x  t0    0, η  x  t1    0
(3)
где ξ  ξ1 ,..ξ k  , η  η1 ,..ηe  , k,e  n .
T
Предполагается,
T
что
все


функции F0 , fi  i  1, n  , ξ, η


дважды
непрерывно
дифференцируемы, f  x   C ' t1 , t2  , R n  , u  t   (C t1 , t2  , R r ) .
В такой постановке задача Лагранжа отличается от задач оптимального управления
только классом допустимы функций (в задаче оптимального управления фазовые
координаты x  t   PC ' являются кусочно-гладкими функциями, а управление u  t   PC
кусочно-непрерывными функциями), а так же отсутствует ограничение на фазовые
координаты и управления.
Применим для решения задачи (1-3) метод Лагранжа.
Составим вспомогательный функционал.
Введение в оптимальное управление. Бушуев А.Ю.
5
t1
Ф  x, u   L dt   T   x  t0    T  x  t1   ,
(4)
0
где L(t , x, x, u )  F0  t , x, u   i  t   xi  fi  t , x, u    F0  λT  x  f  

i 1
n
(5)
−лагранжиан задачи;
  t    1  t  ,, n  t   ,    1 ,, k  ,    1,, e  - множители Лагранжа.
T
T
T
Обобщая теорему о необходимых условиях в задаче Лагранжа на случай граничных
условий вида (3) можно сказать, чтобы найти экстремум задачи Лагранжа (1-3), нужно из
экстремалей вспомогательного функционала (4) выбрать те, которые удовлетворяют
граничным условиям (3) и дифференциальным связям (2).
Уравнения для определения экстремалей (1-3) имеет вид:
d '

L
'

Lx  0, i  1, n
x

 i dt j

 L'  d L  0, j  1, r
u
u

 j dt j
(6)
Или учитывая вид лагранжиана L:

'
T '
 'i   F0  xi   f xi , i  1, n

  F '   T f '  0, j  1, r
uj
 0 u j

где f x'i  f1'xi , f 2' xi ,, f nx' i

fu' j  f1u' j , f 2'u j ,, f nu' j

T

T
,
(7)
, i  1, n ,
, j  1, r .
Условия трансверсальности имеют вид
 i  t    T ξ 'x 
i 


T '
 i  t   ηxi 
t  t 0 
t  t1
0
0
(8)
Итак, для определения экстремалей задачи Лагранжа в форме Понтрягина нужно к
уравнениям Эйлера (7) добавить условия трансверсальности (8), дифференциальные связи
(2) и граничные условия (3).
Рассмотрим задачу оптимального управления со смешанным функционалом
Больца:
Введение в оптимальное управление. Бушуев А.Ю.
6
t1
ФB  x, u   F0  t , x, u  dt  Тˆ  x  t0    T  x  t1  
(9)
t0
с дифференциальной связью (2) и граничными условиями (3)
Вспомогательный функционал для этой задачи имеет вид:
t1
ˆ  x, u   L dt   T   x  t    T  x  t    Tˆ  x  t    T  x  t   ,

B
0
1
0
1

t0
n
где лагранжиан L  F0  i  t  ( xi  fi )
i 1
и терминант
Уравнения Эйлера те же (7), но условия трансверсальности другие за счет
терминальных слагаемых 𝑇 и 𝑇 в функционале Больца:
или
i  t   Gx' i   0, i  i, n
|t t1
i  t   (  T  x' i  Tx'i )   0, i  i, n
|t t0
(10)
i  t   ( T x' i  Tx'i )   0, i  i, n
|t t1
Если граничное условие (3) отсутствует, то получаем задачу со свободными
концами, условия трансверсальности для которой имеет вид:
i (t )  Tx'i 
t t0
i (t )  Tx'i 
t t1
 0, i  1, n
(11)
 0, i  1, n
Применяя принцип Лагранжа для случая, когда отрезок t0 , t1  может изменяться,
получим для решения задачи Лагранжа (1-3) дополнительно к уравнениям Эйлера (7) и
условиям трансверсальности (8), недостающие условия для определения 𝑡0 и 𝑡1 :
n


L

xi L' 


xi
i 1


n


L

xi L' 


xi
i 1


t t0
t t1
0
0,
Введение в оптимальное управление. Бушуев А.Ю.
(12)
7
где L'  i , i  1, n
xi
2. Принцип максимума Понтрягина
Постановка задачи.
Пусть математическая модель
объекта управления описывается системой
уравнений:
x t   f t, x t  , u t 
(1)
С начальным условием:
x  t0   x0 , где
(2)
x∈ 𝐸 𝑛 – вектор состояния; u∈ 𝑈 ⊂ 𝐸 𝑛 – вектор управления;
E n - n – мерное евклидово пространство;
U-заданное множество допустимых значений управления;
t  T  t0 , t1  –отрезок времени функционирования системы;
f  t , x, u   C (T  E n U , R n ) вместе с частными производными.
𝑡0 - момент начала процесса.
𝑡1 − моментом достижения точкой 𝑡, 𝑥 𝑡
заданной поверхности S  E n1 .
S  {(t1 , x) | gi (t1 , x)  0, i  1, e, t1  (t0 , ), x  E n }
Т.е. в момент 𝑡1 должно выполняться условие:
gi  t1 , x  t1    0,
j  1, e
0  e  n 1
(3)
𝑔𝑖 𝑡1 , 𝑥 – непрерывно дифференцируемы.
Система векторов {
gi  t1 , x 
x1
,,
gi  t1 , x  gi (t1 , x)
,
}, j  1, e – линейно-независимая
xn
x1
  t1 , x   E n1
Определение. Множество допустимых процессов
𝐷 𝑡0 , 𝑋 0
- множество троек
{t1 , x(), u()} ( t  T ; x  t   E n , u  t  U ) , где
x(∙) непрерывные и кусочно-дифференцируемые функции и u(∙) – кусочнонепрерывные функции, удовлетворяющие уравнению (1) с начальными условиями (2)
почти всюду на множестве T и условию (3).
Функционал, характеризующий качество управления (функционал Больца):
Введение в оптимальное управление. Бушуев А.Ю.
8
t1
Ф  t1 , x, u   F0  t , x  t  , u  t   dt  G  t1 , x  t1  
(4)
t0
𝐹0 , 𝐺 - заданные непрерывно-дифференцируемые функции.
Требуется найти тройку d *  t1* , x*  , u*   D(t0 , x ) такую, что
Ф  d *   min Ф(t1 , x, u)
(5)
dD
𝑡1∗ - оптимальный момент окончания процесса.
Теорема. ( Принцип максимума Понтрягина) [2]
d *   t1* , x*  , u*   D(t0 , x )
Пусть на тройке
достигается
минимум
функционала Больца (5). Тогда  такой вектор Ψ  t    Ψ1  Ψ  ,,Ψn  t   , для которого
T
*
*
в каждой точке непрерывности управления u (t ) функция H (t, (t), x (t), u)
1)
достигает максимума по управлению:
max H (t , (t ), x* (t ), u(t ))  H (t , (t ), x* (t ), u* (t ))
uU
,
n
где
H (t , , x, u )    j f j (t , x, u )  F0 (t , x, u)
j 1
выполняется условие трансверсальности:
2)
 G  t   H  t   t1  Ψi  t1*  δx i  0
n
*
1
*
1
i 1
при ∀𝛿𝑡1 и 𝛿𝑥𝑖 , удовлетворяющих системе:


 g  t , x  t    0, j  1, e
где H  t   H  t , Ψ  t  , x  t  , u  t  
G  t   G  t , x  t   , а вариации определяются так:
G  t , x  t  
G  t , x  t  
 G t   G t , x t  
t 
x
t
x
 gi t1* , x*  t1*   0, j  1, e
*
1
i
*
*
1
*
1
*
1
*
1
*
1
*
1
*
*
1
*
1
*
*
1
*
*
1
*
*
1
*
1
*
*
1
*
1
n

 g j t , x t
*
*
1
 
*
*
1
1
i
i 1
1
*
1
*
1

g j t1* , x*  t1* 
t1
 t 
1

n
g j t1* , x*  t1* 
j 1
xi

i
 x
3) Удовлетворяется система канонических уравнений:
Введение в оптимальное управление. Бушуев А.Ю.
i
9
x t  

i
H  t ,   t  , x*  t  , u *  t  
 i
 t  

i
 f i  t , x*  t  , u *  t   , xi*  t0   xi i  1, n
H  t ,   t  , x*  t  , u *  t  
xi
, i  1, n
𝛹𝑖 - вспомогательные (сопряженные) переменные.
Замечание.
1. В частном случае задания множества S, когда количество ограничений равно
𝑙 = 𝑘 + 1, момент времени 𝑡1 = 𝑇1 задан и фиксировано 𝑘 координат
xi  t1   xi1 , i  1, 2,, k ; 0  k  n,
вектора 𝑥 𝑡1 ,функции gi (t1 , x) имеет вид:
gi  t1 , x   xi  xi1  0, i  1, k
gk 1  t1 , x   t1  T1  0
Здесь при 𝑘 = 𝑛 правый конец траектории фиксирован, а при 𝑘 = 0 свободен.
Отсюда следует, что  δxi  0, i  1, k ,  t1  0
t1
Задача записывается в форме Ф  d   F0  t , x  t  , u  t   dt G  x  t1    min
t0
 x   , u   
Решением является пара
*
*
оптимальная траектория и оптимальное
управление.
2. Если начальное
состояние и момент начала процесса 𝑡0 не заданы, а
определяются вместе с конечными состояниями соотношениями:
gi (t0 , x  t0  , t1 , x(t1 ))  0, j  1, e , то терминальный член может задаваться в виде
суммы G0  t0 , x  t0    G1  t1 , x  t1  
Тогда условие трансверсальности имеет вид:
n
n

 
*
*
*
*
*

G
t

H
t

t

Ψ
t
δx
–

G
t

H
t

t

 1  1  i  1  it1   0  0   0  0 Ψi  t*0  δxit0   0
 1 1 
i 1
i 1

 

При


 g j t0* , x*  t0*  , t1* , x* (t1* )  0,


g j t0* , x* t0*  , t1* , x* (t1* )  0,
Решение в этом случае есть (t0* , t1* , x*  , u* 
Введение в оптимальное управление. Бушуев А.Ю.
j  1, e
10
3. Если на управление нет ограничений U  E r , то максимум гамильтониана H
ищется с помощью необходимых и достаточных условий безусловного экстремума.
4. Если математическая модель объекта управления
описывается линейным
дифференциальным уравнением, а функционал качества квадратичный, принцип
максимума является необходимым и достаточным условием оптимальности.
5. В общем случае следует записывать гамильтониан в виде
И при решении задач рассматривать 2 случая:
Можно показать, что тогда можно положить  0  t  1
Введение в оптимальное управление. Бушуев А.Ю.
и 𝛹0 𝑡 ≢ 0
.
11
3. Пример решения задачи Лагранжа.
Рассмотрим применение принципа Лагранжа для следующей задачи:

2
u dt  extr
2
0
x  x  u,
 
x1  0   x2  0   0, x1    1
2
Решение
Предварительно задачу нужно привести к задаче Лагранжа.
1. Вводим
.
Тогда система примет следующий вид:
 x1  x2 ,


 x2  u  x1 ,

x  0  x  0  0
 
x  1
2
1  x1  0   0  0
2  x2  0   0  0
 
1  x1    1  0
2


2  0
2. Вспомогательный функционал:

 
Ф   u 2  1  t  x1  x2   2 ( x2  u  x1 )  dt  1 x1  0   2 x2  0   1 ( x1    1)
2
0
2
3. Уравнения Эйлера:
2  t   1  t   0,
1  t   2  t   0,
2u  2  t   0.
4. Условия трансверсальности:
 
 
1  0   1 , 2  0   2 , 1     1 , 2    0
2
2
Введение в оптимальное управление. Бушуев А.Ю.
12
1  t   2  t   1  t   2  t 
2  t   2  t   0
2  t   Asint  Bcost
Используя условия трансверсальности, получаем 2  t   B cos t
u*  t   Ccost.
5. x  x  Ccost
xx 0
x  t   C1sint  C2cost
x  t   C1cost  C2 sint , x  t   C '1cost  C '2 sint  C1sint  C2 cos t
C '1cost  C '2 sint  Ccost

'
'
 C 1sint  C 2cost  0
1
1
C1'  Ccos 2t  C1  cos 2tdt  Ct  Csin2t  C1
2
4
1
1

1

6. x  t    Ct  Csin2t  C1  sint   Ccos 2t  C 2  cos t
4
2

4

1
1
  
x  0   C  C 2  0, x  0   C  C 2  0, x     C1  1
4
4
2 4
1
1
1

1

1

 1

x  t   cost  Ct  Csin2t  C1   sint  C  Ccos 2t   sint  Ccos 2t  C 2   cost   Csin2t 
4
2
2

2

4

 2

1
4
x  0   C1  0  C 2   , C 


1 4
1
2
1 4

1 4
x  t     t   sin2t  sint    cos 2t   cost  t sin t
4 


2 

4 
Рассмотрим применение принципа максимума Понтрягина для решения задачи
оптимального управления с ограничениями на фазовые координаты и управления:
1
 (u )   x1 (1)dt  min
0
Введение в оптимальное управление. Бушуев А.Ю.
13
 x1  x2

 x2  u
u (t )  2
g1  x1 (0)  x1 (1)  0
g 2  x2 (0)  x2 (1)  0
Решение:
H   x1  1 x2  2 u
u   arg max 2sign 2 при u (t )  2
 1  1
  
 2
1


x

x
2
 1
 x 2  2 sign 2
Условие трансверсальности:
 H (t1 ) |T t1  x  0
 1x1 |t 1  2x2 |t 1  1x1 |t 0  2x2 |t 0  0
g1  x1 (0)  x1 (1)  0

g 2  x2 (0)  x2 (1)  0
Значит:
 x1 (1)  x1 (0)

 x 2 (1)  x 2 (0)
( 1 (1)  1 (0))x1 (1)  ( 2 (1)  2 (0))x2 (1)  0
 1 (1)   1 (0)  0
(1)

 2 (1)   2 (0)  0
 1  t  c1


t2



 c1t  c 2
 2
2

Из (1) находим с1=-1/2 и с2=0, а значит
1

 1  t  2

2
   t  1 t
 2
2 2
Введение в оптимальное управление. Бушуев А.Ю.
14

Отсюда следует, что оптимальное управление равно u  2
Тогда
 x1  x 2

 x 2  2

t2
x

2
 c1t  c 2
 1
2

 x  2t  c
1
 2
Очевидно что c1  1, c2  0
Таким образом, оптимальная траектория
*
2

 x1  t  t
 *

 x2  2t  1
Введение в оптимальное управление. Бушуев А.Ю.
15
4. Пример решения задачи оптимального быстродействия
Рассмотрим применение принципа максимума на примере решения простейшей
задачи оптимального быстродействия.
Найти оптимальное по быстродействию управление u*  t  , соответствующую ему
траекторию x*  t  и время T, затрачиваемое на переход из состояния
x1  0   0, x2  0   4 в начало координат для математической модели объекта
управления, описываемой системой дифференциальных уравнений.
x1  t   x2  t 
x2  t   u  t 
x   x1 , x2 
, u 0
T
t [0, T ]
Сформулируем проблему в виде задачи Лагранжа
T
Ф  dt  min, гдеT  не задан
0
f1  x2 , f 2  u, F0  1 , h( x)
Г.у.
x1  0   0 , x2  0   4
x1 T   0 , x2 T   0
1.)
Гамильтониан H  i fi  F0 1 x2   2u  1
2.)
Находятся условия max H  arg max H  t1 , Ψ  t  , x  t  , u   1 sign Ψ 2
3.)
Канонические уравнения принципа максимума
|u|1
x1 0   0 , x1 T   0
x1*  x2
x2*  u*  sign  2  t 
1*  t   
4.)
H
0 ,
x1
x2  0  4
*2  t   
; 2 T   0
H
 1
x2
Проверка условий трансверсальности.
r



G

H
t

t

 i  t1   xi   0



1
1

i 1


H  T   H T ,   T  , x  T  , u T    0
 G  0, x1   x2  0
5.)
t1  T
Решаем двухточечную краевую задачу.
Оптимальное управление имеет вид:
Введение в оптимальное управление. Бушуев А.Ю.
16
u*  t   sign  2  t   sign  C1t  C2 
Так как
является
 2 (t ) меняет знак не более одного раза, то оптимальное управление
кусочно
постоянной
функцией, имеющей
не
более
двух
интервалов
знакопостоянства: либо u*  t   1 , либо u*  t   1 .
Построим фазовый портрет. Для этого получим уравнение траекторий системы на
фазовой плоскости 𝑜𝑥1 𝑥2 .
x1*  t   x2  t  , x2*  t   u (t )
dx1 x2
x
x2

 d x1  2 dx2  x1  2  C
dx2 u
u
2u
На 1-ом отрезке разрыв кривой u*  1, на 2-ом u*  1 T  t1  t2
Найдем суммарное время T на переход из точки x   0, 4  в начало координат.
T
t1  время движения сu*  1, t2  время движения сu* 1
На 1-м участке)
x1*  t   x2  t 
x2*  t   u  1
 x2  t   t  c1 , x1  t  
t2
 c1t  c2
2
t2
 4t
При t=0 x2  0   c1  4 , x1  0   C2  0 
2
x2  t   t  4
x1  t  
На 2-м участке:
x1*  t   x2  t 
x2*  t   u  1
 x2  t  c1 , x1  t   
Введение в оптимальное управление. Бушуев А.Ю.
t2
 c1t  c2
2
(∗∗)
(∗)
17
При 𝑇 = 𝑡1 + 𝑡2 траектория должна попасть в начало координат 0,0 𝑇 :
2

t1  t2 

x1  t1  t2   
 c1  t1  t2   c2  0


2

2
t1  t2 


x2  t1  t2     t1  t2   c1  0  c1  t1  t2 , c2  


2
В силу непрерывности траектории при 𝑡 = 𝑡1
t  t 
t2
t2
x1  t1   1  4t1   1   t1  t2  t1  1 2
2
2
2
2
x2  t1   t1   t1  t1  t2  t2  t1  4
t12  8 t1  8  t1  4  2 2, t2  t1  4  2 2
Окончательно получим минимальное время процесса:
T  t1  t2  4 2  4
Введение в оптимальное управление. Бушуев А.Ю.
18
5. Градиентные методы решения задач оптимального управления, использующие
линеаризованный принцип максимума
Рассмотрим задачу Больца со свободным правым концом:
t1
(u)   F (t , x, u)dt  G( x(t1 ))
(1)
t0
x  f (t , x, u) x(t1 )  X ' u (t ) U
Пусть справедливы следующие ЛП- условия (условия линеаризованного принципа
максимума) [5]:
f  ( f1 ,..., f n ) - непрерывна по ( x, u, t ) вместе с частными производными по
1)
x и удовлетворяет условии Липшица по X с одной константой L для u U , t [t1 , t2 ]
|| f (t , x  x, u) - f (t , x, u) || L || x ||
Скалярные функции
2)
G(x) и
F(t,x,m) непрерывны по своим аргументам
вместе с частными производными по x .
Множество U  E r - выпуклое.
3)
f (t , x, u), F (t , x, u) дифференцируемы по u
4)
Справедлив линеаризованный принцип максимума:
Пусть в задаче (1) – (2) справедливы ЛП - условия и допустимый процесс (u, x)
оптимален.
Тогда в каждой
точке
t   [t0 , t1 ]
этот
процесс
линеаризованному условию принципа максимума:

 H (t , , x* , u* ) *
H
, u (t )  maxU 
(t , , x* , u* ),   (3)
u
u
C функцией   (t ) удовлетворяющей сопряженной задаче:
 G( x* (t2 ))
 H(t , , X * , u* )

,  (t1 )  
(4)
x
x
Введение в оптимальное управление. Бушуев А.Ю.
удовлетворяет
19
Рассмотрим
методы
последовательных
приближений
для
поиска
управлений, удовлетворяющих линеаризованному принципу максимума. Эти методы
используют информацию о градиенте
H 'u функции Понтрягина и применяются для
решения конечномерных задач максимизации гамильтониана в точках [t0 , t1 ] .
5.1 Метод условного градиента
Пусть на k-й итерации имеется допустимое управление u k (t ) c соответствующей
фазовой
и
сопряженной
траекториями
x k (t )
и
 k (t ) ,
t [t1 , t2 ] .
Определим
вспомогательное управление
k
u (t )  argmaxU  H 'u (t ,  k (t ), xk (t ), u k (t )),  
Подсчитаем величину:
t1
 (u k ) =   H 'u (t ,  k (t ), x k (t ), u k (t )), u (t )  u k (t ) dt  0
k
t0
Если  (u k )  0 , то u k удовлетворяет линеаризованному принципу максимума,
иначе образуем
 -параметрическое семейство управлений (выпуклую комбинацию
управлений
k
u k и u ):
(k )
u( k ) (t )  u ( k ) (t )   (u (t ) -u ( k ) (t )), t [t1 , t2 ],  [0,1]
Тогда очередное (k+1)-е приближение ищется в виде:
u ( k 1) (t )  u( kk ) (t ) , t [t0 , t1 ]
Где  k - решение задачи одномерного поиска:
(uk )  min ,  [0,1]
Пример 1.
2
(u )   ( x 2 (t ) - u 2 (t ))dt 0
1
x(2)  min
2
x  u, x(0)  0,| u(t ) | 1
Введение в оптимальное управление. Бушуев А.Ю.
20
Выполнить одну итерацию метода условного градиента для заданного начального
приближения:
u о (t )  0, t [0, 2]
Решение:
Функция Понтрягина: H (t , , x, u)   i fi - F   u - x 2  u 2
1)
2) H 'u    2u
3) Сопряженное уравнение:   2 x, (2) 
1
2
4) Найдем фазовую и сопряжѐнную траектории:
1
 о (t )  , t  [0, 2]
2
xо (t )  0 ,
5) Сформируем вспомогательное управление:
 (u о ) 
6)
1 2
dt  1  0
2 0
1
(1  u о )dt
0 2

1
7) Определим  - параметрическое семейство управлений:
(k )
u( k ) (t )  u ( k ) (t )   (u (t ) - u ( k ) (t ))
uо  0   (1  0)  
0    1, t [0, 2]
Задача одномерного поиска:
0   1
(uо )  min
Найдем представление для функции (uо ) .
Для этого решим задачу Коши:
x   , x(0)  0
x(о )   t , t [0, 2] 
2
1
(u ) =  [( x (t ))  (u (t )) ]dt  ( x( о) (2))   ( 2t 2   2 ) dt
0
2
0
о
2
(о)
2
( о)
2
Введение в оптимальное управление. Бушуев А.Ю.
21
2
3
     2  min 0 1   0 
3
4
3
u1 (t )  uоо  о ,таким образом, u '(t )  , t [0, 2]
4
Тогда
5.2 Метод проекции градиента
Пусть на k-м шаге итерационного процесса имеется допустимое управление
u* (t ), t [t1 , t2 ] u  0,1... . Найдем соответствующие решения
xk (t ),  k (t ), t [t1 , t2 ]
фазовой и сопряженной задачи.
k
Образуем вспомогательное управление u (t ) по правилу:
k
u (t )  P (u k (t )  Hu (t ,  k (t ), x k (t ), u k (t )) t [t1 , t2 ]
P - оператор проектирования на множество U в евклидовой метрике.
Вычислим величину:
t1
 (u k )   H u (t ,  k (t ), x k (t ), u k (t )), u (t )  u k (t )  dt  0
k
t0
Если  (u k )  0 , то управление u k удовлетворяет линеаризованному принципу
максимума.
Если же  (u k )  0 , то формируем  - параметрическое семейство управлений:
k
k
u( k )  (1   )u k   u  uk (t )  u k (t )   (u (t ) -u k (t )) t [t1 , t2 ]
Очередное (k+1)-е приближение определяется по форме:
u ( k 1) (t )  ukk (t ) , t [t1 , t2 ]
Где  k - решение задачи одномерной оптимизации (uk )  min[0,1]
Выполним одну итерацию для начального приближения u о (t )  0 .
1
(u)   x(t )(3u(t )  1)dt  2 x(1)  min; xо (t )  u, x(0)  1
0
| u(t ) | 1
1.)
Функция Понтрягина
H (t , , x, u)   u  3ux  x
| u(t ) | 1
Введение в оптимальное управление. Бушуев А.Ю.
22
2.)
Сопряжѐнная задача:    H 'x  3u  1 , (1)  2
 (t1 )  
 G( x(t1 ))
x
 (t1 )  
 h( x(t1 ))
x
3.)
Находим
фазовую
и
сопряженную
траектории,
соответствующие
управлению u о :
xо (t )  1; о (t )  3  t , t [t0 , t1 ]  [0,1]
4.)
Формируем задачу поиска вспомогательного управления:
u о  H 'u  3x  ,   3  t
о
u  P|u|1 (t ), t [0,1] . Тогда u о (t )  t .
 (u k )   t1  H 'u (t , k , x k , u k ), u
t0
0
1
   3  3  t , t  0  dt   t 2 dt 
0
0
(k )
1
-u ( k )  dt   3x ( о )  ( о ) , u
0
(о)
 u ( о )  dt 
1
0
3
u (1) (t )  u 00 (t )  0t ,
где  0 - решение задачи одномерной минимизации (uо )  min 0    1
Чтобы найти явное выражение для функции
(uо ) от параметра
задачу Коши и
определим xо (t ) , t [t0 , t1 ] .
1
x   t , x(0)  1 . Отсюда, xо (t )  1   t 2 .
2
1
(uо ) =  x1о (t )[3uо (t )  1)]dt - 2 xо (1) 
0
Введение в оптимальное управление. Бушуев А.Ю.
α, решим
23
1
1
3
1
 (1   t 2 )(3 t  1)dt +  2   2    3  min 0 1
0
2
8
3
Таким образом,  0 
4
4
и искомое управление: u (1) (t )  t
9
9
Введение в оптимальное управление. Бушуев А.Ю.
24
6.Вопросы для самоконтроля
1. Сформулируйте принцип Лагранжа.
2. В чем состоит метод Лагранжа?
3. Постановка задачи Лагранжа в форме Понтрягина.
4. Постановка задачи оптимального управления.
5. В чѐм отличие задачи Лагранжа в форме Понтрягина от задачи оптимального
управления?
6. Что называется функцией Гамильтона?
7. Сформулируйте принцип максимума Понтрягина.
8. Выпишите условия трансверсальности.
9. Как ставиться простейшая задача оптимального быстродействия?
10. Сформулируйте линеаризованный принцип максимума.
11. Условия применения линеаризованного принципа максимума.
12. Приведите алгоритм метода условного градиента.
13. Приведите алгоритм метода проекции градиента.
ПРИЛОЖЕНИЕ
Индивидуальное домашнее задание № 1
Задача 1. Используя принцип Лагранжа и принцип максимума Понтрягина решить
задачу Лагранжа
Вариант
Условие задачи
1
1
 u dt  min, x -x  u, x(0)  1
2
 u dt  min, x -x  u, x(0)  1, x(0)  0
2
0
1
2
0
Введение в оптимальное управление. Бушуев А.Ю.
25
1
3
 u dt  min, x -x  u, x(0)  1, x(1)  sh1, x(1)  ch1  sh1
4
 u dt  min, x -x  u, x(0)  x(0)  0, x(1)  sh1, x(1)  ch1  sh1
2
0
1
2
0
1
 u dt  min, x +x  u, x(0)  1
5
2
0
1

 u dt  min, x +x  u, x(0)  0, x(0)  0, x( 2 )  1
6
2
0

7

2
0

8

2
0


 (x
1
11
12
13
 (x
0


2
0


2
0


2
0

 u 2 )dt  min, x  x  u, x(1)  1
2
 2u 2 )dt  min, x 
u 2 dt  x 2 (0)  min, x +x  u

u 2 dt  x 2 (0)  min, x +x  u, x( )  1
2


15
 u dt  x (0)  min, x  x  u
16
17

u 2 dt  x 2 (0)  min, x +x  u, x( )  0, x( )  1
2
2

1

x
 u, x(0)  1
2
14
2
0

2
0
10

u 2 dt  min, x +x  u, x( )  0, x( )  1, x(0)  0, x(0)  
2
2
2
1
9

u 2 dt  min, x +x  u, x(0)  x( )  0, x( )  
2
2
2

u 2 dt  x 2 (0)  min, x +x  u, x( )  x(0)  0, x( )  1
2
2
2
2
0
1
 u dt  x (0)  min, x  x  u, x(0)  1
2
2
0
1

 u dt  x (0)  min, x  x  u, x(0)  0, x( 2 )  1
2
2
0
Задача 2. Решить задачу оптимального быстродействия
Вариант
Введение в оптимальное управление. Бушуев А.Ю.
Условие задачи
26
1
T  min | x | 2 , x(1)  1 , x(T )  1 , x(1)  x(T )  0
2
T  min 3  x  2 , x(0)  3 , x(T )  1 , x(0)  x(T )  0
3
T  min 0  x  1 , x(0)  1 , x(0)  2 , x(T )  x(T )  0
4
T  min | x | 2 , x(0)  x(T )  0 , x(0)  1, x(T )  3
5
T  min 1  x  3 , x(0)  1 , x(0)  x(T )  0 , x(T )  1
6
 x1  x2  2
T  min 
, x1 (t0 )  x2 (t0 )  0 , x1 (T )  1 , x2 (T )  0,| u | 1
 x2  u
7
 x1  x2  2
T  min 
, x1 (0)  x2 (0)  0 , x1 (T )  2 , x2 (T )  0,| u | 2
x


x

u
1
 2
8
 x1  x2  1
T  min 
, x1 (0)  0, x2 (0)  4 , x1 (T )  x2 (T )  0
 x2   x1  u
9
 x1  x2  u1
T  min 
, x1 (0)  x2 (0)  2 , x1 (T )  6 , x2 (T )  2,| u1 | 2,| u2 | 2
 x2  x1  u2
10
 x1   x2  u1
T  min 
, x1 (0)  2, x2 (0)  2 , x1 (T )  2 , x2 (T )  10,| u1 | 2,| u2 | 2
 x2  x1  u2
11
T  min | x | 2 , x(1)  1 , x(T )  1 , x(1)  x(T )  0
12
T  min 3  x  2 , x(0)  3 , x(T )  1 , x(0)  x(T )  0
13
T  min 0  x  1 , x(0)  1 , x(0)  2 , x(T )  x(T )  0
14
T  min | x | 2 , x(0)  x(T )  0 , x(0)  1, x(T )  3
15
T  min 1  x  3 , x(0)  1 , x(0)  x(T )  0 , x(T )  1
16
 x1  x2  2
T  min 
, x1 (t0 )  x2 (t0 )  0 , x1 (T )  1 , x2 (T )  0,| u | 1
 x2  u
17
 x1  x2  2
T  min 
, x1 (0)  x2 (0)  0 , x1 (T )  2 , x2 (T )  0,| u | 2
 x2   x1  u
Введение в оптимальное управление. Бушуев А.Ю.
27
Индивидуальное домашнее задание №2
Задача 1.
Выполнить одну итерацию метода условного градиента и одну итерацию метода
проекции градиента.
Вариант
Условие задачи
1
2
4
(u)  3x1 (u )  x2 (4)   x1 (t )u(t )dt  min
0
1
x10  4u , x1 (0)  4 , x20 
| u | 1 , u (0) (t )  
(u ) 
2
1
x1 , x2 (0)  0
4
1
, t  [0, 4]
4
1
x2 (1)  2 x3 (1)  min
2
x0  u , x1 (0)  0 , x20  x12 , x2 (0)  0
1 | u | 2 , u (0) (t )  0 , t [0,1]
(u ) 
3
1 1 2
(x (t )  2u 2 (t ))dt  min
2 0
x0  2u , x (0)  0
| u | 1, u ( 0) (t )  1, t  [0,1]
(u ) 
4
1 2 
1

x1 ( )  x2 2 ( )  min
2
2 2
2
x10  x2 , x1 (0)  1 , x20   x1  u , x2 (0)  0

| u | 1 , u (0) (t )  0 , t  [0, ]
2
2
(u )  4 x(2)   x(t )(u(t )  2)dt  min
0
5
x0  2u , x1 (0)  0
1 | u | 3 , u (0) (t )  1 , t [0, 2]
Введение в оптимальное управление. Бушуев А.Ю.
28
Вариант
Условие задачи
1
2
3
(u )  4 x(3)  3 x(t )(u (t )  1)dt  min
0
6
x0  u , x(0)  0 ,1 | u | 3 , u (0) (t )  2 , t [0,3]
4
(u )  6 x1 (4)  x2 (4)  2 x1 (t )dt  min
0
7
x10  3u , x1 (0)  0 , x02  x1u 0 ; x2 (0)  0;| u | 2, u (0)  1 , t [0, 4]
(u)  x1 (1)  x2 (1)  min
8
x10  u , x1 (0)  0 , x02  2ux1 , x2 (0)  0,| u | 1 , u (0)  0 , t [0,1]
(u)  x3 (1)  min
9
x10  x2 , x1 (0)  0 , x0 2  u, x2 (0)  0, x03  ux1 , x3 (0)  0
| u | 1 , u (0) (t )  1 , t [0,1]
2
10
1
(u )   [ x 2 (t )  2(t  1)u (t )]dt  min
2
0
x0  u , x(0)  0 ,| u | 1 , u (0) (t )  0 , t [0, 2]
(u)  4 x1 (3)  x2 (3)  x3 (3)  min
11
x10  3u, x1 (0)  0, x20  2 x1u, x2 (0)  0 , x30  6 x1 , x3 (0)  0
3 | u | 1, u ( 0) (t )  2 , t  [0,3]
3
(u )  4 x(3)   x(t )(u (t )  1)dt  min
12
0
x0  u , x(0)  0 , 2 | u | 34, u (0) (t )  3 , t [0,3]
Введение в оптимальное управление. Бушуев А.Ю.
29
Вариант
Условие задачи
1
2
2
(u )  2 x1 (2)  x2 (2)  4 x1 (t )u(t )dt  min
0
13
x10  u , x1 (0)  0 , x20  4 x1 , x2 (0)  0
| u | 3 , u (0) (t )  1 , t  [0, 2]
2
(u ) 
14
3 2
x (2)   x(t )u (t )dt  min
2
0
x0  u  1 , x(0)  1 , 2 | u | 0 , u (0)  1 , t [0, 2]
3
(u )  x(2)  2 x(t )(u (t )  1)dt  min
15
0
x0  u , x(0)  0 ,| u | 2 , u (0) (t )  1 , t [0, 2]
4
(u )  3x1 (4)  x2 (4)  6 x2 (t )u(t )dt  min
16
0
x1  x2u , x1 (0)  0 , x2  2u, x2 (0)  0,| u | 1, u (0) (t )  1, t [0, 4]
Введение в оптимальное управление. Бушуев А.Ю.
30
Список литературы
1. Ванько В.И., Ермошина О.В., Кувыркин Г.Н. Вариационное исчисление и
оптимальное управление. М.: Издательство МГТУ им. Н.Э. Баумана, 2006.
2. Пантелеев А.В., Бортаковский А.С., Летова Т.А. Оптимальное управление в
примерах и задачах. М: Издательство МАИ, 1996.
3. Галеев Э.М. Оптимизация. Теория. Примеры. Задачи. М.: URSS, 2006.
4. Афанасьев В.Н., Колмановский В.Б., Носов В.Р.
Математическая теория
конструирования систем управления. – М.: Высшая школа, 2003.
5. Васильев О.В., Аргучинцев А.В. Методы оптимизации в задачах и упражнениях,
1999.
Введение в оптимальное управление. Бушуев А.Ю.
Скачать