Преобразования задач оптимального управления, упрощающие их решение (обзор) Цирлин А.М. Способы преобразования 1. Уменьшение размерности за счет изменения аргумента. 2.Уменьшение размерности за счет перевода части фазовых переменных в разряд управлений. 3. Построение оценочной задачи. 4. Поиск «инвариантов». 5. Переход к Ляпуновским уравнениям. 6. Переход от линейных ДУ к интегральным. Рассматриваемая задача и типовые предположения Замена аргумента Для автономных задач (время явно не входит в критерий оптимальности и в правые части ДУ) Одна из фазовых координат X1 на возможных решениях заведомо монотонна во времени Преобразованная задача: Число фазовых координат уменьшается на единицу. Оптимальное решение-как функция x1 (частичный синтез). Исходная задача может не содержать f1>0 (f1<0). Сделать замену переменных. Пример Эквивалентная задача Критерий оказывается монотонной функцией X1( Тау) Задачу надо решать только при условии (17) От вариационной Задачи ===к задаче НП с 1 переменной Задача оптимального быстродействия Заданы начальные условия и связь на правом конце Для ВСЕХ задач со связью dq/dt=p переход к полярным координатам дает монотонную переменную Решение с использованием ПМ Понтрягина сводится к краевой задаче из 4 ДУ, замкнутой условиями максимума по u и условиями трансверсальности на правом конце. Сделаем замену, чтобы впоследствии сократить размерность Запишем ДУ для новых переменных и эквивалентную задачу Преобразованная задача Отметим: правая часть первого уравнения положительна, а второе уравнение – Ляпуновское. Это позволяет заменить время на Z и отбросить второе уравнение, заменив его интегральным условием. Преобразованная задача 2 Задача вообще не содержит ДУ и всего лишь одно интегральное условие Ее решение НЕСРАВНЕННО проще, чем исходной u*(z) Перевод фазовой координаты в разряд управлений Прием В.Ф. Кротова для простейшей задачи (x-скаляр) dx/dt=v Если на х наложены ограничения, то максимум I по х ищется с их учетом, а затем реализующее это решение управление V. Если же управление ограничено, то из начальной и конечной точки x(0) и x(T) строится «внешняя допустимая область» и максимум по х ищется внутри ее. Полученное таким образом решение дает оценку значения задачи I* сверху. Далее покажем, что этот прием может быть использован в широком классе задач. Задачи, приводимые к простейшей ) I [ M ( x, t ) N ( x, t )dx ]dt max t K 0 T dx / dt v Оптимальное решение x 2. В задаче могут присутствовать интегральные условия того же вида Каждое из них приводится к виду (1э) получим задачу Лагранжа. Локально неулучшаемы Условия приводимости задачи Можно ли привести ее к простейшей?? 1. Существует u(v,x,t). 2.fo(x,u(v,x,t),t)=Mo(x,t) + No(x,t)v Задачи афинные по u Условия приводимости приводят к соотношениям Пример Q(x,t)—заданная функция Уравнение Миеле (Производная R по x =0) === Задачи, приводимые на части интервала управления Когда отрезок (t1,t2) стягивается в точку Переход к новым фазовым координатам Новые переменные В этих уравнениях x нужно выразить через y Пример После этой замены В этой задаче переменная y1 может быть переведена в разряд управления Оценочные задачи и обобщенные решения (А) В оценочной задаче первое из ДУ отсутствует ПРИМЕР. Решение оценочной задачи Рисунок и оптимальное решение исходной задачи Задача с неограниченным управлением Пусть в задаче А Тогда Сделаем замену y(x,z) Условия независимости y от v Одно из возможных решений –первый интеграл уравнения Задача примет вид Ляпуновские уравнения Правые части этих уравнений не содержат фазовых координат. Их можно заменить интегральными ограничениями. Например, dy/dt= yf(u,t) . Замена z=ln y превращает это уравнение в ляпуновское. Поиск «ИНВАРИАНТА» Законы сохранения (энергии, вещества, момента количества движения, энтропии в обрат.проц….) Пример: Мы можем выразить любую фазовую переменную через X и остальные, сократив размерность. Это задача управления ансамблем квантовых осцилляторов, а Х-однозначно связана с ее энтропией. Замена системы ЛДУ интегральным 1.Некоторые сведения из теории линейных неавтономных дин.сист. 2. Как перейти от системы ЛДУ к формуле свертки? Пример. 3. Принцип максимума для связей в форме интегральных уравнений: 4. Примеры: Задача Булгакова 1. Постановка с использованием ДУ x(T ) max, x x0, dxi / dt xi 1 xi (0) n 0, i; i 0 ai xi u,| u`| 1 Схема решения: Привести уравнение к системе n уравнений, составить функцию Н, решить совместно 2n ДУ с краевыми условиями. Решение задачи Булгакова 2. Решение с использованием уравнения свертки Получить передаточную функцию W ( s) 1 ai s i i По известным правилам найти для нее оригинал по Лапласу k(t). Например, для W(s)=1/(s+b ) k(t)=exp(-bt) Для уравнений с запаздывающим на z аргументом W1(s)=W(s)exp(-sz) k1(t)=k(t-z) T x(T ) k (T t )u(t )dt, k (t ) 0t 0 0 Управление линейной системой с квадратичным функционалом Самая простая постановка Эквивалентная задача x(t)-x(0)= Здесь h(t) –единичная функция (Хевисайда), поэтому верхний предел можно взять равным t. Условия оптимальности для связей в форме интегральных уравнений (Бутковский,Цирлин): Найдутся не равные нулю одновременно L0 и L(α) такие, что L0=0 или --1, а обобщенная функция Лагранжа R на оптимальном решении стационарна по x и максимальна по u. Нижний предел интеграла фактически равен t. Так как функция Хевисайда равна 1, то Так что, если часть уравнений линейные, их можн заменить уравнением свертки, составить обобщенную функцию Лагранжа R для условий в форме интегральных и дифференциальных уравнений и потребовать ее стационарности по X(t) и максимума по u(t) Обобщение Эквивалентно Решение ничем не отличается от простой задачи с заменой функции Хевисайда на K(t). Для линейных систем с переменными коэффициентами импульсная Функция заменяется функцией Грина k(t,τ). Задача Локуциевского 1.Постановка с использованием ЛДУ Оптимальное управление u*=Sign pq. 2. Постановка с использованием интеграла свертки (t ) q1 x(t ) x0 u( )d ( q 1)! 0 t