2. ПРИМЕРЫ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ Пример 1 (Задача о мягком прилунении космического корабля). Теория оптимального управления нашла широкое применение в ракетодинамике. Вывод космических аппаратов на орбиту, маневры в космосе, посадка требуют решения ряда оптимизационных задач, связанных с минимизацией расхода топлива, минимизацией времени выхода в заданную точку траектории и т.п. Именно процессы движения управляемых летательных аппаратов описываются достаточно простыми и, вместе с тем, точными математическими моделями. Наличие хорошо разработанной ранее теории движения ракет позволило быстро и эффективно применить методы оптимального управления к решению ряда проблем в этой актуальной области техники. Предположим, что космический аппарат, который можно рассматривать как материальную точку, осуществляет мягкую посадку на Луну. Прилунение производится по вертикальной прямой, нормальной к поверхности Луны. Пусть начало координат совпадает с этой поверхностью, координатная ось направлена вертикально вверх. В начальный момент времени t0 0 космический корабль, находящийся на известной высоте h, обладает скоростью 0 и имеет массу m0 . В каждый момент времени t на аппарат действует сила притяжения Луны, направленная вертикально вниз и равная по абсолютной величине m(t ) g Л . Здесь m(t ) - масса аппарата, g Л — ускорение свободного падения на Луне, которое мы будем считать постоянным. При включенных двигателях действует сила тяги, направленная вверх и равная u (t ) , где u(t ) мгновенный расход топлива, 0 u (t ) umax ; - известный постоянный коэффициент. Связь изменения массы с расходом горючего определяется формулой m(t ) u (t ). Требуется найти режим расхода топлива, обеспечивающий нулевую скорость аппарата в точке прилунения и минимальные суммарные затраты топлива. Время посадки заранее не оговаривается. Перейдем к формализации поставленной задачи как задачи оптимального управления. Роль управляющего воздействия играет скалярная функция u u(t ) , стесненная ограничениями типа (1.2): 0 u (t ) umax , t [t0 , t1 ]. В качестве вектор-функции, характеризующей состояние процесса, выберем x ( x1 , x2 , x3 ). Здесь — x1 (t ) высота аппарата в момент t , x2 (t ) скорость, x3 (t ) масса аппарата. Тогда x1 x2 . Согласно второму закону Ньютона m(t ) x2 u (t ) m(t ) g Л x2 u (t ) x3 gЛ . По определению расхода топлива x3 u (t ). Приведенные три дифференциальные уравнения образуют систему (1.3), определяющую дифференциальную связь между состоянием и управлением. Ограничениями (1.1) являются начальные условия x1 (0) h, x2 (0) 0 , x3 (0) m0 и условия, обеспечивающие мягкое прилунение: x1 (t1 ) 0, x2 (t1 ) 0. Требуется минимизировать суммарный расход топлива, т.е. J [u, t1 ] m0 x3 (t1 ) min. Этот же функционал можно записать и в интегральном виде: t1 J [u, t1 ] u (t )dt. 0 Рассматриваемый пример представляет собой задачу Лагранжа с закрепленным начальным моментом t0 0, нефиксированным конечным моментом t1 , закрепленным левым концом траектории и подвижным правым концом. Интересна структура решения. Программа оптимального управления состоит из двух участков: свободное падение до момента t 0 при u(t ) 0, полное торможение на отрезке [t , t1 ] при u (t ) umax . Пример 2 (Оптимальное планирование поставки продукции). Рассмотрим процесс непрерывного производства и поставки продукции в течение периода времени [t0 , t1 ]. Спрос на продукцию определяется известной функцией r r (t ), t [t0 , t1 ]. Несовпадение объема поставки x(t ) и потребности r (t ) приводит к убыткам. Если (t ) x(t ) r (t ) 0 (имеет место дефицит), то убытки обусловлены неудовлетворенностью спроса и относятся к разряду упущенной выгоды (прибыли, которую можно было бы получить при другом планировании поставок). В случае превышения объема поставок над спросом ( (t ) 0) убытки вызваны порчей продукции, дополнительными расходами на хранение, на поиск других потребителей и т.п. Предполагается, что функция потерь f1 ( ) - известная зависимость: f1 ( ) 0 , если 0; f1 ( ) 0 , если 0. Дополнительные потери производителей продукции связаны с затратами на перестройку производства при изменении объемов поставки продукции. Эти потери равны нулю при постоянной интенсивности производства ( x(t ) 0 ). Функция убытков производителя f 2 ( x) представляет собой известную зависимость: f 2 ( x) 0 , если x 0; f 2 ( x) 0 , если x 0. Скорость изменения поставок не может быть произвольной, а находится в заданных пределах: A x(t ) B, t [t0 , t1 ]. (1.1) Требуется определить характеризующую поставки продукции функцию x x(t ), t [t0 , t1 ], для которой сводятся к минимуму суммарные потери, связанные с возможным несовпадением объема поставок и спроса, а также с возможными перестройками производства в течение периода времени [t0 , t1 ] . Считаем, что известно начальное состояние: x(t0 ) x0 . Целевой функционал, определяющий суммарные потери, имеет вид t1 J [ f1 ( x(t ) r (t )) f 2 ( x(t ))]dt. t0 Задачу минимизации данного функционала можно рассматривать как задачу вариационного исчисления в классе кусочно-гладких на отрезке [t0 , t1 ] функций с закрепленным левым и свободным правым концами при наличии во всех точках отрезка [t0 , t1 ] нестандартного (для вариационного исчисления) ограничения (1.1). Исследуемую задачу можно интерпретировать как задачу оптимального управления, введя скалярную функцию управления и = u(t), определяющую динамику изменения объема поставки продукции: x u , x(t0 ) x0 , A u B, t [t0 , t1 ], t1 J [ f1 ( x(t ) r (t )) f 2 (u )]dt min. t0 Согласно приведенной выше классификации, мы пришли к задаче Лагранжа с закрепленным временем, закрепленным левым и свободным правым концами траектории. Отметим, что в примере нас интересует не столько вид оптимального управления, сколько соответствующее этому управлению состояние.