Программа курса “Вариационное исчисление и оптимальное управление” 1. Метод И. Бернулли решения задачи о брахистохроне. Решение задачи Лопиталя. 2. Дифференцируемость по Фреше отображения связи в задаче Лагранжа. 3. Уравнение Эйлера–Лагранжа и условия трансверсальности в задаче Лагранжа, как следствие Lb′x = 0. 4. Достаточное условие замкнутости образа оператора A ∈ L(X, Y ) . 5. Теорема Люстерника о неявной функции. 6. Принцип Лагранжа для гладкой задачи. 7. Принцип Лагранжа для задачи Лагранжа. 8. Задача оптимального управления. Формулировка принципа максимума Понтрягина. 9. Доказательство принципа максимума Понтрягина при простейшем функциональном ограничении. 10. Аэродинамическая задача Ньютона. 11. Формулировка теорем о слабом/сильном минимуме в простейшей вариационной задаче. 12. Вывод необходимых условий слабого/сильного минимума в простейшей вариационной задаче. 13. Задача экономического роста: T → inf, x1 (T )x2 (T ) = 1, ẋk = x1 x2 uk , 0 ≤ uk ≤ 1, u1 + u2 = 1. В экзаменационном билете будет три пункта: 1. Один из 13-ти вопросов программы. 2. Задача, более-менее теоретическая. 3. Задача, скорее вычислительная. На экзамене нельзя будет пользоваться ничем, кроме собственных знаний. Рекомендации. 1). Не говорите те слова, которые не понимаете, а лишь запомнили. Лучше признаться, что что-то не поняли: экзаменатор поможет разобраться, предложив соответствующие простые задачки. Вам это принесет двойную пользу: что-то поймете и не разозлите экзаменатора. 2). Продумайте те понятия, которыми будете оперировать. Например, сказав нечто о первом интеграле, надо не только быть готовым дать определение, но и уметь найти, например, первый интеграл I : (t, x) 7→ I(t, x) для уравнения ẋN (t, x) + M (t, x) = 0, если известно, что Nt ≡ Mx . Полезно при этом нарисовать график функции I , ее линии уровня, а также интегральные кривые для частного случая, скажем, когда N (t, x) = −2x, а M (t, x) = 2t . 3). При подготовке теоретического вопроса программы, продумайте этот вопрос в тех или иных частных случаях. Например, разобрав доказательство принципа максимума (в случае простейшего функционального ограничения) проверьте себя, например, попытавшись ответить на вопрос, относящийся к задаче Ляпунова (см. задачу 2а к §4). Тоже самое относится и к задачам. Например, разобрав решение задачи 2 на стр. 25, решите уже полностью самостоятельно задачу о брахистохроне в той ситуации, когда требуется за кратчайшее время добраться до вертикальной стенки. 4). Имейте ввиду, что некоторые предложенные указания к решению задач предполагают, что часть выкладок вами будет проделана. Если же только копировать явно написанное, то можно попасть впросак. Например, понимание цепочки неравенств F (x, u) − F (b x, u b) ≥ 2 Z1 0 u b (ḧ + 2ḣ + h) dt = 2 Z1 0 (u b̈ − 2u ḃ + u b) h dt = 0, относящихся к решению задачи 6 на стр. 26, невозможно без предварительных выкладок, о которых в указании лишь упомянуто. 5). В настоящем варианте Записок устранены некоторые неточности, имевшиеся в прежних вариантах. Сделаны некоторые замены. В частности, прежняя задача 5 к параграфу 4 (экономического содержания) заменена на более содержательную). Поэтому есть резон при подготовке к экзамену пользоваться нижеследующим текстом. 6). Почти все задачи к §5 взяты из учебника [ОПУ] (стр. 251-254), к которым (там на стр. 292-294) даны ценные указания. Есть резон с ними ознакомится. 7). Перед экзаменом постарайтесь выспаться. 1 Вариационное исчисление и оптимальное управление А.С. Демидов МГУ, мех-мат, экономический поток. Осенний семестр 2011-2012 уч.г. (выделенное петитом необязательно к экзамену) Основные рекомендуемые учебники: [Т] Тихомиров В.М. Рассказы о максимумах и минимумах http://ilib.mirror1.mccme.ru/djvu/bib-kvant/max.htm [АМТ] Арутюнов А.В. , Магарил-Ильяев Г.Г., Тихомиров В.М. Принцип максимума Понтрягина. Доказательства и приложения. Москва, Факториал Пресс, 2006 [ОПУ] Галеев Э.М., Зеликин М.И., Конягин С.В., Магарил-Ильяев Г.Г., Осмоловский Н.П., Протасов В.Ю., Тихомиров В.М., Фурсиков А.В. Оптимальное управление. Москва, МЦНМО, 2008 [КФ] Колмогоров А.Н. и Фомин С.В. Элементы теории функций и функционального анализа §1 Некоторые классические задачи вариационного исчисления Прародительницей курса “Вариационное исчисление и оптимальное управление” можно считать мудрую Дидону (героиню "Энеиды"Вергилия). Спасаясь от преследования своего брата Пигмалиона, финикийская царевна Дидона отплыла с Энеем (сыном Афродиты) и его спутниками на Запад вдоль южного берега Средиземного моря. Буря вынесла корабль на берег современного Туниского залива. Первый шаг, который Дидона сделала после кораблекрушения, стал шагом к основанию в 814 г. до н.э. Карфагена (Carthage, от семитического Kart-hadast – новый город). На самом деле, в 9 веке до н.э. этот город, расположенный на высоком полуострове (см. http://worldwide.blog.ru/80220179/123540838), существовал как колония финикийского города Тира (тот самый город, который подвергся бомбардировке в 2006 году). На самой высокой части полуострова находился акрополь, называвшийся Бирса – от финикийского "шкура". Дидона сумела уговорить не слишком любезно встретивших ее местных берберов продать ей совсем немного земли – столько, сколько можно "окружить бычьей шкурой". Она разрезала толстую шкуру на тонкие тесемки, связав которые, получила длинную веревку (порядка 5 км1 , судя по карте основанного ею Карфагена http://3darchaeology.3dn.ru/photo/6) и решила изопериметрическую задачу: при заданной длине веревки охватить ею максимальную площадь, примыкающую к морю. Решение зависит, на самом деле, от формы береговой линии. Но удивительно то, что не зависимо от формы береговой линии искомая кривая есть дуга окружности (или семейство дуг окружностей). Этого Дидона и не скрывала, оговаривая с берберами условия купли-продажи. Ведь она уже знала как решается 1. Задача Дидоны2 : при какой форме кривая длины l охватывает наибольшую площадь в полуплосdef 3 кости R2+ = {(t, x) ∈ R2 | x > 0 } ? Замечательно красивое решение этой задачи придумал Якоб Штейнер3 (1796-1863). Объединив искомую область Ω+ с ее симметричным отражением относительно оси t , получим область Ω с границей Γ длины |Γ| = 2l . Поскольку площадь |Ω+ | области Ω+ ровно в два раза меньше |Ω| , достаточно найти область Ω . Заметив, что она (искомая область Ω ), очевидно, должна быть выпукла, Штейнер отмечает также еще один очевидный факт (базирующийся снова на соображениях симметричного отражения4 ): если точки A и B делят длину кривой Γ пополам, то хорда [AB] делит пополам площадь, заключенную внутри Γ . Остается доказать следующее утверждение: если C – произвольная точка Γ , лежащая между точками A и B , то угол ∠ACB – прямой и потому дуга ⌣ ACB есть дуга окружности, опирающаяся на диаметр [AB] . Вот как гениально просто Штейнер это доказывает: хорда [AB] делит площадь фигуры пополам и эта половина составлена из треугольника △ABC и двух сегментов, опирающихся на хорды [AC] и [CB] . Если рассматривать точку C как шарнир, относительно которого можно повернуть один из сегментов, то у треугольника △ABC будет меняться угол C (и противолежащая ему сторона [AB] ), а потому и его площадь. Эта площадь будет максимальна, если угол ∠ACB 1 Общая длина стен Московского Кремля равна 2235м. Это задача о том, как управлять варьируемым объектом (формой кривой), чтобы для представляющей интерес числовой характеристики (площади области, которую охватывает кривая) получить ее максимально возможное числовое значение при заданных ограничениях (на длину кривой и априори допустимом ее расположении). 3 См., в частности, http://kvant.mirror1.mccme.ru/1988/07/yakob shtejner.htm, а также: В.Ю. Протасов Максимумы и минимумы в геометрии, МЦНМО, Москва, 2005 (http://window.edu.ru/window/library?p rid=27891) и А.О. Иванов, А.А. Тужилин Задача Штейнера на плоскости или плоские минимальные сети, Матем. сб. - 1991. - Т. 182. - № 12. - С. 1813-1844. 4 Метод симметризации (т.е. сопоставление объекту Q объекта Q∗ того же класса, обладающего некоторой симметрией) впервые примененным Штейнером в 1836, нашел эффективные применения в геометрии, математической физике, . . . ; см., в частности, Биркгоф Г., Сарантанелло Э. Струи, следы и каверны. М.: Мир, 1964; J. Serrin A symmetry problem in potential theory. Arch. Rational. Mech. Anal. (1971) 43 304–318; Y. Liu, The equilibrium plasma subject to skin effect. SIAM J. Math. Anal. (1995) 26, No 5(Sept.), 1157-1183. 2 2 – прямой. При этом площади сегментов и длины их дуг не изменятся при таком “шарнирном” преобразовании. NB Проанализируем методологию приведенного рассуждения Штейнера. Она заключается в том, что те или иные области, которые отличны от круга, не могут давать решение задачи. На этом основании был сделан вывод, что максимальную площадь с данным периметром имеет круг. Воспользуемся этой методологией и докажем, что максимальное натуральное число N равно единице. В самом деле, если бы N было больше единицы, то тогда N 2 − N = N (N − 1) > 0, т.е. N 2 > N. Но это невозможно, т.к. именно N — максимальное натуральное число. Итак, следуя методологии рассуждения Штейнера, мы получили обескураживающий результат, известный, как парадокс Перрона5 . Разрешение парадокса, конечно, очевидно: ошибочно предполагалось существование решения максимального натурального числа. Но точно так же неявно предполагалось существование решения задачи Дидоны. Как показывает парадокс Перрона, такого рода априорное предположение может привести к ошибочному утверждению. Будем иметь это ввиду, когда будем в дальнейшем выводить и пользоваться необходимыми условиями существования решения. Чтобы обезопасить себя от ошибок, надо быть уверенным в существовании решения экстремальных задач (т.е. задач на максимум и/или минимум). Задачи такого рода принято записывать в следующем виде F (z) → inf , z∈M ⇐⇒ F− = −F (z) → sup , z ∈ M. (1.1) Эта запись означает, что на некотором множестве M рассматривается отображение F : M → R и ищется такой элемент zb ∈ M, для которого неравенство F (b z ) ≤ F (z) (или, что тоже самое, F− (b z) ≥ F− (z) ) справедливо для любого z ∈ M. В случае задачи Дидоны (учитывая уже установленную выпуклость искомой области и гладкость ее границы) можно считать, что M = {z = (x, T ) ∈ C (0, l) ∩ C[0, l] × (0, l) x(0) = x(T ) = 0 , 1 где ẋ(t) = dx(t) dt . При этом F (z) = − RT 0 Z T 0 p 1 + ẋ2 (t) dt − l = 0} . (1.2) x(t) dt. Наряду с вопросом о нахождении такого элемента zb ∈ M, для которого неравенство F (b z ) ≤ F (z) выполнено при всех z ∈ M , интерес представляет и вопрос о локальном минимуме, т.е. об элементе zb ∈ M, для которого неравенство F (b z ) ≤ F (z) выполнено в достаточно малой окрестности O(b z) ⊂ M точки zb (в той или иной топологии, что отдельно уточняется). В первом случае говорят о глобальном минимуме и пишут zb ∈ globminF/M. Во втором случае говорят о локальном минимуме и пишут zb ∈ locminF/M, уточняя при этом топологию, относящуюся к понятию локальности. В том случае, если минимум достигается в окрестности, определяемой метрикой C 1 , то говорят о слабом локальном минимуме, а если окрестность рассматривается в метрике C , т.е. в существенно более широкой окрестности, то говорят о сильном локальном минимуме. Что касается проблемы существования решения задачи (1.1), то ей мы посвятим в дальнейшем несколько лекций, обратив, в частности, более пристальное внимание и на задачи локального экстремума. Здесь же отметим лишь следующее: доказать наличие локального экстремума проще. А если еще установить его единственность, то получим доказательство существования глобального экстремума. Приведем непосредственное доказательство существования решения задачи Дидоны. Заметим сначала, что можно ограничиться множеством S замкнутых выпуклых областей, лежащих внутри квадрата Q со стороной L. Пусть A и B — два элемента S . Положим ̺(A, B) = max max d(x, B) , max d(x, A) , x∈A x∈B где d(x, B) – расстояние от точки x ∈ Q до множества B . Легко проверяется, что функция ̺ задает метрику на S. Относительно этой метрики множество S компактно, ибо оно 1) замкнуто (если последовательность выпуклых областей заданного периметра сходится по этой метрике к какой-либо области, то она выпукла и имеет тот же периметр) и 2) имеет конечную ε -сеть (состоящую из множества фигур, построенных из квадратиков, возникающих наложением ε -сетки 5 Немецкий математик Оскар Перрон (1880–1975) усовершенствовал с помощью субгармонических функций доказательство Пуанкаре существования решения обобщенной задачи Дирихле в областях с произвольной границей для уравнения Лапласа; см. И.Г. Петровский, Лекции об уравнениях с частными производными. В линейной алгебре известна теорема Перрона(1907)–Фробениуса(1912), нашедшая применение в экономической модели "затраты - выпуск", за разработку которой В.В. Леонтьеву была присуждена Нобелевская премия по экономике за 1973 год. 3 на Q ). Относительно введенной метрики функция площади на компактном множестве S непрерывна. Значит на этом множестве эта функция достигает своего максимума, что и требовалось доказать. 2. Задача Иоганна Бернулли о брахистохроне и геодезические на римановой поверхности. Пусть требуется найти геодезические, т.е. (geo=землю daisia=разделяющие) кратчайшие линии , соединяющие два объекта (например, две точки) на плоскости, риманова метрика которой в декартовых координатах (t, x) такова: dt2 + dx2 ds2 = , α = const ∈ R. x2α Если объектами, соединяемыми искомыми геодезическими, являются две точки (0, 0) и (1, a) , где a > 0, то эта задача может быть записана в виде Z 1p 1 + ẋ2 (t) dt F (x) = → inf при условии x(0) = 0 , x(1) = a > 0. (1.3) xα (t) 0 В случае α = 0 (евклидова геометрия) ответ всем известен: геодезические — это прямые. Изящную интерпретацию получил случай α = 1/2 , исследование которого дало мощный импульс развития математики, механики, физики. Все началось с того, что в 1696 году Иоганн Бернулли (1667-1748), этот наиболее выдающийся ученый из математической династии Бернулли, сформулировал и решил задачу о брахистохроне6 , т.е. о форме жёлоба, соединяющего две точки на разных высотах, по которому тело спустится за минимальное (гр. brachistos кратчайший) время (chronos) под действием силы тяжести. Еще в начале XVII века Галилей установил, что скорость p v свободного падения пропорционален корню √ квадратному пройденной высоты, т.е. v = C x . Ну а 1 + ẋ2 (t) dt — это длина элемента дуги жёлоба. Исходная идея, позволившая И.Бернулли решить задачу о брахистохроне, заключалась в отождествлении искомой траектории движения материальной частицы в потенциальном силовом поле с траекторией луча в соответствующей этому полю оптической среде. Эта оптико-механической аналогия получила в дальнейшем плодотворное развитие в трудах Гамильтона (1805–1865), Карла Якоби7 (1804-1851) и многих других выдающихся ученых, что позволило с единых позиций охватывать основные результаты механики (в том числе квантовой), волновой и геометрической оптики, гидродинамики. Идею И.Бернулли подхватил Лопиталь (1661-1704): он решил задачу для случая α = 1 , как задачу о траекториях световых лучей в атмосфере, поскольку скорость таких лучей можно приближенно считать пропорциональной8 высоте x над поверхностью Земли. Случай α = 1 можно интерпретировать и иначе: как задачу о геодезических на плоскости Лобачевского. Случай α = −1 соответствует поиску тела вращения с минимальной площадью боковой поверхности. Случай α = −1/2 тоже интересен: он определяет траектории снаряда, выпущенного из пушки под тем или иным углом к горизонту. Оказывается, что огибающая этих траекторий есть парабола. Вне нее можно спокойно наблюдать за выстрелами. Поэтому задачу (1.3) при α = −1/2 называют задачей о параболе безопасности. Все эти задачи легко решаются с помощью идеи И.Бернулли. Применим ее к задаче Лопиталя. Согласно принципу Ферма луч света выбирает кратчайшую по времени траекторию t 7→ x(t). Если две среды разделены горизонтальной осью t , выше которой скорость луча равна V1 , а ниже — V2 , то две точки с координатами (0, a) и (1, b) ( ab < 0 ) луч света соединит ломанной, которая пересечет ось абсцисс в той точке (c, 0), абсцисса которой c даст минимум функции p √ b2 + (1 − t)2 a2 + t2 f (t) = + (1.4) V1 V2 6 Задача о брахистохроне была инициирована таким вопросом Галилея: “по дуге ⌣ AB окружности или по стягивающей ее хорде [AB] тело быстрее спустится под действием силы тяжести из одной крайней точки в другую?” Галилей нашел ответ: быстрее по более длинному пути, т.е. по дуге окружности. А быстрее всего при какой форме жёлоба? Это уже задача о брахистохроне. Ее решение вскоре вслед за И.Бернулли нашли (опираясь на новые плодотворные идеи) Лейбниц, Ньютон, Лопиталь и его старший брат Якоб (с именем которого связано дифференциальное уравнение, лемниската и многочлен Бернулли, числа, распределение Бернулли и первая формулировка закона больших чисел). 7 Его родной брат Борис Якоби (1801–1874), немец еврейского происхождения, жил и работал в России с 1835 года. Он изобрел электродвигатель, создал гальванотехнику, около десятка конструкций телеграфных аппаратов. 8 Это относится, прежде всего, к полярным широтам, ибо там плотность воздуха, зависящая от его температуры, а потому и скорость светового луча, изменяются с высотой резче, чем в умеренных широтах. Напротив, в жарких пустынях, на раскаленных асфальтовых дорогах сильно нагретый поверхностный слой воздуха становится более разреженным и потому скорость световых лучей в нем выше по сравнению с более высокими слоями воздха, что приводит к так называемым нижним миражам, якобы, оазисов в жаркой пустыне или луж на сухом раскаленном асфальте (а на самом деле, отражений безоблачного неба). 4 Отсюда вытекает (проверьте!) так называемый закон Снеллиуса (точнее, Снелла; см. Википедию) sin α1 sin α2 = , V1 V2 (1.5) где α1 и α2 — углы падения и преломления (отсчитываемые от вертикали). Поэтому, если V (t) = x(t) + x0 , то получаем cos θ(t) = const, x(t) + x0 ẋ(t) = tgθ(t) , где θ = π/2 − α . (1.6) Эти соотношения позволяют почти мгновенно ответить на поставленный вопрос. Действительно, согласно (1.6), имеем: ẋ(t) = R sin θ(t)θ̇(t) = tgθ(t), что влечет dt/dθ = R cos θ. Тем самым, получаем t = R sin θ + t0 , x + x0 = R cos θ. Итак, (t − t0 )2 + (x + x0 )2 = R2 , т.е. геодезические в задаче Лопиталя — это дуги окружностей. Одним из следствием этого является хорошо всем известное явление сплющености по вертикали солнечного диска во время заката и восхода. 3. Изопериметрической задача. Как уже было сказано, задача о брахистохроне дала мощный импульс развитию математики, механики, физики, особенно после того, как в 1744 году Л. Эйлер предложил единый подход к поиску решения весьма общей так называемой изопериметрической задачи Z T def F0 (x, θ, T ) = f0 (t, x(t), ẋ(t)) dt → inf , (1.7) θ def Fj (x, θ, T ) = Z T fj (t, x(t), ẋ(t)) dt = 0 , j = 1, . . . , m , (1.8) θ Здесь9 C 1 (Rn ) x(θ) = a , (1.9) x(T ) = b . R2 z = (x, θ, T ) ∈ × при возможно фиксированных числах θ и/или T , именуемых концами (интервала интегрирования), а гладкие функции fk : R × Rn × Rn → R , а также числа a и b заданы. В написании нижнего предела в интегралах употреблена буква θ , по начертанию сходная с числом 0, которое естественно вводить для задач с фиксированным левым концом. Замечание 1.1 Формально рассмотренные выше задача Дидоны (простейшая из изопериметрических), задача о брахистохроне и задача (1.3) могли бы рассматриваться как весьма частные случаи задачи (1.7)–(1.9). Однако в задаче (1.3) соответствующая подинтегральная функция f0 даже неопределена, если α > 0 , ибо x(0) = 0. Кроме того, в таких задачах следует искать функцию x b в d пространстве C 1 (0, T ) ∩ C[0, T ], не предполагая существования предела lim [ dt x b(t)] . Этот вопрос мы t→0 обсудим в замечании 2.1. Подобно Ферма, искавшему минимальные значения полиномов, Эйлер стал искать необходимые условия, которым должно удовлетворять решение задачи (1.7)–(1.9). Продумывая ряд конкретных примеров этой изопериметрической задачи, Эйлер намечает такой план действий: 1) предварительно рассмотреть задачу (1.7)–(1.9) в классе непрерывных кусочно-аффинных функций t 7→ xn (t) , поскольку в таком классе задача существенно упрощается, а именно, преобразуется в конечномерную задачу на условный экстремум, где искомыми являются ординаты вершин графика (в виде n -звенной ломаной) искомой кусочно-аффинной функции x bn ; 2) найти требования, которым необходимо должно удовлетворять решение x bn этой конечномерной задачи на условный экстремум; 3) перейти к пределу, при котором последовательность графиков функций x bn стремится к гладкой функции10 . Первый пункт этого замысла не представляет никаких трудностей. Серьезные трудности возникли при реализации второго и третьего пункта программы. Однако Эйлеру удалось их преодолеть на примере более 60-ти весьма разнообразных задач. В итоге, им был найден рецепт поиска решения изопериметрической задачи. В случае фиксированных концов (т.е. чисел θ и T ) суть этого рецепта выражает следующая C1 Конечно, искомую скалярную функцию x b ∈ C 1 (R) = C 1 (R; R) или вектор-функцию x b ∈ C 1 (R; Rn ) , т.е. x b : R → Rn , доставляющую (глобальный или локальный) минимум функционалу F0 при условиях (1.8)–(1.9), мы будем отождествлять со всеми теми x b ∈ C 1 (R) или x b ∈ C 1 (R; Rn ), которые совпадают на (искомом или фиксированном) отрезке [θ, T ] . Это эквивалентно тому, что искомую функцию x b мы будем (здесь и в дальнейшем) отождествлять с ее ограничением на отрезок [θ, T ] . При этом, иногда будем говорить и писать о функции x b ∈ C 1 [θ, T ] или x b ∈ C 1 ([θ, T ]; Rn ) . 10 Аналогичный подход, называемый методом ломанных Эйлера, применяется при доказательстве существования решения задачи Коши для дифференциального уравнения x b = f (t, x), где функция f лишь непрерывна; см., например, учебник И.Г. Петровского “Лекции по теории обыкновенных дифференциальных уравнений”. 9 5 Теорема 1.1 Пусть концы θ и T заданы, а функция x b доставляет слабый локальный минимум в задаче (1.7)–(1.9), т.е. найдется такое достаточно малое число ε > 0 , что F0 (b x) ≤ F0 (x) для всех тех x = (x1 , . . . , xn ) ∈ C 1 (Rn ) , для которых выполнены условия (1.8)–(1.9) и kx − x bk1 < ε , где q def def def kxk1 = kxk0 + kẋk0 , а kxk0 = sup |x(t)| , где |x(t)| = x21 (t) + . . . + x2n (t) . (1.10) t Тогда функция x b : [θ, T ] ∋ t 7→ x b(t) есть решение дифференциального уравнения Lx (t, x(t), ẋ(t)) − Здесь L = P 0≤k≤m d Lẋ (t, x(t), ẋ(t)) = 0 , dt λk fk , где def Lx (t, x, ẋ) = ∂L(t, x, ẋ) , ∂x def Lẋ (t, x, ẋ) = ∂L(t, x, ẋ) . ∂ ẋ (1.11) а λ = (λ0 , λ1 , . . . , λm ) ∈ Rm+1 — некоторый ненулевой вектор. Эту теорему мы докажем несколько позже. Эйлер ее установил в результате длительных размышлений11 , начавшихся с того самого момента, когда ему, 19-летнему (получившему 3 годами ранее степень магистра искусств), его учитель И.Бернулли перед отъездом Эйлера на службу в Российскую Академию наук поставил ему задачу о брахистохроне в среде с сопротивлением, а затем и задачу о геодезических на поверхностях. И только в 1744 году вышел мемуар Эйлера о решении “изопериметрических задач в самом широком смысле”. А затем произошло следующее. В 1755 году Эйлер получил из Турина письмо от итальянца, ставшего впоследствии (как его прадед) французом Lagrange (1736–1813). Это было письмо 19-летнего Лагранжа, в котором он излагал свой взгляд на метод исследования изопериметрических задач. Какое удивительное совпадение: снова 19-летний юноша!, как и тот, которому в 1726 году И. Бернулли предложил одну из этих задач. Письмо содержало вывод уравнения (1.11), базировавшийся на сравнительном анализе исследуемого на минимум интеграла при возмущении (вариации12 ) искомой функции x b. Кроме того, Лагранж высказал общий принцип, который в случае конечномерной задачи на условный экстремум известен студентам под названием метод множителей Лагранжа. Восхищенный идеей Лагранжа, Эйлер посылает ему восторженное письмо. Начинается оживленная переписка. Эйлер получает новые результаты. Но он не спешит их публиковать и 10 октября 1759 года посылает Лагранжу такое в высшей степени знаменательное письмо: “Твое аналитическое решение изопериметрической проблемы содержит, насколько я вижу, все, чего только можно желать в этой области, и я чрезвычайно рад, что эта теория, которой после моих первых попыток я занимался едва ли не один, доведена тобой до величайшего совершенства. Важность вопроса побудила меня к тому, что я с помощью твоего освещения сам вывел аналитическое решение. Я, однако, решил скрывать это, пока ты не опубликуешь свои результаты, так как я никоим образом не хочу отнимать у тебя часть заслуженной тобой славы.” Часть этой славы в том, что уравнение (1.11) известно в науке, как уравнение Эйлера–Лагранжа. 4. Упражнения и задачи. Предварительные задачи. Для каждого номера i) привести пример бесконечно дифференцируемой функции F : Rk → R , где k = 1 или k = 2 , которая обладает следующим свойством: 1.1). F ограничена, имеет критические точки (т.е. в них производная F равна нулю), но глобальный (говорят также, абсолютный) минимум или максимум не достигаются. 1.2). F ограничена, имеет локальные минимумы и максимумы, но глобальные минимум и максимум не достигаются. 1.3). F имеет единственный локальный экстремум, не являющийся глобальным. 1.4). F имеет бесконечное число локальных максимумом, но нет ни одного локального минимума. 1.5). Ограничение функции F : R2 → R на любую прямую, проходящую через начало координат, имеет в нуле локальный минимум, но начало координат не является точкой локального минимума. Условный экстремум в конечномерном случае. Правило множителей Лагранжа. 2.1). Базовая задача. Пусть x b —решение задачи F (x) → inf, x ∈ M = { Q(x) = 0 } , (1.12) где F : R2 ∋ x = (x1 , x2 ) 7→ F (x1 , x2 ) = x2 , Q : R2 ∋ x = (x1 , x2 ) 7→ Q(x) = x21 + (x2 − 1)2 − 1 . (1.13) Построив графики отображений ∇F (b x) : X = R2 ∋ h 7→ ∇F (b x)h , ∇Q(b x) : X = R2 ∋ h 7→ ∇Q(b x)h , проверить, что они, как две приоткрытые страницы одной тетради, могут быть совмещены поворотом 11 Неявно Эйлер, по-существу, получил правило множителей Лагранжа. Он рассуждал так: если чуть возмутить ординаты искомой функции x в m + 1 точках, то в силу экстремальности F0 и стационарности F1 , . . . , Fm получим для F = (F0 , . . . , Fm ) матричное уравнение (∇F )h = 0 относительно возмущения h , а потому линейную связь градиентов отображений F0 , . . . , Fm . 12 Кстати, по этой причине Эйлер ввел в науку термин “вариационное исчисление”. 6 относительно общей оси (корешка тетради), которая является касательной к множеству M в точке x b. Другими словами, в точке x b градиенты F и Q линейно зависимы. Это значит, что справедливо правило множителей Лагранжа: существует ненулевой вектор (λ0 , λ1 ) ∈ R2 , что λ0 ∇F (b x) + λ1 ∇Q(b x) = 0 . Посуществу, то же самое рассуждение для бесконечномерного пространства X не только приводит к теореме 1.1, но и является ключевым в исследовании существенно более общих задач. 2.2). Задача Кеплера (“Стереометрия винных бочек”, 1615г.)13 . Среди цилиндров, вписанных в шар единичного радиуса, найти цилиндр с максимальным объемом. 2.3). На диаметре AB круга единичного радиуса взята точка F. Провести через точку F хорду CD, чтобы площадь четырехугольника ACBD была максимальной. 2.4). Среди всех тетраэдров с заданными основанием и высотой найти тетраэдр с наименьшей площадью боковой поверхности. 2.4a)*. Среди всех пирамид с данной высотой и одинаковой площадью основания, у которых проекция вершины находится строго внутри ее основания — выпуклого n -угольника с заданными длинами сторон, порядок сочленения которых никак не фиксирован, найти пирамиду, у которой площадь боковой поверхности минимальна. Ответ: в основание пирамиды вписывается окружность, касающаяся всех сторон основания. P искомой −1 При этом r = 2S( j lj ) , где r – радиус окружности, lj — длины сторон основания, а S – площадь основания. 2.4b)*. Среди всех пирамид с данной высотой и одинаковой площадью основания, у которых проекция вершины находится строго внутри ее основания — выпуклого n -угольника, найти пирамиду, у которой площадь боковой поверхности минимальна. (Эта задача отличается от задачи 2.4a тем, что длины lj сторон основания не фиксированы). Ответ: искомая пирамида является правильной. Классические задачи вариационного исчисления. (1.11) 3.1) Если функция L : (t, x, x b) 7→ L(x, x b) не зависит от переменной t, т.е. Lt = 0, то уравнение 14 имеет первый интеграл (называемый интегралом энергии) L x b(t), x(t) ḃ −x(t)L ḃ b(t), x(t) ḃ = const , что ẋ x кратко записывается в виде15 b − x(t) b ẋ (t) = const . L(t) ḃ L (1.14) Докажите это утверждение, подправив следующую (стандартную, но не вполне корректную) выкладку (1.11) d b db db b b b b b ḃ + Lẋ (t)x(t) b̈ − x(t) b̈ Lẋ (t) − x(t) ḃ ḃ Lx (t) − Lẋ (t) ≡ 0, L(t) − x(t) ḃ Lẋ (t) = Lx (t)x(t) Lẋ (t) = x(t) dt dt dt b ẋẋ (t) 6= 0. показав при этом, что вторая производная функции x b существует там, где L def ḃ ))−L(b x(t),x(t)) ḃ Указание. Хотя x(t) b̈ может и не существовать, однако для A(τ ) = L(bx(t),x(t+τ существует предел τ d b b lim A(τ ) = dt L(t) − Lx (t)x(t) ḃ . Отсюда и формулы Лагранжа для конечных разностей вытекает, что существует τ →0 ḃ )−x(t) ḃ Lẋ (b x(t+τ ),x(t+τ ḃ )) def x(t+τ d b равный ему предел lim B(τ ), где B(τ ) = . А так как существует dt Lẋ (t), то сущеτ τ →0 x(t+τ ḃ )−x(t) ḃ d d b d b b ẋ (t) = lim B(τ ) + x(t) ствует dt x(t) ḃ L ḃ dt Lẋ (t). Далее, dt Lẋ (t) = Lẋx x e(t), x(t) ė x(t) ḃ + lim Lẋẋ x e(t), x(t) ė , τ τ →0 τ →0 b ẋẋ (t) 6= 0. где x e(t) = x b(t) + θ x b(t + τ ) − x b(t) , x(t) ė = x(t) ḃ + θ x(t ḃ + τ ) − x(t) ḃ , а θ ∈ (0, 1). Отсюда ∃ ẍ(t), если L 3.2) Воспользовавшись теоремой 1.1 и формулой (1.14), решить задачу Дидоны (см. (2.3)), рассмотрев сначала случай фиксированных концов. 3.3) Исследовать задачу (1.3) для α = ±1/2 и α = ±1 методом И.Бернулли, а также с помощью уравнения16 (1.11) и тождества (1.14). 13 Интересные подробности из жизни Кеплера, связанные с этой задачей, изложены в увлекательной книжке В.М. Тихомирова Рассказы о максимумах и минимумах http://ilib.mirror1.mccme.ru/djvu/bib-kvant/max.htm. 14 Вспомним, что первым интегралом системы уравнений ẋ(t) = f (t, x) называется такая функция I : (t, x) 7→ I(t, x) , линии уровня которой {(t, x) | I(t, x) = const} являются интегральными кривыми этой системы уравнений. Если удалось найти такую функцию I, то сделан первый шаг к понижению порядка этой системы дифференциальных уравнений, а в скалярном случае сразу удается найти решение, или как часто говорят, удается проинтегрировать дифференциальное уравнение. По этой причине функция I называется первым интегралом. Найдите первый интеграл I : (t, x) 7→ I(t, x) для уравнения ẋN (t, x) + M (t, x) = 0, если известно, что Nt ≡ Mx . Если речь идет о дифференциальных уравнениях, описывающих динамику физической системы, инвариантную (не зависящую) от времени, то постоянство первого интеграла на интегральных кривых уравнения выражает закон сохранения энергии соответствующей физической системы. def 15 Как правило, в дальнейшем используется (как в (1.14)) сокращенную запись, типа: qb(t) = q(t, x b(t), x b,˙ u b(t)), . . . . 16 В замечании 2.1 будет показано, что уравнение (1.11), а потому и тождество (1.14), справедливы для задачи (1.3) 7 §2 Принцип Лагранжа для задачи Лагранжа с равенствами. Производная Фреше 1. Задача Лагранжа с равенствами. Сформулированный Лагранжем общий принцип, позволяющий находить решения экстремальных задач, стал в дальнейшем называться его именем. Лагранж выдвинул этот принцип для задач F0 (z) → inf , z ∈ M, (2.1) существенно более общих, чем изопериметрические. В обоих случаях множество M задается, как прообраз нуля некоторого оператора Q : Z → Y , т.е. M = {z ∈ Z | Q(z) = 0 } , но в отличие от изопериметрических задач, в которых Y = Rn , в задаче Лагранжа пространство Y бесконечномерно. Действительно, в этой задаче, именуемой задача Лагранжа с равенствами, требуется найти элемент b Tb, x zb = (θ, b, u b) ∈ Z = R×R×X ×U , который доставляет либо глобальный экстремум, скажем, минимум, либо лишь локальный минимум или максимум для характеризующего искомую цель так называемого целевого функционала следующего вида Z T def F0 : Z ∋ z = (θ, T, x, u) 7→ F0 (θ, T, x, u) = f0 (t, x(t), u(t)) dt + g0 (θ, T, x(θ), x(T )) (2.2) θ при условии, что def z = (θ, T, x, u) ∈ M = { Q (θ, T, x, u) = 0 } . (2.3) Q = (F1 , . . . , Fm , Φ) : Z ∋ z = (θ, T, x, u) 7→ Q(z) ∈ Rm × C(R; Rn ) , (2.4) Здесь x = (x1 , . . . , xn ) ∈ X = C 1 (R; Rn ) , u = (u1 , . . . , ud ) ∈ U = C(R; Rd ) , т.е. uj ∈ C(R) для любого j, а так называемое отображение связи связывающее искомый аргумент z условием Q(z) = 0 , имеет своими компонентами m функционалов Fj : (θ, T, x, u) 7→ Z T fj (t, x(t), u(t)) dt + gj (θ, T, x(θ), x(T )), j = 1, . . . , m , (2.5) θ и определенный при t ∈ [θ, T ] дифференциальный оператор где Φ : z 7→ Φ(θ, T, x, u) = ẋ − ϕ(t, x, u), ϕ1 ϕ = . . . , ϕn x d 1 а ẋ = ... . dt xn def (2.6) При этом функции fk , gk и ϕ предполагаются непрерывными по t и непрерывно-дифференцируемыми по остальным переменным, а промежуток [θ, T ] в зависимости от постановки задачи может быть фиксированным или искомым. Вот совсем простой пример задачи Лагранжа: Z 0 π u2 (t) dt → inf , если x(0) = 0 и ẋ(π) = 1. ẍ + x = u, (2.7) x1 0 1 x1 0 Полагая x1 = x, x2 = ẋ и замечая, что ẍ + x = u ⇐⇒ = + , получаем, x2 −1 0 x2 u что задача (2.7) есть частный случай задачи (2.2)–(2.6) с n = 2, f0 (t, x, u) = u2 , g0 = 0, m = 2 и f1 = f2 = 0, g1 = x1 (0), g2 = x2 (π) − 1. Ясно, что u b = 0 и потому x b(t) = − sin t. Но если добавить всего лишь еще одно граничное условие, скажем ẋ(0) = 0, то возникнет достаточно Содержательный пример задачи Лагранжа: d dt Z π 0 u2 (t) dt → inf , если ẍ + x = u, x(0) = 0 , ẋ(0) = 0 и ẋ(π) = 1. (2.8) Эта задача может быть интерпретирована так. На стержень нанизано тело единичной массы, оно подперто пружиной единичной жесткости. В начальный момент времени t = 0 тело находится в точке с даже при α > 0 , т.е. тогда, когда в композиции f (x, y) x=x(t) ,y=y(t) 8 функция (x, y) 7→ f (x, y) не определена при y = 0. координатой x = 0 и имеет нулевую начальную скоростью ẋ = 0. Надо подобрать такое R 1 2управление u : t 7→ u(t), т.е. такую силу, действующую на тело, чтобы с минимальными “затратами” 0 u (t) dt тело приобрело единичнуюRскорость ẋ(1) = 1 в момент времени t = π. Другими словами, требуется мини1 мизировать интеграл 0 u2 (t) dt , найдя такое управление u , чтобы двигаясь в 3-х мерном пространстве переменных (t, x, ẋ) вдоль интегральной кривой уравнения ẍ + x = u, попасть из начала координат (0, 0, 0) на прямую (π, R, 1) . Ясно, что расходы будут ненулевые ( u b 6= 0 ). Но как найти управление, которое минимизирует “затраты”? 2. Дифференцируемость по Фреше. Попробуем найти ответ на поставленный вопрос, предположив, что для задачи Лагранжа (2.2)–(2.6) также, как для базовой задачи (1.12)–(1.13), справедлив принцип Лагранжа, т.е. на искомом решении zb градиенты всех фигурирующих в этой задаче операторов линейно зависимы. Правда, для этого надо сначала понять, что значит градиент, иначе говоря, полная производная Q ′ = ∇Q оператора Q : Z → Y, где Z и Y — бесконечномерные линейные пространства, имея ввиду пространства, фигурирующие в задаче Лагранжа. В 1911 году французский математик Морис Фреше (1878-1973), автор таких фундаментальных понятий, как компактность, полнота, метрическое пространство, определил полную производную Q ′ в точке zb ∈ Z отображения Q : Z → Y линейных метрических пространств, как линейное непрерывное отображение17 Q ′ (b z ) : Z ∋ h 7→ Q ′ (b z )h ∈ Y, которое аппроксимирует приращение Q(b z + h) − Q(b z ), т.е. Q(b z + h) = Q(b z ) + Q ′ (b z )h + r(b z , h) , где ̺Y (r(b z , h), 0) → 0 при ̺Z (h, 0) → 0 , ̺Z (h, 0) (2.9) Здесь ̺Y (·, ·) и ̺Z (·, ·) — метрики в Y и Z . Конечно, определение (2.9) некорректно, поскольку оно не определяет оператор A = Q ′ (b z ) , ибо могут быть несколько (даже континуальное множество) различных операторов A, удовлетворяющих условию (2.9), например, для случая пространств Y = Z = R с p метрикой ̺(z1 , z2 ) = |z1 − z2 | (в которой, заметим, единичный шар не выпуклый). Этот казус18 Фреше исправил в 1925г. после того, как в 1921 году польский математик Стефан Банах (1892–1945) ввел названные позже его именем полные линейные нормированные пространства. Легко проверить, что если метрические пространства Y и Z нормируемы, скажем, ̺Y (r(b z , h), 0) = kr(b z , h)kY и ̺Z (h, 0) = khkZ , то определение (2.9) становится корректным. В случае нормированных пространств Y и Z отображение A = Q ′ (b z ) : Z ∋ h 7→ Ah ∈ Y в этом определении стали называть производной по Фреше в точке zb отображения Q : Z → Y. Если эта производная Q ′ (b z ) : Z ∋ h 7→ Q ′ (b z )h ∈ Y непрерывно зависит от точки zb, то отображение Q называют непрерывно-дифференцируемым и пишут: Q ∈ C 1 (Z, Y ) или C1 Q:Z→Y . (2.10) Ниже, говоря о дифференцируемости или о производной, мы будем подразумевать, что речь идет о дифференцируемости по Фреше, соответственно, о производной по Фреше. Другие типы дифференцируемости (например, дифференцируемость по направлению или строгую дифференцируемость) будем специально оговаривать. Пусть f ∈ C 2 (R3 ) , а g ∈ C 1 (R2 ) . Проверим, что функционал Z 1 1 B : C [0, 1] ∋ x 7→ f (t, x(t), ẋ(t)) dt + g(x(0), x(1)) , (2.11) 0 Больца19 , называемый функционалом имеет в точке x b ∈ C 1 [0, 1] производную по Фреше Z 1 B ′ (b x)h = fx (t, x b(t), x(t))h(t) ḃ + fẋ (t, x b(t), x(t)) ḃ ḣ(t) dt + gx(0) (b x(0), x b(1))h(0) + gx(1) (b x(0), x b(1))h(1) . 0 (2.12) 17 Элемент y множества Y , в которое элемент z множества Z переводится отображением G : Z → Y, принято обозначать через G(z). Если G : Z → Y есть линейное отображение пространств (подразумевается линейных пространств), то элемент G(z) обычно записывают в одном из следующих видов: Gz или hG, zi . 18 Конечно, Фреше прекрасно понимал изъян данного им определения и потому он его скорректировал, добавив условное предложение: “если такой оператор Q ′ (b z ) однозначно определен.” 19 Оскар Больца (1857-1942), немецкий математик, сформулировал в 1913 г. задачу Лагранжа в форме (2.2)–(2.6), где R функционалы Fj имеют не только интегральную часть fj (что было у Лагранжа), но и терминальную (функцию от концов) gj . Впрочем, вводя в задаче Лагранжа дополнительную искомую функцию y, подчиненную дополнительному дифференциальному уравнению ẏ = 0 и дополнительному терминальному ограничению y(T ) = g(θ, T, x(θ), x(T )) , получаем формулировку задачи Лагранжа с функционалами лишь интегрального вида. А вводя переменную κj , подчиненную уравнению κ˙j = fj (t, x, ẋ) и граничному условию κj (θ) = 0 , интегральную часть функционала Fj можно представить в виде функции от концов, которую принято называть функционалом Майера в честь немецкого математика Адольфа Майера (1839-1908). Именно А. Майер в 1886 г. впервые сформулировал и показал (впрочем, далеко не в полной мере), 9 Здесь ∂f (t, x, y) def ∂g(a, b) fx (t, x(t), ẋ(t)) = , . . . , gx(1) (x(0), x(1)) = . ∂x ∂b x=x(t), y=ẋ(t) a=h(0), b=h(1) def В сокращенной записи20 , которой мы будем часто пользоваться, Z 1 ′ B (b x)h = fbx (t)h(t) + fbẋ (t)ḣ(t) dt + gbx(0) h(0) + gbx(1) h(1) . (2.13) (2.14) 0 Поскольку дифференцируемость функции g (т.е. терминальной части функционала Больца) уже оговорена ( g ∈ C 1 (R2 ) ), остается проверить дифференцируемость по Фреше лишь интегральной части функционала (2.11). Для этого, зафиксируем возмущение h : t 7→ h(t) и представим интегральную часть разности B(x + h) − B(x) в виде интеграла от n o b(t) = f t, x b(t) + h(t), x(t) ḃ + ḣ(t) −f t, x b(t), x(t) ḃ . Воспользовавшись условием21 f ∈ C 2 (R3 ) и формулой Тейлора, получим d b(t) = fx (t, x b(t), x(t))h(t) ḃ + fẋ (t, x b(t), x(t)) ḃ ḣ(t) + r t, x b(t), h(t) , dt где остаточный член r допускает оценку через квадрат нормы возмущения h в C 1 , т.е. Z 1 2 2 (1.10) 2 |r t, x b(t), h(t) | ≤ C khk0 + kḣk0 = Ckhk1 =⇒ r t, x b(t), h(t) ≤ Ckhk21 . (2.15) (2.16) 0 Таким образом, имеем B(b x + h) = B(b z ) + B ′ (b x)h + r(b x, h) , где |r(b x, h)| → 0 при khk1 → 0 . khk1 (2.17) Столь же просто проверяется дифференцируемость по Фреше функционалов Fj , фигурирующих в задаче Лагранжа (2.2)–(2.6), если fj ∈ C 2 , а gj ∈ C 1 . При этом, Fj′ (z)ζ = Z θ T fx (t, x(t), u(t))h(t) + fu (t, x(t), u(t))v(t) dt + f (T, x(T ), u(T ))τT − f (θ, x(θ), u(θ))τθ + +gx(0) (x(0), x(1))h(0) + gx(1) (x(0), x(1))h(1) для ζ = (τθ , τT , h, v) ∈ R × R × C 1 × C . (2.18) Установив дифференцируемость функционала Больца, заметим теперь, что мы почти уже установили дифференцируемость и отображения связи (2.4) в задаче Лагранжа. Осталось лишь отметить очевидный факт, а именно: функциональная компонента оператора связи Q , т.е. оператор Φ : Z → C([θ, T ]; Rn ) , заданный формулой (2.6), тоже дифференцируем и его производная есть линейный дифференциальный оператор ζ = (τθ , τT , h, v) 7→ Φ′ (θ, T, x, u)ζ = ḣ − [ϕx (t, x, u)h + ϕu (t, x, u)v] , C1 h : t 7→ h(t) . (2.19) 3. Принцип Лагранжа для задачи Лагранжа. Предположение о справедливости принципа Лагранжа для задачи Лагранжа означает, что в точке минимума zb имеется линейная зависимость производных что принцип Лагранжа для задачи Лагранжа верен, если некоторые функции ϕk в (2.6) тождественно равны нулю (т.е. искомых функций больше числа связывающих их дифференциальных уравнений 1-го порядка). Спустя 10 лет Д. Гильберт (см. его Избранные труды, том 2, “Факториал”, Москва 1998) дал строгое доказательство этого результата А. Майера, опираясь на непрерывную зависимость решений системы дифференциальных уравнений ẋ = ϕ(t, x) от правой части. Отметим, что занимаясь вариационными задачами в ранге профессора Гейдельбергского университета (в котором, заметим, преподавали многие знаменитости, в том числе один из творцов немецкой классической философии Георг Гегель), Майер подошел вплотную к теории непрерывных групп Софуса Ли, с которым вел оживленную переписку. 20 Cм. сноску 15 на стр. 7. 21 На самом деле, условие f ∈ C 2 (R3 ) можно заменить на более слабое, а именно: f ∈ C 1 (R3 ) и даже еще более слабое, требующее непрерывности f, fx , и fẋ ; но доказательство формулы (2.14) в этом случае несколько сложнее (см., например, В.М. Алексеев, В.М. Тихомиров Принцип Лагранжа и задачи оптимального управления, МГУ, 1979). 10 функционалов Fj , j = 0, 1, . . . , m и производной дифференциального оператора (2.6). На уровне физической строгости этот дифференциальный оператор Φ(x) = ẋ − ϕ(t, x, u) можно трактовать как семейство функционалов, параметризованное индексом t = tk . Тем самым, ту часть линейной зависимости, относящуюся к оператору (2.6), можно трактовать как Z X p(tk )(ẋ − ϕ(tk , x, u)) (tk+1 − tk ) = p(t)(ẋ − ϕ(t, x(t), u(t))) dt . lim (tk+1 −tk )→0 tk Поэтому естественно предположить22 , что справедлива b Tb, x Теорема 2.1 Пусть zb = (θ, b, u b) – решение задачи Лагранжа (2.1)–(2.6). Тогда в точке zb производные целевого функционала F0 и отображения связи Q линейны зависимы. Иными словами, найдется такой множитель Лагранжа λ = (λ0 , λ1 , . . . , λm ) ∈ Rm+1 , Λ = (λ, p) 6= 0, p = (p1 , . . . , pn ) ∈ C 1 ([θ, T ]; Rn ) , что L ′ (b z) = 0 , L ′ (b z) ζ = 0 т.е. где L : Z ∋ z = (θ, T, x, u) 7→ L(z) = а23 L(t, x, ẋ, u) = m X j=0 Z ∀ ζ = (τθ , τT , h, v) ∈ Z , T L(t, x, ẋ, u) dt + θ m X λj gj (θ, T, x(θ), x(T )) , (2.20) (2.21) j=0 (2.22) λj fj (t, x, u) + p(t)(ẋ − ϕ(t, x, u)) , Функционал L называется функцией Лагранжа, а функция L — лагранжианом. В дальнейшем будет установлено, что p ∈ C 1 ([θ, T ]; Rn ) . Если применять отображение L′ (b z ) последовательно к векторам ζx = (0, 0, h, 0) , ζθ = (τθ , 0, 0, 0) , ζT = (0, τT , x, 0) , ζu = (0, 0, 0, v) , то необходимое условие (2.20) существования решения задачи Лагранжа будет означать равенство нулю соответствующих “частных” производных по x, θ, T, u. Будем при этом писать Lb ′x = 0 , Lb ′θ = 0 , Lb ′T = 0 , Lb ′u = 0 и будем говорить о стационарности по x , по θ , по T и по u . • Стационарность по x : Lb ′x = 0 . Это означает, что L ′ (b z ) ζx = 0 ∀ ζx = (0, 0, h, 0). Иными словами, согласно (2.12) и в силу соглашения о сокращенной записи (см. сноску 15 на стр. 7) имеем: Z θb Tb h m i X b h(θ) b + gbj b x (t)h(t) + L b ẋ (t)ḣ(t) dt + b) h(Tb) = 0 L λj b gj x(θ) (θ) ( T x(T ) j=0 b Tb]. ∀h ∈ C 1 [θ, (2.23) Как “выудить” из этого бесконечного числа равенств ту информацию, которая относится непосредственно лишь к искомой функции x b ? В качестве подсказки ответа на этот вопрос, рассмотрим два весьма частных случая (в которых фигурирует пространство24 C0∞ (a, b) ): 1) Z b R1 (t)h(t) = 0 a ∀h ∈ C0∞ (a, b) и 2) Z b R2 (t)ḣ(t) = 0 a ∀h ∈ C0∞ (a, b) , (2.24) где R1 ∈ C(a, b) , а R2 ∈ C 1 (a, b) . В первом случае получаем совсем очевидное необходимое следствие, известное, как 22 Это предположение оправдано в § 3, где доказана весьма общая теорема, следствием которой является теорема 2.1. Подразумевается, что в формулах, аналогичных (2.21), аргументы x , ẋ и u заменяются соответственно на x(t) , ẋ(t) и u(t) . 23 def Напомним, что C0∞ (a, b) = {h ∈ C ∞ (a, b), supp h ⊂ (a, b) }, где supp h — это так называемый носитель (support) функции h, а именно, замыкание множества { t ∈ (a, b) h(t) 6= 0}. Условие supp h ⊂ (a, b) влечет равенство нулю функции h в некоторой (зависящей от h ) окрестности точек a и b . 24 11 Лемма 2.1 (Основная лемма вариационного исчисления): R1 ≡ 0 . ♥ Действительно, предположив, что R1 (t0 ) 6= 0 в какой-то точке t0 ∈ (a, b) придем к противоречию, взяв функцию h , равную нулю вне малой окрестности t0 , в которой h и непрерывная функция R1 сохраняет знак R1 (t0 ). Во втором случае, ответ дает Лемма 2.2 (Дю Буа-Реймона): R2 ≡ const. ♥ Покажем, что R2 (t1 ) = R2 (t2 ) для любых двух точек t1 и t2 интервала (a, b) . Возьмем последовательность {δε }ε>0 функций δε ∈ C ∞ (R), отличных от нуля лишь вне ε -окрестности точки t = 0 и Rt сходящихся при ε → 0 к δ -функции Дирака: δε (t) → δ(t). Пусть hε (t) = 0 [δε (τ − t1 ) − δε (τ − t2 )] dτ. Имеем: hε ∈ C0∞ (a, b) и Z b Z Z (2.24) R2 (t)ḣε (t) dt = R2 (t)δε (t−t1 ) dt − R2 (t)δε (t−t2 ) dt → R2 (t1 )−R2 (t2 ) при ε → 0 . 0 = a |t−t1 |<ε |t−t2 |<ε Тем самым, R2 (t1 ) = R2 (t2 ) для любых t1 и t2 из (a, b), т.е. R2 ≡ const. Приведем еще одно столь же простое доказательство этой леммы, однако на этот раз применим более общий метод (пригодный к любым линейным, а не только, как здесь, к интегральным функционалам), чем мы воспользуемся в дальнейшем. def ♥ Пусть f — линейный (не обязательно непрерывный) функционал на CR0∞ (R), такой, что hf˙, ϕi = ∞ −hf, ϕ̇i = 0 ∀ ϕ ∈ C0∞ (R). Возьмем функцию ϕR0 ∈ C0 (R) , такую, что R ϕ0 = 1 . Любую функцию R ∞ ϕ ∈ C0 (R) можно представить в виде ϕ = ϕ1 + ϕ ϕ0 , где ϕ1 = ϕ − ϕ ϕ0 . Заметим, что ϕ1 = 0 . Rt R Пусть ψ(t) = −∞ ϕ1 (τ )dτ . Имеем ψ ∈ C0∞ (R) и ψ̇ = ϕ1 . Тогда hf, ϕi = hf, ψ̇i + hf, ϕ ϕ0 i . Отсюда, R поскольку hf, ψ̇i = 0 , получаем: hf, ϕi = C ϕ ∀ ϕ ∈ C0∞ (R) , где C = hf, ϕ0 i . Значит f = const . Вернувшись к равенствам (2.23), мы должны преодолеть еще одну небольшую трудность. Дело в том, что интегральное слагаемое в (2.23) содержит и h , и ḣ. Можно последовать Лагранжу и избавиться R Tb b ẋ (t)ḣ(t) dt. Но для этого надо быть уверенным, что функция от ḣ, взяв по частям интеграл Ib = θb L b b Lẋ : t 7→ Lẋ (t) дифференцируема. Априори уверенности в этом нет. В самом деле, если L(t, x, ẋ) = ẋ2 , а x ∈ C 1 , то функция t 7→ Lẋ (t) не дифференцируема. Тем не менее, как впервые (в 1879г.) показал Поль Дю Буа-Реймон (Du Bois-Reymond)25 (1831-1889), справедлива (2.22) b ẋ : t 7→ L bẋ (t) дифференцируема даже, если искомая функция26 t 7→ x Лемма 2.3 Функция p = L b(t) 1 априори всего лишь из класса C . b x . Тогда ♥ Чтобы это доказать, обозначим через R первообразную функции L Z Tb Z Tb Z Tb b θ) b . b Lx (t)h(t) dt = Ṙ(t)h(t) dt = − R(t)ḣ(t) dt + R(Tb)h(Tb) − R(θ)h( θb θb Следовательно, Z Tb h Z i b b Lx (t)h(t) + Lẋ (t)ḣ(t) dt = θb θb θb Tb h i b θ) b . b ẋ (t) ḣ(t) dt + R(Tb)h(Tb) − R(θ)h( −R(t) + L Поэтому уравнения (2.23) можно переписать в виде Z Tb h m m i X X b − R(θ) b h(θ) b = 0 . (2.25) b ẋ (t) ḣ(t) dt + λj gbj x(T ) (Tb) + R(Tb) h(Tb) + λj b gj x(θ) (θ) −R(t) + L θb j=0 j=0 25 Поль Дю Буа-Реймон также впервые (в 1876) построил пример непрерывной функции, ряд Фурье которой расходится в некоторой точке. Будучи в окружении Вейрштрасса, он работал над проблемами теории функций вещественного переменного. На его работы ссылался Г. Кантор (в частности, потому, что Поль Дю Буа-Реймон вплотную подошел к методу диагонального процесса). Более известен старший брат Поля: основоположник нервно-мышечной физиологии Эмиль Дю Буа-Реймон (1818–1896). Их родители, имевшие французские корни (мать была дочерью французского представителя в Берлине) в 1804 году переехали R в Берлин из швейцарского городка Нёшатель (фр. Neuchatel - “новый замок”). 26 В вариационных задачах Ω∋(t,ξ) L(t, ξ, x(t, ξ), xt (t, ξ), xξ (t, ξ)) dt dξ → inf для функций многих переменных включение b ẋ ∈ C 1 (Ω) верно, вообще говоря, лишь если x L b ∈ C 2 (Ω) . 12 b Tb) ⊂ C 1 [θ, b Tb]. Для таких h В частности, уравнения (2.25) справедливы для любых функций h ∈ C0∞ (θ, внеинтегральные слагаемые в (2.25) обращаются в нуль. Таким образом, ! Z Tb h i Лемма2.2 b Tb] b ẋ (t) ḣ(t) dt = 0 ∀ h ∈ C0∞ [θ, b ẋ(t) ≡ const. −R(t) + L =⇒ −R(t) + L (2.26) θb b x , т.е. функция R дифференцируема. Поэтому дифференцируема функция L b ẋ(t) : По построению Ṙ = L (2.26) b ẋ(t) (t) ≡ R(t) + const. t 7→ L Следствие 2.1 Функция x b является решением дифференциального уравнения Эйлера–Лагранжа Lx (t, x(t), ẋ(t)) − d Lẋ (t, x(t), ẋ(t)) = 0 . dt (2.27) ♥ Утверждение сразу следует из тождества (2.26). Оно также вытекает из леммы 2.1, ввиду установR Tb b ẋ (t)ḣ(t) dt. ленной в лемме 2.3 возможности интегрирования по частям в интеграле θb L Замечание 2.1 Вернемся к затронутому в замечании 1.1 вопросу, касающемуся задач следующего типа Z 1 F (x) = f t, x(t), ẋ(t) dt → inf , x ∈ C 1 (0, 1] ∩ C[0, 1] , x(0) = 0 , x(1) = a , x(t) > 0 ∀ t ∈ (0, 1] , 0 2 в которых функция f имеет особенность при x = 0, а именно: f (t, x, y) = g(y) xα где g ∈ C (R) , α > 0 . R1 В этом случае интеграл 0 f t, x(t), ẋ(t) dt расходится, если x(t) = O(tβ ) при t → 0 , где 0 < αβ < 1 . Поэтому поступим так. Пусть x b — решение. Зафиксируем произвольную функцию h ∈ C0∞ (0, 1) . Тогда ∀ µ ∈ (−ε, ε) , где ε > 0 достаточно малое число, имеем: x b(t) + µh(t) > 0 при t ∈ (0, 1] . Так ∞ как h ∈ C0 (0, 1) , то можно повторить вышеприведенные построения (2.14)–(2.27), ибо в отличие от функции f , а также ее производных, их произведения с h , с ḣ или с ḧ не имеют особенностей. В результате получим: 0 ≤ F (b x + µh) − F (b x) = Kµ + o(µ) при µ → 0 , (2.28) R1 где коэффициент K определен по формуле: K = 0 fbx (t)h(t) + fbẋ (t)ḣ(t) dt . В силу (2.28), имеем: Z 1 0 fx t, x b(t), x(t) ḃ h(t) + fẋ t, x b(t), x(t) ḃ ḣ(t) dt = 0 для любой h ∈ C0∞ (0, 1) . Функции t 7→ fbx (th(t) , t 7→ fbẋ (t)h(t) (в отличие от функции f ее производных) не имеют особенностей, ибо h равна нулю вблизи t = 0 . Благодаря этому можно выполнить все построения, представленные в формулах (2.14)–(2.27). В результате получим: fx (t, x b(t), x(t)) ḃ − d fẋ (t, x b(t), x(t)) ḃ ≡ 0. dt (2.29) Определение 2.1 Экстремалью называется любое решение уравнения Эйлера–Лагранжа. Так как x b является экстремалью, то необходимые условия (2.23) влекут Следствие 2.2 Справедливы следующие равенства m m X X b −L b h(θ) b =0 b ẋ (Tb) h(Tb) + b ẋ (θ) λj gbj x(T ) (Tb) + L λj b gj x(θ) (θ) j=0 j=0 13 b Tb] . ∀h ∈ C 1 [θ, (2.30) Последовательно вставляя в эти уравнения27 те функции h, которые обращаются в нуль на левом, а b Tb], получаем краевые условия затем на правом конце отрезка [θ, m X j=0 m X b ẋ (Tb) = 0 , λj b gj x(T ) (Tb) + L j=0 b −L b = 0, b ẋ (θ) λj b gj x(θ) (θ) (2.31) которым должна удовлетворять искомая функция x b при t = θb и t = Tb. Эти условия показывают как должен график функции x b пересекать прямые t = θb и t = Tb. По этой причине соотношения (2.31) называются условиями трансверсальности. Запоминать их не надо — намного проще их вывести в каждом конкретном случае. P Учтем, что лагранжиан L(t, x, ẋ, u) = m j=0 λj fj (t, x, u) + p(t)(ẋ − ϕ(t, x, u)) функции Лагранжа L(θ, T, x, u) = Z T L(t, x, ẋ, u) dt + θ m X λj gj (θ, T ; x(θ), x(t)) j=0 задачи (2.1)–(2.6) имеет специфическую структуру. Поэтому условие Lbx = 0 стационарности по x, т.е. уравнение Эйлера–Лагранжа и условия трансверсальности для x b примут такой вид: db b x ⇐⇒ ṗ = λfbx − p ϕ Lẋ = L bx dt и p(Tb) + λ b gx(T ) (Tb) = 0, Здесь и ниже (уравнение Эйлера–Лагранжа) (2.32) b + λb b = 0 (условия трансверсальности). −p(θ) gx(θ) (θ) λf = m X λj fj , λg = j=0 m X (2.33) (2.34) λj gj . j=0 Теперь нетрудно расшифровать и условия стационарности по θ , по T и по u . • Стационарность по θ и/или T (если θ и/или T не фиксировано): (2.33) b Lb ′θ = 0 ⇐⇒ −L(θ) + λ gbθ + b gx(θ) x ḃ t=θb = 0 ⇐⇒ −λfb + λ b gθ + p ϕ b (2.33) b )+λ b ḃ t=Tb = 0 ⇐⇒ λfb + λ gbT − p ϕ Lb ′T = 0 ⇐⇒ L(T gT + gbx(T ) x b • Стационарность по u : 4. Упражнения и задачи. t=Tb λfbu (t) − p ϕ bu (t) = 0 . =0; (2.35) =0. (2.36) t=θb (2.37) 1). Следуя схеме вывода условий стационарности (2.32)–(2.37), вывести необходимые условия для решения задачи Лагранжа, представленной в (2.8). Проверить, R πчто этим условиям удовлетворяет лишь одна пара функций (b x, u b). Доказать, что F (b x, u b) ≤ F (x, u) = 0 u2 dt , т.е. (b x, u b) — решение этой задачи при указанных в (2.8) ограничениях на (x, u) = (b x + h, u b π R π+ v). Rπ Указание. Проверить, что F (b x + h, u b + v) − F (b x, u b) ≥ 2 0 u b (ḧ + h) dt = u bḣ0 −uh| ḃ π0 + 0 (b u + u)h b̈ dt = 0. RT 1 1 2 2). Пусть b ∈ C (0, ∞), x ∈ C (0, ∞)∩ C[0, ∞), а F (x, T ) = 0 f (t, x(t), ẋ(t)) dt, f ∈ C (R× R+ × R). Применив принцип Лагранжа к задаче F (x, T ) → inf , x(0) = x0 ≥ 0 , x(T ) = b(T ) , вывести уравнение Эйлера-Лагранжа и выяснить под какимpуглом пересекаются графики экстремали и функции b. Рассмотреть случай, когда f (t, x, y) = M (t, x) 1 + y 2 . 3). При всех ли R > 0 существует функция x ∈ C 1 [−1, 1] , подчиненная p условию x(±) = R и R1 доставляющая минимум функционалу, заданному формулой: F (x) = −1 x(t) 1 + ẋ2 (t) dt . Физическая формулировка вопроса: всегда ли мыльная плёнка может реализоваться в виде поверхности вращения, края которой есть соосные кольца радиуса R ? 27 Расшифровка стоящих в скобках выражений делается согласно со сделанным в сноске 15 на стр. 7 соглашением. 14 §3 Задача Люстерника (гладкая экстремальная задача с равенствами) 1. Замкнутые подпространства в функциональных пространствах. Как уже было отмечено (в сноске 19 на стр 9), первая попытка доказать теорему 2.1 была предпринята А. Майером. В своей работе, опубликованной в 26 томе знаменитого журнала Mathematische Annalen, он писал: “Реальное доказательство нужно не столько из-за того, что формальное применение метода Лагранжа может привести, как в известном примере, к неверным результатам, а скорее всего потому, что оно позволит в дальнейшем надежно применять этот метод не только к изопериметрическим, но и к другим вариационным задачам. До сих пор метод Лагранжа рассматривается одной частью математиков как некоторая аксиома, в то время как другая часть математиков предпочитает просто игнорировать все задачи вариационного исчисления, для решения которых не известны другие методы.” Однако реальное доказательство теоремы 2.1 было получено лишь в 1934 году Л.А. Люстерником28 (1899 –1981) в качестве следствия его теоремы об условном экстремуме в банаховых пространствах (см. Матем. сб., 1934, т. 41, № 3, 390-401; http://www.mathnet.ru/links/7ed93df20a6daf6834ebb1b1500d3cfb/sm6470.pdf ). Эту задачу Люстерника (ей посвящен настоящий параграф) часто называют гладкой экстремальной задачей с равенствами. Прежде чем переходить к формулировке задачи Люстерника и полученным им для нее результатам, вспомним и/или ознакомимся с некоторыми элементами теории банаховых пространств, т.е. полных нормированных пространств (см., например, [КФ]). 29 p Ясно, что любое гильбертово пространство X является банаховым с нормой k·k : X ∋ x 7→ kxk = (x, x), где (x, y) — скалярное произведение элементов x ∈ X и y ∈ X . Скалярное произведение, определяющее в гильбертовом пространстве топологию с помощью соответствующей нормы позволяет, в частности, говорить о таких фундаментальных понятиях, как ортобазис, ортогональное дополнение и пр. Частично мы этим будем пользоваться в дальнейших построениях. Вот несколько примеров гильбертовых пространств: def R 1) L2 (Ω) = { x : Ω ∋ t 7→ x(t) ∈ R (x, y) = x(t)y(t) dt }, где Ω — область в Rn , а интеграл Ω понимается в смысле Лебега30 . Если Ω = (0, 1) ⊂ R, то вместо L2 ((0, 1)) пишут просто L2 (0, 1) . 2) l2 — линейное пространствоP числовых последовательностей x = (x1 , . . . , xn , . . .) , снабженное скалярным произведением (x, y) = xn yn . Координату xk в x = (x1 , . . . , xn , . . .) можно интерпретиn≥1 ровать как k -ый коэффициент Фурье функции из L2 , заданной на окружности T = R/Z. m R P ∇k x(t) ∇k y(t) dt }. Имеем: H 0 (Ω) = L2 (Ω). 3) H m (Ω) = { x : Ω ∋ t 7→ x(t) ∈ R (x, y) = k=0 Ω 4) hm def — пространство последовательностей x = (x1 , . . . , xn , . . .) с kxkm = P (nm xn )2 < ∞ . Отме- n≥1 тим, что h0 = l2 , а k -ый коэффициент Фурье функции из H m (T) можно рассматривать как координату xk последовательности x = (x1 , . . . , xn , . . .) ∈ hm . В гильбертовом пространстве справедлива лемма о параллелограмме: сумма квадратов диагоналей равна сумме квадратов его сторон. Иначе говоря, для любых x ∈ X и y ∈ X справедливо равенство kx + yk2 + kx − yk2 = 2kxk2 + 2kyk2 . Это так, ибо (x + y, x + y) + (x − y, x − y) = 2(x, x) + 2(y, y) . Воспользовавшись этой леммой, легко проверить, что банахово пространство C m (Ω) , т.е. пространm P ство m ≥ 0 раз непрерывно дифференцируемых функций с нормой kxk = sup |∇k x(t)|, также как k=0 t∈Ω и пространство C m (Ω) = C m (Rn )Ω с той же нормой, в том числе C(Ω) = C 0 (Ω) и C(Ω) = C 0 (Ω) , 28 См. В. М. Тихомиров, "Лазарь Аронович Люстерник и теория экстремума", Матем. просв., сер. 3, 5, МЦНМО, М., 2001, 12-19. http://www.mathnet.ru/links/fc5fb41c2e90ead3f565fac2e746c42b/mp74.pdf 29 Следуя [КФ], под гильбертовым пространством будем понимать полное линейное пространство, наделенное структурой скалярного произведения. 30 Если бы имелся ввиду интеграл Римана, то такоеP пространство не было бы полным. В самом деле, пусть {λn } по∞ следовательность положительных чисел, таких, что 2n−1 λn = λ ∈ (0, 1) , а xn — характеристическая функция S2n−1 k n=1 k Sn множества Cn = [0, 1] \ ( m=1 In ), где In = k=1 Im , а Im — k -й интервал m -го ранга, т.е. интервал длины λm , центр которого совпадает с центром R k -го ( k = 1 , . . . , 2m−1 ) отрезка множества Cm−1 . Последовательность функций 1 xn является фундаментальной, ибо 0 |xm (t) − xm+n (t)|2 dt → 0 для любого n ∈ N и m → ∞. Кроме того, эта последовательность, монотонно убывая, поточечно сходится к характеристической функции 1C ≥ 0 так называемого канторова T множества C = Cn . В силу теоремы Беппо Леви, функция 12C = 1C интегрируема по Лебегу. Однако она не интегрируема по Риману, так как любая ее верхняя сумма Дарбу равна мере множества C , т.е. 1 − λ > 0 , в то время как ее нижняя сумма Дарбу есть ноль (ибо множество C нигде не плотно). 15 не являются гильбертовыми (их топология не может быть задана с помощью скалярного произведения). При исследовании той или иной задачи успех во многом зависит от адекватного для данной задачи выбора функциональных пространств. Вот еще несколько важных примеров банаховых при31 p ∈ [1, ∞) пространств: l rR P p пространство Соболева W l,p (Ω) с нормой k · k : x 7→ kxk = |∇k x(t)|p dt < ∞ . W 0,p = Lp , W m,2 = H m . k=0 пространство w l,p Ω числовых последовательностей x = (x1 , . . . , xn , . . .) , для которых kxkp = l P P kn |xn |p < ∞. k=0 n≥1 Отметим еще два простых факта, относящиеся к Rn : 1). Если k · k1 и k · k2 — две нормы в Rn , то они эквивалентны, т.е. найдется число C > 0, что 1 n C kxk1 ≤ kxk2 ≤ Ckxk1 для любого x ∈ R . n 2). В R любое его линейное подпространство замкнуто, т.е. содержит все свои предельные точки. Однако в бесконечномерном гильбертовом или банаховом пространстве это не так. В частности, не замкнуто в X любое линейное подпространство X0 X , которое плотно в X, как например, подпространство X0 = C 1 в X = C или в X = L2 . Примером замкнутого подпространств является, конечно, нуль-пространство X0 = {x ∈ X Ax = 0 } любого оператора A ∈ L(X, Y ) , где L(X, Y ) есть пространство линейных непрерывных операторов из X в Y . (3.1) Нуль-пространство оператора A ∈ L(X, Y ) называют ядром этого оператора и обозначают так: KerA. В дальнейшем нам будет важно знать, является ли замкнутым в Y образ оператора A ∈ L(X, Y ) , def т.е. множество ImA = { y ∈ Y y = Ax }. Обозначая через M замыкание множества M , т.е. множество всех его предельных точек, интересующий нас вопрос можно сформулировать так: верно ли, что ImA = ImA? Это, конечно, не так, если ImA = Y0 , где Y0 Y , а Y 0 = Y , скажем, если Y0 = C 1 , а Y = C или Y = L2 . Такая ситуация возникает, например, когда X = Y0 , а оператор A является идентичиым, т.е. оператором вложения Y0 в Y. Другим примером является оператор “интегрирования”, скажем, A : C [0, 1] ∋ x 7→ Zt 0 x(τ ) dτ ∈ C [0, 1] или A : l2 = h0 ∋ (x1 , . . . , xn , . . .) 7→ (x1 , . . . , xn , . . .) ∈ l2 . n В первом из этих случаев ImA = C 1 [0, 1] C[0, 1] = C 1 [0, 1], а во втором ImA = h1 h0 = h1 . В обоих случаях образ оператора A ∈ L(Y, Y ) является незамкнутым линейным подпространством в Y. В нижеследующей лемме 3.1, в которой приводится важное для нас достаточное условие замкнутости образа оператора A ∈ L(X, Y ), действующего в банаховых пространствах X и Y , фигурирует понятие фактор-пространства X/X0 линейного пространства X по линейному подпространству X0 ⊂ X. Это (см., например, [КФ]) есть линейное пространство так называемых классов смежности x e, в котором нулевым элементом e 0 считается пространство X0 , а любой другой элемент x e ∈ X/X0 есть сдвиг e 0 = X0 на некоторое x ∈ X или любое другое x′ ∈ X, но только такое, для которого x′ −x ∈ X0 . Так например, два вектора (x1 , x2 , x3 ) и x′1 , x′2 , x′3 ) из координатного пространства X = R3 представляют один и тот же элемент в X/X0 , где X0 = { (0, 0, a) | a ∈ R }, тогда и только тогда, когда (x′1 , x′2 ) = (x1 , x2 ). Иными словами, (x′1 , x′2 , x′3 )−(x1 , x2 , x3 ) ∈ X0 . Вот другой пример: C[0, 1]/C 1 [0, 1] — это линейное пространство классов непрерывных функций x e, представимых в виде x+ϕ, где ϕ — любая функция из C 1 [0, 1]. Если 0 < a < b < 1, а xa (t) = |t − a|, xb (t) = |t − b|, то предположив, что линейная комбинация элементов x ea 1 e и x eb равна нулю в C[0, 1]/C [0, 1] , иначе говоря, λa x ea + λb x eb = 0 , получим: λa = λb = 0, т.е. элементы x ea и x eb линейно независимы в C[0, 1]/C 1 [0, 1] . Отсюда следует, что dim C[0, 1]/C 1 [0, 1] = ∞. Этот частный результат обобщает весьма полезная Лемма 3.1 Пусть A ∈ L(X, Y ) и пусть dim Y /ImA < ∞ . Тогда ImA – замкнут в Y . ♥ Так как dim Y /ImA < ∞ , то Y = ImA+̇M (пpямая сумма линейных пространств), где dim M < ∞, и потому M , снабженное некоторой нормой k · kM есть банахово пространство. Рассмотрим опера- Если p = 2, то эти пространства гильбертовы со скалярным произведением (x, y) = kx + yk2 − kx − yk2 /4. Если же p ∈ (0, 1), то функционал x 7→ kxk — не является нормой (ибо единичный шар kxk < 1 не выпукл), однако функция (x, y) 7→ ̺(x, y) = kx − yk задает метрику в этих (тем самым, метрических) пространствах. 31 16 тор A1 , действующий из банахова32 X1 = X/KerA ×M в банахово Y = ImA+̇M по формуле: A1 (e x, m) = Ax + m . Обратный к A1 существует, ибо A1 имеет нулевое ядро. Ясно, что оператор A1 непрерывен. Он действует “на”. По теореме Банаха об обратном операторе33 , оператор B = A−1 1 непрерывен. Отсюда вытекает, что Im A = B −1 (X/KerA × {0}) замкнут в Y, как прообраз замкнутого множества X/KerA × {0} ⊂ X1 при непрерывном отображении B : Y = ImA+̇M → X/KerA × M. Вспомним еще, что сопряженным пространством Z ∗ = L(Z, R) к пространству Z, называется пространство линейных непрерывных функционалов, определенных на Z. Вот два примера: 1). L(Rn , R) = { a : Rn ∋ x = (x1 , . . . , xn ) 7→ ha, xi = a1 x1 + . . . + an xn , где Rak ∈ R } ⇒ (Rn )∗ ≃ Rn . 1 2). (C[0, 1])∗ — это пространство функционалов a : C [0, 1] ∋7→ ha, xi = 0 x(t)dµa (t), задаваемых функцией ограниченной вариации µa (см., например, [КФ]). Этот результат установил венгерский математик Фридьес Рисс (1880–1956), правильнее, Риес (Riesz). Его именем названы также введенные им p (Ω) функций, интегрируемых в степени p > 0 по Лебегу, с функцией расстояния (до пространства Lq R нуля) ̺(x, 0) = p Ω |x(t)|p dt , являющейся нормой при 1 ≤ p < ∞ . Напомним здесь же, что в теории обобщенных функций задание функции x : Ω → R осуществляется посредством линейR ного функционала x∗ : ϕ 7→ hx∗ , ϕi = Ω x(t)ϕ(t) dt , определенного на некотором пространстве так называемых пробных функций. Они играют роль измерительных инструментов в реальном процессе измерения физической величины (например, температуры), которая измеряется сначала каким-то прибором ϕ1 в “большой” области, содержащей данную точку, затем с помощью прибора ϕ2 с бо́льшей разрешающей способностью в меньшей области (содержащей ту же точку) и т.д. В дальнейшем нам будет очень полезна (доказанная, например, в [КФ]) Теорема 3.1 (Хана–Банаха)34 Пусть X — нормированное пространство, а X0 X — его замкнутое подпространство. Тогда существует не равный нулю функционал Λ ∈ L(X, R), такой, что X0 = KerΛ. Комментарий. Может показаться, что теорема Хана–Банаха вполне очевидна и связана лишь с требованием замкнутости подпространства X0 , ибо если X0 X плотно в X , то любой функционал, равный нулю на X0 , будет равным нулю на всем X. Однако, суть теоремы существенно более глубокая. Она заключается в том, что утверждение теоремы может оказаться неверным для тех линейных топологических пространствах, в том числе метрических, в которых (в отличие, скажем, от нормированных пространств или так называемых основных пространств D, E, S в теории обобщенных функций) топологию нельзя задать с помощью выпуклых окрестностей. Показателен в этом отношении пример метрического пространства X = Lp (0, 1), где 0 < p < 1 , для которого сопряженное пространство X ∗ состоит лишь из одного элемента, т.е. единственным линейным непрерывным функционалом над таким X является нулевой функционал35 . 32 e × M , где X e = X/KerA задается формулой k(e Норма в прямом произведении X x, m)kX1 = ke xkXe + kmkM . Здесь ke xkXe = inf kx + akX есть норма (см., например, [КФ]) класса смежности x e ∈ X/KerA , представителем которого a∈KerA является элемент x ∈ X. Действительно, ke 0kXe = 0, ke x + yekXe ≤ ke xkXe + ke ykXe и kae xkXe = |a| ke xkXe ∀ a ∈ R . Эти свойства нормы очевидны. Наконец, если 0 = ke xkXe , то 0 = inf kx + an kX = kx + akX . При этом a = lim ∈ KerA KerA∋an →a n→∞ (ввиду замкнутости KerA ), поэтому x = −a ∈ KerA, т.е. x e = 0. Снабженное нормой k · kXe , фактор-пространство e наследует полноту пространства X. В самом деле, пусть {e X xn } — такая подпоследовательность фундаментальной e что ke e , а затем при последовательности в X, xn+1 − x en kXe ≤ 1/2n . Выберем представитель x1 ∈ X элемента x e1 ∈ X e , что kxn+1 − xn kX ≤ 1/2n . Для любого m ∈ N имеем: n ≥ 1 возьмем такой представитель xn+1 ∈ X элемента x en+1 ∈ X kxn+m − xn kX ≤ 1/2n (1 + 1/2 + . . . + 1/2m ) ≤ 1/2n−1 . В силу полноты X , существует такое x ∈ X, что kxn − xkX → 0, e имеем: ke а потому для x e∈X xn − x ekXe → 0. 33 Пусть X и Y – банаховы пространства, A ∈ L(X, Y ) . Если KerA = 0 , то ∃A−1 : ImA → X . Однако оператор A−1 может не быть непрерывным (например, если A : (x1 , . . . , xn . . .) 7→ (x1 , . . . , n1 xn . . .) — оператор “интегрирования” в l2 ). Теорема Банаха об обратном операторе (см., например, [КФ]), утверждает, что A−1 будет непрерывным, если ImA = Y . 34 Эта теорема является следствием несколько более общих теорем (см., например, [КФ]), одна из которых впервые доказана в 1927г. австрийским математиком Хансом Ханом (1879–1934), а другая С. Банахом в 1929г. 35 Отметим, впрочем, что для метрического пространства lp —дискретного аналога пространства Lp , сопряженным к p l , где 0 < p < 1 , является нормированное пространство последовательностей (x1 , . . . , xn , . . .) с нормой kxk = supk |xk |. Такое разительное отличие между сопряженным к Lp и сопряженным к lp при 0 < p < 1 связано с тем, что выпуклая оболочка единичного шара lp есть единичный шар в l1 , а выпуклая оболочка единичного шара в Lp всего лишь плотна в единичном шаре пространства L1 . 17 ♥ Докажем этот факт от противного. Предположим, что для X = Lp (0, 1), где 0 < p < 1 , существует ненулевой функционал f ∈ X ∗ . Это предположение означает, что найдется функция x ∈ Lp (0, 1), для которой ̺(x, 0) = 1 Rs и hf, xi = a > 0. Пусть ϕ(s) = 0 |x(t)|p dt . Возьмем разбиение 0 < s1 < . . . < sn < 1 отрезка [0, 1] так, чтобы ϕ(sr ) − ϕ(sr−1 ) = 1/n . Заметим, что x = y1 + . . . + yn , где yk (t) = x(t) при t ∈ [sk−1 , sk ] и yk (t) = 0 вне отрезка [sk−1 , sk ] . Имеем: hf, xi = hf, x1 i + . . . + hf, xn i . Поэтому |hf, ym i| ≥ a/n для некоторого m . Зафиксируем это m и возьмем последовательность функций xn , такую, что xn (t) = nym (t). Имеем: |hf, xn i| ≥ a > 0 , но ̺(xn , 0) → 0, что противоречит непрерывности f. 2. Принцип Лагранжа для гладкой задачи. Гладкой экстремальной задачей с равенствами (или задачей Люстерника) называется задача F (z) → inf , z ∈ M = {z ∈ Z Q(z) = 0} , F ∈ C 1 (Z, R) , Q ∈ C 1 (Z, Y ) , (3.2) где Z и Y — банаховы пространства. Эта задача является абстрактной формой всех ранее рассмотренных нами задач (изопериметрической и задачи Лагранжа) и для нее Люстерником была доказана Теорема 3.2 (принцип Лагранжа для гладкой задачи) Пусть zb — решение задачи и пусть ImQ ′ (b z) = ImQ ′ (b z ) , т.е. образ ImQ ′ (b z ) отображения Q ′ (b z ) : Z → Y замкнут в Y . Тогда существует ненулевой вектор (так называемый набор множителей) Лагранжа Λ = (λ, y ∗ ) ∈ R × Y ∗ , что производная def соответствующей ему функции (функционала) Лагранжа L(z) = λF (z) + y ∗ Q(z) обращается в нуль на решении zb : L ′ (b z ) ζ = 0 для любого ζ ∈ Z. Иначе говоря, линейно зависимы производные целевого функционала F : Z → R и оператора связи Q : Z → Y , т.е. λF ′ (b z ) + hy ∗ , Q ′ (b z )i = 0 . (3.3) При этом, λ = 0, если ImQ ′ (b z ) 6= Y, а если ImQ ′ (b z ) = Y , то λ 6= 0 (можно считать, что λ = 1 ). ♥ Если ImQ ′ (b z ) 6= Y , то формула (3.3) с ненулевым Λ = (0, y ∗ ) ∈ R × Y ∗ непосредственно следует из теоремы 3.1 (Хана–Банаха). Если же ImQ ′ (b z ) = Y , то формула (3.3) доказывается в конце этого пункта в лемме 3.4 с использованием приводимых ниже лемм 3.2 и 3.3 . Лемма 3.2 (Люстерника о касательном пространстве). Пусть Im Q′ (b z ) = Y. Тогда для достаточно малого ε > 0 и любого t ∈ (−ε, ε) найдется такая “поправка” s(t) ∈ Z к заданному элементу x = z ) , что tζ ∈ Ker Q′ (b 1) zb + tζ + s(t) ∈ M = {z ∈ Z Q(z) = 0} и 2) ks(t)kZ = o(t) при t → 0 . (3.4) Примечание. Хотя множество M , вообще говоря, не обладает какой-либо гладкой структурой, естественно назвать век- тор ζ ∈ KerA , удовлетворяющий свойствам (3.4), касательным к этому множеству M в точке zb , а само ядро KerA касательным пространством к M в точке zb . Пониманию этих понятий поможет упражнение 4) в конце параграфа. ♥ Лемма 3.2 непосредственно вытекает из следующей теоремы, имеющей самостоятельное значение. Теорема 3.3 (Люстерника о неявной функции) Пусть Q ∈ C 1 (Z, Y ), где Y и Z — банаховы пространства. Пусть Q(b z ) = 0, а Im Q ′ (b z ) = Y. Тогда существуют константа K > 0 и число ε > 0 , такие, что для любого элемента x ∈ Z, подчиненного условию kxkZ < ε найдется элемент s ∈ Z , такой, что 1) zb + x + s ∈ M = {z ∈ Z Q(z) = 0} и 2) kskZ ≤ KkQ(b z + x)kY . (3.5) Комментарий. Теорема утверждает, что в случае, когда Im Q ′ (b z ) = Y, расстояние до нулевой линии уровня отображения Q от близких к zb точек прямой lzb (ζ) = {b z + tζ ; t ∈ R} , задаваемой элементом ζ ∈ Z, не больше KkQ(b z + tζ)kY . Отметим, что неявную функцию x 7→ s(x) можно выбрать непрерывной. См. в связи с этим статьи М.А. Красносельского и В.М. Тихомирова в 7-ом выпуске сборника Оптимальное управление, изд-во МГУ, 1977. Если к тому же Z есть прямая C1 сумма X +̇S подпространств X и S , а G(x, s) = Q(b z + z) − Q(b z) , то для функции G : X × S → Y , такой, что G(0, 0) = 0, Im G ′s (0, s)s=0 = Y, получаем утверждение о существовании в связной окрестности точки 0 ∈ X неявно заданной функции C x 7→ s(x), для которой G(x, s(x)) ≡ 0. Эта функция единственна и класса C 1 , если X и S банаховы. ♥ Доказательство теоремы 3.3 изложено в следующих четырех подпунктах. 18 1). Требуется для заданного с малой нормой элемента x ∈ Z найти такую “поправку” s ∈ Z для возмущения σ0 = zb + x , kxkZ < ε ≪ 1 (3.6) элемента zb ∈ Z , чтобы была выполнена оценка (3.5) и чтобы σ b = σ0 +s ∈ M = {z ∈ Z Q(z) = 0}. Если ′ Q(b σ ) = 0 , то −Q(σ0 ) = Q (σ0 )(b σ − σ0 ) + o(kb σ − σ0 k) . Следуя Ньютону, пренебрежем малой величиной o(kb σ − σ0 k) и определим элемент σ1 формулой σ1 = σ0 − [Q ′ (σ0 )]−1 Q (σ0 ) ⇐⇒ −Q (σ0 ) = Q ′ (σ0 )(σ1 − σ0 ) , рассматривая это σ1 в качестве первого приближения к искомому корню σ b уравнения Q(z) = 0. Как впервые заметил Ньютон, последующие приближения, найденные с помощью итераций σk+1 = σk − [Q ′ (σk )]−1 Q (σk ) ⇐⇒ −Q (σk ) = Q ′ (σk )(σk+1 − σk ) , сходятся (причем весьма быстро, со скоростью убывающей геометрической прогрессии) к искомому b. Этот итерацикорню σ b, если k Q ′ (σk )k ≥ C > 0 , а начальное приближение σ0 достаточно близко к σ онный метод Ньютона нахождения корня (не только скалярного) уравнения называют также методом касательных, т.к. метод заключается в последовательном вычислении точек σk+1 ∈ Z , в которых “касательная” y = Q(σk ) + Q ′ (σk )(z − σk ) к графику функции Q : z 7→ y = Q(z) пересекает “ось абсцисс” Z . Но удобнее с точки зрения вычислений чуть иной итерационный процесс, в котором производная вычисляется лишь в одной точке. Так как Q ∈ C 1 (Z, Y ), а Im Q ′ (b z ) = Y, то естественно попытаться ′ ′ строить итерации, в которых вместо производных Q (σk ) будет Q (b z ) , предполагая, конечно, что точка zb близка (как и σk ) к искомому корню. С этой целью заметим, что для любого η > 0 найдется такое δ > 0, что η kQ(σk+1 ) − Q(σk ) − Q ′ (σk ) (σk+1 − σk )kY ≤ kσk+1 − σk kZ , 2 η k Q ′ (σk ) − Q ′ (b z ) (σk+1 − σk )kY ≤ kσk+1 − σk kZ , 2 если kσk+1 − zbkZ < δ и kσk − zbkZ < δ. Следовательно, полагая A = Q ′ (b z ) ∈ L(Z, Y ), получим: kQ(σk+1 ) − Q(σk ) − A (σk+1 − σk )kY ≤ η kσk+1 − σk kZ , если kσj − zbkZ < δ = δ(η) ∀ j . (3.7) b , такому, что Q(b σ ) = 0 , то естественно Если исходить из того, что σk должно стремится при k → ∞ к σ определять приближение σk+1 , предполагая, что Q(σk+1 ) , а также правая часть неравенства (3.7) много ближе к нулю, чем Q(σk ) и их следует считать нулем при построении k -го шага итерационного процесса. В таком случае получим такую модификацию метода Ньютона Q(σk ) + A (σk+1 − σk ) = 0 , (3.8) Может показаться, что это эквивалентно следующим итерациям σk+1 − σk = −A−1 Q(σk ) , где A−1 — оператор, обратный к A : Z → Y. Однако в общей, наиболее типичной ситуации (которая иллюстрируется простым примером Z = R2 и Y = R ) оператор A−1 не существует, иными словами Ker A 6= 0. 2). Суть возникающей здесь трудности и, соответственно, ее разрешение выявляется на простом примере, относящимся к базовой36 задаче, т.е. когда Q : Z = R2 ∋ z = (z1 , z2 ) 7→ Q(z) = z12 + z22 − 1. Если zb = (cos ϕ, sin ϕ), то Ker A = { (z1 , z2 ) | z1 cos ϕ + z2 sin ϕ = 0 }. Пусть для определенности x = (ε, 0). Тогда Q(b z ) = 0, но Q(b z + x) 6= 0 при 0 < ε ≪ 1. Чтобы из точки σ0 = zb + x перейти в точку σ b = zb + x + s ∈ M = {z ∈ Z | Q(z) = Q(b z ) } с помощью такой “поправки” s , для которой была бы выполнена оценка (3.5), можно к линейному подпространству Z0 = Ker A ⊂ Z = R2 взять, скажем, ортогональное дополнение Z1 , содержащее точку σ0 = zb+x , а затем применить итерационный процесс(3.8) в подпространстве Z1 , учитывая, что на Z1 оператор A : Z1 → Y обратим. Однако высказанная идея дополнить конкретное замкнутое подпространство Z0 = KerA ⊂ Z до прямой суммы Z0 ⊕ Z1 = Z банаховых пространств не всегда реализуема, если только Z не гильбертово пространство37 . Поэтому перейдем (как и при доказательстве леммы 3.1) к фактор-пространству 36 См. (1.13) на стр. 6. В 1933г. С. Банах со своим ближайшим сотрудником Станиславом Мазуром (1905–1981) первые построили пример подпространства банахова пространства, которое не дополняемо. И лишь в 1971г. Дж. Линденштрасс и Л. Тцафрири, завершили (см. Isr. J. Math., 9 (1971), 263-269) усилия многих исследователей, доказав, что бесконечномерное банахово пространство изоморфно гильбертову тогда и только тогда, когда в нем каждое замкнутое подпространство дополняемо. Впрочем, KerA дополняемо, если Y = ImA конечномерно, ибо (как легко видеть) условие d = dim ImA < ∞ эквивалентно тому, что размерность дополнения к KerA тоже конечна (а именно, равна d ) и потому дополнение будет замкнутым и значит банаховым. 37 19 Z/Ker A (как бы имитирующему дополнение Z1 к Z0 ) и рассмотрим оператор e : Z/Ker A ∋ ze 7→ A e ze def A = Az , (3.9) где z — некоторый представитель класса смежности ze ∈ Z/Ker A, подчиненный условию 1 def kzkZ ≤ ke z kZe = 2 inf a∈KerA kz + akZ . (3.10) e имеет нулевое ядро, тем самым, он обратим. Обозначив через A e−1 оператор, обратный к Оператор A e , определим, следуя (3.8), последовательность {σk } : N ∋ k 7→ σk ∈ Z , полагая σ0 = zb + x и A e−1 Q(σk ) σ ek+1 − σ ek = −A e (e Q(σk ) + A σk+1 − σ ek ) = 0 ⇔ (3.9) ⇔ Q(σk ) + A (σk+1 − σk ) = 0 , (3.11) где σk — любой38 подчиненный условию (3.10) представитель класса смежности σ ek ∈ Z/Ker A. Так −1 e e как ImA = Y , то оператор A непрерывен (в силу теоремы Банаха об обратном операторе). Таким ez k ≤ c2 ke образом, существуют константы c1 и c2 ≥ c1 > 0, что c1 ke z k ≤ kAe z k. Поэтому e−1 k ≤ kAk e −1 (3.9) cA kA = kAk−1 < ∞ , где cA = c1 /c2 . (3.12) 3). Надежда на то, что итерационный процесс (3.11) ⇔ (3.8) приведет к нужному результату, базировалась на справедливости свойства (3.7). Покажем, что это свойство реализуется, если для любого j ≥ 0 выполнено неравенство kσj − zbkZ < δ, где δ — наперед заданное сколь угодно малое положительное число. Проверим, что так и будет, если kxkZ < ε , где ε = ε(δ) > 0 столь мало́, что kσ0 − zbkZ = kxkZ < δ 2 и 4 kQ(b z + x)kY δ < ⇔ kQ(b z + x)kY < δkAk/8 . kAk 2 (3.13) Это означает, что возмущение x следует брать столь маленьким, чтобы kxkZ < ε(δ) = min(δ/2, ε1 (δ)), где ε1 (δ) выбирается (с учетом непрерывности отображение Q в точке zb и равенства Q(b z ) = 0 ) так, чтобы было выполнено правое неравенство в (3.13). Действительно, в силу неравенств kσn+1 − σn kZ ≤ kσ1 − σ0 kZ , 2n kσ1 − σ0 kZ ≤ 2kQ(σ0 )kY , kAk (3.14) которые мы чуть ниже установим, будем иметь kσj − zbkZ < δ, как при j = 0, так и при j ≥ 1 , ибо kσj − zbkZ ≤ kσj − σj−1 kZ + . . . + kσ1 − σ0 kZ +kσ0 − zbkZ ≤ kQ(σ )k 1 1 0 Y + kσ0 − zbkZ ≤ 2 j−1 + . . . + + 1 2 2 kAk (3.13) < δ δ + = δ. 2 2 Чтобы доказать неравенства (3.14), сделаем индуктивное предположение о том, что неравенство kσk − zbkZ < δ справедливо для k ≤ n , учитывая, что для k = 0 оно выполнено. Тогда для k ≤ n (3.12) справедлива и оценка (3.7), в которой пусть η = cA kAk/4 . Тогда (3.7) kAk kQ(σn )kY = kQ(σn ) −Q(σn−1 ) − A (σn − σn−1 ) kY ≤ cA kσn − σn−1 kZ | {z } 4 =0 , и потому kσn+1 − σn kZ (3.10) ≤ 2ke σn+1 − σ en kZe согласно (3.15) (3.11) (3.11) e−1 Q(σn )k = 2kA e Z (3.12) ≤ 2kQ(σn )kY cA kAk (3.15) ≤ kσn − σn−1 kZ kσ1 − σ0 kZ ≤ . 2 2n (3.16) Тем самым, неравенства (3.14) установлены. Кроме того, kσn+m − σn kZ ≤ kσn+m − σn+m−1 kZ + . . . + kσn+1 − σn kZ ≤ 38 1 1 + . . . + + 1 kσn+1 − σn kZ 2m−1 2 (3.17) В зависимости от конкретного выбора σk мы получим ту или иную “поправку” s = lim sk , для которой Q(e z +x+s) = k→∞ Q(b z ). Как уже отмечалось в комментарии к теореме, можно добиться непрерывности отображения s : x 7→ s = s(x). 20 (3.11) и, тем самым, последовательность {σn } : N ∋ n 7→ σn ∈ Z фундаментальна, ибо (3.17) kσn+m − σn kZ (3.16) ≤ kσ1 − σ0 kZ /2n−1 → 0 при n → ∞ . ≤ 2kσn+1 − σn kZ (3.18) b ее предел: 4). Итак, при kxkZ < ε последовательность {σn } фундаментальна. Обозначим через σ (3.18) lim σn → σ b∈Z, n→∞ def т.е. kσn − σ bkZ → 0 при n → ∞ . (3.19) (3.19) (3.11) (3.19) Пусть s = σ b − σ0 , иначе говоря, σ b = zb + x + s . Имеем: 0 ← −A(σk+1 − σk ) = Q(σk ) → Q(b σ) , т.е. Q(b z + x + s) = 0. Наконец, kskZ = kb σ − σ0 kZ (3.19) = lim kσm − σ0 kZ m→∞ (3.17) ≤ 2kσ1 − σ0 kZ (3.14) ≤ 4kAk−1 kQ(b z + x)kY . Таким образом, оценка (3.5) установлена. Теорема 3.3 полностью доказана. Лемма 3.3 Пусть zb — решение задачи (3.2), оператор A = Q′ (b z ) ∈ L(Z, Y ) действует “на”, т.е. ImA = Y, а ζ ∈ KerA. Тогда F ′ (b z) ζ = 0 . ♥ Согласно лемме 3.2, для достаточно малого ε > 0 и любого t ∈ (−ε, ε) найдется такая “поправка” s(t) ∈ Z , что zb + tζ + s(t) ∈ M = {z ∈ Z Q(z) = 0} и ks(t)k = o(t) при t → 0 . А так как F (b z ) ≤ F M , то F ∈C 1 0 ≤ F (b z + tζ + s(t)) − F (b z ) = t F ′ (b z ) ζ + F ′ (b z )s(t) + o(ktζ + s(t)k) ks(t)k=o(t) = t F ′ (b z ) ζ + o(t) . (3.20) (3.20) z ) ζ + o(t) ≥ 0 очевидно вытекает равенство F ′ (b z ) ζ = 0. Из неравенства39 tF ′ (b Лемма 3.4 Пусть zb — решение задачи (3.2) и пусть ImA = Y, где A = Q ′ (b z ) . Тогда существует такой элемент y ∗ ∈ Y ∗ , что F ′ (b z ) + hy ∗ , Q ′ (b z )i = 0 , иначе говоря, hF ′ (b z ) + y ∗ Q ′ (b z ), ζi = 0 для ∀ζ ∈Z, где def y ∗ Q ′ (b z ) = hy ∗ , Q ′ (b z )i . (3.21) ♥ 1). В том частном случае, когда оператор связи Q : Z → Y является функционалом, т.е. когда Y = R, доказательство совсем просто. Оно аналогично второму доказательству леммы 2.2 Дю БуаРеймона. В самом деле, возьмем элемент ζ1 ∈ Z, для которого Q ′ (b z ) ζ1 6= 0 (такой элемент существует, z ) = R ). Далее, для любого ζ ∈ Z справедливо тождество Q ′ (b z )(ζ + Kζ1 ) = 0 , в силу условия ImQ ′ (b ′ ′ ′ где K = −Q (b z )ζ/Q (b z )ζ1 ) . Поэтому (согласно лемме 3.2) F (b z )(ζ + Kζ1 ) = 0 , т.е. F ′ (b z )ζ1 ∈ R. ′ Q (b z )ζ1 def 2). В общем случае введем оператор D : Z ∋ ζ 7→ Dζ = F ′ (b z ) ζ , Q ′ (b z ) ζ ∈ Y1 = R × Y . Отождествим элементы d1 = (b1 , a1 ) и d2 = (b2 , a2 ) координатного пространства R × Y, если (b1 , a1 ) − (b2 , a2 ) ∈ Im D, и рассмотрим линейное пространство Y1 /Im D. Имеем: 1) dim Y1 /Im D ≤ 1 (т.к. Im D = Y ) и потому40 , в силу леммы 3.1, Im D замкнут в Y1 ; 2) Im D 6= Y1 , т.к. (1, 0) ∈ / Im D , что верно, ибо иначе F ′ (b z ) ζ , Q ′ (b z ) ζ = (1, 0) и потому ζ ∈ KerA , ′ что влечет (в силу леммы 3.2) противоречие: F (b z ) ζ = 0. hF ′ (b z ) + µQ ′ (b z ), ζi = 0 ∀ ζ ∈ Z , где µ = − Применяя теорему 3.1 (Хана–Банаха) к замкнутому в Y1 = R × Y подпространству Im D 6= Y1 , возьмем такой ненулевой (!) функционал Λ = (λ, y ∗ ) ∈ Y1∗ , что hΛ, yi = 0 ∀ y ∈ Im D. В частности, для Более слабое условие, а именно: tk F ′ (b z ) + o(tk ) ≥ 0 для |tk | → 0 , также влечет равенство F ′ (b z )h = 0. 2 2 2 Пусть C = (B, A) : l → l × l , где Bx = (x1 , 0, x3 , 0, x5 , 0, . . .) , а Ax = (0, x1 + x22 , 0, x3 + x44 , 0, x5 + x66 , 0, . . .) Этот простой пример показывает, что образ оператора C = (B, A) ∈ L(Z, X × Y ) может не быть замкнутым даже тогда, когда операторы B ∈ L(Z, X) и A ∈ L(Z, Y ) имеют замкнутый образ. Однако, если ImB замкнут и на KerA (как, например, Im F ′ (b z ) на Ker Q ′ (b z ) ), то ImC замкнут. Этот результат, вошедший во многие учебники по оптимальному управлению (см., например, [ОПУ]) принадлежит Владимиру Михайловичу Алексееву (1932 - 1980), профессору мех-мат факультета МГУ, крупнейшему специалисту по качественным методам небесной механики и символической динамики. 39 40 21 y = F ′ (b z ) ζ , Q ′ (b z ) ζ = (1, 0) будем иметь: hλF ′ (b z ) + y ∗ Q ′ (b z ), ζi = 0 для ∀ ζ ∈ Z . Осталось заметить, ∗ ′ что λ = 6 0. Это так, ибо иначе hy Q (b z ), ζi = 0 для ∀ ζ ∈ Z , что дает y ∗ = 0 , так как ImQ ′ (b z ) = Y. ∗ Тем самым, предположение λ = 0 влечет Λ = (λ, y ) = 0, вопреки тому, что мы взяли Λ 6= 0. 3. Доказательство теоремы 2.1. Убедимся, что к задаче Лагранжа (2.1)–(2.6) применима теорема 3.2. Что касается дифференцируемости целевого функционала F = F0 и оператора связи Q , то она уже была установлена в § 2. Проверим, что образ производной Q ′ (z) : Z ∋ ζ = (τθ , τT , h, v) 7→ Q ′ (z) ζ = (F ′1 z) ζ, . . . , F ′ ′ m (z) ζ; Φ (θ, T, x, u) ζ) ∈ Y1 = Rm × Y, . (3.22) оператора связи замкнут. Здесь (см. сноску 9 на стр.5) Y = C(R; Rn ), а (2.19) Φ ′ (θ, T, x, u) ζ = ḣ − [ϕx (t, x, u) h + ϕu (t, x, u) v] . (3.23) В силу теоремы о разрешимости неоднородного линейного обыкновенного дифференциального уравнения, для любого y ∈ Y существует элемент ζ = (0, 0, h, 0) ∈ Z, для которого Φ ′ (θ, T, x, u) ζ = y. Таким образом, dim Y1 /ImQ ′ (b z ) < ∞ и потому, по лемме 3.1, ImQ ′ (b z ) замкнут. Применив к задаче Лагранжа (2.1)–(2.6) теорему 3.2, получим, что вектор-множитель Лагранжа имеет вид Λ = (λ0 , y ∗ ), где y ∗ = (λ1 . . . , λm , µ) ∈ Rm × (C([θ, T ]; Rn ))∗ , а функция Лагранжа такова: L(z) = m X j=0 λj Z T fj (t, x, u) dt + θ m X j=0 λj gj (θ, T, x(θ), x(T )) + hµ, ẋ − ϕ(t, x, u)i (3.24) m m (3.3) b ′ = 0 . Полагая (как в (2.34)) λ f = P λj fj и λ g = P λj gj , имеем: Поскольку L ′ (z) = 0 , то L x j=0 b′ h= L x Z θb Tb b h(θ) b + b λfbx (t) h(t) dt + λ gbx(θ) (θ) gx(T ) (Tb) h(Tb) + hµ, yi , j=0 где y = ḣ − ϕ bx (t) h . (3.25) По известной теореме Ф. Риеса (см. [КФ]) функционал µ задается мерой dµ (t) Стилтьеса41 , т.е. hµ, yi = R Tb θb y(t) dµ (t) . Проверим, что (по-существу, по тем же причинам, которые лежат в основании леммы 2.2 Дю Буа-Реймона) справедлива R Tb Лемма 3.5 Мера dµ (t) имеет плотность p = (p1 , . . . , pn ) , т.е. hµ, yi = θb p(t) y(t) dt ∀ y ∈ C(R; Rn ), b Tb]; Rn ) . причем p ∈ C 1 ([θ, h i R Tb bx (t) h dt , где y = ḣ − ϕ bx (t) h , имеем: ♥ Полагая Rµp (y) = hµ, yi − θb p(t) ḣ − ϕ (3.3) b x h (3.25) 0 = L = = Z θb Tb h Z θb Tb λfbx (t) h(t) dt + Z θb Tb b b b b p(t) ḣ − ϕ bx (t) h dt + λ b gx(θ) (θ) h(θ) + b gx(T ) (T ) h(T ) +Rµp (y) i b b b λfx (t) − ṗ + ϕ bx (t) p h(t) dt + λ gbx(θ) − p h(θ) + λ b gx(T ) + p h(T ) +Rµp (y) . (3.26) b b t= θ t= T | {z } | {z } обнулим обнулим Чтобы обнулить первое слагаемое, возьмем в качестве p = (p1 , . . . , pn ) решение уравнения ṗ + ϕ bx (t) p = λfbx (t) . (3.27) Оно зависит от n вещественных параметров. От такого же числа вещественных параметров зависит b Tb]; Rn ) . Для нахождеи решение h системы линейных уравнений ḣ − ϕ bx (t) h = y , где y ∈ C([θ, ния значений этих 2n параметров имеются, во-первых, 2n граничных условий: λ gbx(θ) − p = 0 t=θb 41 Нидерландский математик и астроном Томас Стилтьес прожил совсем мало (29 декабря 1856 - 31 декабря 1894). В 30 лет стал членом Нидерландской Академии наук. Основные его труды касаются теории функциональных непрерывных дробей, проблемы моментов, теории ортогональных многочленов, приближенного интегрирования. В год смерти он ввёл так называемый интеграл Римана-Стилтьеса и был избран членом-корреспондентом Петербургской Академии наук. 22 и λ gbx(T ) + p t=Tb = 0, которые обнуляют второе слагаемое в (3.26), но которые, заметим, частично могут вырождаться (когда gbxj (θ) = 1 и/или gbxk (T ) = 1). Во-вторых, они дополняются равенствами R Tb (2.5) b Tb, x b x b(t), u b(t)) dt + gj (θ, b(θ), b(Tb)) = 0, входящими в систему уравнений связи: Fj = 0. Итак, θb fj (t, x R Tb b Tb]; Rn ) . bx (t) h, т.е. hµ, yi = θb p(t) y(t) dt ∀ y ∈ C([θ, Rµp (y) = 0 для любой функции y = ḣ − ϕ Таким образом, функционал L, введенный формулой (3.24) есть функционал L , заданный форму(3.3) (2.20) лой (2.21). А поскольку L ′ (b z ) = 0 , то доказана формула L ′ (b z ) = 0, а вместе с ней и теорема 2.1. 4. Упражнения и задачи. 1). Показать, что условие ImQ ′ (b z ) = ImQ ′ (b z ) в теореме 3.2 существенно, т.е. если оно нарушено, то утверждение теоремы может оказаться ошибочным. P Указание. Возьмите Z = Y = l2 ∋ z = (z1 , . . . , zn , . . .), F (z) = zk /k и Q(z) = (z1 , . . . , zk /k, . . .) . k≥1 2a). Пусть оператор связи Q : Z → Y является функционалом, т.е. Y = R. Доказать в этом случае лемму 3.2, используя простейший вариант теоремы о неявной функции, а именно, теорему о неявной C1 функции t 7→ r(t), определенной неявно формулой a(t, r(t)) = 0, где a : R2 → R. Указание. “Поправку” s(t) ∈ Z можно строить в виде s(t) = r(t) ζ1 , где ζ1 6= KerQ ′ (b z ) (ср. доказательство леммы 3.4 в случае Y = R ). 2b). Доказать лемму 3.2 в случае Y = Rm , используя теорему о неявной функции t 7→ r(t) ∈ Rm , C1 определенной неявно формулой a(t, r(t)) = 0, где a : R × Rm → Rm . 2c). Доказать лемму 3.2 в предположении, что Z — гильбертово пространство. Указание. Взяв ортогональное дополнение Z1 к Z0 = KerA и зафиксировав ненулевой элемент h ∈ Z0 , рассмотреть функцию G : R × Z1 ∋ (t, s) 7→ G(th, s) ∈ Y. Проверить, что к G применима теорема о неявной функции s ∈ C 1 (R, Z1 ), такой, что G(th, s(t)) ≡ 0 при |t| ≪ 1 (см. комментарий к теореме 3.3 на стр. 18 и/или гл. 10 учебника Ж. Дьедонне Основы современного анализа). 3). Если оператор связи Q : Z → Y является функционалом, т.е. если Y = R, то утверждение теоремы 3.2 можно переформулировать так: либо zb есть критическая точка оператора связи, т.е. Q ′ (b z) = 0 , ′ ′ либо найдется такое число µ ∈ R, что F (b z ) + µQ (b z ) = 0. Проверьте, что в задаче F (z) → inf, z ∈ M = {Q(z) = 0} , где F : Z = R2 ∋ z = (z1 , z2 ) 7→ F (z1 , z2 ) = z1 , а Q(z1 , z2 ) = z13 − z22 , реализуется первый случай. Привести такого же рода пример для случая, когда Z = Y = R. 4). Согласно данному в примечании к лемме 3.2 определению, нулевой вектор h = 0 ∈ X является касательным к любой точке произвольного множества M ⊂ X банахового пространства X. Выясните имеются ли ненулевые касательные вектора к множествам Mk = {x ∈ X = R | x2 fk (x) = 0 }, где k = 1, 2 , а fk (0) = 0 и f1 (x) = sin x1 , f2 (x) = sin log1 x при x 6= 0. 5). Проанализировав доказательство теоремы 3.3, выяснить проходит ли оно, если заменить требование Q ∈ C 1 (Z, Y ) на одно из следующих: 1) существует производная Q ′ (b z ); 2) отображение Q строго дифференцируемо в точке zb , т.е. (см. (3.7)) для любого η > 0 существует такое δ > 0 , что z ) (σk − σk−1 )kY ≤ η kσk − σk−1 kZ , kQ(σk ) − Q(σk−1 ) − Q ′ (b если kσj − zbkZ < δ = δ(η) . (3.28) 6). Проверить, что функция Q : R ∋ z 7→ z 2 sin 1z не удовлетворяет условию (3.28) для zb = 0. 7). Проверить, что функция Q : R2 ∋ (x, y) 7→ Q(x, y) = x − (ay + y 2 sin y1 ) всюду дифференцируема и при a 6= 0 ее частная производная ∂Q(x,y) не равна нулю. Проверить также, что уравнение ∂y x=y=0 Q(x, s(x)) = Q(0, 0) = 0 определяет неявную функции s : x 7→ s(x) , но лишь при |a| > 2/π. 8)*. Построить пример функции f : [−1/2, 1/2] ∋ x 7→ f (x) ∈ R, строго дифференцируемой в точке x = 0, но не дифференцируемой ни в какой окрестности этой точки.42 9). Пусть M есть замыкание множества {(x, y) ∈ R2 | x2 sin x−1√y = 0 }. Проверить, что для задачи def F (x, y) = y → inf, (x, y) ∈ M справедлив принцип Лагранжа (см. сноску 39 на стр. 21). 42 В тех теоретических исследованиях, где речь идет, скажем, о некоторой гипотетической точке экстремума и где для получения результата достаточна строгая дифференцируемость в этой точке, имеет смысл (с эстетической точки зрения) пользоваться условием строгой дифференцируемости лишь в этой точке, а не предполагать более жесткое требование непрерывной дифференцируемости в ее окрестности (что проверять, впрочем, проще, ибо легче нести два легких чемодана: дифференцируемость и ее непрерывность, чем один тяжелый: строгую дифференцируемость). Что же касается реальных задач, где ставится вопрос о точке экстремума, то требование строгой дифференцируемости в этой пока еще не найденной точке вряд ли целесообразно, тем более, что это требование далеко не необходимо (как показывает упражнение 9). 23 Решение задач 2.4a)* и 2.4b)*, представленных на стр. 7, и задачи 8)* на стр. 23 2.4a)*. Среди всех пирамид с данной высотой и одинаковой площадью основания, у которых проекция вершины находится строго внутри ее основания — выпуклого n -угольника с заданными длинами сторон, порядок сочленения которых никак не фиксирован, найти пирамиду, у которой площадь боковой поверхности минимальна. Решение. Пусть h = (h1 , . . . , hn ), где hj — расстояние от O до прямой, содержащей j -ую сторону основания, длину q которой обозначим через lj . Удвоенная площадь боковой поверхности пирамиP ды равна lj H 2 + h2j , где H – высота пирамиды, а площадь основания выражается формулой 1≤j≤n P S = 12 hj lj . Тем самым, приходим к такой гладкой задаче с функциональным ограничением: 1≤j≤n F0 (h) = X lj 1≤j≤n q H 2 + h2j → inf при условии F1 (h) = 0 , где F1 (h) = X 1≤j≤n hj lj − 2S . Ее решение b h существует, а принцип Лагранжа выражается условием стационарности для функции Лагранжа, т.е. b h – удовлетворяет следующей системе: X q X ∂L(h) = 0, где j = 1, . . . , n, L(h) = λ0 lj H 2 + h2j + λ1 hj lj , а (λ0 , λ1 ) ∈ R2 \ {0}. ∂hj 1≤j≤n Отсюда следует, что q hj H 2 +h2j 1≤j≤n = − λλ10 для любого j = 1, . . . , n , т.е. hj = const для любого j . Таким образом, в основание искомой пирамиды (касающаяся всех сторон основания) окружность Pвписывается −1 с центром в точке O. При этом r = 2S( j lj ) , где r – радиус окружности, а S – площадь основания. 2.4b)*. Среди всех пирамид с данной высотой и одинаковой площадью основания, у которых проекция вершины находится строго внутри ее основания — выпуклого n -угольника, найти пирамиду, у которой площадь боковой поверхности минимальна. (Эта задача отличается от задачи 2.4a тем, что длины lj сторон основания не фиксированы). Решение. Согласно решению задачи 2.4a)*, в основание пирамиды вписывается окружность. Обозначим через ϕj = 2βj углы с вершиной в центре этой окружности, опирающиеся на искомые стороны осноP −1 есть вания. Тогда длины lj сторон основания задаются формулой: lj = 2r tg βj , где r = 2S( j lj ) радиус вписанной окружности, а S – площадь основания. В результате приходим к задаче X 2 2S 2 lj H 2 + r2 = H 2 + 4S 2 → inf, r r j X lj = 2S , j X βj = π , βj > 0 , j которая эквивалентна следующей гладкой задаче с функциональными ограничениями: F0 (r, β) = r → sup, def F1 (r, β) = r 2 P j tg βj − 2S = 0 , def F2 (r, β) = P j βj − π = 0 , βj > 0 , b этой задачи существует, а принцип Лагранжа выражается где β = (β1 , . . . , βn ) . Решение (b r , β) P P условием стационарности для функции Лагранжа L(r, β) = λ0 r + λ1 r 2 j tg βj + λ2 j βj , т.е. искомое b удовлетворяет соотношениям: решение (b r , β) L′r = 0 , L′βj = 0 ⇒ λ0 + 2λ1 r X tg βj = 0 , j λ1 r2 + λ2 = 0 для любого cos2 βj j. Отсюда λ1 6= 0 (иначе λj = 0 ∀j ). Значит, βj = const, т.е. искомая пирамида является правильной. 8)*. Построить пример функции f : [−1/2, 1/2] ∋ x 7→ f (x) ∈ R, строго дифференцируемой в точке x = 0, но не дифференцируемой ни в какой окрестности этой точки. 1 , 0) Решение. График функции f есть ломанная, проходящая через точки с координатами (0, 0) , (± 2n 1 1 1 1 и (± 2n+1 , n3 ), где n ∈ N. (Добавив к f на (± 2n±1 , ± 2n∓1 ) соответственно уменьшенный аналог f и итерируя эту процедуру, получим функцию, строго дифференцируемую в нуле, но нигде не дифференцируемую вне x = 0. ) 24 Задачи, обязательные к 1-ой части зачета. Указания к их решению R1 1a). Запись F : C 1 (0, 1); R ∋ x 7→ F (x) = f (t, x(t), ẋ(t)) dt ∈ R означает, что в некоторой области 0 Ω ⊂ R3 задана некоторая функция f : Ω ∋ (t, x, y) 7→ f (t, x, y) ∈ R и рассматриваются те вещественные R1 скалярные функции x ∈ C 1 (0, 1), для которых определен интеграл ϕ(t) dt, где ϕ(t) = f (t, x(t), ẋ(t)), 0 p 2 (t) ẋ(t) , то функция f : (t, x, y) 7→ f (t, x, y) задается . Например, если f (t, x(t), ẋ(t)) = x а ẋ(t) = dx(t) dt √ формулой: f (t, x, y) = x2 y. Тем самым, полагая R+ = {r ∈ R | r ≥ 0 } , мы видим, что максимальная область определения функции f есть Ω = R × R × R+ . Ясно, T ∞что функция f : Ω → R непрерывна, ее производная по y определена лишь при y > 0 и f ∈ C(Ω) C (R × R × RT+ ), где R+ = {r ∈ R | r > 0 }. При этом говорят, что функция f принадлежит классу гладкости C(Ω) C ∞ (R × R × R+ ). Пусть σ — одно из следующих чисел: 0, ±1/2, ±1. Выясните, какова максимальнаяpобласть определения функции f и какому классу гладкости она принадлежит, если f (t, x(t), ẋ(t)) = xσ (t) 1 + ẋ2 (t). p R1 T 1b). Пусть F (x) = f (x(t), ẋ(t)) dt < ∞, где f (x(t), ẋ(t)) = xσ (t) 1 + ẋ2 (t), x ∈ C 1 (0, 1) C[0, 1), 0 x(0) = 0, x(t) > 0 при t > 0 , а σ ∈ R. Доказать, что лишь когда σ — целое неотрицательное число, существует оператор A ∈ L(C 1 [0, 1], R) , такой, что F (x+h)−F (x) = Ah+r(x, h), где r(x, h) = o(khk1 ) при khk1 → 0, а khk1 = max(khk0 , kḣk0 ) , khk0 = max |h(t)| . Выписать формулу для Ah. Показать, что при t∈[0,1] любом σ ∈ R определена и дифференцируема функция ϕ = ϕh : (−ε, ε) ∋ α 7→ ϕ(α) = F (x + αh) − F (x), где h — заданная функция из C0∞ (0, 1), а ε > 0 — достаточно малое число. Выявить отличие между ϕ′ (0) и Ah. Указание. Доказательство существования оператора A ∈ L(C 1 [0, 1], R) в случае, когда σ — целое неотрицательное число, проводится также, как доказательство дифференцируемости по Фреше оператора Больца (2.11). В случае, когда σ не является целым неотрицательным числом, величина F (x + h) не определена при h = −2xχε , где χε ∈ C ∞ , χε (t) = 0 при t < ε ≪ 1 и χε (t) = 0 при t > 2ε . Существование производной ϕ′ (0) (которая называется производной функционала F по направлению h ) установлено в замечании 2.1 (см. также замечание 1.1). В чем отличие между Ah и ϕ′ (0) ? Найти ответ поможет понимание отличия между градиентом (полной производной) функции класса C 1 (R2 ) и производной по направлению в точке 0 ∈ R2 характеристической функции множества {(x, x2 ) ∈ R2 | x > 0 } . R1 k 1c). Пусть a ∈ R, b ∈ R, q ∈ C k (0, 1) и q(t) d dth(t) dt + ah(0) + bh(1) = 0 для ∀ h ∈ C ∞ [0, 1]. k 0 Доказать, что a = −b при k = 1 и a = b = 0 при k ≥ 2. R1 R1 k Указание. Интегрируя q(t) ddtkh dt по частям k раз, показать (ср. лемму 2.1), что 0 C0∞ (0, 1) и 0 dk q(t) dtk h(t) dt = 0 для любой функции h ∈ потому q(t) = A0 + . . . + Ak−1 tk−1 . Следовательно, h i h i q(1)h(k−1) (1) − q(0)h(k−1) (0) + . . . ± b + q (k−1) (1) h(1) + a − q (k−1) (0) h(0) = 0 ∀ h ∈ C ∞ [0, 1] . Далее, как при выводе формул (2.31), следует последовательно подставлять в эти уравнения те функции h ∈ C ∞ [0, 1], для которых все фигурирующие здесь их производные, исключая лишь какую-то одну из них, обращаются в нуль. В результате будет получена информация о коэффициентах Aj полинома q , а именно: a = −b = A0 при k = 1 и a = b = Aj = 0 для любого j при k ≥ 2. RT 2). Пусть b ∈ C 1 (0, ∞), x ∈ C 1 (0, ∞) ∩ C[0, ∞), а F (x, T ) = 0 f (t, x(t), ẋ(t)) dt, f ∈ C 2 (R × R+ × R). Применив принцип Лагранжа к задаче F (x, T ) → inf , x(0) = x0 ≥ 0 , x(T ) = b(T ) , выяснить под каким углом пересекаются графики экстремали (соответствующего уравнения Эйлера–Лагранжа) и функции p b : R+ → R. Рассмотреть случай f (t, x, y) = M (t, x) 1 + y 2 , а также случай b(t) = k(t − 1) при k → ∞. RT Указание. В данном случае функция Лагранжа есть 0 λ0 f (t, x(t), ẋ(t)) dt + λ1 x(0) + λ2 x(T ) − b(T ) , а для экстремали x b имеем такие условия трансверсальности (2.31) и стационарности (2.36) по T : b b b b b b b b b b b λ0 fẋ (0) = λ1 , λ0 fẋ (T ) + λ2 = 0, λ0 f (T ) + λ2 x( ḃ T ) − ḃ(T ) = 0. Отсюда ḃ(T ) = x( ḃ T ) − f (T )/ fbẋ (Tb) , что связывает тангенсы угла наклона между касательными к кривой t 7→ b(t) и к экстремали вp точке их пересечения. Это позволяет определить искомый угол. Он равен π/2, если f (t, x, y) = M (t, x) 1 + y 2 . 25 3). При всех ли R > 0 существует функция x ∈ C 1 [−1, 1] , Rподчиненная условию x(±1) = R и доставp 1 ляющая минимум функционалу, заданному формулой: F (x) = −1 x(t) 1 + ẋ2 (t) dt . √ Указание. Согласно (1.14), такая функция x должна быть решением уравнения x = C 1 + ẋ2 . Представляя x(t) в виде x(t) = C ch y(t) , получаем, что y(t) = t+D C . А поскольку x(1) = x(−1), то необхоt димо имеем: x(t) = C ch C , где параметр C должен определяться из условия: C ch C1 = R. Графики t параметризованного числами C > 0 семейства x(t) C = ch C гомотетичны так называемой цепной линии, задаваемой уравнением ξ = ch τ , и потому имеют общую касательную x = At, с A = sh σ, где σ — корень уравнения cth σ = σ. Поэтому при R < sh σ не существует искомой функции x. 4). Пусть Z — банахово пространство, Q ∈ C 1 (Z, Rm ), ζ0 ∈ Ker Q ′ (b z ) и ImQ ′ (b z ) = Rm . Опираясь на C1 теорему о неявной функции t 7→ r(t) ∈ Rm , определенной формулой G(t, r(t)) = 0, где G : R × Rm → Rm , доказать лемму 3.2 о том, что для достаточно малого ε > 0 и любого t ∈ (−ε, ε) найдется такое s(t) ∈ Z, что: 1) zb + tζ0 + s(t) ∈ M = {z ∈ Z Q(z) = 0} и 2) ks(t)kZ = o(t) при t → 0 . Указание. Пусть {e1 , . . . , em } — базис в Rm = Im Q ′ (b z ), причем ek = Q ′ (b z )ζk . Тогда для функции m m G : R × R → R , заданной формулой G(t, r) = Q(b z + tζ0 + r1 ζ1 + . . . + rm ζm ) , где r = (r1 , . . . , rm ), име 6= 0, что влечет существование при |t| ≪ 1 функции ем: G ∈ C 1 (R × Rm ), G(0, 0) = 0, det ∂G(t,r) ∂r t=0,r=0 C1 r : t 7→ r(t) = (r1 (t), . . . , rm(t)), такой, что G(t, r(t)) ≡ 0, т.е. свойство 1) с s(t) = r1 (t)ζ1 + . . . + rm (t)ζm . Сверх того, имеем: ∂G(t,r) = Q ′ (b z )ζ0 = 0 , т.к. ζ0 ∈ Ker Q ′ (b z ). Это приводит у свойству 2). ∂t t=0,r=0 5). Рассмотрев задачу PC : F (b x, u b) = min (x,u)∈MC def F (x, u), где F (x, u) = MC = {(x, u) ∈ X × U = C 2 [0, 1] × C[0, 1] ẍ = u R1 0 f (t, x(t), u(t)) dt, f ∈ C 2 (R3 ) , при t ∈ (0, 1), x(0) = 0, x(1) = 0 , ẋ(0) − 1 = 0} , как прототип следующей задачи в n -мерном кубе Ω = {t = (t1 , t′ ) , t′ = (t2 , . . . , tn ) | tj ∈ (0, 1)}, n ≥ 1, а def R именно задачи PH : F (b x, u b) = min F (x, u), где F (x, u) = Ω f (t, x(t), u(t)) dt1 dt′ , f ∈ C 2 (R3 ) и43 (x,u)∈MH def Pn MH = {(x, u) ∈ X × U = H 2 (Ω) × H 0 (Ω) ∆x = j=1 ∂2x ∂t2j = u в Ω , x∂Ω = 0 и ∂x ′ ∂t1 (0, t ) = g(t′ )} , проверить, что принцип Лагранжа для задачи PC верен (см. теорему 2.1) и в такой форме: существует ненулевой элемент Λ = (λ0 , λ1 , λ2 , µ, p(·)) ∈ R4 × C 2 [0, 1], что L ′ (b x, u b) = 0, где Z 1 L(x, u) = λ0 f (t, x(t), u(t)) + p(t) ẍ(t) − u(t) dt + λ1 x(0) + λ2 x(1) + µ(ẋ(0) − 1) . (3.29) 0 Замечание. Применяя теорему 3.2 и следуя схеме вывода теоремы 2.1 нетрудно проверить, что принцип Лагранжа верен также для задачи PH . А именно, ∃ Λ = (λ0 , λ(·), µ(·), p(·)) 6= 0, что L ′ (b x, u b) = 0, где (аналогично (3.29)) Z Z Z ∂x ′ ′ L(x, u) = λ0 f (t, x(t), u(t)) + p(t) ∆x(t) − u(t) dt + λ(t)x(t) dΓ + µ(t ) −g(t ) dt′ . ∂t1 t1 =0 Ω t1 =0 Γ=∂Ω NB! При n > 1 принцип Лагранжа не верен для задачи PH , если заменить H 2 (Ω) × H 0 (Ω) на C 2 (Ω) × C(Ω). Причина: образ C 2 (Ω) при отображении оператором ∆ не замкнут в C(Ω), если n > 1. 6). Доказать, что среди пар функций (x, u) ∈ C 2 [0, 1] × C[0, 1], подчиненных дифференциальному уравнению ẍ + 2ẋ + x = u и условиям x(0) = 0, x(1) = 0, ẋ(0) = 1 , существует ровно одна пара функций 1 def R (b x, u b), такая, что F (b x, u b) ≤ F (x, u) = u2 dt . Дополнительный бонус: найти (b x, u b). 0 Указание. Сначала проверить, что лишь одна пара функций удовлетворяет необходимому условию, который дает принцип Лагранжа (см. теорему 2.1 или задачу 5). Далее, для этой пары функций (b x, u b) 1 1 R R проверить (интегрируя по частям), что F (x, u) − F (b x, u b) ≥ 2 u b (ḧ + 2ḣ + h) dt = 2 (u b̈ − 2u ḃ + u b) h dt = 0, 0 0 где (x, u) = (b x + h, u b + v) — пара функций, подчиненная указанным в задаче условиям. 43 Пространство H m (Ω) определено в примере 3) на стр. 15. 26 §4 Задачи оптимального управления. Принцип максимума Понтрягина 1. Задачи оптимального управления. Начнем с простого примера: Z π def x(t) sin t dt → inf при условии, что x(±π) = 0 и |ẋ(t)| ≤ 1 ∀ t ∈ [−π, π] . F (x, u) = (4.1) −π Хотя исследование этой задачки можно осуществить без всякой теории, буквально “в две строчки” (что и сделаем несколько позже), мы начнем анализировать задачу (4.1) с общих позиций, рассчитывая найти единый подход к поиску необходимых условий разрешимости того типа задач, называемых задачами оптимального управления понтрягинского типа, теория которых была разработана Л.С.Понтрягиным (1908 – 1988)44 и его учениками. Принципиальное отличие таких задач от уже известной нам задачи Лагранжа (2.1)–(2.6) заключается в том, что дифференциальная связь ẋ − ϕ(t, x, u) = 0, обременена (как и в случае (4.1), где ϕ(t, x, u) = u ) дополнительным ограничением на управление, а именно: u∈U ⇐⇒ u(t) ∈ K ∀ t, (4.2) где K — некоторое (вообще говоря, зависящее от t ) множество, скажем в Rd , которое не является обязательно открытым. Это и составляет основную трудность. Она заключается в том, что в случае принадлежности точки (b x, u b + τ v + o(τ )) при малом τ ∈ R множеству M , заданному формулой (2.3), а также включению u b(t) + τ v(t) + o(τ ) ∈ K, соотношения F ∈C 1 x, u b) v + o(τ ) , 0 ≤ F (b x, u b + τ v + o(τ )) − F (b x, u b) = τ Fu′ (b (4.3) верные для предполагаемого решения zb = (b x, u b), уже не влекут, как в (3.20), равенства нулю произ′ водной Fu (b x, u b). Это связано с тем, что условие u b(t) + τ v(t) + o(τ ) ∈ K не позволяет менять знак параметра τ, если в окрестности O(t0 ) некоторой точки t0 значения u b(t) не являются внутренней точкой какого-нибудь открытого множества Rd , целиком принадлежащего множеству K. Преодоление этой трудности стало особенно актуальным в середине 20 века в связи с острой необходимостью решения важных прикладных задач управления в различных областях техники и навигации (включая ракетную отрасль и космонавтику)45 . В возникших здесь задачах ограничение (4.2) на управление является существенным. Более того, без такого рода ограничений задача может не иметь решения. 44 См. на http://www.ega-math.narod.ru/LSP/book.htm чрезвычайно интересное “Жизнеописание Льва Семёновича Понтрягина, математика, составленное им самим”. Будучи 13-летним парнишкой, он пытался починить примус, который в его руках и взорвался. В результате взрыва Понтрягин получил тяжёлые ожоги, что привело к потере зрения. Но, как пишет И.Р. Шафаревич, “Понтрягин преодолел чувство ущербности, недостаточности, которое могло бы возникнуть в результате его несчастья. Он никогда не производил впечатления несчастного, страдальца. Наоборот, жизнь его была предельно напряжённой, полной борьбы и побед.” Об этой борьбе и победах читайте в на том же сайте в разделе Избранные статьи и выступления: 1). О моих работах по топологии и топологической алгебре; 2). Оптимизация и дифференциальные игры; 3). О математике и качестве её преподавания; 4). К вопросу о переброске рек. В начале 50-х гг. у Л. С. Понтрягина, всемирно признаного тополога, созрело решение (как сказано на http : //www.mi.ras.ru/index.php?c = show_dep&id = 2) сменить тематику, целиком посвятив себя обыкновенным дифференциальным уравнениям (в широком смысле - включая задачи, связанные с теорией управления, которая в то время называлась (и была) теорией автоматического регулирования). В связи с этим, осенью 1952 г. в МИАН начал работать руководимый Л. С. Понтрягиным семинар по этой тематике. Первый значительный цикл работ по материалам этого семинара был посвящен асимптотике релаксационных колебаний. Второй, наиболее известный и обширный цикл работ, начался с исследования оптимальных режимов в управляемых процессах. Постановке задачи способствовали контакты со специалистами по теории автоматического регулирования (главным образом, А. А. Фельдбаумом). Математически речь идет о вариационной задаче неклассического характера (что препятствовало использованию результатов вариационного исчисления в том виде, как оно сложилось к тому времени). К 1955 г. Л. С. Понтрягин нашел необходимое условие оптимальности, известное ныне как принцип максимума Понтрягина. Вначале он был гипотезой, подтверждавшейся как эвристическими соображениями, так и примерами (наряду с конкретными задачами теории автоматического регулирования, в которых ответ уже был известен. Доказательство принципа максимума для широкого класса линейных систем вскоре (в 1957 г.) получил Р. В. Гамкрелидзе, а в 1958 г. В. Г. Болтянский доказал принцип максимума в общем виде. 45 Однако первой задачей, в которой выявилась эта трудность, была так называемая аэродинамическая задача Ньютона Z 1 t dt F (x, u) = , x(0) = 0 , x(1) = h , ẋ = u ≥ 0 , (4.4) 1 + u2 0 где h > 0 — заданное число. И. Ньютон (1643-1727) поставил и дал решение этой задачи (используя типичный для него метод геометрических построений) в своем фундаментальном труде “Математические начала натуральной философии” 27 Так, например, если снять ограничение |u| ≤ 1 в задачах (4.1), (4.5), (4.6) или ограничение ẋ = u ≥ 0 в задаче Ньютона (4.4), то инфимум F станет, очевидно, равным нулю, но он не будет достигаться. Решение будет отсутствовать и в том случае, если эти ограничения заменить, соответственно, на такие: |ẋ(t)| < 1 и ẋ(t) = u(t) > 0 , другими словами, если множество K ∋ u(t) открыто. Итак, рассмотрим задачу (4.1) и попытаемся проанализировать ее с позиций принципа Лагранжа в надежде понять, возможно ли преодолеть обозначенную трудность, связанную с включением (4.2). Вслед за этим постараемся “переоткрыть” формулировку теоремы, называемую принцип максимума Понтрягина. Затем приступим к ее доказательству. Будем следовать концепции, связанной с функцией Лагранжа (x, u) 7→ L(x, u), корректируя соответствующие выводы о ее производной, исходя из условия (4.3) и включения (4.2). Имеем: Z π L(x, u) = L t, x(t), ẋ(t), u(t)) dt + λ1 x(π) + λ2 x(−π) , (4.7) −π где L t, x(t), ẋ(t), u(t) = λ0 x(t) sin t + p(t) (ẋ(t) − u(t)) . (4.8) В силу того, что возмущение (b x +τ h+o(τ ), u b) при малом τ ∈ R предполагаемого решения (b x, u b) связано лишь условием принадлежности множеству M , заданному формулой (2.3), можно считать (согласно лемме 3.2 Люстерника), что F ∈C 1 0 ≤ F (b x + τ h + o(τ ), u b) − F (b x, u b) = τ Fx′ (b x, u b) h + o(τ ) . Отсюда, следуя доказательству теоремы 2.1, получим, что L′x (b x, u b) = 0. Это, как мы знаем, дает следующее: ṗ(t) = λ0 sin t, причем в данном случае λ0 6= 0. Тем самым, Z π Z π (4.7) ′ x, u b) v = L(b x, u b + v) − L(b x, u b) = − p(t) v(t) dt = λ0 v(t) cos t dt . (4.9) Lu (b −π −π где первое равенство верно, в силу линейности L по u. Если предположить, что |b u(t)| < 1 на какомто интервале O(t0 ) = {|t − t0 | < ε}, то тогда, следуя доказательству теоремы 2.1, можно получить равенство L′u (b x, u b) v = 0 для тех малых v , равных нулю вне O(t0 ), для которых |b u + v| ≤ 1. Но в таком случае, мы бы получили, что cos t = 0 при |t − t0 | < ε, что неверно. Значит, |b u(t)| = 1 на любом том интервале, лежащем в [−π, π], где u непрерывна. А потому, v ≥ 0 на том интервале, где u b = −1 и v ≤ 0 , где u b = 1. Невольно возникающая ассоциация с вопросом о знаке нормальной производной (1687), т.е. за 9 лет до 1696 года, когда была поставлена и решена задача И. Бернулли о брахистохроне, инициировавшая становление вариационного исчисления. Но лишь спустя почти 3 столетия насущная практическая необходимость инициировала в 50-х годах 20 века создание Понтрягиным и его учениками математической теории, в фундамент которой первый камень был положен Ньютоном. Впрочем, начальные импульсы, приведшие к созданию этой теории зародились в работах инженеров. Так, в 1935 году Д.И.Марьяновский и Д.В.Свечарник взяли патент на систему перемещения валков прокатного стана, в которой обеспечивалось максимальное быстродействие при квадратичной обратной связи. Основы теории управляемых гироскопических систем заложили член-корреспондент АН СССР Б.В. Булгаков (1900 – 1952) и проф. Я.Н. Ройтенберг (1910 – 1988). Первую теоретическую работу о быстродействии опубликовал А.А. Фельдбаум (1913 – 1969) в 1949 году в журнале “Автоматика и телемеханика”. В ней впервые была поставлена и решена так называемая простейшая задача быстродействия, т.е. задача об остановке за кратчайшее время в заданной точке оси x некоторого объекта, перемещаемого вдоль этой оси под действием силы, не превышающей заданой величины. Иными словами, была рассмотрена такая задача Z T dt → inf (т.е. T → inf), если ẍ = u, |u(t)| ≤ 1, x(0) = a, ẋ(0) = b , x(T ) = ẋ(T ) = 0. (4.5) 0 В последующих работах, опубликованных в 1951–1953 годах, Фельдбаум изучил задачу быстродействия, описываемой линейной системой ẋ = Ax + Bu со скалярным управлением u(t) ∈ K в случае действительных собственных значениях оператора A. Эти работы были связаны с разработкой и созданием первых в СССР аналоговых вычислительных машин, за что проф. А.А. Фельдбаум был удостоен в 1953г. Сталинской премии. Случай комплексно-сопряженных собственных значений оператора A был рассмотрен в 1952г. в диссертации американского математика Дональда Бушоу (Bushaw), по-существу, на примере задачи T → inf если ẍ + x = u, |u(t)| ≤ 1, x(0) = a, ẋ(0) = b , x(T ) = ẋ(T ) = 0 . (4.6) Отметим, что задача (4.6) возникает, например, при оптимизции по быстродействию позиционирования ствола артиллерийского орудия относительно цели http://www.atprocess.ru/laboratornie-raboti/sintez/optimalnoe-po-bistrodeystviiupozitsionirovanie-stvola-artilleriyskogo-orudiya-otnositelno-tseli. 28 функции в точке ее минимума на границе области ее определения, приводит к гипотезе: L′u (b x, u b) v ≥ 0 , которая, согласно (4.9), означает, что L(b x, u) ≥ L(b x, u b) , (4.2) если u ∈ U min L t, x b(t), x(t), ḃ s = L t, x b(t), x(t), ḃ u b(t) . (4.10) (4.7)−(4.8) ⇐⇒ s∈K (4.7)−(4.8) Утверждение ⇐⇒ в формуле (4.10) верно, конечно, в предположении, что функция u непрерывна почти всюду, т.е. на некотором множестве полной меры, которое обозначим через Cu . Импликация “ ⇐ ” абсолютно очевидна. Проверим справедливость импликации “ ⇒ ”. Если предположить, что b(t0 ), x(t ḃ 0 ), s < L t0 , x b(t0 ), x(t ḃ 0 ), u b(t0 ) в некоторой точке t0 ∈ Cu , то тогда найдется функmin L t0 , x s∈K ция u, непрерывная почти всюду, которая совпадает с u b вне малой окрестности точки t0 , а в ней L t, x b(t), x(t), ḃ u(t) < L t, x b(t), x(t), ḃ u b(t) . Но это повлечет L(b x, u) < L(b x, u b), т.е. противоречие. Предположив теперь, что гипотеза (4.10) верна, попробуем найти решение задачи (4.1). Имеем min L t, x b(t), x(t), ḃ s = L t, x b(t), x(t), ḃ u b(t) (4.9) ⇐⇒ s∈K max s p(t) = u b(t) p(t) ⇔ u b(t) = sgn p(t) . −1≤s≤1 Как мы видели, ṗ(t) = λ0 sin t, λ0 6= 0. Это, ввиду условий x(±π) = 0, дает либо u b(t) = sgn cos t, либо u b(t) = − sgn cos t. В первом случае sgn x(t) = sgn t, а во втором случае sgn x(t) = − sgn t. Сравнивая, приходим к выводу, что λ0 > 0, а минимум функционала (4.1) достигается при u b(t) = − sgn cos t. Рассуждения, приведшие к формуле (4.10), были эвристическими. Поэтому решим задачу (4.1) непосредственно, как и обещали, “в две строчки.” Имеем: Z π Z π Z π |ẋ|≤1 x(±π)=0 F (x, u) = x(t) sin t dt = ẋ(t) cos t dt ≥ − sgn cos t cos t dt = F (b x, u b) , −π −π −π где график функции x b есть ломанная, соединяющая точки (−π, 0), (−π/2, π/2), (π/2, −π/2) и (π, 0). 2. Принцип максимума Понтрягина. Пример задачи (4.1) показывает, что в задачах оптимального управления фазовая функция x : t 7→ x(t) может быть кусочно-непрерывно дифференцируемой, а управление u : t 7→ u(t) кусочно-непрерывным. Определение 4.1 Скажем, что u ∈ P C(R; K), если функция u : R → K — кусочно непрерывна и принимает в точках τ ∈ Cu , где она непрерывна, значения из множества K = Kτ ⊂ Rd . Скажем, что функция x = (x1 , . . . , xn ) ∈ P C 1 (R) = P C 1 (R; Rn ), если ẋ ∈ P C(R; Rn ). b Tb, x Теорема 4.1 Пусть Z = R×R×P C 1 (R)×P C(R; K) и пусть есть такой элемент zb = (θ, b, u b) ∈ Z, что F0 (b z ) ≤ F0 (z) ∀ z = (θ, T, x, u) ∈ M = {z ∈ Z | Q(z) = 0 } . (4.11) Здесь Q = (F, Φ) : Z ∋ z = (θ, T, x, u) 7→ Q(z) ∈ Rm × P C(R; Rn ) , а Fk : (θ, T, x, u) 7→ Z F = (F1 , . . . , Fm ) , (4.12) k = 0, . . . , m , (4.13) T fk (t, x(t), u(t)) dt + gk (θ, T, x(θ), x(T )), θ ϕ1 ϕ = . . . ϕn Φ : z 7→ Φ(θ, T, x, u) = ẋ − ϕ(t, x, u), и x1 def d . . . . ẋ = dt xn (4.14) При этом, fk ∈ C 1 (R1+n+d ; R), gk ∈ C 1 (R2+n+d ; R), а ϕ : (t, x, u) 7→ ϕ(t, x, u) — непрерывна по t и непрерывно-дифференцируема по (x, u) . Тогда найдется такой множитель Лагранжа Λ = (λ, p) 6= 0, λ = (λ0 , λ1 , . . . , λm ) ∈ Rm+1 , p = (p1 , . . . , pn ) ∈ P C 1 ([θ, T ]; Rn ) , что функция Лагранжа L : Z ∋ z = (θ, T, x, u) 7→ L(z) = Z T L(t, x, ẋ, u) dt + θ m X j=0 29 λj gj (θ, T, x(θ), x(T )) , (4.15) с лагранжианом L(t, x, ẋ, u) = m X j=0 (4.16) λj fj (t, x, u) + p(t)(ẋ − ϕ(t, x, u)) , удовлетворяет условиям стационарности по x, θ и T : L ′x (b z) = 0 , L ′T (b z) = 0 , L ′θ (b z) = 0 , (4.17) а также условию минимума лагранжиана L min L t, x b(t), x(t), ḃ s = L t, x b(t), x(t), ḃ u b(t) s∈K def (4.18) ∀ t ∈ Cub , иначе говоря, условию максимума функции Понтрягина H = −L + ẋLẋ max H t, x b(t), x(t), ḃ s = H t, x b(t), x(t), ḃ u b(t) ∀ t ∈ Cub . (4.19) s∈K b Tb] — множество точек непрерывности функции u Здесь Cu ⊂ [θ, b. Доказательство. Пусть τ – точка непрерывности управления u b . Пусть α ∈ R, 0 < α ≪ 1. Определим uα и xα следующим образом u^ uα s def s при t ∈ δα = [τ − α, τ ) , (4.20) uα (t)= u b(t) при t 6= δα , , t θ ẋα = ϕ(t, xα , uα ) , x^ xα , (4.21) xα (θ) = x b(θ). t θ τ−α τ Утверждение 1 (см., например, [АМТ]) Функция xα дифференцируема по α : xα (t) = x b(t) + αy(t) + rα (t), max |rα (t)| = o(α) θ≤t≤T при α → 0. (4.22) а (ее так называемая вариация) y удовлетворяет уравнению b(t), u b(t))y ẏ = ϕ′x (t, x при (4.23) t > τ. u)−ϕ(t) b ẋα −x ḃ (4.21)−(4.22) α ,b = lim ϕ(t,bx+αy+r α α α→0 α→0 В самом деле, uα = u b при t > τ. Поэтому ẏ = lim Утверждение 2. В точке τ функция y удовлетворяет условию =ϕ b ′x (t). (4.24) y(τ ) = [ϕ(τ, x b(τ ), s) − ϕ(τ b )]. Действительно, имеем: ) xα x^ def (4.22) δxα = xα (τ ) − x b(τ ) = αy(τ ) + rα (τ ) , δxα = α ẋα (t) − x(t) ḃ t=τ −α (4.25) τ−α самым, y(τ )τ = Тем δxα (4.26) = α→0 α t lim (4.21) +o(α) = при этом, (4.25) ϕ(t, x b(t), s) − ϕ(t) b t=τ −α +o(α). (4.26) ϕ(τ, x b(τ ), s) − ϕ(t) b , т.е. формула (4.24) доказана. Продолжим доказательство теоремы в случае простейшего функционального ограничения, когда (4.12) F = F1 , причем F1 (θ, T, x, u) = g0 (θ, T, x(θ), x(T )) = x(θ) − xθ , 30 xθ ∈ Rn . (4.27) В этом случае заведомо справедливо включение b Tb, xα , uα ) ∈ M (θ, и потому Следовательно, def b Tb, xα , uα ) ≥ F0 (θ, b Tb, x J0 (α) = F0 (θ, b, u b) = J0 (0) J0 (α) − J0 (0) 1 0 ≤ lim = lim α→+0 α→+0 α α + lim Z α→+0 τ Tb Z τ τ −α (4.28) ∀ α > 0, α ≪ 1. (4.29) f0 (t, x b + αy + rα , s) − f0 (t, x b, u b(t) dt b Tb, x b xα (Tb)) − gb0 f0 (t, x b + αy + rα , u b(t)) − fb0 (t) g0 (θ, b(θ), dt + lim α→+0 α α Z b(τ ), s) − f0 (τ, x b(τ ), u b(τ ) + = f0 (τ, x τ Tb f0 ′ x (t, x b(t), u b(t) y(t) dt + b g0 ′ x(T ) y(Tb). (4.30) Искомое решение удовлетворяет неравенству (4.30). Однако фигурирующая в этом неравенстве функция y = dxα /dαα=0 (как решение задачи Коши (4.23)–(4.24)) зависит не только от искомой пары (b x, u b) , но d и от выбранных параметров τ ∈ C(b u) и s ∈ K ⊂ R , т.к. y t=τ (4.24) = ϕ(τ, x b(τ ), s) − ϕ(τ b ) . b Tb] → Rn , Это неудобство можно обойти, если мы найдем такую независящую от τ и s функцию p : [θ, что Z Tb p(τ )y(τ ) + f0 ′ x (t, x b(t), u b(t) y(t) dt + gb0 ′ x(T ) y(Tb) = 0. (4.31) τ В этом случае неравенство (4.30) примет вид 0 ≤ f0 (τ, x b(τ ), s) − fb0 (τ ) −p(τ ) ϕ(τ, x b(τ ), s) − ϕ(τ b ) , что означает справедливость условия “минимума по u ” в формуле (4.17) в рассматриваемом частном случае (4.27), а именно: L t, x b(t), x(t), ḃ s = f0 (τ, x b(τ ), s) − p(τ )ϕ(τ, x b(τ ), s) ≥ fb0 (τ ) − ϕ(τ b ) = L t, x b(t), x(t), ḃ u b(t) . При этом λ0 = 1 . Остается построить функцию p , удовлетворяющую условию (4.31). Это будет так, если мы определим p как решение такой задачи Коши d (4.23) f0 ′ x (t, x b(t), u b(t) y = (py) ⇐⇒ ṗ = fb0 ′ x − pϕ b′x , dt p(Tb) + gb0 ′ x(T ) = 0. (4.32) (4.27) b −b Взяв теперь λ1 = p(θ) g0 ′ x(θ) и учитывая, что λ0 = 1, а g1 (θ, T, x(θ), x(T )) = x(θ) − xθ , получаем условие трансверсальности при θ, т.е. b + λ0 gb0 ′ −p(θ) + λ1 b g1 ′ x(θ) = 0 . x(θ) (4.33) (4.17) Соотношения (4.32)–(4.33) составляют аннонсированное условие “стационарности по x ”: L ′x (b z ) = 0. (4.17) (4.17) Свойства L ′θ (b z ) = 0 и L ′T (b z ) = 0, т.е. “стационарность как по θ , так и по T ” (в том случае, когда θ и/или T не фиксированы) также выполнены, поскольку L θ′ (b z ) = Fb0 ′ θ , L ′T (b z ) = Fb0 ′ T , а F0 (θ, Tb, x b, u b) ≥ Fb0 b ≪ 1, при |θ − θ| b T, x F0 (θ, b, u b) ≥ Fb0 31 при |T − Tb| ≪ 1 и поэтому Fb0 ′ θ = 0 , Fb0 ′ T = 0 . Тем самым, для того частного случая, когда оператор F удовлетворяет условию (4.27), теорема 4.1 полностью доказана. В случае оператора F общего вида ситуация осложняется тем, что априори практически невозможно явно предъявить то управление uα , параметризованное малым числом α > 0, которое бы не только, как в (4.20), содержало интегрально малый (порядка α ) скачок типа “игольчатого всплеска” (что позволяет выявить точку разрыва оптимального управления b Tb] при u b ), но и обеспечивало бы включение (θ, T, xα , uα ) ∈ M, где ẋα = ϕ(t, xα , uα ) для t ∈ [θ, T ], а [θ, T ] → [θ, α → 0. Но наличие такого управления uα можно доказать с помощью построения всюду плотного подмножества U 0 def в множестве всех допустимых управлений, т.е. тех функций u ∈ U = P C(R; K) (см. определение 4.1), для которых соответсвующие им элементы (θ, T, x, u) принаджежат множеству M (т.е. множеству, где минимизируется функционал F0 ). Оказывается, что в качестве U 0 можно выбрать множество управлений вида uα = u b + sα , где sα — некий N мерный интегрально малый (порядка α ) “пакет иголок”, параметризованный вектором (t1 , . . . , tN ; α1 , . . . , αN ) с tj ∈ [θ, T ], αj ∈ R, N ∈ N. Тем самым, исходная задача оптимального управления “аппроксимируется” некой ассоциированной с ней задачей минимизации функции конечного числа переменных, подчиненных некоторому ограничению. Для такой задачи справедлив принцип Лагранжа, который после перехода к пределу при N → ∞ , преобразуется в теорему 4.1. Детали обозначенных здесь построений описаны, например, в [АМТ]. Примечание. Теорема Люстерника 3.2 вскрывает внутреннюю причину справедливости принципа Лагранжа для задачи Лагранжа, в частности, гладкость определяющих ее операторов. Соответствующий же аналог такой причины для задачи оптимального управления в гладкости по фазовой переменной и аппроксимативной выпуклости по управлению (см. статью Авакова–Магарил-Ильяева–Тихомирова в журнале Функциональный анализ и его приложения, 2012). 3. Аэродинамическая задача Ньютона. Так называется задача, которую сформулировал Ньютон в VII-ом Отделе II-ой книги своего основного труда: “Математических начал натуральной философии”, названного Лагранжем “величайшим из произведений человеческого ума”. В 1679 году Ньютон, уже будучи признаным 35-летним ученым, автором закона всемирного тяготения, приступил к работе над “Началами” после того, как Эдмунд Галлей (Halley) убедил его опубликовать полученное Ньютоном доказательство эллиптичности орбит планет солнечной системы. В “Началах”, наряду с основными законами механики, физики, астрономии, открытие которых Ньютон сопровождал их доказательствами, как правило, чисто геометрическими (использующими, по-существу, идеи его и Лейбница математического анализа), рассматривались и многие частные вопросы. Одним из них был вопрос о форме тела вращения, испытывающего наименьшее сопротивление при движении в так называемой разреженной среде, т.е. состоящей из упругих частиц, которые при столкновении с телом отскакивают от него как бильярдные шары (угол падения равен углу отражения). Ньютон предваряет ответ на этот вопрос расчетами, которые показывают, что сила сопротивления, которую при движении в такой среде испытывает шар, в два раза меньше той, которую испытывает цилиндр с тем же радиусом основания. Затем той же мето́дой он получает, казалось бы, парадоксальный результат: минимальное сопротивление испытывает не острый, а усеченный конус! При этом, с уменьшением высоты конуса, угол между его образующей и усекающей его круговой площадкой стремится к 1350 . Этих предварительных рассмотрений Ньютон посчитал достаточными для того, чтобы читатель смог, следуя его методу, удостовериться в справедливости того, что тело вращения, имеющее наименьшее сопротивление при движении в разреженной среде, тоже имеет круговое усечение радиуса [BG], где B — центр круга, а G — кромка кругового усечения. При этом, боковая поверхность характеризуется приводимым Ньютоном соотношением между следующими величинами: 1) расстоянием [M N ] от точки N на боковой поверхности тела до оси вращения; 2) расстоянием [GR] вдоль прямой, параллельной касательной в точке N , от кромки G усекающего круга до точки R на оси вращения и 3) расстоянием [BR] . Вывод указанного Ньютоном соотношения 4[M N ][BR][GB]2 = [GR]3 появился лишь после его смерти в дополнении к переводу “Начал” на английский язык (“Начала” были написанные Ньтоном на латыне). Этот вывод в деталях приведен в уже не раз цитируемой книжке В.М. Тихомирова Рассказы о максимумах и минимумах http://ilib.mirror1.mccme.ru/djvu/bib-kvant/max.htm. Там же (а также в [АМТ]) показано, что аэродинамическая задача Ньютона может быть сформулирована в виде (4.4). Применим теорему 4.1 к задаче (4.4). Выпишем функцию Лагранжа Z 1 λ0 t L(x, u) = + p(t)(ẋ − u) dt + λ1 x(0) + λ2 x(1) . 1 + u2 0 (4.34) Условие Lb′x = 0 означает, что а) p(0) = λ1 и p(1) = −λ2 (условия трансверсальности) и б) ṗ = 0 (уравнение Эйлера–Лагранжа), влекущее p = const . Условие же (4.18) минимума лагранжиана принимает вид: λ0 t λ0 t − ps ≥ − pu b(t) ∀ s ≥ 0. (4.35) 2 1+s 1+u b2 (t) a) Легко видеть, что λ0 6= 0. В противном случае имели бы одно из трех: 1) p = 0 =⇒ λ1 = λ2 = 0; (4.35) (4.35) 2) p < 0 =⇒ s ≥ u b ∀s ≥ 0 ⇒ u b ≡ 0 ; 3) p > 0 =⇒ s ≤ u b ∀s ≥ 0 ⇒ u b ≡ ∞ . Все эти три случая приводят к противоречию. Следовательно, λ0 6= 0. 32 def Таким образом, можно h i считать, что λ0 = 1. Отметим еще, что q = −p > 0. Действительно, если t p ≥ 0, то inf 1+s2 − p s достигается лишь при s = ∞, что влечет противоречие: u b = ∞. s≥0 Значит, u b(t) есть то значение s ≥ 0, при котором для данного t ≥ 0 достигается минимум def N (t, s) = L t, x b(t), x(t), ḃ s +qx b(t) = t + qs. 1 + s2 (4.36) Найдем сначала те t ≥ 0, для которых этот минимум достигается при s = 0. Другими словами, u b(t) = 0 , если 1 t def 2 2 + s ≥ t ⇐⇒ t ≤ τ = 2q . + q s ≥ t ⇐⇒ t + qs1 + s ≥ t + tv ⇐⇒ q 1 + s2 s Итак, u b(t)= 0 при 0 ≤ t < τ , (4.37) u b(t) при τ ≤ t ≤ 1 . Число u b(τ ) > 0 , задающее скачок функции u b при t = τ, характеризуется тем, что (4.36) N (τ, u b(τ )) = τ (4.36) +qu b(τ ) = min N (τ, s) = min N (τ, s) = N (τ, 0) = τ . 2 s>0 s≥0 1+u b (τ ) Поэтому, во-первых, u b(τ ) = s > 0 есть корень уравнения τ +qs = τ 1 + s2 ⇔ τ + qs(1 + s2) = τ + s2 τ q(1 + s2 ) = sτ ⇔ Во-вторых, u b(t) = s > 0 при t ≥ τ = 2q есть корень уравнения dN (t, s) =0 ds ⇔ q= 2t s (1 + s2 )2 ⇔ t(s) = q 2 τ =2q ⇔ 1 + s2 = 2s 1 + 2s + s3 s . ⇔ (4.38) u b(τ ) = 1. (4.39) Далее, x(t) ḃ = u b(t) = s, где s > 0 доставляет минимум N (t, s) для данного t. Поэтому при t > τ имеем: db x(t(s)) dt dt (4.39) q 1 q 1 3 4 7 3 2 = x(t) ḃ =s = − + 2s + 3s ⇒ x b(t) = ln + s + s − q , (4.40) ds ds ds 2 s 2 s 4 8 t=t(s) где постоянная интегрирования равна − 78 q , поскольку x b(τ ) = 0, а u b(τ ) = 1. Масштабный коэффици(4.4) ент q определяется из граничного условия x b(1) = h. Кривую, s 7→ (t(s), x(s)) заданную параметрически формулами (4.39)–(4.40), называют кривой Ньютона. Она задает боковую поверхность тела вращения, испытывающего наименьшее сопротивление при движении в разреженной среде. Действи(4.35) тельно, интегрируя неравенство 1+ẋt2 (t) + q ẋ(t) ≥ 1+but2 (t) + q u b(t) в пределах от 0 до 1 и учитывая, R1 R1 что 0 ẋ(t) dt = 0 x(t) ḃ dt, получаем требуемый результат Z 0 1 t dt ≥ 1 + u2 (t) Z 0 1 t dt . 1+u b2 (t) С начала 90-х годов 20 века появились интересные работы, обобщающие задачу Ньютона в разных направлениях: ослаблялись условия на осевую симметрию, на выпуклость. Задача минимизации сопротивления движущегося тела рассматривалась в более реалистичных средах, с температурным движением частиц, при котором соударения не являются абсолютно упругими (см., например, А.Ю. Плахов, Д. Торреш Аэродинамическая задача Ньютона в средах хаотически движущихся частиц, Матем. сб., 2005, том 196, № 6, 111-160). 4. Упражнения и задачи. 1). Показать, что отсутствие условия |u| ≤ 1 в задачах (4.1), (4.5), (4.6) (соотв. условия ẋ = u ≥ 0 в задаче Ньютона (4.4)) влечет отсутствие в них решения. Пояснить, почему решение будет отсутствовать 33 и в том случае, если эти условия заменить, соответственно, на такие: |ẋ(t)| < 1 и ẋ(t) = u(t) > 0 , или более общ́о, если множество K ∋ u(t) открыто. R1 2a). Пусть K ⊂ R, u b ∈ C(R; K), F (b u) ≤ F (u) = 0 f (t, u(t)) dt ∀ u ∈ M = {u ∈ C(R; K) | Q(u) = 0}, R1 где Q(u) = 0 q(t, u(t)) dt, а f и q — достаточно гладкие функции. Это есть (ср. с (4.11)–(4.14)) так называемая задача Ляпунова46 в ее простейшем варианте. Показать, что существует такой ненулевой def вектор λ = (λ0 , λ1 ) ∈ R2 с λ0 ≥ 0, что L(b u) ≤ L(u) = λ0 F (u) + λ1 Q(u) для любого u ∈ U = C(R; K). 2b). Пусть F ∈ C 1 (U ; R), Q ∈ C 1 (U ; R), M = {u ∈ U | Q(u) = 0 }, где U — банахово пространство. def Показать, что ошибочно утверждение, будто бы L(b u) ≤ L(u) = λ0 F (u) + λ1 Q(u) для любого u ∈ U, если F (b u) ≤ Q(u) для любого u ∈ M. Сравните с задачей 2a и принципом максимума Понтрягина. Указание. Рассмотреть случай, когда F : R2 ∋ u = (u1 , u2 ) 7→ F (u1 , u2 ) = u1 u2 , а Q(u1 , u2 ) = u1 − u2 . 3). Показать, что существует ровно один коэффициент q > 0 , фигурирующий в формулах (4.39)– (4.4) (4.40), для которого выполнено граничное условие x b(1) = h, где h > 0 — заданное число. Указание. Проверьте, что кривая, заданная в (4.39)–(4.40), выпукла, т.е. ẍ = u̇ = u (dx/du)−1 ≥ 0. 4a). Решить так называемую простейшую задачу быстродействия (задачу Фельдбаума (4.5)) T → inf, если ẍ = u, |u(t)| ≤ 1, x(0) = a, ẋ(0) = b , x(T ) = ẋ(T ) = 0. Указание. Выписав для функции Лагранжа Z 1 L(T, x, u) = p1 (ẋ1 − x2 ) + p2 (ẋ2 − u) dt + λ0 T + λ1 x1 (0) + λ2 x2 (0) + λ3 x1 (T ) + λ4 x2 (T ) 0 условия (4.17) и (4.18), проверить, что p2 6≡ 0, u b(t) = sgn A(t − Tb) + B . Поскольку ẋ1 /ẋ2 = x2 /u, то на d том интервале, где u b = const, элемент (b x1 , x b2 , u b) таков, что dt ux1 − x22 = 0 и, следовательно, имеем: ±x1 = x22 + C. Требование x1 (T ) = x2 (T ) = 0 выделяет в фазовой плоскости две зоны, разделенные ветвями парабол ±x1 = x22 , где sgn x1 = −sgnx2 , выше/ниже которых u b = ∓1. Для того, чтобы доказать b оптимальность найденного элемента (T , x b1 , x b2 , u b), другими словами, установить разрешимость задачи, можно воспользоваться тем, что там, где ẍ ≤ 1, имеем (дважды проинтегрировав это неравенство): Rτ R1 x b(τ ) − x(τ ) = 0 0 (1 − ẍ(s)) dsdt ≥ 0. При этом, равенство эквивалентно условию (1 − ẍ(s)) = 0 п.в., что дает x(t) = x b(t) для t ∈ [0, τ ]. Аналогично, там, где ẍ ≥ −1, имеем: x(t) = x b(t) для t ∈ [τ, T ] для любого T < Tb. Отсюда получаем, что T = Tb. 4b)*. Решить еще одну задачу Фельдбаума T → inf, если d3 x = u, dt3 |u(t)| ≤ 1, x(0) = a, ẋ(0) = b , ẍ(0) = c , x(T ) = ẋ(T ) = ẍ(T ) = 0. (4.41) 4c). Решить задачу Бушоу (4.6): T → inf, если ẍ + x = u, |u(t)| ≤ 1, x(0) = a, ẋ(0) = b , x(T ) = ẋ(T ) = 0. Указание. Отличие от задачи 4a) лишь в том, что теперь u b(t) = sgn A sin t + B cos t , (u − x1 )ẋ1 = x2 ẋ2 и там, где u b = const, имеем: (x1 − u)2 + x22 = R2 . Требование x1 (T ) = x2 (T ) = 0 выделяет в фазовой плоскости две зоны, разделенные семейством полуокружностей, радиуса 1, с центрами в нечетных точках оси x1 и находящихся во 2-й и 4-й четвертях плоскости (x1 , x2 ), выше/ниже которых u b = ∓1. 5). Максимизация капитала. Начальный капитал предприятия x(0) = a > 0 пополняется за счет продажи продукции по следующему закону: ẋ(t) = u(t)x(t), где t 7→ u(t) ∈ [0, 1] есть управляющая функция дирекции. Согласно уставу предприятия, сумма βx(t), где β ∈ (0, 1) , идет на зарплату и прочие текущие расходы. Какое нужно выбрать управлении, чтобы предприятие имело максимальный 46 Ляпунов Алексей Андреевич (1911-1973) один из основоположников кибернетики, член-корреспондент АН СССР. Его работа “О вполне аддитивных вектор-функциях”, Изв. АН СССР, Сер. матем., 4:6 (1940) в существенной мере вскрывает причину справедливости принципа максимума Понтрягина, выраженного в (4.10) неравенством L(b x, u b) ≤ L(b x, u) ∀u ∈ U . 34 капитал к моменту T ? RT Указание.Итоговыйкапитал равен K = 0 1−β −u(t) x(t) dt. Требуется минимизировать функционал RT −K = 0 −γ + u(t) x(t) dt , где γ = 1 − β ∈ (0, 1). Функция Лагранжа L(x, u) = Z 0 Th i λ0 u(t) − γ x(t) + p(t) ẋ(t) − u(t)x(t) dt + λ1 x(0) . Условие стационарности по x дает ṗ = λ0 (u − γ) − pu , p(0) = λ1 , p(T ) = 0. Отсюда получаем, что функция t 7→ p(t) не может иметь более конечного числа нулей на [0, T ], иначе: λ0 = 0 ⇒ p ≡ 0 ⇒ λ1 = 0. Далее, равенство λ0 = 0, приводящее к уравнению ṗ = −pu , несовместимо с условием p(T ) = 0. Можно считать, что λ0 = 1. Из условия минимума (4.18) получаем: u b(t) = 1 ⇔ 1 − p < 0 и u b(t) = 0 ⇔ 1 − p > 0. В последнем def случае: p = −γ(t−T ) < 1, что выполнено при t > τ = T − γ1 . Поэтому оптимальное управление таково: если τ > 0, т.е. T > γ1 , то вначале, а именно, при 0 < t < τ надо максимально “воспроизводиться”, т.е. брать u b(t) = 1, а затем лишь извлекать прибыль, полагая u b(t) = 0 при t ∈ [τ, T ]. Если же T столь мало, что T < γ1 , то “воспроизводиться” вовсе не следует. В этом случае u b(t) = 0 ∀ t ∈ [0, T ]. 6). Мягкая посадка на Луну. Требуется подобрать такое управление u : R+ ∋ t 7→ u(t) ∈ [0, 1] двигателем спускаемого вертикально вниз космического аппарата на поверхность небесного тела, лишенного атмосферы, чтобы при минимальном расходе топлива скорость аппарата в момент T его посадки была бы равна нулю. Обозначив через m(t) массу аппарата в момент t, а через x1 (t) ≥ 0 расстояние до поверхности небесного тела, рассмотрим такую модель обозначенной задачи: m(T ) → sup , ẋ1 = x2 , m(t)ẋ2 = k u − γ m(t) , ṁ = −u , xj (0) = ξj , xj (T ) = 0 , j = 1, 2 . Здесь γ и k — положительные коэффициенты, −γ m(t) — сила притяжения, а ku(t) — сила тяги (тормозящая падение), которая создается двигателем аппарата с помощью управления u(t) ∈ [0, 1] . Указание. Применяя теорему 4.1 и вводя функцию Лагранжа Z T ku L(T, x, u) = −λ0 m(T )+ p1 (ẋ1 −x2 )+p2 (ẋ2 − +γ)+p3 (ṁ+u) dt+λ1 x1 (0)+λ2 ẋ2 (0)+µ1 ẋ1 (T )+µ2 ẋ2 (T ) m 0 получим из условия стационарности по переменным (x1 , x2 .m), что p1 (t) = p = const, p2 (t) = −pt + q, kp 2 q = const, а функция ψ = −p3 + kp m удовлетворяет уравнению ψ̇ = − m(t) . Кроме того, из стационарности по T вытекает равенство ψ(T )b u(T ) = γ p2 (T ), а из условия минимума (4.18) следует: u b(t) = 0 при ψ(t) < 0. Легко проверяется, что p 6= 0. Отсюда следует (подробности см., например, в [АМТ]), что в предположении существования решения задачи, найдутся такое T > 0 и такое единственное τ ≥ 0 , что u b(t) = 0 при t < τ и u b(t) = 1 при t ∈ (τ, T ). Это значение параметра τ , а также искомое время T “прилунения” определяются из условия непрерывной склейки двух вектор-функций: x0 : [0, τ ] 7→ (x01 , x02 ) и x1 : [τ, T ] 7→ (x11 , x12 ) . Первая из них x0 определяется свободным падением ( u b(t) = 0 ) и потому τ2 0 x1 (τ ) = ξ1 + ξ2 t − γ 2 , x2 (τ ) = ξ2 − γτ. Эти же значения при t = τ должна принимать функция x1 , которая зависит от искомого параметра T (итогового времени “прилунения”) и является при t ∈ [τ, T ) решением следующей задачи Коши ẋ1 = x2 , m(t)ẋ2 = k − γ m(t) , x1 (T ) = x2 (T ) = 0, где m(t) = m(0)− t. Решение задачи 4b)*, представленной на стр. 34 ... Применим теорему 4.1 к задаче (4.41), записав уравнение x (t) = u(t) в виде системы ẋ1 = x2 , ẋ2 = x3 , ẋ3 = u (4.42) относительно фазовой переменной x = (x1 , x2 , x3 ), где x1 = x, x2 = ẋ и x3 = ẍ . Условие стационарности Lb ′x = 0 по x для функции Лагранжа L(T, x, u) = ZT h 0 i λ0 + p1 (x2 − ẋ1 ) + p2 (x3 − ẋ2 ) + p3 (u − ẋ3 ) dt+ λ1 x1 (0) + λ2 x2 (0) + λ3 x3 (0) + λ4 x1 (T ) + λ5 x2 (T ) + λ6 x3 (T ) (4.43) 35 приводит к системе уравнений Эйлера–Лагранжа ṗ1 (t) = 0, ṗ2 (t) = −p1 (t), ṗ3 (t) = −p2 (t) (4.44) и условиям трансверсальности λ1 + p1 (0) = λ2 + p2 (0) = λ3 + p3 (0) = λ4 − p1 (T ) = λ5 − p2 (T ) = λ6 − p3 (T ) = 0 . (4.45) Условие минимума (4.18) влечет u b(t) = − sgn p3 (t) (в точках непрерывности u b) , (4.46) (4.41) (4.45) а стационарность Lb ′T = 0 по T , ввиду x(T ) = 0 и λ6 − p3 (T ) = 0 дает: λ0 = −p3 (T )u(T ) . Отсюда следует, что p3 6≡ 0 (иначе все множители Лагранжа, включая λ0 , будут равны нулю). Таким образом, 2 (4.44) поскольку ddtp23 = const, оптимальное управление u b меняет знак не более двух раз, принимая при этом значения ±1. 2 (4.44) В силу (4.42), на участках знакопостоянства u b (которых, в силу условия ddtp23 = const, не более d трех) имеем: dt =u b dxd3 . Поэтому, согласно (4.42), на участках знакопостоянства u b имеем: d2 x1 = x3 , dx23 u b (4.42) что совместно с уравнением ẋ3 = u дает x3 (t) = u b(t)(t − A) , dx2 = x3 , dx3 x2 (t) = u b(t) x23 (t)/2 + B , x1 (t) = x33 (t)/6 + Bx3 (t) + C . (4.47) (4.48) Фигурирующие в формулах (4.48) параметры A, B и C зависят от соответствующего участка знакопостоянства u b и стартовой точки (x1 (0), x2 (0), x3 (0)) = (a, b, c, ) ∈ R3 искомой фазовой траектории. При этом, t < Tb, где Tb — искомое значение целевого функционала. Поэтому u b(t) = − sgn x3 (t) . (4.49) S1 = {(x1 , x2 , x3 ) = (x33 /6 , −(sgn x3 )x23 /2 , x3 ) ∈ R3 } , (4.50) В силу того, что (x1 (Tb), x2 (Tb), x3 (Tb)) = (0, 0, 0), финальный участок фазовой траектории (очевидно, соответствующий параметрам A = Tb и B = C = 0 ) принадлежит кривой параметризованной параметром x3 ∈ R. Если стартовая точка (x1 (0), x2 (0), x3 (0)) = (a, b, c, ) ∈ R3 не принадлежит этой кривой, то оптимальная траектория необходимо должна выйти на S1 в некоторой точке (e x1 , x e2 , x e3 ) = (e x33 /6 , −(sgn x e3 )e x23 /2 , x e3 ) ∈ S1 , подходя к ней с управлением противоположного знака, т.е. с u b(t) = sgn x e3 , вдоль кривой S2 (e x3 ) , определяемой формулами (4.48) и условием (4.48),(4.50) x33 /6 + Bx3 + C , sgn x e3 x23 /2 + B , x3 = (e x33 /6 , − sgn x e3 x e23 /2 , x e3 ) . (4.51) x1 =e x1 ,x2 =e x2 ,x3 =e x3 Из (4.51) вытекает, что B = −e x23 , а C = x e33 . Семейство этих кривых S2 (e x3 ) , параметризованное параметром x e3 ∈ R , образует поверхность S2 = (x33 /6 − x̃23 x3 + x̃33 , (sgn x̃3 )(x23 /2 − x̃23 ) , x3 ) , (4.52) причем x3 ∈ (−∞, x̃3 ) при x̃3 ∈ (0, ∞) и x3 ∈ (x̃3 , ∞) при x̃3 ∈ (−∞, 0), ибо u b(t) = sgn x e3 . Если точка (a, b, c) принадлежит поверхности S2 , оптимальная траектория стартуя из этой точки, достигает вдоль соответствующей кривой S2 (e x3 ) ⊂ S2 точки (e x33 /6 , −(sgn x e3 )e x23 /2 , x e3 ) на кривой S1 и, сменив знак управления, движется в начало координат вдоль этой кривой S . Если же стартовая точка 1 (a, b, c) = x1 (x3 , x e3 ) , x2 (x3 , x e3 ) , c лежит вне поверхности S2 , то оптимальная траектория предвариb(t) = − sgn x e3 принимает значение ±1 , если тельно достигает поверхность S2 . При этом управление u x3 ≶ x e3 и c > x3 . А если x3 ≶ x e3 и c < x3 , то u b = ∓1 . В заключение отметим, что искомый минимум Tb целевого функционала равен сумме модулей изменений x3 на всех участках знакопостоянства управления, поскольку ẋ3 = u b, а u b = ±1 . 36 §5 Слабый и сильный минимум. Поле экстремалей. Уравнение Гамильтона-Якоби 1. Условия локального минимума для простейшей вариационной задачи. В рассмотренных в предыдущих параграфах задачах ставился вопрос о необходимых условиях, которым удовлетворяет некий элемент zb из заданного множества M , доставляющий минимальное значение целевому функционалу F0 , рассматриваемому на M , т.е. F0 (b z ) ≤ F0 (z) ∀ z ∈ M. Ответ на этот вопрос для задачи Лагранжа (включая изопериметрическую задачу), для задачи Люстерника и для задачи оптимального управления представлен, соответственно, в теоремах 2.1, 3.2 и в теореме 4.1. Заметим, что приведенные доказательства этих теорем позволяют их усилить, поскольку в этих доказательствах можно предполагать выполнение всех условий соответствующей теоремы лишь локально, т.е. в некоторой ε -окрестности элемента zb . Анализируя доказательства теоремы 2.1 и теоbn ) элемента ремы 4.1, приходим к выводу, что за ε -окрестность фазовой компоненты x b = (b x1 , . . . , x b Tb, x zb = (θ, b, Tb) в задаче оптимального управления следует взять множество, не меньшее, чем {x ∈ P C(R; Rn ) | max |x(t) − x b(t)| < ε} , где t |x(t) − x b(t)| = max |xj (t) − x bj (t)| , 1≤j≤n (5.1) т.е. множество всех тех кусочно-непрерывных функций x, для которых в точках t непрерывности x и x b при любом j = 1, . . . , n справедливы неравенства: max |xj (t) − x bj (t)| < ε. Что же касается ε -окрестности фазовой компоненты x b = (b x1 , . . . , x bn ) в задаче Лагранжа, то здесь можно взять как множество O(b x, ε) = {x ∈ C(R; Rn ) | max |x(t) − x b(t)| < ε} , (5.2) O1 (b x, ε) = {x ∈ C 1 (R; Rn ) | max |x(t) − x b(t)| < ε, max |ẋ(t) − x(t)| ḃ < ε} (5.3) t аналогичное (5.1), так и существенно меньшее (но минимально возможное в рамках доказательства теоремы 2.1) множество t t всех тех непрерывно дифференцируемых функций x, для которых при любом j = 1, . . . , n справедливы неравенства: max |xj (t) − x bj (t)| < ε, max |ẋj (t) − x ḃj (t)| < ε. Определение 5.1 Говорят, что zb есть слабый, соответственно, сильный минимум в задаче Лагранz ) ≤ F0 (z) справедливо для ∀ z ∈ M ∩ O1 (b x, ε) , соответственно, жа (2.1)–(2.6), если неравенство F0 (b для ∀ z ∈ M ∩ O(b x, ε) при некотором ε > 0. Такая терминология вызвана тем, что окрестность O1 (b x, ε) , так сказать, “тощенькая”, “слабенькая” по сравнению с более “солидной”, более “сильной” окрестностью O(b x, ε) . Вот некоторые выводы, которые могут быть сделаны, если известны необходимые и достаточные условия минимума (слабого и/или сильного): 1) если не выполнено хотя бы одно из необходимых условий, то задача не имеет решение; 2) если какому-то необходимому условию удовлетворяет лишь один элемент, то задача имеет не более одного решения; 3) если среди тех элементов, удовлетворяющих тем или иным необходимым условиям, есть только один, который удовлетворяет какому-то достаточному условию, то задача имеет, причем единственное решение. Выписать в явном виде необходимые и/или достаточные условия (которые были бы близки к критерию) весьма затруднительно для общей задачи Лагранжа47 . Поэтому ограничимся здесь рассмотрением тех необходимых и достаточных условий слабого, а также сильного минимума, которые были установлены классиками вариационного исчисления: Эйлером, Лежандром48 , Якоби и Вейерштрассом. Найденные ими условия относятся к весьма частному случаю задачи Лагранжа, а именно, к так называемой простейшей задаче вариационного исчисления: Z t1 F (x) = f (t, x(t), ẋ(t)) dt → inf , x(t0 ) = x0 , x(t1 ) = x1 . (5.4) t0 где f ∈ C 3 (R3 ), а t0 и t1 — фиксированы. 47 48 См., впрочем, главу 4 книги [ОПУ], где рассматривается этот вопрос для гладкой задачи. Адриен-Мари Лежандр (1752 – 1833) — французский математик, член Парижской Академии наук (с 1783 года). 37 Определение 5.2 Говорят, что x b есть слабый, соответственно, сильный минимум в простейшей задаче вариационного исчисления (5.4), если неравенство F (b x) ≤ F (x) верно для ∀ x ∈ M ∩ O1 (b x, ε) , соответственно, для ∀ x ∈ M ∩ O(b x, ε) при некотором ε > 0. Определение 5.3 Скажем, что выполнено условие Эйлера (условие Э), если x b — экстремаль, т.е. x b есть решение уравнения Эйлера–Лагранжа. Определение 5.4 Скажем, что выполнено условие Лежандра (условие Л), если fbẋẋ (t) ≥ 0 ∀ t ∈ [t0 , t1 ]. Определение 5.5 Скажем, что выполнено усиленное условие Лежандра (условие Л*), если fbẋẋ (t) > 0 ∀ t ∈ [t0 , t1 ]. Определение 5.6 Скажем, что выполнено условие Якоби (условие Я), если справедливо усиленное условие Лежандра49 , а решение уравнения Якоби50 − d b fẋẋ (t) ḣ + fbẋx (t)h + fbẋx (t) ḣ + fbxx (t)h = 0 dt ⇔ d b d fẋẋ (t) ḣ = fbxx (t) − fbẋx (t) h (5.5) dt dt не обращается в ноль на интервале (t0 , t1 ) при начальных условиях: h(t0 ) = 0, ḣ(t0 ) = 1. Определение 5.7 Скажем, что выполнено усиленное условие Якоби (условию Я*), если справедливо усиленное условие Лежандра, а решение уравнения (5.5) не обращается в ноль на полусегменте (t0 , t1 ] при начальных условиях: h(t0 ) = 0, ḣ(t0 ) = 1. Определение 5.8 Скажем, что выполнено условие Вейерштрасса (условие В), если на экстремали x b функция ẋ 7→ f (t, x b(t), ẋ) выпукла при любом t ∈ [t0 , t1 ]. Определение 5.9 Скажем, что выполнено усиленное условие Вейерштрасса (условие В*), если функция ẋ 7→ f (t, x(t), ẋ) выпукла в “C”-окрестности экстремали x b при любом t ∈ [t0 , t1 ] , т.е. для любого t ∈ [t0 , t1 ] и x(t) ∈ O(b x, ε) (с некоторым ε > 0 ) функция ẋ 7→ f (t, x(t), ẋ) выпукла. Теорема 5.1 Справедливы следующие импликации Э∪Л∪Я∪В Э∪Л∪Я ⇑ ⇑ сильный минимум =⇒ слабый минимум ⇑ ⇑ Э ∩ Л* ∩ Я* ∩ В* Э ∩ Л* ∩ Я* . 49 Это требование означает, что уравнение (5.5) является дифференциальным уравнением 2-го порядка. Нет никакого резона специально запоминать любую из приведенных в (5.5) форм уравнения Якоби, поскольку первая из этих форм, очевидно, есть стандартная форма записи уравнения Эйлера для квадратичного функционала Z t1 def F ′′ (b x, ·) : h 7→ F ′′ (b x, h) = fbẋẋ (t)ḣ2 + 2fbẋx (t)ḣh + fbxx (t)h2 dt , 50 t0 появляющегося в разложении F (b x + αh) − F (b x) = αF ′ (b x)h + α2 ′′ F (b x, h) + o(α2 ) 2! где F ′ (b x) = Zt1 t0 fbx (t)h(t) + fbẋ (t)ḣ(t) dt . 38 при α → 0, Следующие два простых примера дают возможность ощутить некоторые слабые и сильные стороны теоремы 5.1 о необходимых и достаточных условиях локального минимума. R 1 2 3 Пример 1. F (x) = 0 x − x ẋ dt → inf , x(0) = x(1) = 0. Имеется единственная зкстремаль R1 R1 x). Конечно, x b(t) ≡ 0 . Она доставляет глобальный минимум, т.к. F (x) = 0 x2 dt + 0 3x2 ẋ2 dt ≥ 0 = F (b все условия Э, Л, Я, В выполнены, что легко проверяется непосредственно. Однако ни одно из условий Л*, Я*, В*, входящих в достаточные условия для локального минимума не выполнено. R 1 2 3 Пример 2. F (x) = 0 ẋ − xẋ dt → inf , x(0) = x(1) = 0. Имеется единственная зкстремаль R1 x b(t) ≡ 0 . Очевидно, что она доставляет слабый локальный минимум, т.к. F (x) = 0 ẋ2 1 − xẋ dt ≥ 0 (5.3) при 1−xẋ ≥ 0 и, следовательно, для любого x ∈ O1 (b x, 1). Конечно, все условия Э, Л*, Я* выполнены, что легко проверяется непосредственно. Очевидно, верно и условие В, но не выполнено условие В*. Поэтому вопрос о сильном минимуме не удается разрешить с помощью теоремы 5.1. Поэтому рассмотрим семейство непрерывных функций при 0 < t ≤ t1 = ε2 /k , kt/ε xε (t)= (5.6) m(t2 − t)/ε при t1 ≤ t < t2 = t1 + ε2 /m , равных нулю при t ≥ t2 и зависящих от ε > 0 , а также от выбираемых ниже параметров k > 0 и m > 0 . Для этого семейства функций Z t1 Z t2 2 ẋε 1 − xε ẋε dt = k(2 − k)/2, а ẋ2ε 1 − xε ẋε dt = m(m + 2)/2 . 0 t1 Поэтому при t2 = 5ε2 /4 ≤ 1 и k(2 − k) + m(m + 2) < 0 (например, при k = 4 , m = 1 ) имеем: Z (5.2) O(b x, ε) ∋ 7→ F (xε ) = 1 0 ẋ2ε 1 − xε ẋε dt < F (b x) = 0 . Это свидетельствует о том, что экстремаль x b = 0 не является сильным локальным минимумом. 2. Доказательство теоремы 5.1 в части необходимых условий. Поскольку сильный минимум влечет слабый, достаточно установить, что слабый минимум влечет Э ∪ Л ∪ Я, а сильный минимум влечет условие Вейерштрасса. 2.1. В том случае, когда x b доставляет лишь слабый минимум, можно утверждать (как уже было отмечено в сноске 50 на стр. 38), что 0 ≤ F (b x + αh) − F (b x) = αF ′ (b x)h + α2 ′′ F (b x, h) + o(α2 ) 2! при α → 0 , (5.7) где Zt1 F (b x) = fbx (t)h(t) + fbẋ (t)ḣ(t) dt ′ и F ′′ (b x, h) = Z t1 t0 t0 fbxx (t)h2 (t) + 2fbxẋ (t)h(t)ḣ(t) + fbẋẋ (t)ḣ2 (t) dt . Ввиду (5.7), имеем: F ′ (b x) = 0 и F ′′ (b x, h) ≥ F ′′ (b x, 0) = 0 для любых функций h ∈ C01 [t0 , t1 ]. Равенство F ′ (b x) = 0 влечет, очевидно, условие Эйлера. А неравенство F ′′ (b x, h) ≥ F ′′ (b x, 0) = 0 означает, что функb b ḃ ция h = 0 доставляет глобальный минимум 0 = K(h, h) ≤ K(h, ḣ) в следующей задаче оптимального управления: K(h, u) = F (b x, h) def ′′ ḣ=u = Z t1 t0 k t, h(t), u(t) dt → inf, ḣ = u , (5.8) где k t, h(t), u(t) = fbxx (t)h2 (t) + 2fbxẋ (t)h(t)u(t) + fbẋẋ (t)u2 (t), а (h, u) ∈ C01 [t0 , t1 ] × C [t0 , t1 ]. Функция Лагранжа этой задачи Z t1 h i (5.9) L(h, u) = λ0 k t, h(t), u(t) +p(t) ḣ(t) − u(t) dt . t0 39 Согласно теореме 4.1, справедливо уравнение и следующее условие минимума Lb ′h = 0 ṗ(t) = λ0 b kh (t) ⇔ λ0 k(t, b h(t), s) − p(t)s ≥ λ0 k(t, b h(t), u b(t)) − p(t)b u(t) (5.10) (5.11) ∀s ∈ R. Ясно, что λ0 6= 0 (иначе все множители Лагранжа равны нулю, т.к. условие max p(t)s (5.11) s∈R = p(t)b u(t) влечет p(t) ≡ 0 ). Поэтому можно положить λ0 = 1, Таким образом, для любого фиксированного t ∈ [t0 , t1 ] функция q : R ∋ s 7→ q(s) = k(t, b h(t), s) − p(t)s (5.12) достигает минимум при s = u b(t). Как известно, в точке минимума, производная равна нулю, т.е. p(t) = ks′ t, b ⇔ p(t) = 2 fbxẋ (t)b h(t) + fbẋẋ (t)ḃ h(t) . (5.13) h(t), s s=b u(t) Кроме того, d2 q(s) ≥ ds2 s=b u(t) 0. Это дает условие Лежандра: fbẋẋ (t) ≥ 0 ∀ t ∈ [t0 , t1 ]. Докажем, что выполнено условие Якоби. В противном случае (при наличии усиленного условия Леb ẋẋ (t) > 0 ) найдется такое τ ∈ (t0 , t1 ) и найдется такое нетривиальное решение hτ уравнения жандра L Якоби, что hτ (t0 ) = hτ (τ ) = 0. Продолжим функцию hτ нулем для t > τ , т.е. возьмем функцию b h, b b такую, что h(t) = hτ (t) при t ∈ [t0 , τ ] и h(t) = 0 при t ∈ [τ, t1 ]. Вычислим значение K(h, u) в точке (h, u) = (b h, u b) , т.е. при (h, u) = (b h, ḃ h). Имеем (5.8) K(b h, ḃ h) = Z τ h i 2 fbxx (t)b h2 (t) + fbxẋ (t)b h(t)ḃ h(t) + fbxẋ (t)b h(t)ḃ h(t) + fbẋẋ (t)ḃ h (t) dt . t0 Проинтегрируем по частям 2 Rτ fbxẋ (t)b h(t)ḃ h(t) + fbẋẋ (t)ḃ h (t) dt. Учитывая, что внеинтегральные члены t0 обратятся в нуль, а b h(t) = hτ (t) при t ∈ [0, τ ] и hτ — решение уравнения Якоби (5.5), получим Z τh i d b (5.5) (5.8) b − K(h, u b) = fẋẋ (t) ḣτ + fbẋx (t)hτ + fbẋx (t) ḣτ + fbxx (t)hτ hτ dt = 0 ≤ K(h, u) . dt t0 u b =ḃ h b b) есть решение задачи оптимального управления (5.8). Отсюда, согласно (5.13), имеем: Итак, пара (h, u p(t) = 2 fbxẋ (t)b h(t) + fbẋẋ (t)ḃ h(t) . Поэтому p(t) ≡ 0 при t ∈ [τ, t1 ], ибо b h и, соответственно, ḃ h равны нулю при t ≥ τ. В частности, lim p(t) = 0. Однако t→τ +0 b b (t) h(τ=)=0 L b ẋẋ (t) ḣτ (τ ) 6= 0 , lim p(t) = lim L ḣ t→τ −0 t→τ −0 так как иначе ḣτ (τ ) = 0 (ввиду того, что fbẋẋ (t) > 0 ). Но равенство ḣτ (τ ) = 0 невозможно, поскольку hτ — нетривиальное решение уравнения Якоби, подчиненное условию hτ (t0 ) = hτ (τ ) = 0. Таким образом, получаем, что функция p разрывна. А это противоречит принципу максимума Понтрягина. 2.2. В случае, когда x b доставляет сильный минимум, можно утверждать, что пара (b x, u b), где u b=x ḃ является решением (доставляющим локальный минимум) для такой задачи оптимального управления Z t1 f (t, x(t), u(t)) dt → inf , u(t) = ẋ(t) , x(t0 ) = x0 , x(t1 ) = x1 . (5.14) t0 Согласно теореме 4.1, существуют множители Лагранжа λ0 ≥ 0, λ1 ∈ R, λ2 ∈ R и p ∈ C 1 [t0 , t1 ], одновременно не равные нулю, такие, что и ṗ(t) = λ0 fbx (t) , p(t0 ) = λ1 , λ0 f (t, x b(t), s) − p(t)s ≥ λ0 fb(t) − p(t) u b(t) 40 p(t1 ) = λ2 (5.15) ∀ s ∈ R , t ∈ [t0 , t1 ] . (5.16) Ясно, что λ0 6= 0 (иначе все множители Лагранжа равны нулю, т.к. условие max p(t)s = p(t)b u(t) s∈R (5.15) влечет p(t) ≡ 0 ⇒ λ1 = λ2 = 0). Поэтому можно положить λ0 = 1. Таким образом, для любого фиксированного t ∈ [t0 , t1 ] функция q : R ∋ s 7→ q(s) = f (t, x b(t), s) − p(t)s (5.17) p(t) = fẋ (t, x b(t), x(t)) ḃ . (5.18) достигает минимум при s = u b(t). В точке минимума производная этой функции равна нулю, т.е. Тем самым, ввиду того, что λ0 = 1 , неравенство (5.16) принимает вид f t, x b(t), s −f t, x b(t), u b(t) ≥ fẋ t, x b(t), x(t) ḃ s−u b(t) ∀s ∈ R. (5.19) означающий, что на экстремали x b функция ẋ 7→ f (t, x b(t), ẋ) выпукла при любом t ∈ [t0 , t1 ]. Замечание 5.1 Условие Вейерштрасса (5.19) можно представить в таком виде: def E(t, x b(t), x(t), ḃ u) ≥ 0 ∀ u ∈ R , t ∈ [t0 , t1 ], где E(t, x, ẋ, u) = f (t, x, u) − f (t, x, ẋ) − fẋ (t, x, ẋ)(u − ẋ) так называемая функция Вейерштрасса. 3. Поле экстремалей и доказательство теоремы 5.1 в части достаточных условий. 4. Упражнения и задачи. R1 1). 0 ẋ2 dt → inf, x(0) = 1, x(1) = 0. R1 2). ẋ2 − x dt → inf, x(0) = 0, x(1) = 0. 0 R1 3). ẋ2 + tx dt → inf, x(0) = 0, x(1) = 0. 0 4). tẋ2 dt → inf, x(0) = 0, x(e) = 1. 1 R1 x2 ẋ2 dt → inf, x(0) = 1, x(1) = 0 R2 5). 6). t2 ẋ2 dt → inf, x(1) = 3, x(2) = 1. 0 4/3 R 7). 8). 9). Re x ẋ2 0 R1 −1 π/2 R 10). 11). 12). 13). §6 ẋ2 − x2 dt → inf, x(0) = 0, x(π/2) = 1. ẋ2 − 4x2 dt → inf, x(0) = 0, x(3π/4) = −1. cos ẋ dt → inf, x(0) = 0, x(1) = π. 0 RT0 0 dt → inf, x(0) = 1, x(4/3) = 1/9. ẋ2 − x2 dt → inf, x(0) = 1, x(π/2) = 0. 0 3π/4 R 0 2. ẋ2 + 4x2 dt → inf, x(±1) = ±1. 0 π/2 R R1 √ ẋ3 dt → inf, x(0) = 0, x(T0 ) = a. Задачи линейные по управлению. Особые экстремали 41