15. Символы o и O, теорема о среднем, формула Тейлора Начнем эту лекцию с того, что введем два часто используемых в анализе f и g x → a, обозначения. Именно: пусть стремящиеся к нулю при | две функции переменной x, обе Обозначение 15.1. Если limx→a (f (x)=g (x)) = 0, будем писать: что f (x) = o(g (x)); если существуют такие C > 0, > 0, что |f (x)| 6 C · |g (x)|, если 0 < |x − a| < , то будем писать, что f (x) = O(g (x)). g (x) 6= 0 при всех x, достаточ- (Здесь подразумевается, конечно, что но близких к a). o(g (x)) означает, что g (говорят еще: f | бесконечно малая более высокого порядка, чем g )); соотношение f (x) = O(g (x)) означает: что f стремится к нулю не быстрее, чем g . Неформально говоря, соотношение функция f f (x) = стремится к нулю быстрее, чем функция У определения 15.1 имеются различные вариации. Например, вместо x → a можно предполагать, что x → ∞. Можно также считать, что переменная не непрерывна, а дискретна, заменив функции последовательности функции f и g {fn } и {g n }. {fn } (или последовательности бесконечности, а не к нулю. Пусть, например, 0 при x → ∞. f и g на Можно, наконец, предполагать, что < m < n. Тогда xn = {gn }) и o(xm ) при x → 0 и xm → xn f (x) В силу самого определения ясно, что слова « смысл только вместе с уточнением «при обе стремятся к x → a». = o(g (x))» имеют Тем не менее на прак- тике это уточнение всегда опускают, полагая, что из контекста ясно, что куда стремится. Для начинающих символы o и O могут представлять известную трудность, поскольку их использование представляют собой довольно серьезную вольность речи (например, одним и тем же символом o(x) могут обозначаться совершенно разные функции). Тем не менее такая символика и удобна, и общепринята, так что давайте к ней привыкать. Приведем примеры использования символа o. Начнем с очень про- стой, но важной переформулировки. Предложение 15.2. Пусть f : (p; q ) → C | функция и a ∈ (p; q ). Тогда следующие два условия эквивалентны: (1) (2) f 0 ( a ) = c; f (x) = f (a) + c(x − a) + o(x − a). 1 (В условии (2), конечно, подразумевается уточнение «при Доказательство. (1) ⇒ (2). x → a».) Нам надо доказать, что f (x) − f (a) − c(x − a) x→a x−a lim : = 0 Это действительно так, поскольку f (x) − f (a) − c(x − a) x→a x−a lim f (x) − f (a) − c; x→a x−a = lim (15.1) и правая часть равна нулю ввиду определения производной. (2) ⇒ (1). На сей раз нам дано, что f (x) − f (a) − c(x − a) x→a x−a lim = 0; формула (15.1) показывает, что это соотношение равносильно тому, что lim x→a f (x)−f (a) − c. x− a А теперь покажем, как o-символика может работать. f : (p; q ) → R | дифференцируемая функция, и пусть для точки a ∈ (p; q ) имеем f 0 (a) > 0. Тогда существует такое " > 0, что f (x) > f (a) при a < x < a + " и f (x) < f (a) при a − " < x < a. Предложение 15.3. Пусть Можно сказать, что это предложение | локальный аналог достаточного признака возрастания функции. Ясно, что аналогичное утверждение верно и для случая Доказательство. f 0 (a) < 0. Положим f 0 (a) = c > 0. Идея доказательства состоит в следующем. Ввиду предложения 15.2 имеем f (x) = f (a) + c(x − a) + o(x − a); x > a, то f (x) − f (a) = c(x − a) + o(x − a), где первое слагаемое положительно, так как c > 0, а второе слагаемое, коль скоро оно стремится к нулю быстрее, чем x − a, будет (при достаточно малом x − a) много меньше по модулю, чем c(x − a), так что после прибавления этого слагаемого к c(x − a) результат останется положительным. если теперь, скажем, Аккуратно эта идея проводится следующим образом. Обозначим «остаточный член» f (x) − f (a) − c(x − a) через r(x). Поскольку r(x) = o(x − a), 2 < |x − a| < " имеем |r(x)| < 2c |x − a|, и тем самым знак выражения c(x − a) + r (x) = f (x) − f (a) совпадает со знаком выражения c(x − a) (если |v | < |u|, то знаки чисел u и u + v совпадают). Стало быть, если a < x < a + ", то знак f (x) − f (a) совпадает со знаком c(x − a) и тем самым положителен: а если a − " < x < a, то знак f (x) − f (a) опять же совпадает со знаком c(x − a) и тем самым существует такое " > 0, что при 0 отрицателен. Из доказанного предложения немедленно вытекает«теорема Ферма» (необходимое условие экстремума). Более того, из этого же предложения нетрудно получить доказательство достаточного условия возрастания (предложение 13.14), не опирающееся на теорему Лагранжа: если f0 > 0 f (v ) > f (u), если v > u и v близко к u, а переход к случаю, когда v далеко от u, делается с помощью всюду, то из предложения видно, что той же техники, что в нашем доказательств теоремы о промежуточном значении. Наша следующая тема | теорема о среднем, являющаяся естественным обобщением теорем Ролля и Лагранжа из предыдущей лекции. Естественнее всего формулировать и понимать ее геометрически. Напомним (см. предыдущую лекцию), что вой параметризованной кри- (мы будем иногда говорить просто «кривой») на плоскости называ- ется непрерывное отображение : [a; b] → R2 ; (непрерывность функции 1 и 2 означает, что t 7→ (1 (t); 2 (t)) функции 1 и 2 непрерывны). Если a b), к тому же дифференцируемы на интервале ( ; бу- | гладкая параметризованная кривая. Если в этой c ∈ (a; b), то вектор 0 (c) = (10 (c); 20 (c)) будем называть вектором скорости в точке c (или «в момент c»: параметр c полезно представлять себе как время, а отображение | как описание движе- дем говорить, что ситуации ния материальной точки по плоскости). Стоит иметь в виду, что если : [a; b] → R2 | гладкая кривая, то образ ([a; b]) может не во всех точках выглядеть как гладкая кривая: на нем могут быть «точки самопересечения», «точки заострения», «изломы» и прочее | см. рис. 1. Пусть [a; b] ⊂ R | отрезок и ; 2 ) : [a; b] → R | отображение, непрерывное на [a; b] и дифференцируемое на (a; b). Предположим также, что (a) 6= (b). Тогда существует такая точка c ∈ (a; b), что вектор скорости 0 (c) = 0 0 (1 (c); 2 (c)) коллинеарен вектору (a); (b). Теорема 15.4 (Теорема о среднем). = ( 1 3 B A Рис. 1. Кривая и касательный вектор (Напомним, что нулевой вектор коллинеарен любому.) Доказательство. Для всякого ' ∈ R обозначим через ': x cos ' − sin ' x R' : 7→ : y sin' cos ' y R' : R2 → R2 поворот плоскости на угол Поскольку R' | линейное отображение, оно коммутирует с взятием R' ◦ в момент t получается момент t поворотом на угол '. Вот производной: вектор скорости кривой из вектора скорости кривой в формальная выкладка: '1 (t) − sin '2 (t))0 ; (sin '1 (t) + cos '2 (t))0 ) = 0 cos ' − sin ' 1 (t) 0 0 0 0 = (cos '1 (t)−sin '2 (t); sin '1 (t)+cos '2 (t)) = : sin ' cos ' 20 (t) ((cos R' (a); R' (b) также получается из вектора (a); (b) поворотом на угол ', а коллинеарность векто- Поскольку при этом, разумеется, вектор ров при повороте сохраняется, утверждение теоремы верно для кривой R' ◦ . Выберем R' ( (a); R' ( (b)))] будет горизонтаR' ◦ = (1 ; 2 ), то 2 (a) = 2 (b), то есть тогда и только тогда, когда оно верно для кривой теперь ', для которого отрезок [ лен. Это означает, что если 2 : [a; b] → R удовлетворяет условиям теоремы Ролля. Значит, c ∈ (a; b) имеем 20 (c) = 0; это означает, что касательвектор к кривой R' ◦ в момент c также горизонтален, то есть функция для некоторого ный коллинеарен вектору, соединяющего концы кривой. Ввиду сказанного 4 выше из этого следует, что и касательный вектор к исходной кривой в момент c будет коллинеарен вектору Пусть функции Следствие 15.5 (теорема Коши). прерывны на 0 (t) a b] [ ; (a); (b). и дифференцируемы на a b), ( ; '; 6= 0 для всех t ∈ (a; b). Тогда существует такое '0 (c) 0 ( c) Доказательство. = a b] → R не(a) 6= (b) и c ∈ (a; b), что : [ ; причем '(b) − '(a) : (b) − (a) Примените теорему 15.4 к кривой t 7→ ( t ; '(t)). ( ) Наша следующая тема | формула Тейлора; для формулировки и доказательства основных результатов нам понадобится терминология и обозначения, относящиеся к высшим производным. С этого и начнем. Пусть f : (p; q ) → R (или в C | это все равно) | дифференцируе- мая функция; тогда можно рассмотреть функцию эта функция также дифференцируема, то говорят, жды дифференцируема p q ); на интервале ( ; f 00 (c) f 0 : (p; q ) → R; что функция f производная функции если два- f0 в c ∈ (a; b) обозначается и называется второй производной функции f в точке c. Если f дважды дифференцируема, то можно рас00 смотреть ее вторую производную как функцию f : (p; q ) → R на (a; b); 00 также дифференцируема, то говорят, что f трижды если функция f точке дифференцируема, и т.д. При этом если вторую и третью производную обычно обозначают с помощью двух и трех штрихов, то в общем случае k -ю производную функции f обозначают Определение 15.6. Если функция a b) ференцируемой на интервале ( ; f (k) . f : (a; b) → C является и при этом функция непрерывна, то говорят, что функция f fk ( ) k раз диф- a b) → C C k на ин- : ( ; принадлежит классу a b). Множество всех функций класса C k на (a; b) обозначается k при всех k ∈ N, то гоЕсли функция принадлежит классу C ∞ ворят, что функция f принадлежит классу C ; это равносильно тому, тервале ( ; C k (a; b). что она бесконечно дифференцируема. Понятие «функция класса C k » является более ограничительным, чем «бесконечно дифференцируемая функция», но оно является более «правильным» | в первую очередь потому, что с ним удобнее работать. Теперь, переходя непосредственно к формуле Тейлора, рассмотрим такую задачу. Пусть f | функция (скажем, бесконечно дифференци- 5 руемая); предположим, что мы хотим представить ее в виде суммы степенного ряда f (x) = c0 + c1 (x − a) + c2 (x − a)2 + : : : + cn (x − a)n + : : : ; сходящегося в некоторой окрестности точки кими при этом должны быть коэффициенты c0 : Проще всего с коэффициентом ства (15.2) значение x = a, a. ci . (15.2) Давайте прикинем, ка- подставим в обе части равен- тогда все слагаемые в правой части, кроме первого, обратятся в нуль, и получим, что c0 = f (a). Чтобы найти c1 , продифференцируем обе части (15.2): f 0 (x) = c1 + 2c2 (x − a) + 3c3 (x − a)2 + : : : + ncn (x − a)n + : : : (вообще-то степенной ряд | это не конечная сумма, и законность такого дифференцирования надо обосновывать; поскольку наше рассуждение не строгое, а прикидочное, мы эту трудность проигнорируем). Если теперь подставить в обе части x = a, то в правой части обратятся в f 0 (a). произвольного k . нуль все слагаемые кроме первого, откуда Теперь ясно, как найти k ck для c1 = Именно, давайте раз продифференцируем обе части равенства (15.2) (правую часть опять будем дифференцировать почленно, не задумываясь о законности этой операции). Легко видеть, что k -я производная от ( x − a)n равна n(n − 1) : : : (n − k + 1)(x − a)n−k n < k ). Поэтому в k -кратного дифференцирования равенства (15.2) получится (в частности, она тождественно равна нулю при результате вот что: f (k) (x) = k !ck +(k +1)k : : : 2ck+1 (x−a)+: : :+n(n−1) : : : (n−k +1)(x−a)n−k +: : : Подставляя теперь x = a, получаем, что ck = f (k) (a) = k !ck , f (k) (a)=k !; откуда (15.3) k = 0, если считать, что нулевая производная от функции f | это сама f , а 0! = 1. P∞ n Ряд n=0 cn (x − a) ,где коэффициенты ck задаются формулой (15.2), называется рядом Тейлора функции f (в точке a). эта формула годится и при Теперь обсудим, как все эти неформальные прикидки связаны с реальностью. Оказывается, что почленное дифференцирование степенного ряда (правой части равенства (15.2)) действительно законно внутри 6 его круга сходимости (мы это докажем в дальнейшем); беда в том, что f даже для бесконечно дифференцируемой функции ее ряд Тейлора не обязан к ней сходиться нигде (кроме, конечно, самой точки a). Макси- мум, чего можно гарантировать для произвольной бесконечно дифференцируемой функции | не разложение (15.2), а некоторый его суррогат, называемый формулой Тейлора. Подчеркнем, что этот «суррогат» на самом деле чрезвычайно важен. Теорема 15.7. a ∈ (p; q ). Пусть f : (p; q ) → R и пусть Тогда f (x) = f (a) + f 0 (a)(x − a) + Доказательство. f 00 (a) 2! ( r f (n) (a) n n (x − a) + o((x − a) ): n! x − a)2 + : : : + Положим r(x) = f (x) − f (a) − f 0 (a)(x − a) − Ясно, что C n, | функция класса f 00 (a) 2! | также функция класса что ( x − a)2 − : : : − Ck f (n) (a) n (x − a) : n! p q ), на интервале ( ; а также r(a) = r0 (a) = : : : = r(n) (a) = 0: Пусть теперь x ∈ p q ); ( ; применим теперь a ствие 15.5) к отрезку, соединяющему и x, «теорему положив ( Коши» x) = ( (след- x − a)r и '(x) = r(x); согласно этой теореме, для некоторого 1 , лежащего между a и x, имеем r 0 (1 ) n(1 − a)n−1 = ( r(x) − r(a) x − a)n − (a − a)n = ( r(x) : x − a)n a и 1 и функциям x 7→ n(x − a)n−1 и x 7→ r0 (x), получаем, что для некоторого 2 , лежащего между a и 1 , имеем Применяя теорему Коши к отрезку, соединяющему r00 (2 ) n(n − 1)(2 − a)n−2 = r 0 ( 1 ) n(1 − a)n−1 = r(x) n: (x − a) n , n = r (n )=n!. Мы доказали следующую Продолжая в том же духе, получим, что существует такое число лежащее между x и a, что r(x) (x−a)n ( ) лемму. Лемма 15.8. число , В условиях теоремы, если лежащее между a и x, x ∈ (p; q ), для которого r(x) n (x − a) = 7 r(n) ( ) : n! то существует Теперь можно завершить доказательство следующим образом. Нам n x→a r(x)=(x − a) = 0. Пусть {xk } | последовательность (отличных от a) чисел, сходящаяся к a; достаточно n = 0. Ввиду леммы для всякого установить, что limn→∞ r (xk )=(xk − a) n существует n , лежащее между a и xn , для которого r(xk )=(xk − a)n = r(n) (k )n!. По теореме о двух милиционерах имеем lim k = a; поскольку (k ) k функция r непрерывна (так как r ∈ C (p; q )), имеем необходимо установить, что lim lim n→∞ r(n) (k ) = r(n) (a) = 0: Все доказано. 8