Избранные вопросы алгебры многочленов

11 МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ «НИЖЕГОРОДСКИЙ ГОСУДАРСТВЕННЫЙ ПЕДАГОГИЧЕСКИЙ УНИВЕРСИТЕТ ИМ. КОЗЬМЫ МИНИНА» В.А. Глуздов АЛГЕБРА МНОГОЧЛЕНОВ Учебно-методическое пособие Нижний Новгород 2013 22 Печатается по решению редакционно-издательского совета НГПУ им. Козьмы Минина Глуздов В.А. Алгебра многочленов: Учебно-методическое пособие для студентов, обучающихся по направлению 050100 «Педагогическое образование», профиль «Математика». 33 Введение В этом курсе мы построим общую теорию многочленов от одной и нескольких переменных (неизвестных) над произвольным целостным кольцом R. Для понимания излагаемого нам достаточно элементарных, первичных понятий алгебры логики, теории множеств, основных алгебраических структур, затронутых в самых первых разделах алгебры, изучаемых студентами I курса педагогических вузов по направлению «Педагогика», профиль «Математика». Значительная часть содержания алгебры многочленов профессионально ориентирована, имеет прямое отношение к школьному курсу математики. Более того, будучи подвергнуты надлежащей методической обработке это содержание или отдельные, логически законченные его части могут быть положены в основу элективных курсов для старшеклассников, стать основой дополнительных занятий с математически одаренными учениками. Стандартные обозначения и стандартные отношения, активно используемые ниже: G – группа, R - кольцо, F - поле (первые буквы английских слов group - группа, ring - кольцо, field - поле), С, R, Q, Z, N, N 0 , C  , R  , Q  , R  , Q  - обозначения множеств комплексных, вещественных, рациональных, целых чисел и их различных подмножеств (усматривается из обозначений или будет ясно из контекста). Символ «<» означает подструктуру (подгруппу, подкольцо). Например, Z < Q - кольцо Z является подкольцом кольца Q. Везде в дальнейшем под кольцом мы понимаем коммутативно-ассоциативное кольцо с единицей и без делителей нуля (целостное). Глава I. Многочлены от одной неизвестной §1. Определение, примеры, построение кольца многочленов от одной неизвестной над целостным кольцом. Основные понятия и свойства Определение. Пусть R - целостное кольцо и х - некоторый объект, элемент, не принадлежащий кольцу R: хR (1) 44 Кольцом многочленов от одной неизвестной (переменной) х над целостным кольцом R называют новое кольцо, обозначаемое R[x], удовлетворяющее требованиям (аксиомам): 1. x  R[x] (2) 2. R < R[x] (3) 3. Кольцо R[x], удовлетворяя требованиям (2), (3), является минимальным. Иными словами, R[x] не содержит в себе собственных подколец со свойствами (2), (3). Поставим себе задачу построить кольцо многочленов R[x] над целостным кольцом R. Т.е., мы хотим построить кольцо, удовлетворяющее аксиомам кольца многочленов от одной неизвестной. Обозначим через R множество всех псевдобесконечных («похожих» на бесконечные) последовательностей элементов кольца R последовательностей, у каждой из которых все элементы, начиная с некоторого номера, нули. Формализованный вид таких последовательностей следующий: def f  (a 0 , a 1 , . . . ,a n , 0,0, . . . ), a i  R, i N 0 (4) Замечание. Элементы a i в (4) могут быть нулями или нет все зависит от контекста. Существенно то, что начиная с некоторого номера все элементы последовательности (4) - нули. Зададим теперь на R две бинарные операции - сложение и умножение. Возьмем любые элементы f,g R . Пусть f задан формулой (4), а g - формулой g = (b 1 , b 2 , . . . ,b m , 0, . . .), b j  R, j  N 0 (5) Определим сумму f+g и произведение fg следующими формулами: def f + g  (a 0 +b 0 , a 1 +b 1 , . . ., a k +b k , 0,, . . . ), k=max{n,m} (6) def fg  (c 0 , c 2 , . . . , c s . . . . , c n  m , 0, . . . ) (7) В формуле умножения (7) элементы c s , задающие fg, определяются формулами: 55 cs = a b i js i j , s=[0,n+m] (9) Тем самым, мы получили алгебраическую структуру ( R ,+,×). Мы постулируем, опуская проверку, что эта структура является кольцом. Единицей кольца является элемент 1 = (1, 0, , . . . ) (10) Выделим теперь следующее подмножество в R : Ř = {(a, 0, . . . )| a  R}  R (11) Применяя к Ř критерий подкольца устанавливаем, что Ř является подкольцом кольца R : Ř< R (12) Более того, подкольцо Ř изоморфно исходному кольцу R. Изоморфизм u: R → Ř задается формулой:  a  R, u(a) = (a, 0, . . . )  Ř (13) Изоморфизм колец R и Ř позволяет отождествить их, т.е., считать R подкольцом кольца R : R< R (14) Отождествление колец R и Ř есть результат отождествления их элементов на основании изоморфизма u, заданного формулой (13): a = (a, 0, . . . ) (15) Cогласно правилам умножения (9) несложно устанавливается, что (см. (4)):  a  R,  f  R , af = (aa 0 , aa 1 , . . . , aa n , 0, . . .) (16) Выделим и специально обозначим следующий элемент кольца R: 66 х = (0, 1, 0, . . . ) (17) Ясно, что хR (18) Подведем промежуточный итог. На данный момент мы построили кольцо R , удовлетворяющее требованиям (1) - (3) определения кольца многочленов от одной неизвестной. Т.е., кольцо R удовлетворяет аксиомам 1, 2 этого определения. Наша задача - задача построения кольца R[x] - будет решена, если R будет удовлетворять и третьей аксиоме определения кольца многочленов от одной неизвестной. Покажем это. Воспользовавшись формулами умножения (9), находим натуральные степени элемента х:  n  N 0 , x n = (0, . . . , 0, 1, 0, . . . ) (19) n Отправляясь теперь от формул и обозначений (10), (15) - (17), (19). Мы, выполняя тождественные преобразования, можем придать любому элементу f (см. (4)) из R вид: f = (a 0 , a 1 , . . . ,a n , 0,0, . . . ) = (a 0 , 0, . . .) + (0, a 1 , 0, . . .) + . . . + (0, . . . , 0, n a n , 0, . . . ) = a 0 (1, 0, . . . ) + a 1 (0, 1, 0, . . . ) + . . . + a n (0, . . . , 0, 1, . . . ) n = a 0 + a1 x + . . . + a n x n (20) Итак, всякий элемент f из R мы записали в виде (20) по возрастающим степеням элемента х. Часто (20) записывают по убывающим степеням х: f = a n x n + a n 1 x n 1 + . . . + a 1 x + a 0 Возмем теперь произвольное подкольцо S кольца R удовлетворяющее требованиям (2), (3): x  S, R < S (21) (S < R ), (22) 77 Первое условие (22) гарантирует принадлежность S любой натуральной степени х (с показателем степени из N 0 ), а второе условие принадлежность S любой комбинации вида a n x n + a n 1 x n 1 + . . . + a 1 x + a 0 . Но это, согласно (21), - элемент из R , т.е., R  S, а значит S = R и аксиома 3 определения колца многочленов от одной неизвестной удовлетворена. Итак, построенное кольцо R является искомым кольцом R[x]: R = R[x] (23) Опуская детали, мы отметим, что над кольцом R существует (строится) единственное - с точностью до изоморфизма - кольцо R[x]. Элементы этого кольца называются многочленами от неизвестной х. Они обозначаются f(х) или - проще - f и в общем виде имеют строение (21). Элементы a n , a n 1 . . . , a 1 , a 0  R (24) называются коэффициентами многочлена f. Представление многочлена f(x) в виде (4) называют его канонической записью. Элементы исходного кольца R - в силу (3) - тоже многочлены, которые мы будем называть скалярами. У нулевого многочлена f = 0 все коэффициенты - нули. Если f  0, то среди коэффициентов (5) хотя бы один отличен от 0. В этом случае ненулевой коэффициент с максимальным значением нижнего индекса - коэффициент a n - называется старшим коэффициентом многочлена f, а сам индекс n называют степенью многочлена f и обозначают deg f (англ. degree - степень). Коэффициент a 0 называется свободным членом многочлена f. Замечание. Степень определяется только для ненулевого многочлена. У ненулевого многочлена свободный член, в отличии от его старшего коэффициента, может быть любым элементом из R - нулевым или нет. Нетрудно заметить следующее правило степени суммы многочленов. Пусть складываются два ненулевых многочлена f и g. Тогда, если f+g  0, deg (f+g)  max {deg f, deg g} (25) Т.е., степень ненулевой суммы ненулевых многочленов не превосходит максимальной из степеней слагаемых. Обратимся к формулам (9) умножения многочленов. Если всмотреться и вдуматься в эти формулы, то можно увидеть, что 88 коэффициент с k есть результат приведения подобных слагаемых со степенью x k . Первое и последнее слагаемые в формуле (9) указывают на справедливость двух правил: Правило 1. Старший коэффициент и свободный член произведения двух ненулевых многочленов равны соответственно произведению старших коэффициентов и свободных членов перемножаемых многочленов (сомножителей). Правило 2. Степень произведения двух ненулевых многочленов равна сумме степеней сомножителей (проще - при перемножении двух ненулевых многочленов их степени складываются): deg (f g) = deg f + deg g (26) Замечание. Правило 2., равно как и дублирующая его формула (26), исполнены при молчаливом предположении, что произведение ненулевых многочленов всегда отлично от нуля. Но это действительно так, что следует из Правила 1. Иными словами, рассматривая умножение многочленов, нами попутно доказана Теорема. Над целостным кольцом R кольцо многочленов от одной неизвестной R[х] так же целостно. Без доказательства отметим, что справедлива Теорема. Если кольцо R - факториально, то R[х] так же факториально. Поскольку любое поле по факту (тривиально) является факториальным кольцом, то из этой теоремы сразу получаем Следствие. факториально. Над полем F кольцо многочленов F[х] - Приведем несколько утверждений о кольце F[х], представляющих собой версию - уточнение, перефразировку некоторых положений из теории колец. Во-первых, достаточно очевидно, что GF[x] = GF = F \ {0} = F* (27) 99 Далее, пусть многочлен f F[x] является простым элементом кольца F[x]. Это - как минимум - означает, в соответствии с (27), что f  F (не 0 и необратим или, что то же самое, deg f > 0). Специфика кольца F[x] специфицирует и понятия простоты - состАвности его элементов: в кольце F[х] простые многочлены чаще называют неприводимыми, а составные - приводимыми над полем F многочленами. Чтобы раскрыть суть спецификации «простота – состАвность» («приводимость – неприводимость»), оттолкнемся от состАвности (приводимости). Итак, пусть многочлен f  F[x] приводим над полем F. Это означает, что у него в кольце F[x] имеются собственные делители. Пусть g - один из них: f=gh (28) По условию приводимости (состАвности) f сомножители g и h необратимы и неассоциированы с f: f, g  F*  f∙ F* (29) Соотношение (14) указывает на то, что deg g > 0, deg h > 0 (30) Теперь наши рассуждения, включающие формулы (29), (30), будучи прочитанными вновь, зазвучат так: Многочлен f F[x] степени больше 0 приводим над полем F, если его можно разложить в произведение двух многочленов (равенство (28)), у каждого из которых степень больше 0 (равенство (30)). Неприводимые многочлены характеризуются отрицанием данного предложения. Поскольку число 1  N никак не распадается в сумму двух натуральных чисел, то из (28) и (30) усматривается ((30) исключает равенство: deg f = 1 = deg g + deg h). Вывод: любой многочлен первой степени из F[x] неприводим на полем F. §2. Деление многочлена на линейный двучлен. Схема Горнера 10 Пусть R - произвольное целостное кольцо и R[х] - кольцо многочленов над ним. Все дальнейшие рассмотрения проводятся в кольце R[х]. Среди многочленов первой степени выделяются многочлены со старшим коэффициентом 1 и свободный член которых записывается со знаком « - »: x-  . Такие и так записанные многочлены называются линейными двучленами. Определим и рассмотрим деление многочлена на линейный двучлен. Определение. Пусть дан многочлен f и линейный двучлен x-  . Говорят, что выполнено деление многочлена f(x) на линейный двучлен x-  , если удалось найти (построить) новый многочлен g и скаляр r такие, что многочлен f оказался представленным в виде: f = g  (x-  ) + r (1) Если это удалось сделать, то найденные g и r называются соответственно - частным и остатком от деления многочлена f на линейный двучлен x-  . В случае, когда остаток r =0, говорят что многочлен f(x) делится (без остатка) на линейный двучлен x-  или, что линейный двучлен x-  делит многочлен f(x). Записывают это, соответственно, так: f ÷ (x-  ) или (x-  )│ f (2) Замечание. По существу деление многочлена на линейный двучлен копирует евклидово деление в кольце. Дело, в данном случае, однако в том что в кольце R[x] (над кольцом R) евклидово деление не гарантировано. Именно поэтому рассматривается случай деления многочлена на линейный двучлен. Покажем, что в кольце R[x] любой многочлен всегда можно разделить на линейный двучлен. Итак, пусть дан многочлен f и линейный двучлен x-α. Здесь необходимо отдельно рассмотреть два случая: 1. deg f =0 или сам многочлен f =0; 2. deg f(x) ≥1. Рассмотрим их по отдельности. 1. В этом случае многочлен f представляет собой просто скаляр: f = а  R. Мы можем составить очевидное равенство: f = 0(x- α) + а. Мы нашли частное g=0 и остаток r = а. Таким образом, искомое равенство (1) составлено, а значит в этом случае требуемое действие выполнено. 2. Пусть многочлен f задан. Это значит, что нам известны все его коэффициенты. Запишем его в виде (4) §1: 11 f = a n x n + a n 1 x n 1 + ….. + a 1 x + a 0 (3) В этой записи deg f = n ≥1. Обратимся теперь к равенству (1), точнее к его правой части. Ясно, что deg (x- α) =1. А поскольку скаляр r на степень произведения g  ( x- α) не влияет, то deg f = deg g + deg (x- α), т. е. n = (deg g) +1, или deg g = n-1 (4) Итак, при делении многочлена n-й степени (n ≥1) на линейный двучлен (x-  ) - если такое деление возможно - частное является многочленом, степень которого на 1 меньше степени заданного многочлена. Исходя из (3) запишем искомое частное g в виде: g = b n 1 x n 1 +b n 2 x n 2 + … +b 1 x+b 0 (5) Здесь нужно иметь в виду, что многочлен g(x) является искомым, поэтому и его коэффициенты тоже являются искомыми, т.е пока неизвестными. Внесем теперь в (1) развернутые выражения многочленов f и g из (3) и (5). Получим: a n x n + a n 1 x n 1 + ….. + a 1 x + a 0 = (b n 1 x n 1 +b n 2 x n 2 + … +b 1 x+b 0 )(x-  ) + r (6) Если теперь в правой части (6) произвести все указанные там действия, привести подобные члены и приравнять полученные коэффициенты при одинаковых степенях неизвестной х в правой и левой частях равенства (6). то последовательно по убыванию степеней неизвестной х получим n+1 равенств: a n = b n 1 a n 1 = b n 2 - αb n 1 . . . . . a k = b k 1 - αb k . . . . . a 1 = b 0 - αb 1 a 0 = r - αb 0 (7) Из первого равенства (7) мы находим b n 1 . Подставив найденный коэффициент b n 1 во второе равенство (7) мы найдем следующий коэффициент b n 2 и т. д. «Спускаясь » по равенствам (7) 12 сверху вниз мы последовательно найдем все коэффициенты многочлена-частного g и и остаток r. иными словами, мы разделили многочлен f(x) на линейный двучлен x-α. Равенства (7) являются алгоритмом деления многочлена на линейный двучлен. Этот алгоритм можно представить в виде изящной схемы, построенной английским математиком Горнером, и носящей его имя (Горнер Вильямс Джордж (1786 – 1837) английский математик, работавший в области алгебры. Его именем названа схема деления многочлена на линейный двучлен). Суть схемы Горнера достаточно легко усматривается из равенств (7), если их переписать так, чтобы в левых частях стояли искомые величины - коэффициенты многочлена-частного g и остаток r: b n 1 = a n b n 2 = а n 1 +αb n 1 . . . . . b k 1 = а k +α b k . . . . . b 0 = а 1 +α b 1 r = а 0 +α b 0 (8) Полученные формулы (8) удобно представить в виде таблицы следующим образом. В качестве первой строки выпишем коэффициенты заданного многочлена f. Во второй строке, отступив влево на один шаг, запишем элемент α  R, задающее линейный двучлен x-α (обратить внимание на знак перед α). Затем в этой же второй строке под коэффициентами многочлена f выписываем левые части равенств (8) - это коэффициенты искомого многочленачастного g и остатка r. В результате получится следующая таблица: an α b n1 =a n а n 1 … аk … а1 b n 2 =а n 1 + ... b k 1 =а k + … b 0 = а 1 + αb n 1 α bk αb 1 r а0 = а 0 + (9) αb 0 Полученная таблица и называется схемой Горнера. Пользоваться схемой Горнера очень просто и удобно. Итак, нам нужно разделить заданный многочлен f на линейный двучлен x-α. Мы выполняем последовательно следующие шаги: 1. Выписываем в строку коэффициенты многочлена f; 2. Во второй строке, отступив влево на один шаг, записываем число α; Далее вторую строку заполняем так: 13 2.1. под коэффициентом a n записываем его же вновь - это коэффициент b n 1 (см. схему Горнера); 2.2. каждый следующий коэффициент искомого многочлена-частного g равен стоящему над ним коэффициенту многочлена f, сложенному с произведением числа α на найденный перед этим коэффициент многочлена g; 2.3. под свободным членом а 0 выписывается остаток r = а 0 +αb 0 (а 0 и α заданы, а b 0 мы нашли на предыдущем шаге). 2.4. Вторая строка схемы Горнера задает нам многочленчастное g (его коэффициенты) и остаток r. Теперь мы можем явно записать равенство (1), т.е мы выполнили деление многочлена f на линейный двучлен x-α. §3. Евклидово деление многочлена на многочлен Деление многочлена на линейный двучлен - это частный случай более общей ситуации в кольце R[x] деления одного многочлена на другой. Нужно только иметь в виду, что такое деление носит ограниченый характер, задаваемый кольцом R. Изложим вопрос более подробно. Определения. 1. Ненулевой многочлен из R[x] c обратимым старшим коэффициентом назовем нормируемым. 2. Пусть f,g  R[x] и g≠0. Разделить евклидово (с остатком) многочлен f на g, означает найти многочлены q и r из R[x] такие, что f = gq + r, где r = 0 или deg r < deg g (1) Многочлены f, g, q и r в представлении (равенстве) (1) называются, соответственно, делимым, делителем, (неполным) частным и остатком от деления многочлена f на g. Теорема. В кольце многочленов R[x] над целостным кольцом R евклидово деление произвольного многочлена f на нормируемый многочлен g всегда выполнимо и реализуется единственным образом. Доказательство. Пусть f,g  R[x], причем g Запишем эти многочлены в каноническом виде: - нормируемый. f = a n x n + . . . + a1x + a 0 (2) g = b m x m + . . . +b 1 x + b 0 , (3) 14 где нормируемость g (см. определение) означает: b m  GR (4) Если n = deg f < deg g = m, то очевидное равенство f = g0 + f, где q=0, а r=f, реализует функцию равенства (1). Рассматриваем, поэтому, случай n = deg f ≥ deg g = m (5) Соотношения (4), (5) позволяют построить следующий многочлен: f 1 = f - g(b m1 a n x n m ) (6 1 ) Если f 1 = 0 или deg f 1 < deg g, то ограничимся построенным равенством (6 1 ). Если же deg f 1 ≥ deg g, то, отталкиваясь от f 1 , построим - по типу (6 1 ) - следующий многочлен f 2 , но вначале оценим сложившуюся ситуацию. Конструкция многочлена f 1 указывает на то, что n = deg f > deg f 1 = n 1 Если теперь обозначить через а n 1 (7 1 ) - старший коэффициент многочлена f 1 , то искомы многочлен f 2 запишется так: f 2 = f 1 - g (b m1 а n x n 1  m ) 1 (6 2 ) Вновь, если f 2 = 0 или degf 2 < degg, то ограничимся построенными равенствами (6 1, 2 ). Если же degf 2 ≥ degg, то, опираясь теперь на f 2 , построим - по типу (6 1, 2 ) - очередной многочлен f 3 . При этом для f 2 фиксируем соотношение типа (7): n 1 = degf 1 > degf 2 = n 2 (7 2 ) И т. д. Если позволяют многочлены f, f 1 , f 2 , . . . (их степени должны быть не меньше степени многочлена g), то у нас выстраивается убывающая последовательность натуральных чисел, получаемая соединением неравенств (7 1, 2,... ): n = deg f > deg f 1 = n 1 > degf 2 = n 2 > . . . (8) 15 Ограниченность сверху последовательности (8) натуральных чисел обеспечивает достижение такого шага с номером k+1, на котором полученный по типу (6 1 k ) многочлен f k 1 = 0 или degf k 1 < degg: f k 1 = f k - g (b m1 a n x n k k m ), f k 1 = 0 или degf k 1 < degg (6 k 1 ) Этим шагом мы заканчиваем процедуру построения многочленов f 1 , f 2 , . . . , f k , f k 1 . Основываясь теперь на равенствах (6 1( k 1) ), произведем следующие действия. Выразим из (6 1 ) многочлен f: f = g (b m1 a n x n m ) + f 1 Затем в (9 1 ) заменим f 1 из (6 2 ): (9 1 ) f = g (b m1 a n x n m + b m1 а n x n 1  m ) + f 2 (9 2 ) 1 И т.д. «Спустившись вниз» по равенствам (6 1( k 1) ), мы - на последнем (k+1)-м шаге - получим искомое равенство (1), где - как это следует из построения равенств (9 1( k 1) ): q = b m1 a n x n m + b m1 а n x n 1  m + . . . + b m1 a n x n k k 1 m ), r = f k 1 (10) Остается доказать единственность Евклидова деления (1), если, конечно, оно реализуемо. Пусть наряду с (1) имеется еще одно разложение такого же типа: f = gq 1 + r 1 , где r 1 = 0 или deg r 1 < deg g (11) Из (1) и (11) стандартным образом получаем: g(q - q 1 ) = r 1 - r (12) Если допустить, что q - q 1 ≠ 0, то - согласно (12) - (r 1 - r) ≠ 0 и в силу ограничений на степени r 1 и r получим, что deg(r 1 - r) < degg, что противоречит (12). Следовательно, q - q 1 = 0 или q = q 1 и (12) дает r 1 = r, т.е., частное и остаток от деления f на g определяются единственным образом. Комментарии. 1. Доказательство теоремы существенным образом опиралось на нормируемость многочлена g - равенства (9 1( k 1) ) конструируются сугубо при условии (4); 16 2. Поскольку в кольце многочленов F[x] над полем F любой ненулевой многочлен нормируем, в нем всегда реализуется евклидово деление; 3. Алгоритм (6 1( k 1) ) построения многочленов f 1 , f 2 , . . . , f k , f k 1 - а в результате построения остатка r = f k 1 и частного q (см. (10)) евклидова деления многочлена f на g - визуализируется схемой, на практике известной как «деление уголком»: a n x n + . . .+ a 0 (=f) f - g(b m1 a n x n m )(=f 1 ) b m x m + . . .+ b 0 (=g) b m1 a n x n m + b m1 а n x n 1  m +…+ b m1 a n x n k 1 m k (=q) f 1 - g(b m1 а n x n 1  m )(= f 2 ) . . . . . 1 f k -g(b m1 a n x n k k m )(= f k 1 =r) Конструируется схема «деления уголком» пошагово и представляет собой визуализированную версию построения последовательности многочленов f 1 , f 2 , . . . , f k , f k 1 : - в верхней строке выписываем многочлены f и g; - во второй строке в правом столбце под многочленом g записываем член b m1 a n x n m , умножаем его на g и в левом столбце под многочленом f выписываем разность f 1 (см. схему); - в третьей строке в правом столбце под многочленом g записываем в качестве слагаемого к b m1 a n x n m член b m1 а n x n 1  m , умножаем его на g и в левом столбце под многочленом f 1 выписываем разность f 2 (см. схему); - и т.д., заполняем строки схемы до тех пор, пока не получим многочлен f k 1 равный нулю или степени меньше degg. В результате получаем частное q и остаток r от деления f на g. Евклидово деление f на g выполнено. 1 17 §4. Корни многочлена. Функциональная и алгебраическая трактовки. Кратные корни. Пусть задано кольцо многочленов R[x] и f ∈ R[x]. Считаем, что f дан в канонической записи (4) §1: f = a n x n + a n 1 x n 1 + ….. + a 1 x + a 0 (1) Пусть теперь α  R - произвольный скаляр. Каноническая запись многочлена f совершенно формально - при заданном α позволяет построить новый скаляр, обозначим его f(α), по формуле: f(α) = a n α n + a n 1 α + ….. + a 1 α + a 0 α  R n 1 (2) Определение. Скаляр f(α) называется значением многочлена f при х = α. В итоге, многочлен f  R[x] позволяет задать отображение кольца R в себя - R → R - , обозначаемое f* по правилу: f* : α → f(α) (3) Отображение f* : R → R, действующее по правилу (3), называется полиномиальной функцией многочлена f. Замечание. Опуская выкладки, отметим без доказательства, что если кольцо R конечно, то может случиться, что полиномиальные функции различных многочленов f и g могут совпадать: f ≠ g , но f* = g*. Если же кольцо R - бесконечно, то всегда у различных многочленов различны же их полиномиальные функции: f ≠ g  f* ≠ g*. Осюда важный Вывод Если кольцо R - бесконечно, то многочлен f  R[x] можно отождествить с его полиномиальной функцией f*: f = f*. Именно это и происходит, когда рассматриваются многочлены с числовыми коэффициентами. В общем виде кольцо многочленов C[x] можно интерпретировать как кольцо полиномиальных функций. Именно так трактуются многочлены в школьном курсе математики, в курсе математического анализа. Определение. Пусть R - произвольное кольцо и f R[x]. Скаляр α  R называют корнем многочлена f, если 18 f(  ) = 0. (4) Это - так называемое функциональное определение корня многочлена. Но к понятию корня многочлена можно подойти по другому, опираясь на операцию деления многочлена на линейный двучлен. Пусть заданный многочлен f мы разделили на линейный двучлен x- α и, следовательно, получили равенство (1) §2: f = g  (x-  ) + r (5) Здесь cкаляр α  R является произвольным и необязательно - корень многочлена f. Положим теперь в равенстве (5) х = α. Так как в правой части (1) α - α = 0, то независимо от значения g(α) окончательно получим: f(α) = r (6) Будучи прочитанным, равенство (2) представляет собой следующее (доказанное нами!) утверждение, называемое теоремой Безу (Безу Этьен (1730 - 1783) - французский математик. Работал в области алгебры. Написал учебник по математике, шеститомный «Курс математики». Его именем названа теорема об остатке от деления многочлена на линейный двучлен): Теорема (Безу). Значение многочлена f(x) при х = α равно остатку от деления этого многочлена на линейный двучлен х - α. Если мы соединим теперь определение корня многочлена (равенство (4)) с теоремой Безу (равенство (6)), то придем к следующему выводу, представляющему собой (по существу доказанную) теорему: Теорема. Скаляр α  R является корнем многочлена f  R[x] тогда и только тогда, когда линейный двучлен x- α делит этот многочлен: (x- α)│ f (7) Соотношение (7) указывает на то, что остаток отделения) f на x- α r = 0. Это значит, что для корня α многочлена f равенство (1) принимает вид 19 f = g  (x- α) (4) Поскольку сформулированная (и доказанная!) теорема носит необходимый и достаточный характер (критерий), то признак (7) можно тоже считать определением корня многочлена. Это - так называемое алгебраическое определение корня многочлена. В зависимости от характера поставленной задачи одно из двух определений корня многочлена бывает предпочтительнее другого. Так, например, именно алгебраическое определение корня многочлена позволяет ввести понятие кратности корня. Определение. Пусть скаляр α  R является корнем многочлена f  R[x] . Говорят, что корень α имеет кратность k или, что он является корнем кратности k, где k - натуральное число, если k является наибольшим показателем степени линейного двучлена x- α, делящего многочлен f(x). Раскроем это определение более детально. То, что α - корень многочлена f, означает, что выполняется делимость (7). В (7) линейный двучлен x- α представлен в первой степени. Но можно спросить себя: а другие степени линейного двучлена x- α делят многочлен f ? И если да, то какова наибольшая степень линейного двучлена? Ответ на второй вопрос и приводит к понятию кратности корня. Итак, если k - кратность корня  многочлена f то обязательно (x- α) k │f (5) То, что k - наивысший показатель степени означает, что x- α в большей степени уже не делит многочлен f(x), т. е. (x- α) k  1 не делит f (6) Пусть α - корень многочлена f. Найти его кратность помогает схема Горнера. Действительно, то что α - корень многочлена f(x) устанавливается с помощью схемы Горнера, из которой мы находим частное отделения f(x) на x- α. В таблице (9) §2 это - многочлен g с коэффициентами b j , где j = n-1, n -2, …, 1, 0. Если кратность корня α многочлена f больше 1, то это значит, что как минимум 20 (x- α) │f 2 (7) Т. е., найдется многочлен, обозначим его g 1 такой, что f = (x- α) g 1 2 (8) Если в левой части (8) заменить f его выражением из (4), то получим g  (x- α) = (x- α) g 1 2 (9) Разделив обе части (9) на многочлен x- α, мы получим g = (x- α)g 1 (10) Но равенство (10) говорит о том, что α корень многочлена g (ведь (x- α) делит g)!), т. е. α - корень частного от деления исходного многочлена f на (x- α). Проверить же это можно схемой Горнера, причем не составляя новую, а используя прежнюю (см. схему Горнера (9) §2). Тем самым, мы получим многочлен g 1 . Не выписывая коэффициенты многочленов f, g, g 1 , мы изобразим результаты в новой схеме - мультисхеме - Горнера так: α α f (первая строка с коэффициентами многочлена f) g ( строка с коэффициентами многочлена g) 0 g 1 ( коэффициенты многочлена g 1 ) 0 (11) Нули в конце второй и третьей строк - это остатки отделения на линейный двучлен x- α соответственно многочленов f и g. Конечно, эту мультисхему Горнера можно продолжить. А именно, добавить четвертую строку, поделив имеющийся многочлен g 1 на линейный двучлен x- α. В четвертой строке будут выписаны коэффициенты многочлена-частного от указанного деления. Обозначим этот многочлен через g 2 . При этом получится некоторый остаток. Если этот остаток равен 0, то это значит, что g 1 (х) делится на линейный двучлен x- α: g 1 = (x- α) g 2 (12) Если теперь в (8) заменить g 1 (х) его выражением из (12), то получим 21 f = (x- α) g 2 3 (13) Равенство (13) указывает на то, что корень многочлена f(x) имеет кратность не менее 3-х, т.е . кратность корня не менее числа нулевых остатков в обобщенной схеме Горнера. Допустим теперь, что полученный многочлен g 2 уже не делится на на линейный двучлен x- α, т. е. при делении g 2 на x- α получается некоторое частное g 3 и ненулевой остаток r: g 2 = (x- α) g 3 + r (14) Если внести в (13) вместо g 2 (х) его выражение из (14), то получим f =( x- α) ((x- α)g 3 + r) = (x- α) g 3 + (x- α) r 3 4 3 Отсюда видно, что в правой части не удается выделить 4 3 сомножитель (x- α) , а значит многочлен f(x), делясь на (x- α) , не 4 делится на бОльшую степень - (x- α) . Следовательно, в соответствии с определением кратности корня в нашем случае эта кратность равна 3. Если обратиться к обобщенной схеме Горнера, то легко видеть, что кратность 3 корня α многочлена f(x) в точности совпадает с числом нулей, стоящих в конце каждой строки, начиная со второй, обобщенной схемы Горнера. Отсюда усматривается общее правило нахождения кратности α многочлена f(x): Пусть дан произвольный многочлен f  R[x] и произвольный скаляр α  R . Чтобы выяснить, является ли α корнем многочлена f, и, если является, то какова кратность этого корня, мы поступаем следующим образом: 1. с помощью схему Горнера делим f на линейный двучлен xα. Если полученный при этом остаток r отличен от 0, то α - не корень и ответ получен; 2. если же r = 0, то α - корень многочлена f. Для определения кратности корня α начатую схему Горнера достраиваем нижними строками до мультисхемы Горнера (см (11)): последовательно делим на x- α многочлен-частное g, затем - g 1 , g 2 и т. д.). Построение мультисхемы Горнера завершаем по получении первого ненулевого остатка. При этом кратность корня α совпадает с числом нулей, стоящих в конце каждой строки, начиная со второй, мультисхемы Горнера. 22 §5. Примитивные многочлены. Пусть теперь R - факториальное кольцо и R[x] - кольцо многочленов над ним. Запишем f  R[x] в каноническом виде: f = a n x n + a n 1 x n 1 + ….. + a 1 x + a 0 (1) Определение. Многочлен f называют примитивным, если все его коэффициенты в совокупности взаимно просты: (a n , a n 1 , ….., a 1 , a 0 ) = 1 (2) Лемма Гаусса. Произведение примитивных многочленов вновь является примитивным многочленом. (Гаусс Карл Фридрих (1777 – 1855) - немецкий математик, физик, астроном, геодезист. Доказал т.н. основную теорему алгебры дал не менее шести различных доказательств. Трудно назвать отрасль математики, в которую Гаусс не внес бы существенного вклада). Доказательство. Доказываем методом от противного. Пусть наряду с многочленом f дан еще один примитивный многочлен g  R[x]: g = b m x m +b m1 x m1 +…+b 1 x+b 0 (b m , b m1 , …,b 1 , b 0 ) = 1 (3) (4) Построим их произведение h = f g = cn mx m n + … +c k x k + … + c 1 x +c 0 (5) где коэффициенты c k находятся по формулам: ck =  i  j k a i b j , i = 1,...,n; j=1,...,m (6) Допустим, что - в отличии от f и g - произведение h = fg не является примитивным многочленом. Т. е., НОД его коэффициентов d = (c n m , …,c k ,..., c 1 ,c 0 ) (7) 23 не является обратимым элементом кольца R: d  GR. По определению факториального кольца d разлагается в произведение простых элементов. Пусть p - простой делитель элемента d: p│d и p - простой (8) Выясним отношение «делит» элемента p к коэффициентам многочлена f. Во-первых, в силу (2) p не может делить все коэффициенты a i . Следовательно, тестируя коэффициенты многочлена f на признак «делиться на p» в последовательности возрастания индексов, мы непременно найдем в этой последовательности первый из коэффициентов с наибольшим индексом s, не делящийся на p: p│a 0 , …, p│ a s 1 , p не делит a s (9) Точно по тем же основаниям среди коэффициентов многочлена g в порядке возрастания индексов мы найдем первый наибольший среди них - пусть это будет t, - не делящийся на p: p│b 0 , …, p│ b t 1 , p не делит b t (10) Определив из (9) и (10) индексы s и t, мы рассмотрим и исследуем коэффициент c st произведения h = fg. Воспользуемся формулой (6), выделив в правой части слагаемое a s b t : c st = a s b t +  i  j  s t a i b j , где i ≠ s, j ≠ t (11) Протестируем «суперслагаемое» i  a i b j на свойство «делиться на j  s t p». Сделаем это анализируя значения индексов i и j суперслагаемого по отношению к индексам s и t. Здесь, в силу (11), возможны два случая: 1. i < s 2. i>s   p│a i j<t  p│a i b j   p│b j p│ i  ai b j j  s t  p│ i  ai b j j  s t В обоих случаях p делит «суперслагаемое» в правой части (11): p│ i  ai b j j  s t Кроме того, из (7) и (8) следует, что (12) 24 p│c st (13) Но тогда на основании (12) и (13) из (11) следует, что p│ a s b t (14) А так как p простой элемент, то из (14) следует, что p│ a s или p│b t . В первом случае мы вступаем в противоречие с (9), во втором - с (10). Теорема доказана. Глава II. Многочлены от многих неизвестных §1. Построение кольца многочленов от многих неизвестных над целостным кольцом. Основные понятия Пусть R - произвольное целостное кольцо. Взяв неизвестную х 1  R, мы построим над R кольцо многочленов R[x 1 ]. Кольцо R[x 1 ] целостное и ничто не мешает нам, взяв неизвестную х 2  R[x 1 ], построить над ним кольцо (R[x 1 ])[x 2 ], которое называется кольцом многочленов от двух неизвестных (переменных) х 1 и х 2 над целостным кольцом R и обозначается R[х 1 , х 2 ]. На следующем шаге по этой же схеме над R строится кольцо многочленов от трех, затем - от четырех, и т.д., наконец - от n неизвестных x 1 , x 2 , . . ,x n (n  N): R[x 1 , x 2 , . . . ,x n ]. Описанная схема построения кольца R[x 1 , x 2 , . . . ,x n ] - когда каждый следущий объект строится на базе предыдущего - называется рекурсивной (лат. recursio - возвращение) и формализуется так: def  n > 1, R[x 1 , x 2 , . . . ,x n ]  (R[x 1 , x 2 , . . . ,x n 1 ])[x n ] (1) Элементы f(x 1 , x 2 , . . . ,x n )  R[x 1 , x 2 , . . . ,x n ] - или просто f (ради краткости) - называются многочленами от n неизвестных x 1 , x 2 , . . . ,x n над целостным кольцом R. Замечание. Отметим без обоснования, что выбор порядка неизвестных x 1 , x 2 , . . . ,x n несущественен: иной их порядок приводит к тому же кольцу R[x 1 , x 2 , . . . ,x n ] (точнее, если быть математически строгим, изменение порядка неизвестных приводит к кольцу, изоморфному кольцу R[x 1 , x 2 , . . . ,x n ]). Выясним строение многочлена f  R[x 1 , x 2 , . . . ,x n ]. Для большей точности формируемых представлений подробно рассмотрим 25 случай n = 2. Многочлен f R[x 1 , x 2 ], согласно рекурсивной схеме (1), имеет вид: f = a n (x 1 )x 2 n + a n 1 (x 1 )x 2 n 1 + . . . , a 1 (x 1 )x 2 + a 0 (x 1 ) В записи (2) коэффициенты при степенях неизвестной х 2 многочлены от неизвестной х 1 с коэффициентами из R: a i (x 1 )  R[x 1 ], i = [0,n] (2) - это (3) Если в (2) внести канонические записи многочленов (3), то - после приведения подобных - мы придем к выводу, что ненулевой многочлен f от двух неизвестных всегда представим суммой слагаемых, устроенных так: это - произведения натуральных (из N 0 ) степеней неизвестных х 1 и х 2 с коэффициентами из R: a i i x 1 i x 2 i , где a i i  R, i 1 ,i 2  N 0 1 2 12 12 (4) Точно такие же рассуждения приложимы к анализу строения многочлена от любого числа неизвестных. Результатом таких рассуждений является вывод: всякий ненулевой многочлен f  R[x 1 , x 2 , . . . ,x n ] всегда представим суммой слагаемых (приведены подобные члены), представляющих собой произведения натуральных (из N 0 ) степеней неизвестных х 1 , х 2 , . . . , х n с коэффициентами из R: a i i ...i x 1i x i2 …x in , где a i i ...i  R, i 1 ,i 2 ,…,i n  N 0 1 12 n 2 n 12 n (5) Слагаемые (5), в сумме составляющие многочлен f, называются его членами или мономами. Если обозначить моном (5) через M, то факт принадлежности M многочлену f обозначают в теоретикомножественных терминах так: M f. Сам же многочлен f записывают так: f = {M| M  f } (6) Скаляр a i i ...i  R, участвующий в конструкции монома (5), называют его коэффициентом, а множество коэффициентов всех мономомов многочлена f - коэффициентами самого многочлена. Соглашение. Ниже мы будем говорить о степенях монома многочлена и самого многочлена от нескольких неизвестных. При этом в контексте предстоящих рассуждений не участвуют коэффициенты. Поэтому в дальнейшем, если это несущественно и не оговорено иное, 12 n 26 коэффициенты мономов мы принимаем равными 1, т.е., мы считаем, что моном M имеет вид: M = x 1i x i2 …x in , i 1 ,i 2 ,…,i n  N 0 1 (7) n 2 Итак, пусть дан произвольный ненулевой многочлен f  R[x 1 , x 2 , . . . ,x n ] с мономами M. Определения (степеней). 1. Степенью монома M относительно (по) неизвестной х k - обозначается deg x M - называют показатель степени i k , с которым х k входит в состав M: k def deg x M  i k k (8) 2. Полной степенью (или просто - степенью) монома M обозначается degM называют сумму его степеней по всем неизвестным: def degM  n  deg k 1 (8) xk M  n i k 1 k = i 1 +i 2 +…+i n (9) 3. Степенью многочлена f относительно (по) неизвестной х k - обозначается deg x f - называют максимальную из степеней его мономов по этой неизвестной: k def deg x f  max{ deg x M| M  f} (10) 4. Полной (или просто - степенью) многочлена f обозначается degf - называют максимальную из (полных) степеней его мономов: k k def degf  max{ degM| M f} (11) Достаточно прозрачными и легко доказываемыми являются утверждения, корреспондирующие определениям степеней и составляющие следующую теорему. Теорема. Пусть M и N - два монома, а f и g - два ненулевых многочлена от одних и тех же n неизвестных х 1 , х 2 , . . . , х n . Тогда 1. deg x (MN) = (deg x M)(deg x N), deg(MN) = (degM)(degN) (12) k k k 27 2. deg x (fg) = (deg x f)( deg x g), deg(fg) = (degf)( degg) k k k (13) Читателю предлагается не только доказать равенства (12), (13), но и составить их лингвистические версии. §2. Лексикографическое упорядочение членов многочлена Рассматривается ненулевой многочлен f  R[x 1 , x 2 , . . . ,x n ], где R - целостное кольцо. При n > 1 - в отличие от многочлена от одной неизвестной (см. (20), (21) §1, Главы I) – отсутствует естественный способ порядка записи членов (мономов) многочлена f. Тем не менее, наличие какого либо единого способа упорядочения членов многочлена f является желательным и даже необходимым. В поисках такого способа на помощь приходит хорошо известный способ расположения слов в словаре, когда из двух слов первым выписывается то, у которого первая из различных букв, последовательно сравниваемых с буквами другого слова, предшествует в алфавите сравниваемой с ней букве второго слова. Логическим основанием переноса идеи лексикографического (словарного) расположения слов в словаре на упорядочение мономов от n неизвестных являются следующие соображения: 1) роль алфавита играет упорядоченный набор неизвестных х 1 , х 2 , . . . , х n ; роль слов мономы, рассматриваемые в единстве неизвестных и их показателей степеней. Итак, имеется два монома из R[x 1 , x 2 , . . . ,x n ]: M = x 1i x i2 …x in , 1 2 n N = x 1j x 2j …x nj 1 2 n (1) Определение. Говорят, что моном M ниже монома N, а N соответственно - выше M и обозначают - M < N (N ˃ M) - если: def M < N  ((1) i 1 <j 1 ))  ((2)  k  [2, n  1] , (i 1 =j 1 ,…,i k =j k , i k 1 <j k 1 ) (2) Пояснение. В формализации (2) определения отношения мономов «ниже» правая часть эквиваленции указывает на два возможных исхода, которые, для удобства в дальнейшем, выделены знаками (1) и (2). Замечание. Из определения отношения «ниже» со всей очевидностью вытекает, что из двух различных мономов обязательно один ниже другого или, что то же самое, любые два различных монома сравнимы между собой по высоте. Теорема. Пусть M, N, S и T - мономы из R[x 1 , x 2 , . . . ,x n ]. 28 1. Отношение «ниже» на множестве всех мономов от одних и тех же неизвестных - транзитивно: ((M < N)  (N< S))  (M < S) 2. (3) ((M < N)  (S ≤ T))  (MS < NT) (4) Доказательство обеих частей теоремы имеет сходные особенности. А именно, в каждом из двух случаев оно объемногромоздкое за счет большого числа вариантов, которые необходимо тщательно перебрать, не упустив из виду ни один. Доказательство же каждого варианта в отдельности сложности не представляет, более того доказательства всех вариантов сходны, ибо основаны на одном и том же логическом основании сравнении по величине натуральных чисел. Ниже мы продемонстрируем сказанное на примере части 1 теоремы, проведя полностью доказательство одного из вариантов и обозначив ход доказательства другого варианта. Доказательство. Пусть мономы M и N имеют вид (1), а мономы S и T - вид: S = x 1u x u2 … x un , 1 2 n T = x 1v x v2 … x vn 1 2 n (5) 1, Отношение M < N раскрывается правой частью (2). Точно так же раскроем отношение N < S: N < S: ((1) j 1 < u 1 )  ((2)  s  [2, n  1] , (j 1 =u 1 ,…,j s =u s , j s 1 <u s 1 ) (6) Левая часть импликации (3) указывает, что (2) и (6) имеют место одновременно. А это, в свою очередь, означает что надлежит рассмотреть четыре случая (варианата): (1,1) (первый случай (2) с первым случаем (6)); (1,2); (2,1) и (2,2). Рассмотрим случаи (1.2) и (2,2): (1,2). Из (2) и (6) получаем очевидные соотношения показателей степеней по величине и нужную нам импликацию: (i 1 <j 1 = u 1 )  (M < S). (2,2). Здесь (см. (2) и (6)) постулируется существование двух натуральных чисел k и s, наделенных соответствующими функциями. Эти числа - в свою очередь - задают три подслучая: (2,2) 1 - k = s; (2,2) 2 - k < s; (2,2) 3 - k ˃ s. Для определенности рассмотрим подслучай (2,2) 2 . Вновь из (2) и (6) выводим достаточно очевидные соотношения, детерминирующие требуемое отношение: (i 1 =j 1 = u 1 ,…,i k =j k =u k , i k 1 <j k 1 = u k 1 )  (M < S). Следует обратить внимание на соотношение i k 1 <j k 1 = u k 1 . Оно 29 получено с учетом того, что (k < s)  (k+1 ≤ s) и поэтому «работает» второй случай правой части (6). Во второй части теоремы прежде чем проводить доказательство надлежит раскрыть по типу (1) подлежащие рассмотрению мономы MS и NT. С учетом рассуждений, предваряющих доказательство теоремы, считаем ее доказанной. Замечание, следующее за определением отношения «ниже», и доказанная теорема представляют собой искомый лексикографический способ упорядочения мономов ненулевого моногочлена от n неизвестных при его записи. Причем упорядочение возможно в двух вариантах: 1) по убыванию - каждый следующий моном ниже предыдущего; 2) по возрастанию - каждый следущий моном выше предыдущего. Суть этого способа описывается алгоритмом (дается вариант «по убыванию»): Лексикографический (словарный) способ упорядочения членов многочлена от n неизвестных. 1. из (ненулевых) мономов многочлена f выбираем самый высокий и записываем его первым слагаемым; 2. из оставшихся мономомов многочлена f вновь выбираем самый высокий и записываем его вторым слагаемым; и т.д., если всего мономов k, то после исполнения (k-1)-го шага останется последний моном, который будет записан последним слагаемым. Процедура лексикографического упорядочения членов многочлена f завершена. Определение. Самый высокий моном ненулевого многочлена f от n неизвестных (определен на первом шаге «упорядочения») называется его высшим членом и обозначается h(f) (англ. highest – высший). Теорема (о высшем члене произведения многочленов). Высший член произведения двух ненулевых многочленов (от одних и тех же неизвестных) равен призведению высших членов сомножителей. Формализация: если f,g - ненулевые многочлены из R[x 1 , x 2 , . . . ,x n ], то h(fg) = h(f)h(g) (7) Доказательство. Мономы каждого из многочленов f и g разделим на две категории: высший член и все остальные (ниже высшего): f: h(f); M f (M < h(f)) (8) g: h(g); N g (N < h(g)) (9) 30 Перемножив многочлены f и g, мы, на основании (8) и (9), получим для произведения fg мономы четырех категорий: fg: h(f)h(g); h(f)N; Mh(g); MN (10) Приведение подобных при умножении многочленов новых категорий мономов произведения fg не вводит. На основании выше доказанной теоремы среди мономов (10) многочлена fg самым высоким будет h(f)h(g), что - в формализованном виде - и представлено формулой (7). Определение. Моном M назовем невозрастающим, если не возрастает последовательность показателей степеней неизвестных, его составляющих (см. (1)): i 1 ≥i 2 ≥…≥i n (11) Важной для дальнейшего является Теорема. Убывающая (по высоте) невозрастающих мономов обязательно конечна. последовательность Доказательство. Пусть N - первый член указанной в теореме последовательности и M - любой другой ее член: N > . . .> M > . . . (12) Оценим число вероятных членов M последовательности (12). Считаем, что N и M заданы формулами (1), причем невозрастаемость дана соотношениями (11) (для M) и соотношениями (для N) j1 ≥ j 2 ≥ . . . ≥ j n (13) Первый член последовательности (12) конкретен, поэтому показатели степеней j 1 , j 2 , . . . j неизвестных фиксированы. Далее, соотношение (12) мономов N и M выражено правой частью (2), которая и позволит нам оценить число вероятных членов M последовательности (12). Действительно, если реализован первый случай правой части (2) то максимальное число значений i 1 равно j 1 , т.е, конечно. В силу (11) конечным будет и число значений других показателей i, следовательно конечным будет и число комбинаций значений показателей степенй неизвестных, задающих мономы M. Т.е., в этом случае последовательность (12) - конечна. И во втором случае правой части (2) последовательность (12) конечна по тем же логическим основаниям. Теорема доказана. 31 §3. Симметрические многочлены. Основные элементарные симметрические многочлены. Основные понятия и свойства Пусть R[x 1 , x 2 , . . . ,x n ] - кольцо многочленов от n неизвестных над целостным кольцом R. Рассмотрим некоторый моном из R[x 1 , x 2 , . . . ,x n ]: M = x 1i x i2 …x in 1 2 (1) n Пусть, далее, S n - группа подстановок n-й степени и α - одна из них. Зададим действие подстановки α на моном M следующим образом: def α(M)  x i (1) x i ( 2) … x i ( n) (2) Из (2) следует, что действин подстановки α на мономы обладает свойством «гомоморфичности». Более точно, если M и N - два монома от одних и тех же неизвестных, то 1 2 n α(MN) = α(M)α(N) (3) Примеры. Пусть M = x 12 x 52 x 34 - моном от четырех неизвестных х 1 , х 2 , х 3 и х 4 . Пусть α = 1 2 3 4 - подстановка 4-й степени. 4312 Обратим внимание на «фиктивный» характер вхождения неизвестной х 3 в состав M - х 3 представлена в M в нулевой степени: M = x 12 x 52 х 30 x 34 . С учетом этого обстоятельства находим, на основании (2): α(M) = х 24 х 53 х 10 х 32 = х 32 х 53 х 24 . Формула (2) служит основанием перенесения действия подстановки α на любой ненулевой многочлен f из R[x 1 , x 2 , . . . ,x n ]. А именно, определим это действие так: def α(f)  { α(M)| M f} (4) Формально можно распространить действие α на нуль: α(0) = 0. Тогда можно считать, что α действует на каждый элемент кольца R[x 1 , x 2 , . . . ,x n ]. Более того - α как отображение R[x 1 , x 2 , . . . ,x n ] → R[x 1 , x 2 , . . . ,x n ] - является изоморфизмом кольца R[x 1 , x 2 , . . . ,x n ] на себя, т.е., в частности:  f,g  R[x 1 , x 2 , . . . ,x n ], (α(fg)=α(f)α(g))  (α(f+g)=α(f)+α(g)) (5) 32 Определение. Многочлен от n неизвестных над целостным кольцом R называют симметрическим, если он не изменяется при действии на него любой подстановки n-й степени. Множество всех симметрических многочленов над R обозначим через SR[x 1 , x 2 , . . . ,x n ]. Тогда формализованная версия определения симметрического многочлена выглядит так: def f  SR[x 1 , x 2 , . . . ,x n ]  (α(f) = f) (6) Примеры. 1. Симметрическими - по определению являются все скаляры из R; 2. Приведем своего рода базовые примеры симметрических многочленов от n неизвестных. А именно, следующие многочлены из R[x 1 , x 2 , . . . ,x n ] являются симметрическими (проверка - читателю) и называются основными элементарными симметрическими многочленами (кратко - ОЭСМ): σ1 = х1 + х 2 + . . . + х n , σ 2 = х 1 х 2 + х 1 х 3 + . . . х 1 х n + . . . +х n 1 х n . . . σ k = х 1 х 2 . . . х k + . . . х n k 1 х nk  2 . . . х n . . . σ n = х1 х 2 . . . х n (6) Выпишем явно высшие члены ОЭСМ: h(σ 1 ) = х 1 h(σ 2 ) = х 1 х 2 . . . h(σ k ) = х 1 х 2 . . . х k . . . h(σ n ) = х 1 х 2 . . . х n (7) 33 Теорема (о высшем члене симметрического многочлена). Высший член симметрического многочлена является невозрастающим. Формализация (коэффициент высшего члена считаем равным 1): (f  SR[x 1 , x 2 , . . . ,x n ])  (h(f) = x 1i x i2 …x in )  (i 1 ≥i 2 ≥…≥i n ) 1 2 n (8) Доказвательство. Допустим противное, что в каком либо звене правой части импликации (8) «невозрастаемость» нарушена. В формализованной версии сказанное означает:  k=[1,n-1], i k < i k 1 (9) По найденному значению k построим подстановку-транспозицию α = (k,k+1) S n (α меняет местами k и k+1, оставляя на месте остальные числа от 1 до n). Находим α(h(f)) (cм. (2)): α(h(f)) = x 1i x i2 … х kk 1 х ik 1 … x in 1 2 k n (10) В силу симметричности f моном α(h(f)) является мономом многочлена f. Сравнивая по высоте мономы h(f) и α(h(f)) (см. (2) §2), на основании (9) заключаем, что h(f) < α(h(f)), что противоресит статусу h(f). Противоречие доказывает теорему. §4. Выражение симметрических многочленов через основные элементарные симметрические Лемма. Сумма и произведение симметрических многочленов над целостным кольцом R являются симметрическими многочленами. Доказательство. Пусть f и g - симметрические многочлены над целостным кольцом R: f,g  SR[x 1 , x 2 , . . . ,x n ] (1) α(fg)=α(f)α(g)) = fg  (α(f+g)=α(f)+α(g) = f+ g (2) Cогласно (5) §3: Что и доказывает лемму. 34 Учитывая, что скаляры из R это симметрические многочлены, более широкой версией доказанной леммы является утверждение: SR[x 1 , x 2 , . . . ,x n ] < R[x 1 , x 2 , . . . ,x n ] (3) Обратимся теперь к ОЭСМ (см. (6) §3) и - формально - их обозначения σ 1 , σ 2 , . . ,σ n будем рассматривать в качестве новых ненизвестных и строить многочлены над R от них. Если в таком многочлене φ(σ 1 ,σ 2 , . . ,σ n ) формально заменить ОЭСМ σ i их выражениями из (6) §3, то получится многочлен f от исходных неизвестных x 1 , x 2 , . . . ,x n , причем - на основании леммы симметрический. Формализация: φ(σ 1 , σ 2 , . . ,σ n )  f(x 1 ,x 2 , . . . ,x n )  SR[x 1 , x 2 , . . . ,x n ] (4) Мы ставим перед собой решение обратной задачи. Дан симметрический многочлен f (правая часть (4)). Требуется найти такой многочлен φ от ОЭСМ (левая часть (4)), чтобы выполнялось равенство (4). Если равенство (4) реализовано, то говорят, что исходный симметрический многочлен f выражен (представлен) через ОЭСМ. Итак, пусть дан симметрический многочлен f (правая часть (4)). Считаем f ненулевым и ненулевой степени, в противном случае самазадача становится тривиальной. Выполняем следующие шаги. Шаг 1. Выпишем с коэффициентом его высший член: h(f) = A 0 x 1i x i2 …x in 1 2 (5) n Согласно теореме о высшем члене симметрического многочлена моном h(f) является невозрастающим, т. е., показатели степеней неизвестных подчиняются неравенствам (см. правую часть (8) §3): i 1 ≥i 2 ≥…≥i n (6) На основании (6) корректным будет следующий моном от неизвестных σ 1 , σ 2 , . . ,σ n : φ 0 = σ 1 i i σ 2 1 2 i2 i3 , . . ,σ n 1 i n 1 in σn in (7) 35 Теперь рассматриваем σ i в (7) как многочлены от x 1 , x 2 , . . . ,x n и ищем h(A 0 φ 0 ). Конструируя h(A 0 φ 0 ), опираемся на лемму о высшем члене произведения многочленов (см. §2) и (7) §3. Тщательно проведя необходимый выкладки, получим: h(A 0 φ 0 ) = h(f) (8) Построим теперь новый многочлен f 1 : f1 = f - A 0 φ 0 (9 1 ) Согласно выше доказанной лемме (или ее версии (3)) многочлен f 1 симметрический. Если он - ненулевой, то выписываем его высший член h(f 1 ). При этом (внимание!), в силу (8) и на основании конструкции (9 1 ) самого f 1 , мы заключаем, что h(f) > h(f 1 ) (10 1 ) Шаг 2. Выпишем h(f 1 ): h(f 1 ) = А 1 x 1j x 2j . . . x nj 1 2 (11) n Вновь на основании леммы о высшем члене симметрического многочлена делаем вывод о невозрастаемости h(f 1 ), что служит основанием построения - по образцу (7) - монома φ 2 от неизвестных σ 1 , σ 2 , . . ,σ n : φ 1 = x 1j  j x 2j  j . . . x nj 1  j x nj (12) 1 2 2 3 n 1 n n По тем же основаниям, что и на шаге 1 (см. (8)) устанавливаем, что h(А 1 φ 1 ) = h(f 1 ) (13) после чего строим многочлен f 2 = f1 - А1 φ1 (9 2 ) Если f 2 - ненулевой, то вновь в силу (8) и на основании конструкции (9 2 ) многочлена f 2 , мы заключаем, что h(f 1 ) ˃ h(f 2 ) (10 2 ) 36 Обсудим сложившуюся ситуацию. Предположив, что f 2 ненулевой (симметрический по x 1 , x 2 , . . . ,x n ) многочлен, мы найдем его высший член h(f 2 ), . . . и т.д. (см. шаги 1, 2). Каждый следующий шаг возможен, если на предыдущем шаге многочлен, полученный по схеме (9), будет ненулевым. У конструируемых при этом многочленов f 1 , f 2 , . . . высшие члены - будучи невозрастающими мономами - порождают убывающую последовательность (10 1, 2, . . . ): h(f) > h(f 1 ) > h(f 2 ) > . . . (14) Последовательность же (14), согласно последней теореме §2, обязательно конечна. Последнее означает лишь то, что на некотором шаге - пусть это будет (k+1)-й шаг - мы получим нулевой многочлен: f k 1 = f k -А k φ k = 0 (9 k 1 ) Итак, выполнив k+1 шаг, мы 1) получили нулевой многочлен f k 1 и 2) построили k+1 моном А 0 φ 0 , А 1 φ 1 , . . . , А k φ k от σ 1 ,σ 2 , . . ,σ n . Для окончательного решения проблемы выражения исходного симметрического многочлена f через ОЭСМ, обратимся к построенным равенствам (9 1, 2,..., k 1 ). Из (9 1 ) находим: f = А 0 φ 0 + f 1 . В это равенство вносим f 1 из (9 2 ). Получаем: f = А 0 φ 0 + А 1 φ 1 + f 2 . И т.д., пока не будет использовано равенство (9 k 1 ), в результате чего мы получим: f = А 0 φ 0 + А1 φ1 . . . + A k φ k (15) Правая часть (15) является многочленом (сумма мономов А 0 φ 0 , А 1 φ 1 , . . . ,A k φ k ) от ОЭСМ, т.е., (15) является искомым представлением f через ОЭСМ. Задача решена. Решение задачи есть, одновременно, и практический метод, алгоритм - назовем его базовым - представления симметрического многочлена через ОЭСМ. Это - шаги 1, 2, … k+1, в рамках которых конструируются мономы φ 0 , φ 1 , . . . ,φ k и их коэффициенты А 0 , А 1 , . . . , A k , дающие искомую правую часть (15). Без доказательства отметим, что представление (15) симметрического многочлена f через ОЭСМ - единственно. Наряду с базовым методом представления симметрического многочлена чеоез ОЭСМ мы изложим еще один метод неопределенных коэффициентов. Итак, пусть дан симметрический многочлен f: 37 f  SR[x 1 , x 2 , . . . ,x n ] (16) Обратим внимание на то, что в его представлении (15) черз ОЭСМ первый член - коэффициент А 0 и моном φ 0 - конструируется немедленно после задания f и установления его высшего члена (см. (5)). Остальные же слагаемые правой части (15) появляются только после построения - в процессе реализации базового алгоритма - серии многочленов f 1 , f 2 , . . . , f k (см. выше). Причем, для построения этих слагаемых используются даже не сами многочлены f 1 , f 2 , . . . , f k , а их высшие члены, образующие - вместе с h(f) - конечную убывающую последовательность (см. последнюю теорему §2, а так же (10 1, 2,... )): h(f) > h(f 1 ) > . . . > h(f k ) (17) Идея метода неопределенных коэффициентов состоит в следующем: зная первый член h(f) , мы - формально - можем задать и выписать всю потенциальную убывающую последователь невозрастающих мономом с неопределенными пока(!) коэффициентами. Действительно, все члены последовательности (17) кроме первого (он задан) - определяются комбинациями показателей степеней j 1 , j 2 , . . . , j n неизвестных x 1 , x 2 , . . . ,x n с неопределенными (неизвестными) коэффициентами А 1 , . . . , A k . При этом, каждая из этих комбинаций подчиняется двум требованиям - 1) определяемый ею моном - невозрастающий и 2) конструируемая этими мономами последовательность - убывающая. Сконструировав последовательность (17), мы явно выпишем формулу (15), в которой 1) все мономы φ 0 , φ 1 , . . . ,φ k выписаны явно (определяются либо комбинацией показателей степеней i 1 , i 2 , , i n моном φ 0 , либо комбинациями j 1 , j 2 , . . . , j n - мономы φ 1 , . . . ,φ k ); 2) коэффициент А 0 известен, а коэффициенты А 1 , . . . , A k подлежат нахождению. Способ нахождения коэффициентов А 1 , . . . , A k навевается линейным относительно этих коэффициентов характером равенства (15). «Линейность» (15) относительно искомых - а потому выступающих в роли неизвестных - коэффициентов А 1 , . . . , A k подсказывает и способ их нахождения: на базе равенства (15) необходимо «сконструировать» определенную (т.е., имеющую единственной решение) систему k линейных уравнений с k неизвестными А 1 , . . . , A k . Решив эту систему, мы построим искомое равенство (15) и, тем самым, выразим заданный многочлен (16) через ОЭСМ. Надлежащая система линейных уравнений будет сконструирована, если надлежащим же способом удастся зафиксировать k серий значений (x 1u , x u2 , . . . ,x un )  R n (u = [1,k]) 38 исходных неизвестных x 1 , x 2 , . . . ,x n , на каждой из которых равенство (15) трансформируется в реальное линейное уравнение с коэффициентами из R и неизвестными А 1 , . . . , A k . Изложенный выше механизм получения нужной системы линейных уравнений визуализируется следующей Таблицей: x 1 , …, x n f σ 1 ,…,σ n φ 0 ,φ 1 ,…,φ k A 1 φ 1 +…A k φ=fA0φ0 A 1 φ 11 +…A k φ 1k =fx 11 ,...,x 1n  R f 1  R σ 11 ,…,σ 1n  R φ 10 ,φ 11 ,…,φ 1k  R A 0 φ 10 . . . . . . . . . . . . . . . . . . . . . . . . х 1k ,...,х kn  R f k  R σ 1k ,…,σ kn  R φ 0k ,φ 1k ,…,φ kk  R A 1 φ 1k +…A k φ kk =f k A 0 φ 0k Таблица В первой строке Таблицы представлены все многочлены, участвующие в построении искомой формулы (15), равно как и само равенство (15) (последняя клетка). В остальных k строках таблицы - начиная со второй - даны: 1) в первом столбце - k серий значений исходных неизвестных x 1 , x 2 , . . . ,x n ; 2) во втором столбце - соответствущие им значения ОЭСМ; 3) в третьем - соответствующие значения мономов φ 0 , φ 1 , . . . ,φ k ; 4) наконец, в четвертом столбце сформированы k линейных уравнений с k неизвестными А 1 , . . . , A k , образующие систему линейных уравнений, которую в свернутом виде можно записать так: 39 k  А i 1 i k i = f k -A 0 φ 0k (18) Мы подошли к заключительному этапу применения метода неопределенных коэффициентов для выражения симметрического многочлена через ОЭСМ: необходимо решить систему линейных уравнений (18) относительно А 1 , . . . , A k . Для этого система (18) должна быть определенной (иметь единственное решение): ее основной определеитель k-го порядка должен быть ненулевым: Det (φ ij ) ≠ 0, i,j = [1,k], i - номер строки (19) При выполнении условия (19) стандартными процедурами строится единственое решение системы линейных уравнений (18), т.е., находятся значения А 1 , . . . , A k , после чего конструируется искомое равенство (15). Замечание. Условие (19) обеспечивается подходящим выбором значений исходных неизвестных x 1 , x 2 , . . . ,x n , т.е., подходящим заполнением первого столбца Таблицы. Это - главная, базовая операция построения Таблицы. Построение остальных столбцов Таблицы требует лишь должного внимания, аккуратности и осуществляется рутинно-автоматически. Построение же первого столбца - акт во многом творческий. При решении конкретных задач серии значений неизвестных, образующих первый столбец Таблицы, часто выбираются из простейших элементов 0, ±1 кольца R. 40 Литература (основная) 1. Курош А.Г. Курс высшей алгебры. 18 изд. Стереотип. – СПб.: Издательство «Лань», 2011 (2004,1968, 1971, 1975).рекомендовано 2. Винберг Э. Б. Курс алгебры.- М.: Издательство «Факториал Пресс», 2002. – 544 с. Литература (дополнительная) 1. Куликов Л.Я. Алгебра и теория чисел. Учебное пособие для студентов физ.мат. специальностей, пед. Институтов.- М.; Просвещение, 1993.

Избранные вопросы алгебры многочленов

Разделы

Поддержка

Избранные вопросы алгебры многочленов

Добавить этот документ в коллекции

Добавить этот документ в сохраненные

Предложите, как улучшить StudyLib