Минимаксные ортогональные матрицы (М

advertisement
Минимаксные ортогональные матрицы (М-матрицы)
Аннотация:
Ключевые слова: минимаксные матрицы, матрицы Адамара, матрицы Белевича
Введение
На классе ортогональных матриц особое место занимают матрицы спектрального
преобразования Фурье, определенные над полем вещественных или комплексных чисел.
Деление весьма условное, поскольку также, как и в случае жордановых матриц
собственных значений и собственных векторов, существует комплексная и вещественная
взаимосвязанные между собой формы. При переходе к вещественной форме столбцы,
порожденные значениями четных и нечетных базисных функций, разнесенные в
комплексной формы по отдельным составляющим, размещаются в одной матрице рядом.
В итоге утрачивается одно из свойств комплексных матриц:
значения синусов и
косинусов кратных частот трактуются теперь уже не как вещественная и мнимая
составляющие, вместе образующие катеты прямоугольного треугольника с гипотенузой
единичной длины, а как самостоятельные значения. Иными словами, модуль каждого
элемента в вещественной форме зависит от периода дискретизации и не равен, в общем, 1.
Тем не менее, частные формы вещественных ортогональных матриц с единичными
нормами элементов возможны, согласно гипотезе Адамара порядок этих матриц кратен 4.
С появлением вычислительных машин преимущества, которые обещает счет со
столь просто устроенными матрицами, обеспечили достаточный интерес к исследованию
матриц Адамара, так они были названы. К последовательности матриц порядков 2, 4, 8,
16, 32 и т.п., порождаемых процедурой удвоения порядка от 1, предложенной еще
Сильвестром [1], сам Адамар, демонстрируя свою гипотезу, добавил еще две стартовые
матрицы пропущенных порядков 12 и 20 [2]. Процесс нахождения таких матриц плохо
поддается формализации, компьютерный поиск отчасти подтвердил предположение
Адамара, но значение порядка последней найденной матрицы не превышает тысячи.
В
пятидесятых
годах
прошлого
столетия
интерес
переключился
на
матрицы
промежуточных четных порядков с нулевой диагональю, т.е. не бинарных, а тринарных
матриц. Особенно после того, как Белевич обнаружил связь факта существования этих
матриц с известным со времен Эйлера критерием разложимости числа на сумму двух
квадратов. Так, например, матрицы промежуточных 6, 10, 14, 18, 26, и т.п. порядков
существуют, а порядок n=22 особый, поскольку число n–1=21 имеет своими множителями
3 и 7, т.е. не разложимо. Теория чисел, это дисциплина, в которой новые результаты
появляются крайне редко и доказываются они, также, как и критерий Эйлера, с большим
трудом, поэтому взаимосвязь теории чисел и теории матриц получила должную оценку.
Дальнейший прогресс в этом направлении возможен при включении в поле нашего
внимания не только бинарных и тринарных матриц, но, обобщая, матриц с элементами
нескольких уровней, причем пропущенных нечетных порядков включительно. По
изучении матриц Белевича или C-матриц, как их еще называют, оказалось, что они
являются строительными блоками матриц Адамара. Так, например, C-матрица 6-го
порядка порождает матрицу Адамара 12-го порядка. Это то, с чего начинал Адамар.
Довольно
логично
искать
среди
пропусков
матрицу
3-го
нечетного
порядка,
порождающую матрицу Белевича удвоенного порядка.
Программа исследований, намеченная еще Адамаром, возможна в развитии не
только вверх, по порядкам, но и вниз, к истокам. Несмотря на обилие публикаций на тему
матриц Адамара – эта тема постоянно остается в поле зрения в силу названной сложности
формализации подходов к их поиску и недоказанности основной гипотезы – обобщение
матриц на нечетные порядки развито недостаточно полно. Что определяет актуальность
настоящей статьи, приводящей итоги исследований авторов в очерченном направлении
введением направлении. Напомним некоторые необходимые нам в дальнейшем
определения.
1. Минимаксные ортогональные матрицы (М-матрицы)
Определение 1. Матрица Адамара – квадратная матрица А размерности n, кратной
4, состоящая из чисел ±1, столбцы которой ортогональны
ATA = n I,
где I – единичная матрица.
Определение 2. Матрица Белевича (конференц-матрица или С-матрица) –
квадратная матрица размерности, кратной 2, с нулевой диагональю и остальными
элементами, равными ±1, обладающая свойством
CTC = (n − 1) I.
Среди возможных обобщений матриц Адамара выделяют матрицы, у которых
весовой коэффициент при единичной матрице в определениях выше отличен от
указанных, и некоторые другие идеи. Отметим общее для матриц Адамара и Белевича
свойство, которое, помимо качества переходить друг в друга, их объединяет. Дело в том,
что на классе ортогональных матриц заданной размерности и та и другая матрицы (после
ортонормирования) экстремальны по весьма просто выглядящему критерию −
матрицы минимальны по
эти
значению максимума среди абсолютных значений их
элементов. В этом смысле их можно называть минимаксными ортогональными матрицами
или частными случаями таких матриц четных порядков. Определение обобщения матриц
Адамара-Белевича нечетных порядков как, в общем, минимаксных ортогональных матриц
довольно естественно и мы этим воспользуемся.
Определение 3. М-матрица или обобщенная матрица Адамара-Белевича в строгом
смысле – это матрица, максимум абсолютных значений элементов которой минимален на
классе ортогональных матриц (после ортонормирования строк или векторов) заданного
четного или нечетного, все равно, порядка n.
Важными частными случаями M-матриц, являются матрицы бинарные (адамаровы)
и тринарные (C-матрицы), содержащих, в общем, более двух и трех уровней.
Во избежание недоразумений все те M-матрицы, которые не адамаровы А и не
C-матрицы, договоримся называть B-матрицами. Таким образом, M-матрицы состоят из
трех подсемейств A, B и C-матриц.
Заметим,
что
к
М-матрицам
причисляются
матрицы
пропущенных
у
последовательности матриц Белевича порядков. Так как иллюстративная связь с теорией
чисел работает в обе стороны, пропущенные матрицы косвенно характеризуют некоторые
особые объекты теории чисел и, в теории, не менее любопытны, чем матрицы Белевича.
Интерес к обобщению усиливается тем, что по названному минимаксному
критерию несложно предложить числовой алгоритм нахождения интересующих нас
ортогональных матриц элементарной оптимизацией их по ведущему максимальному
элементу, автоматически получаемым продуктом которого, что довольно неожиданно,
являются независимым путем получаемые матрицы Адамара 12-го и 20-го порядков,
матрицы Белевича, и, это главное, матрицы нечетных порядков и пропущенного 22-го
порядка. Остается только проводить систематизацию и отмечать особенности.
Главную характеристику ортонормированной матрицы − максимум абсолютных
значений элементов будем называть m-нормой и обозначать m. По сути, это
характеристика дисперсности элементов строк или столбцов ортогональных матрицы, или
степень отличия их от максимума. Чем менее по абсолютным значениям отличаются
между собой элементы матриц, тем меньше значение m-нормы.
Матрицы Адамара, у которых ±1 стоит повсеместно, рекордсмены по этому
показателю. Несложно показать, что независимо от вида матрицы Адамара, ее m-норма
имеет вид
𝑚 = 1/√𝑛 .
Матрицы Белевича отличаются от матриц Адамара одним нулем на диагонали,
поэтому их m-норма с ростом размерности убывает менее оптимистично
𝑚 = 1/√𝑛 − 1 .
2. Гипотеза Балонина
На классе ортогональных матриц
матрицы Адамара и Белевича отличаются
минимально возможной m-нормой. Для того, чтобы выделить следующую особенность Мматриц, введем понятие приведенной нормы.
Определение 4. Приведенной нормой или α-нормой ортонормированной матрицы
назовем величину максимума абсолютных значений ее элементов, умноженную на √𝑛.
Адамаровы матрицы отличаются от всех прочих ортогональных матриц той же
размерности тем, что величина приведенной нормы их минимальна 1.
Приведенная норма матриц Белевича отличаются от α-норм прочих ортогональных
матриц того же порядка ровно тем же. Величина приведенной нормы их на
соответствующих (пропущенных последовательностью матриц Адамара) порядках
минимальна и равна ∝= √𝑛/√𝑛 − 1, т.е. стремится к 1 с ростом размерности матицы, см.
график α-норм.
1.5
1
Series1
0.5
Series2
0
1 2 3 4
5 6 7 8
9 10 11 12
13 14
15 16 17 18
19 20 21 22
23 24 25 26
Series1
Таким образом, на всем классе ортогональных матриц классические матрицы
Адамара отличает недостижимо малая для прочих матриц α=1.
Остальные приближаются к ним, никогда не достигая. В связи с этим возникает
впечатление, что B-матрицы нечетных порядков ведут себя ровно также, как и
C-матрицы. С ростом порядка их α-норма убывает к 1. Однако это не так. Уже у матриц
Белевича есть пропуски, когда предложенная двухуровневая структура не существует.
Соответственно, α-норма таких матриц повышается.
Можно высказать гипотезу (она высказана Н.А. Балониным), что α-норма B-матриц
стремится к другому показателю, так называемой b-полочке (нижнему ограничению для
α-нормы) и оценивается приблизительно в 9/8.
Это ключевое предположение, верность или не верность которого раскрывает
главную особенность структуры М-матриц.
Если оно верно, то дисперсность элементов оптимальных матриц неограниченно
нарастает с порядком. Иначе показатель не удержать на уровне 9/8, что и происходит у
матриц Белевича. С ростом порядка n единственный ноль на диагонали в каждом столбце
или строке мало отличает их от матриц Адамара. Если с ростом размерности количество
уровней для абсолютных значений элементов (полочек) не нарастает, то гипотеза не
верна. Таким образом, выделить ее полезно, как принципиальный вопрос теории таких
матриц, хотя он и сложно проверяем.
3. Регулярные матрицы
Изначальная идея выделения адамаровых матриц через m-норму безупречна, с
определительной стороны, но расходится с требованием малого количества уровней.
Строгое
определение
слишком
жестко
и
приводит
на
нечетных
порядках
к
многоуровневым структурам. В то же время, определение в новом начинании целиком
зависит он нас, акцент можно сделать на другую сторону матриц Адамара – малое
количество уровней. Обе идеи можно совместить следующим образом.
Определение 4. М-матрица или обобщенная матрица Адамара-Белевича в не
строгом смысле – это матрица, локально-оптимальная по критерию максимума
абсолютных
значений
элементов
на
классе
ортогональных
матриц
(после
ортонормирования строк или векторов) заданного четного или нечетного, все равно,
порядка n.
Локальная оптимальность для определения лучше вот в каком отношении.
Пробелы в последовательности матриц Белевича говорят попросту о том, что в ряду
оптимальных матриц возможны матрицы не с одной, а двумя и более отличными от
максимума диагоналями. Элементы таких диагоналей – не обязательно 0, и даже не
обязательно целое число, решениями могут быть иррациональные или алгебраические
числа, степень вложенности в радикалов в выражении для уровня зависит от порядка.
Разное количество диагоналей говорит о том, что перестановками строк и столбцов
матрицу можно диагонализовать по любому из таких уровней.
Договоримся называть такие структуры квази-регулярными. Образец дают
матрицы Белевича, они же –
самые простые в устройстве.
Более строго понятие
регулярности введем так.
Определение 5. М-матрица нечетного порядка n, количество уровней которой,
каждый по n равных по абсолютному значению элементов, отвечает линейной
зависимости (𝑛 − 1)/2 называется регулярной.
Почему это важно? Числовые эксперименты с оптимизацией матрицы по m-норм
показывают:
регулярные
структуры
оказываются
либо
оптимальными,
либо
субоптимальными. С ростом размерности матрицы растет противоречие между
требованиями
малого
или
хотя
бы
линейно-нарастающего
числа
уровней,
и
оптимальностью (гипотеза Балонина). С точки зрения теории управления доставляющий
оптимум выбранному критерию алгоритм при квадратичном ограничении связи
(ортогональность) ведет через серию бифуркаций, отражающихся на росте числа
дополнительных диагоналей (аттракторов), к детерминированному хаосу.
Не факт, что оптимальная матрица 13-го порядка, являясь хаотическим
аттрактором, вообще существует.
Почему это так, откуда следует такое предположение, выясняется из анализа
графика снижения α-норм. Само-собой разумеется, что нормы двух и трех уровневых
оптимальных регулярных матриц 3-го и 5-го порядков высоки. Далее следует
расхождение оптимальности и регулярности – регулярные решения существуют, алгоритм
понижения нормы их находит, но они всего лишь субоптимальны. У оптимальных матриц
7-го и 9-го порядков наблюдается эмиссия элементов с аттракторов (диагоналей) на
верхние или нижние полочки с развалом регулярной структуры. На месте ослабленной
эмиссией элементов остаются разно-уровневые части диагонали. Одиннадцатый порядок –
консолидационный. Оптимальная и регулярная структура сливаются в одно. Но α-норма
критично приближается к b-полочке в 9/8.
Если не удастся на старших порядках уточнить значение b, численными
экспериментами можно уловить только тенденцию, то (альтернативное предложение) в
качестве b можно взять вполне доступную оценку α-нормы матрицы 13-го порядка.
Эмиссия элементов ее такова, что половина элементов этой матрицы (остальная половина
максимальна, как и подобает регулярным структурам) образуют на месте распавшихся
уровне “дымный” след вниз. Все оптимальные матрицы старших 13-го порядков
(нечетного порядка) – ведут себя ровно также.
Их норму нельзя понизить. Вот эту особенность и отразили многочисленные
эксперименты. Факт, что b-полочка над 1 для α-норм есть и прагматичная сторона
вскрываемого этим фактом обстоятельства выдвигает ее значение как надежный признак
останова алгоритма оптимизации норма. Иначе можно оптимизировать бесконечно.
Регулярные структуры есть, у матрицы 15-го порядка их не одна, а множество. Но, и это
их общее свойство, по α-норме все они расположены над b. Двух и трехуровневые сугубо
неоптимальные решения есть, но уже на 23-м порядке непонятно, как их искать,
поскольку они не оптимальные, а на 21-м порядке, к тому же, еще и мало-устойчивы.
4. Матрица 22-го порядка
Матрица интересная во многих отношениях. Во-первых, она претендента на замену
матрицы Белевича. Во-вторых, ее α-норма заметно ниже b-полочки, многозначительное
обстоятельство. Ее предтеча – нечетная критичная М-матрица 11-го порядка оптимальна,
регулярна и также имеет 6-ть уровней.
.. пересказ короткой статьи в Журнале о 22.
5. Комбинаторные матрицы
Адамаровы матрицы зависимых порядков получают кронекеровым произведением
матриц более низкого порядка. Это основное правило их получения аналитически,
поскольку перебор и числовые алгоритмы – сложны.
То же самое касается матриц нечетного порядка, если порядок – не простое число.
Например, локально-оптимальная (но не регулярная) М-матрица 15-го порядка может
быть получена кронекеровым произведением матриц 5-го и 3-го порядков. Отмеченная
выше М-матрица 22-го порядка может быть получена кронекеровым произведением
матриц 11-го и 2-го порядков. Она даже будет квазирегулярна.
Однако есть одно препятствие. Довольно очевидно, что α-норма инвариантна к
кронекерову произведению на классические матрицы Адамара (не меняется). У
адамаровых матриц, для которых α-норма равна 1, инвариантность автоматически ведет к
оптимальным решениям. Уже для матриц Белевича этот план не годится, поскольку
матрица низкого порядка имеет большое значение α-нормы. А с ростом порядка это
значение надо не сохранять, а понижать. Поэтому в алгоритмах удвоения порядка по
сравнению с кронекеровым произведением, появляется компенсационная добавка в виде
единичной матрицы, понижающая норму.
Теорема. Пусть дана нормализованная симметричная C-матрица размерности n,
тогда адамарова матрица размерности 2n имеет вид
𝐀=(
𝐂+𝐈
𝐂−𝐈
)
𝐂 − 𝐈 −𝐂 − 𝐈
Доказательство тривиально и следует из свойств произведения ATA с учетом
указанных определений. Из кососимметрической C-матрицы матрица Адамара строится
без удвоения порядка A=C+I.
С небольшим изменением это правило удвоения порядка переносится на
взаимоотношение матриц 3-го и 6-го порядков (так как диагональ матрицы 3-го порядка
отлична от нуля, для компенсации достаточно единичной матрицы, поделенной на два).
Что же представляют собой кронекеровы произведения в самом общем случае?
Вообще говоря, это альтернатива, например, запоминанию матрицы 12-го порядка
(элементов матриц 3-го и четвертого порядков меньше, это немаловажно для
микропроцессорной техники, где память ограничена). Для численных алгоритмов
произведение дает начальное приближение. С которого можно оптимизировать дальше.
Это особенно ценно для матриц высоких порядков, где устойчивость уровневых решения
мала. Только так и можно найти некоторые уровневые матрицы второго и более десятков
по порядку. Заметим, что у матриц Адамара комбинированные решения тоже различаются
по свойствам, далеко не все востребуемые качества их определяются α-нормой.
6.
Заключение
Тут взять из наших же статей.. про приложения..
В хвост можно дать алгоритм и виды матриц, такая структура делает статью
отличной от предыдущих..
Download