Введение. Множество практических задач решается на основе информации об измеряемом объекте. При наличии полной информации процесс обработки, хранения и восстановления экспериментальных данных уже хорошо изучен. Иная ситуация может возникнуть, когда информация об изучаемом объекте частично отсутствует. В работе рассматривается именно такой случай в предположении, что для измеряемого объекта существует ограниченное число образцов (классов), к одному из которых он может принадлежать. В работе к рассмотрению предлагается метод распознавания исследуемого объекта, основанный на использовании вейвлет-преобразования экспериментальных данных. Постановка задачи и методы решения. Предположим, что исходный сигнал может принадлежать к одному из классов K1, K 2 ,..., K n , образующих разбиение множества сигналов и имеются теоретические значения k соответствующих функций f xi , y j , k 1,..., n в точках xi , y j эталонных образцов каждого класса K k . Пусть g xi , y j - измеренные значения экспериментального двумерного сигнала в тех же самых точках. На основе значений g xi , y j требуется определить, к какому классу принадлежит измеряемый сигнал. Для принятия такого решения можно воспользоваться либо различными статистическими или детерминированными методами, применёнными к исходным сигналам, либо предварительно преобразовать дискретно-значные функции f k xi , y j и g xi , y j с последующим сравнением полученных характеристик. В данной работе рассматривается второй подход, основанный на вейвлетпреобразовании соответствующих функций с использованием вейвлета Добеши 2-го порядка и сравнением получающихся коэффициентов. Основную модель вейвлет-преобразования можно описать следующим образом. Сначала выбирается подходящий анализирующий (т.н. отцовский) вейвлет x . Затем на его основе строится масштабирующий (материнский вейвлет) x . Из функций x и x путём сдвига и растяжения, получаем копии, называемые вейвлетными функциями.[1] Для одновременного проведения как частотного, так и временного анализа данных вейвлеты должны удовлетворять определённым условиям, например, иметь компактный носитель, нулевое среднее значение, быть непрерывными, желательно, чтобы вейвлетные функции образовывали ортогональный базис и т.п. Одними из наиболее удобных в использовании таких функций являются вейвлеты Добеши, не имеющие формального математического описания, но легко получаемые алгоритмически. В данной работе использовался вейвлет Добеши 2-го порядка. В результате разложения двумерного сигнала по базисным функциям, полученным из вейвлета Добеши, получаем наборы коэффициентов, соответствующих различным уровням детализации. Соответствующие коэффициенты принято называть следующим образом: Аппроксимирующие коэффициенты cA j получаются как коэффициенты разложения по вейвлет-базису j ,n x j ,m y . Горизонтальные детализирующие коэффициенты cH j получаются как коэффициенты разложения по вейвлет- базису j ,n x j ,m y . Вертикальные детализирующие коэффициенты cV j получаются как коэффициенты разложения по вейвлет- базису j ,n x j ,m y . Диагональные детализирующие коэффициенты cD j получаются как коэффициенты разложения по вейвлет- базису j ,n x j ,m y .[2] Практически выходной сигнал задается матрицей S . При разложении этого сигнала получаются указанные выше четыре типа коэффициентов. Например, горизонтальные детализирующие коэффициенты cH1 получаются сверткой строк матрицы S с низкочастотным фильтром вейвлета и децимацией и затем сверткой столбцов полученной матрицы с высокочастотным фильтром и децимацией[3]. Схему разложения можно изобразить в виде S cA1, cH1, cV1, cD1 cA2 , cH 2 , cV2 , cD2 , cH1, cV1, cD1 ... Поскольку массив начальных коэффициентов двумерный, то более естественно схему разложения сигнала S (рис.1) изобразить в виде cH 2 cA2 cH1 cD2 cV2 cH1 S cV1 cD1 Рис. 1 Предположим, что измеренный сигнал g x, y является частью одного из эталонных сигналов f k x, y , т.е. или g xi , y j f k xi , y j , k 1,..., n для какого-то фиксированного k , или g xi , y j 0 . Тогда, в силу компактности носителей для вейвлетов Добеши и соответствующих масштабирующих копий в определённых областях все коэффициенты разложений g x, y и f k x, y будут совпадать и значительно отличаться от соответствующих коэффициентов других эталонных функций. В качестве меры отличия между сигналами выберем l2 - норму: f k x, y g x , y 2 2 2 2 k k k k cA f cA g cH f cH g cV f cV g cD f cD g j j j j j j j j , где cA j f k , cH j f k , cV j f k , cD j f k - соответствующие коэффициенты базисного разложения функции f k по вейвлет – базису, аналогичные обозначения и для функции g . В случае, когда g является частью f , эта норма будет иметь наименьшее значение по сравнению с аналогичными нормами при использовании других эталонных функций. Алгоритм обработки информации следующий: Этап 1 (Построение исследуемых сигналов). На этом этапе осуществляется расчет вейвлет–коэффициентов, то есть разложение сигналов на аппроксимирующие, горизонтальные детализирующие, вертикальные детализирующие и диагональные детализирующие коэффициенты, для так называемых эталонных образцов. [3] Этап 2 (Разложение сигнала). На данном этапе осуществляется разложение измеренного сигнала, на аппроксимирующие, горизонтальные детализирующие, вертикальные детализирующие и диагональные детализирующие коэффициенты. Этап 3 (Классификация). На этом этапе происходит сравнение вейвлеткоэффициентов измеренного сигнала и вейвлет-коэффициентов эталонных образцов и определение к одному из классов. В качестве индикатора различий выступает l2-норма. Класс K k , к которому принадлежит измеряемый сигнал g , определяется путем сравнения указанных выше норм и выбора наименьшей из них. Результаты. В качестве примера работы алгоритма было рассмотрено распознавание букв кириллического алфавита, встречающихся на государственных регистрационных знаках автомобиля. В качестве сигнала g(x,y) было взято изображение буквы А при условии, что часть информации была намеренно стерта (рис. 2). Рис. 2 В качестве классов принадлежности взяты буквы А, В, Е, К, М, Н, О, Р, С, Т, У, Х. В эксперименте исследуемыми сигналами были все буквы, встречаемые на государственных регистрационных знаках. Результаты распознавания приведены в таблице 1. Таблица 1 Сравнительный анализ распознавания экспериментального сигнала Буква Значение F критерия l2 -норма Фишера- Снедекера А 39880 В 53649 59,911 Е 50345 12,169 К 48648 1,365 М 57546 176,746 Н 49662 5,849 О 51073 21,382 Р 48786 0,259 С 47834 0,007 Т 42656 65,140 У 45068 27,994 Х 47349 0,931 Легко заметить, что наименьшая значение l2 -нормы получается при сравнении буквы А с частично удалённой информацией именно с буквой А. Для проверки значимости полученного результата распознавания был проведён сравнительный однофакторный дисперсионный анализ для выбранного базисного элемента и всех других возможных элементов при доверительной вероятности 95%. Данный метод анализа эффективен в тех случаях, когда в наличии есть три или более независимые выборки значений, полученные из одной генеральной совокупности путем изменения какого-либо независимого фактора. Для этих выборок предполагают, что они имеют разные выборочные средние и одинаковые выборочные дисперсии. Необходимо определить, оказал ли этот фактор существенное влияние на разброс выборочных средних или разброс является следствием случайностей, вызванных небольшими объемами выборок. Другими словами если выборки принадлежат одной и той же генеральной совокупности, то разброс данных между выборками (между наборами) должен быть не больше, чем разброс данных внутри этих выборок (внутри набора). Для анализа использовалась программа Microsoft Excel и включенный в её состав пакет «Анализ данных». В качестве выборок брались значения разностей коэффициентов вейвлет-разложения исходного сигнала и эталонных букв. Сравнительные результаты также приведены в таблице 1. При сравнении с теоретическим значением F, равным 3,84, можно убедиться, что с большинством букв различие сигнала с утерянной на 79% информацией всё равно является статистически значимым. При меньшей доле потерь количество значимых различий будет возрастать. Для проверки эффективности метода было проведено сравнение предлагаемого метода распознавания сигнала с другими методами. Если использовать только статистические методы и не подвергать распознаваемый сигнал предварительной обработке, то значимое распознавание возможно лишь при потере информации не более одного процента. В случае же, если использовать предварительное вейвлет-преобразование сигнала, то статистически значимое распознавание возможно в случаях, когда процент потерянной информации достигает 23. Аналогично, предлагаемый метод имеет преимущество перед сигналом, к которому было применено двумерное преобразование Фурье, поскольку в отличие от него, вейвлеты являются ограниченными функциями, как в частотной, так и во временной области. Это доказывают значения l2 -нормы найденные с использованием вейвлет-преобразования (таблица 1) и двумерного преобразования Фурье (таблица 2) Двумерное преобразование Фурье можно представить в виде: km ln 2 i 1 M 1 N 1 M N , где m 0,1,..., M 1 , n 0,1,..., N 1. f mn f e k ,l MN k 0 l 0 f k ,l номер элемента в матрице имеющей M строк и N столбцов. Таблица 2 Нахождение l2 -нормы с использованием ДПФ Буква l2 -норма А В Е К М Н О Р С Т У Х 24902000 34641000 32156000 30670000 36494000 31154000 32289000 30988000 29974000 26771000 28128000 29676000 Как видно из рассмотренного выше примера, распознавание предложенным методом возможно и при значительно больших потерях, но при этом возникает ненулевая вероятность ошибок, как первого, так и второго рода. Заключение. В данной работе предлагается метод распознавания сигналов различной природы при отсутствии полной информации. Для проверки метода было проведено распознавание сигнала и его классификация в практически важной задаче распознавания текста. Полученные результаты свидетельствуют о перспективности разработанного метода и его преимуществе по сравнению с основными существующими методами распознавания. Можно сделать вывод, что во многих случаях независимо от помех в измерениях, по коэффициентам вейвлет-разложения можно определить, к какому классу (какой букве) он относится. Данный метод может быть применен при обработке видеосигналов, полученных с регистрирующих устройств в условиях недостаточной видимости или при низком разрешении видеокамеры. Описанный выше метод распознавания сигналов не требует проведения сложных вычислений, и может применяется при решении практических задач одним из направлений усовершенствования метода может служить поиск паттернов (одинаковых ненулевых последовательностей) в коэффициентах разложения.