АЛГОРИТМ «ГОЛОТИП 1» Назначение — решение задач распознавания в случае, когда в МО представлены объекты только одного образа; решение задач районирования, определение представительности МО. Постановка задачи 1. Задана совокупность объектов, для части объектов известна принадлежность к образу, относительно оставшейся части объектов следует принять решение о принадлежности их к данному образу (задача распознавания на один образ). 2. Задана совокупность объектов, которую требуется разбить на группы однородных (в некотором смысле) объектов (задача районирования). 3. Задана совокупность объектов, для которой необходимо определить представительность МО. Метод решения задачи. Пусть совокупность экспериментально изученных объектов a1 , a2 ,..., an со свойствами f1, f 2 ,..., f m представлена в виде таблицы «объекты-свойства»: f j k 1,2,..., m , j 1,2,..., n , k где m — число свойств, n — число объектов. Свойства могут быть измерены в различных шкалах (арифметическая, логическая 1-го рода, логическая 2-го рода). По каждому свойству f k определим минимальное ( f k* min f k ) и максимальное ( f k** max f k ) значения и вычислим экстремальные разности: Ek f k** f k* , где k 1,2,..., m . (4.2) Определим информационный вес каждого свойства k m свойств можно задать самим таким образом, чтобы k 1 k 1 . Информативные веса m 1. Вы числим меру сходства k i , j между парой объектов ai , a j по свойству f k : 1. Если свойство f k является арифметическим или логическим 2-го рода применяется следующая формула k i , j 1 f ki f k j f k** f k* , (4.3) где f k* min f k , f k** max f k . 2. Если свойство f k является логическим 1-го рода, то применяется формула 1, если fki f k j k i , j i j 0, если f k f k . (4.4) вычисляется по формуле Общая матрица мер сходства по всем свойствам i , j m i , j k k i , j , (4.5) k 1 где k — информативный вес свойства f k , k 1,..., m . Используя i, j разобьем всю исходную совокупность объектов на однородные группы (компоненты связанности). Под компонентами связанности понимается следующее. Будем говорить, что два объекта ai , a j связаны между собой одной связкой, если i , j 0 , где 0 — некоторая постоянная. Если ai связан посредством одной связки с a j , а a j связан с al , то ai и al связаны между собой посредством двух связок. Совокупность объектов ai , каждый из которых связан с каждым посредством любого числа связок, называют 1 компонентой связности (однородной группой). В качестве 0 , например, выберем среднюю меру сходства 0 1 n 1 n i, j . nn 1 i 1 j i (4.6) Рассмотрим q -ю компоненту связности Bq , содержащую nq объектов. Занумеруем объекты в Bq и построим для Bq матрицу коэффициентов сходства q i , j . Для объектов из Bq определим коэффициент типичности 1 nq i i 1 nq q где q 1 nq t nq j t1 q i q i , j , 2 t nq i , j ; nq — число объектов в Bq ; i, j t1,..., tnq . q j t1 Объект из Bq , которому соответствует максимальное значение коэффициента типичности, назовем голотипом ( Г q ). Назовем радиусом компоненты связности величину 0 , если Bq содержит один объект, Rq min Г , j , если Bq содержит несколько объектов. q 1 j n q Радиусом компоненты связности является мера сходства голотипа с удаленным объектом компоненты связности. Таким образом, компонента связности представляется в виде m мерного шара, в который входят все объекты, попавшие в данную компоненту связности и, кроме того, некоторые другие объекты, для которых в силу их сходства с объектами компоненты связности возможен вывод аналогии о принадлежности к образу, представленному объектами этой компоненты связности. Распознавание объекта x проводится следующим образом: объект принадлежит образу, если существует голотип, мера сходства которого с x больше соответствующего радиуса, в противном случае x к образу не относится. Для случая исследования материала обучения на представительность для объекта x проводим аналогичные сравнения. МО считается непредставительным для x, если нет ни одного голотипа, мера сходства которого с x больше соответствующего ему радиуса. Для задачи районирования в качестве результата используются все вышеперечисленные компоненты связности. Условия применимости. ТОС должна быть без пропусков; свойства — арифметические, логические 1-го и 2-го рода. П р и м е р. Имеется некоторая исходная ТОС. Определить для каких объектов МЭ данный МО является представительным, а для каких нет. Р е ш е н и е. Исходными данными является ТОС (табл. 3). На каждом объекте МО и МЭ измерены два свойства: f 1 и f 2 . В МО представлены объекты только одного образа. табл. 3 Материал обучения N f1 f2 1 2 3 4 5 6 7 8 126 138 182 196 152 193 113 154 2.91 4.50 2.16 2.30 4.70 4.22 5.23 4.06 Материал экзамена Образ N f1 f2 1 1 1 1 1 1 1 1 1 2 3 4 5 6 7 8 140 135 115 187 169 141 201 112 3.20 4.38 5.99 4.54 5.39 2.44 3.04 3.18 Образ 0 0 0 0 0 0 0 0 2 9 10 11 12 13 14 15 16 17 18 124 179 174 145 108 117 145 115 149 168 5.65 2.72 1.41 4.62 5.26 4.92 3.28 3.27 4.76 2.79 1 1 1 1 1 1 1 1 1 1 9 10 11 12 13 14 15 129 119 205 139 165 204 187 4.92 3.96 2.58 3.23 4.00 5.30 4.67 0 0 0 0 0 0 0 По формуле (4.2) находим экстремальную разницу для каждого свойства МО: Для свойства f 1 : f 88.3; Для свойства f 2 : f 4.25. Вычисляем матрицы мер сходства по каждому свойству по формуле (4.3) или (4.4). Выбираем k — информативный вес каждого свойства, в данном случае 1 2 0.5. Вычисляем общую матрицу мер сходства по формуле (4.5) (табл. 4): Табл.4 1 2 3 4 5 6 7 8 9 1 1 2 0.74 3 0.59 0.47 4 0.53 0.41 0.91 5 0.64 0.9 0.53 0.47 6 0.46 0.65 0.69 0.76 0.71 7 0.65 0.77 0.25 0.18 0.72 0.43 8 0.71 0.86 0.62 0.55 0.91 0.76 0.63 9 0.66 0.78 0.26 0.19 0.73 0.44 0.89 0.64 10 11 12 13 14 15 16 17 18 0.74 0.59 0.53 0.64 0.46 0.65 0.71 0.66 0.68 0.55 0.69 0.62 0.71 0.85 0.89 0.65 0.75 1 0.47 0.41 0.9 0.65 0.77 0.86 0.78 0.56 0.43 0.95 0.74 0.83 0.82 0.72 0.9 0.63 1 0.91 0.53 0.69 0.25 0.62 0.26 0.92 0.86 0.5 0.21 0.3 0.65 0.49 0.51 0.84 1 0.47 0.76 0.18 0.55 0.19 0.85 0.77 0.44 0.15 0.24 0.59 0.43 0.44 0.78 1 0.71 0.72 0.91 0.73 0.61 0.49 0.95 0.69 0.78 0.79 0.62 0.98 0.68 1 0.43 0.76 0.44 0.74 0.56 0.68 0.39 0.48 0.61 0.44 0.69 0.69 1 0.63 0.89 0.33 0.2 0.75 0.97 0.94 0.59 0.76 0.74 0.4 1 0.64 0.7 0.57 0.88 0.6 0.69 0.85 0.69 0.89 0.77 1 10 0.68 0.56 0.92 0.85 0.61 0.74 0.33 0.7 0.34 0.34 0.22 0.76 0.86 0.88 0.6 0.67 0.75 0.41 1 11 0.55 0.43 0.86 0.77 0.49 0.56 0.2 0.57 0.22 0.82 0.82 0.58 0.3 0.39 0.74 0.57 0.59 0.93 1 12 0.69 0.95 0.5 0.44 0.95 0.68 0.75 0.88 0.76 0.58 0.46 0.46 0.17 0.26 0.61 0.45 0.47 0.8 1 13 0.62 0.74 0.21 0.15 0.69 0.39 0.97 0.6 0.86 0.3 0.17 0.72 0.72 0.81 0.84 0.67 0.96 0.65 1 14 0.71 0.83 0.3 0.24 0.78 0.48 0.94 0.69 0.88 0.39 0.26 0.81 0.91 0.91 0.56 0.73 0.71 0.37 1 15 0.85 0.82 0.65 0.59 0.79 0.61 0.59 0.85 0.6 0.74 0.61 0.84 0.56 0.65 0.65 0.79 0.8 0.46 1 16 0.89 0.72 0.49 0.43 0.62 0.44 0.76 0.69 0.67 0.57 0.45 0.67 0.73 0.79 0.83 17 0.65 0.9 0.51 0.44 0.98 0.69 0.74 0.89 0.75 0.59 0.47 0.96 0.71 0.8 0.83 0.8 0.81 1 0.8 0.63 0.63 0.64 1 18 0.75 0.63 0.84 0.78 0.68 0.69 0.4 0.77 0.41 0.93 0.8 0.65 0.37 0.46 0.81 0.64 0.66 0.66 1 Вычисляем порог: 0 по формуле (4.6), но в данном примере для порога выбираем среднюю меру сходства 0 0.82 . И разбиваем объекты на однородные группы. Для того, чтобы облегчить процесс разбиения на однородные группы построим просеянную общую матрицу мер сходства (табл. 5). табл. 5 1 1 2 2 3 4 0.9 1 0.91 0.91 1 8 9 10 11 12 13 14 15 16 17 0.9 0.86 0.95 0.83 0.82 18 0.9 0.92 0.86 0.84 0.85 1 6 0.91 0.95 0.98 1 7 9 7 0.85 0.89 1 4 8 6 1 3 5 5 1 0.86 0.91 0.89 1 0.89 0.97 0.94 0.88 1 0.85 0.89 0.86 0.88 3 10 0.92 0.85 11 1 0.86 12 1 0.95 0.95 13 0.88 0.97 14 0.93 0.83 0.94 15 0.85 0.82 1 0.86 0.88 0.85 0.84 0.89 0.96 0.84 1 0.91 0.91 1 16 0.89 17 0.9 18 0.98 0.84 0.96 1 0.83 0.83 1 1 0.93 1 В группу 1 вошли объекты: a1 , a2 , a5 , a7 , a8 , a9 , a12 , a13 , a14 , a15 , a16 , a17 . Группу 2 составляют объекты: a3 , a4 , a10 , a11 , a18 . Группа 3 состоит из одного объекта: a 6 . В каждой группе находим голотип и находим радиус эталона: R Голотип Группа 1 0.62 Группа 2 0.53 Группа 3 0.46 a2 a3 a6 Определяем, является ли данный МО представительным для представленного МЭ (табл. 6). табл. 6 Материал обучения N F1 F2 Об раз Гр. 1 Гр. 2 Гр. 3 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 126 138 182 196 152 193 113 154 124 179 174 145 108 117 145 115 149 168 2.91 4.50 2.16 2.30 4.70 4.22 5.23 4.06 5.65 2.72 1.41 4.62 5.26 4.92 3.28 3.27 4.76 2.79 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + Материал экзамена N F1 F2 Обра з Гр. 1 Гр. 2 Гр. 3 1 2 3 140 135 115 3.20 4.38 5.99 0 0 0 + + + + + + + + + 4 4 5 6 7 8 9 10 11 12 13 14 15 187 169 141 201 112 129 119 205 139 165 204 187 4.54 5.39 2.44 3.04 3.18 4.92 3.96 2.58 3.23 4.00 5.30 4.67 0 0 0 0 0 0 0 0 0 0 0 0 + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + При определении представительности МО для данного МЭ с помощью алгоритма Голотип-1 выяснилось, что в данной задаче МО является представительным для всех объектов МЭ. 5