СЕКЦИЯ 6 А.В. СЕРГИН Институт прикладной математики им. М.В. Келдыша РАН, Москва post-box2000@mail.ru БИОЛОГИЧЕСКИ ПРАВДОПОДОБНЫЙ НЕЙРОСЕТЕВОЙ ДЕТЕКТОР КРАЯ Аннотация На основе физиологических данных об обработке зрительной информации в сетчатке глаза, латеральном коленчатом теле и первичной зрительной коре млекопитающих предлагается нейросетевой детектор края. В системах машинного зрения важную роль играет выделение краев. Однако ни один из известных детекторов края не является совершенным. Принята следующая классификация ошибок: потеря настоящих краев, появление ложных краев, искажение формы и положения краев. Широко распространен подход, при котором края находят путем сглаживания и последующего дифференцирования изображения. Из-за чувствительности к шумам дифференцирование является некорректно поставленной задачей, а сглаживание изображения (регуляризация) приводит к потере информации [1]. Описываемый детектор края опирается не столько на математический аппарат, сколько на данные о функционировании мозга. Такой подход может привести к алгоритмам с очень хорошими характеристиками. Свет воспринимается специальными фоторецепторами, колбочками и палочками, содержащими зрительные пигменты. Сигналы от фоторецепторов, посредством биполярных, горизонтальных и амакриновых клеток достигают ганглиозных клеток. Аксоны ганглиозных клеток проходят в составе зрительного нерва и являются единственными нервными волокнами, несущими зрительную информацию от глаза в мозг. Волокна зрительного нерва заканчиваются в области латерального коленчатого тела, где расположены вторые нейроны цепочки зрительного тракта. Нейроны коленчатого тела, в свою очередь, проецируются в первичную зрительную кору V1 [2]. Все эти связи имеют ретинотопическую организацию: окружающий нас мир (его оптическое изображение на сетчатке) упорядоченно отображается в различных областях зрительной системы в виде пространственного распределения возбужденных нейронов [3]. УДК 004.032.26(06) Нейронные сети 249 СЕКЦИЯ 6 Рецептивным полем ганглиозной клетки называют область сетчатки, световая стимуляция которой может повлиять на импульсацию данной клетки. По устройству рецептивных полей можно выделить клетки с onцентром и клетки с off-центром. В обоих случаях рецептивные поля представляют собой круг и прилегающее к нему кольцо. Круг называют центром, а кольцо - периферией рецептивного поля. Клетки с on-центром в темноте или при равномерном освещении их рецептивных полей проявляют спонтанную активность. При освещении небольшого пятна в центре рецептивного поля on-клетка разряжается с повышенной частотой. Наиболее сильный ответ получается в том случае, когда светлое пятно занимает весь центр. При освещении периферии рецептивного поля активность on-клетки, напротив, подавляется. Поведение клетки с off-центром противоположно: освещение периферии увеличивает ее активность, а освещение центра – подавляет. Клетки обоих типов перемешаны и встречаются одинаково часто. Рецептивные поля соседних клеток частично перекрываются. Ответы клеток латерального коленчатого тела не имеют разительных отличий от сигналов ганглиозных клеток. Они также имеют концентрически организованные рецептивные поля on- или off-типа, но механизм контраста отрегулирован тоньше, за счет большего соответствия между тормозными и возбуждающими зонами [2]. В первичной зрительной коре V1 содержатся (среди многих других) клетки, для которых наилучшим стимулом является граница между светлым и темным, проходящая в фиксированном направлении. Такая клетка совсем не реагирует на границы, перпендикулярные оптимальному направлению, и на рассеянный свет. Она дает несколько более слабый ответ на границы, проходящие под небольшим углом к оптимальному направлению. Клетки с ориентационной чувствительностью сгруппированы в микроколонки. В микроколонке представлены все возможные ориентации на данном участке зрительного поля. Рецептивные поля соседних микроколонок частично перекрываются. Равномерной решеткой на прямоугольнике x0 x x0 x, y0 y y0 y называется множество точек l 0,.., N x , k 0,..,N y , h x {(xl , yk ) ( x0 l hx , y0 k h y )} , где y x , hy . Nx Ny УДК 004.032.26(06) Нейронные сети 250 СЕКЦИЯ 6 Рис. 1. Общая схема биологически правдоподобного детектора края Общая схема нейросетевого детектора края представлена на рис. 1. Исходное изображение задано в виде значений яркости I l ,k в узлах ( xl , y k ) равномерной решетки. Яркость может принимать значения от 0 (черный) до 1 (белый). Искусственные нейроны, имитирующие активность ганглиозных клеток, клеток с ориентационной чувствительностью и микроколонок, расположены в узлах точно таких же решеток. Построим аналог ганглиозной on-клетки. Скалярный выход a l ,k искусственного нейрона, расположенного в узле ( xl , y k ) , определим как свертку весовой функции со значениями яркости: Wi, j УДК 004.032.26(06) Нейронные сети 251 СЕКЦИЯ 6 al ,k Wi, j I l i,k j . Положим весовую функцию кусочно-постоянной, i, j в соответствии с устройством рецептивного поля on-клетки: Wi, j w , (i h x ) 2 ( j h y ) 2 R12 ж; 1 w2 , R12 (i h x ) 2 ( j h y ) 2 R22 ; w , R22 (i h x ) 2 ( j h y ) 2 , 3 где R1 – радиус центра рецептивного поля, R2 – внешний радиус периферии рецептивного поля, w1 , w2 и w3 – постоянные веса. Поскольку световая стимуляция за пределами рецептивного поля не может влиять на ответ on-клетки, имеем w3 0 . Потребуем, чтобы спонтанной активности on-клетки соответствовало a l ,k 0 . Это означает, что при I l ,k c (яркость одинакова во всех узлах) al ,k Wi, j I l i,k j c Wi, j c ( w1 N1 w2 N 2 ) 0 , i, j i, j где N1 – число узлов, попавших в центр рецептивного поля (удовлетворяющих неравенству ( x m xl ) 2 ( y n y k ) 2 R12 ), а N 2 – число узлов, попавших в периферию рецептивного поля (удовлетворяющих неравенству R12 ( x m xl ) 2 ( y n y k ) 2 R22 ). Отсюда w1 N1 w2 N 2 0 . Световая стимуляция в центре увеличивает активность on-клетки, следовательно w1 0 . Световая стимуляция на периферии уменьшает активность on-клетки, следовательно w2 0 . Тогда максимально возможный ответ a lmax ,k модели on-клетки достигается при 1, ( x m xl ) 2 ( y n y k ) 2 R12 ; max Im ,n 2 2 2 0, ( x m xl ) ( y n y k ) R1 (пятно максимальной яркости полностью занимает центр рецептивного max поля): almax ,k Wi, j I l i,k j w1 N1 . Минимально возможный ответ i, j a lmin ,k модели on-клетки достигается при УДК 004.032.26(06) Нейронные сети 252 СЕКЦИЯ 6 0, ( x m xl ) 2 ( y n y k ) 2 R12 ; min Im .n 2 2 2 1, ( x m xl ) ( y n y k ) R1 (пятно максимальной яркости полностью занимает периферию рецептивmin ного поля): almin ,k Wi, j I l i ,k j w2 N 2 . Введем условие нормировi, j min ки: almax ,k a l ,k 1 . Отсюда w1 N1 w2 N 2 1 . С учетом того, что w1 N1 w2 N 2 0 имеем: Wi, j 1 /(2 N ), (i h x ) 2 ( j h y ) 2 R12 ; 1 1 /(2 N 2 ), R12 (i h x ) 2 ( j h y ) 2 R22 ; 0, R22 (i h x ) 2 ( j h y ) 2 . Свертка яркости с этой весовой функцией может быть найдена как половина разности средних значений яркости по центру и по периферии рецептивного поля. Аналогичным образом построенная модель off-клетки имеет весовую функцию Wi, j 1 /(2 N ), (i h x ) 2 ( j h y ) 2 R12 ; 1 1 /(2 N 2 ), R12 (i h x ) 2 ( j h y ) 2 R22 ; 0, R 22 (i h x ) 2 ( j h y ) 2 . Скалярный выход a l ,k искусственного аналога off-клетки отличается от выхода on-клетки только знаком: a l ,k a l ,k . Поскольку особое внимание в этой работе уделяется обнаружению краев, введем следующее понятие. Идеальным краем называется такая прямая sin() x cos() y d , что яркость 1, I ( x, y ) 1 / 2, 0, sin() x cos() y d ; sin() x cos() y d ; sin() x cos() y d , где – угол наклона прямой, d – расстояние от прямой до начала координат. На рис. 2 применительно к краям сравниваются ответы ганглиозУДК 004.032.26(06) Нейронные сети 253 СЕКЦИЯ 6 ных клеток сетчатки и описанной выше модели on-клетки. Из соображений подобия графиков (и, следовательно, соответствия физиологическим данным) выбрано R2 4 R1 . Рис. 2. Слева – ответы on- и off- клеток, построенные по экспериментальным данным [3]; справа – ответы модели on-клетки. По оси абсцисс отложено смещение центра рецептивного поля клетки относительно границы светлого и темного Построим аналог клетки из первичной зрительной коры V1, настроен ной на край, проходящий под углом . По аналогии с работой мозга, 2 входной информацией для модельной клетки является активность a l ,k onклеток и a l ,k off-клеток. Распределение активности on-клеток на идеальном крае представлено на рис. 2. Реальный край может быть размытым, иметь меньший контраст, быть зашумлен. Размытость приводит к увеличению расстояния между максимальным и минимальным ответами и к уменьшению их амплитуды A . Уменьшение контраста – к пропорциональному уменьшению амплитуды. При малых значениях R1 подавление шума не происходит. В общем случае можно лишь предположить, что в среднем слева от края положительными будут a l ,k , а справа – a l ,k . Иначе говоря, для узла ( xl , y k ) УДК 004.032.26(06) Нейронные сети 254 СЕКЦИЯ 6 через который проходит край с параметром будет выполнено 2 1 a l i,k j 0 , где R3 и R4 N 0ihx R3 , R4 j h y R4 R3 ihx 0, R4 j hy R4 определяют прямоугольники, по узлам внутри которых производится суммирование, а N – число слагаемых в сумме. Необходимо, чтобы по мере отклонения угла наклона края от угла , на который настроена клетка, ответ bl ,k модельной клетки убы2 вал. Необходимо, чтобы по мере удаления края от узла ( xl , y k ) ответ bl ,k 1 N a l i,k j быстро bl ,k убывал. 1 min( N R ih 3 x 0, Этим требованиям 1 a l i, k j , N 0, R j h R 0ih R 4 y 4 x удовлетворяет a l i,k j ) . 3 , R4 функция Внутри одно- j hy R4 родных областей и когда край перпендикулярен оптимальному направлению имеем bl ,k 0 . отличается от опи2 санной выше поворотом прямоугольников, по узлам внутри которых про изводится суммирование, вокруг точки ( xl , y k ) на угол . 2 Клетки с ориентационной чувствительностью, расположенные в одном и том же узле ( xl , y k ) , но настроенные на разные ориентации края i i 2 , i 0,.., K 1 , сгруппированы в микроколонки. За ответ целой K микроколонки примем максимальный из ответов входящих в нее клеток: cl ,k max (bl ,k ( i )) . Тогда высокая активность микроколонки означает Клетка в узле ( xl , y k ) , настроенная на угол i 0..K 1 наличие края, проходящего близко к центру ее рецептивного поля. Работа описанного детектора края продемонстрирована на рис. 3. УДК 004.032.26(06) Нейронные сети 255 СЕКЦИЯ 6 Рис. 3. Слева – матрица яркости, 192x168 узлов. Справа – результат выделения краев с параметрами R1 1 , R2 4 , R3 2 , R4 1 , K 16 . Узел закрашивался в черный, если активность микроколонки в нем превосходила 0.004 Список литературы 1. Ziou D. and Tabbone S. Edge Detection Techniques - An Overview // Pattern Recognition and Image Analysis. 1998. Vol 8. № 4. P. 537–559. http://www.loria.fr/~tabbone/PAPERS/EDsurvey.pdf 2. Николлс Дж. Г., Мартин А. Р., Валлас Б. Дж., Фукс П. А. От нейрона к мозгу. М.: Едиториал УРСС, 2003. 3. Физиология человека / Под ред. Р. Шмидта и Г. Тевса. 2-е изд., перераб. и доп. М.: МИР, 1996. УДК 004.032.26(06) Нейронные сети 256