СЕКЦИЯ 4 Д.С. ПЕРЕВАЛОВ Институт математики и механики УрО РАН, Екатеринбург denis.perevalov@mail.ru О ВОЗМОЖНОСТИ РАСПОЗНАВАНИЯ ФОРМЫ ОБЪЕКТА С ПОМОЩЬЮ МИКРОЧАСТИЦ Аннотация Предлагается метод распознавания трехмерной формы объекта, погруженного в жидкость. Для реализации распознавания используется набор частиц, которые при контакте с поверхностью объекта запоминают особенности ее геометрии. Для математического описания поверхности используется расширенный образ Гаусса. В работе содержатся результаты численных экспериментов по физическому моделированию процесса распознавания. В связи с развитием нанотехнологий и проведением исследований по созданию микро- и нанороботов и автономных биомолекулярных устройств, встает задача построения микро- и наносенсоров [1], [3]. Такие сенсоры требуются для технологического контроля производства и для ориентации автономного устройства в некоторой среде. Нужно отметить, что в зависимости от конкретной задачи варьируется тип необходимой информации: начиная от химического состав раствора и его температурой и заканчивая описанием трехмерной структуры объектов в наблюдаемой сцене. В работе предлагается метод распознавания формы трехмерного объекта, погруженного в жидкость. Метод основан на использовании набора частиц, способных контактировать с объектом и запоминать особенности поверхности в месте контакта. Применение метода не требует использования оборудования больших размеров. Поэтому он может использоваться для создания микророботов, функционирующих в водной среде и крови, а также при управлении химическими реакциями и нанотехнологическими процессами. Постановка и анализ задачи Пусть имеется объект небольших размеров, порядка микрометров или нанометров. Требуется разработать метод, с помощью которого можно УДК 004.032.26(06) Нейронные сети 175 СЕКЦИЯ 4 построить устройство, позволяющее определить тип объекта. При этом устройство должно: быть небольших размеров для того, чтобы можно было использовать его в качестве сенсора микроробота; легко перестраиваться для распознавания новых классов объектов. Существует несколько известных способов идентификации объектов, но для решения задачи они не совсем подходят. 1. Методы компьютерного зрения [4] универсальны, но для их применения требуется достаточно большое по размерам оборудование, такое как камера и компьютер. 2. Методы химической детекции молекул и веществ [2] компактны, но для каждого класса молекул требуется синтез специальных молекулдетекторов. 3. Методы оптического и голографического распознавания [1] представляются перспективными, но в настоящий момент трудно в полной мере оценить возможность их использования. В работе предлагается и исследуется метод, объединяющий универсальность подходов компьютерного зрения с возможностями химической детекции. Описание метода Метод заключается в использовании специальных частиц, которые исследуют форму объекта и передают собранную информацию распознающему устройству. Общая схема распознавания изображена на рис. 1. Работа распознающего устройства состоит из следующих операций. Устройство A выпускает частицы B из расположенного в нем контейнера. Частицы B совершают хаотическое движение и касаются поверхности объекта C, снимая и запоминая в точке касания некоторую информацию о поверхности. Устройство A захватывает частицы и считывает записанную в них информацию. Эти операции продолжаются некоторое время до достижения устойчивого состояния. В результате в устройстве будет содержаться статистическая информация о форме объекта. Используя ее, оно должно определить тип объекта и передать результат распознавания для дальнейшего использования роботу или системе наблюдения. УДК 004.032.26(06) Нейронные сети 176 СЕКЦИЯ 4 Рис. 1. Схема распознавания с помощью частиц: A – устройство распознавания, способное хранить, выпускать, захватывать и анализировать частицы; B – частицы; C – исследуемый объект Для работоспособности метода требуется, чтобы частицы случайным образом касались поверхности объекта, и хотя бы часть из них возвращалась к распознающему устройству. Этого можно достичь, если потребовать, чтобы распознающее устройство, частицы и объект были помещены в невязкую жидкость. Кроме того, устройство и объект не должны быть расположены далеко друг от друга, а в жидкости не должно быть сильных потоков. При выполнении этих условий в случае, если частицы достаточно малы, они будут совершать тепловое хаотическое движение и с равной вероятностью касаться разных участков поверхности и возвращаться к устройству. В дальнейшем предполагается, что все перечисленные условия соблюдены. Конкретный способ проведения идентификации объекта зависит от возможностей частиц. В работе мы сосредоточим внимание на простейшей ситуации, когда частицы независимы и не могут самопроизвольно образовывать кластеры. В этом случае частицы могут снимать и информацию лишь о небольшом участке поверхности объекта. Это значит, что им доступна информация о нормали и/или кривизне поверхности объекта, или же о строении небольшого участка поверхности. При этом, если распознаваемый объект на 1-2 порядка больше частиц, можно использовать все упомянутые характеристики поверхности, применив для распознавания, например, метод семантических сетей [5]. Более интересен случай, когда распознаваемый объект на 3-4 порядка больше частиц. В этом случае кривизна поверхности во всех точках с практической точки зрения нулевая, а небольшие участки поверхности близки к плоскости. Поэтому остается использовать лишь нормали. Остановимся именно на этом случае. УДК 004.032.26(06) Нейронные сети 177 СЕКЦИЯ 4 Распознавание гладких поверхностей с помощью расширенного образа Гаусса Формально задача распознавания поверхности объекта описывается следующим образом: пусть имеется набор поверхностей S1 , S 2 , ..., S k ; для некоторой поверхности S нужно определить, на какую из данных поверхностей она больше всего похожа. В предыдущем пункте было установлено, что при работе с большими объектами система частиц может эффективно измерять только нормали к поверхности. Поэтому для решения задачи распознавания был использован известный метод расширенных образов Гаусса [6]. Недавно было показано, что хотя этот метод в ряде случаев уступает по возможностям некоторым другим методам (использующим глобальную информацию о поверхности), в то же время он эффективен и прост в реализации [7]. Расширенным образом Гаусса для гладкой поверхности S R 3 называется вещественнозначная функция GS , определенная на единичной сфере по правилу GS (n) mes{ p S | n p n} , где n – точка с единичной сферы, n p – нормаль к поверхности S в точке p , mes – мера множества. Иными словами, значение расширенного образа Гаусса в некоторой точке n единичной сферы равно площади тех точек поверхности, нормаль которых совпадает с n . В нашем случае удобней работать с нормированной функцию GSnorm (n) GS (n) / mes ( S ) , в этом случае она будет инвариантной к размеру поверхности. Кроме того, эта функция инвариантна относительно положения объекта, а при повороте поверхности «поворачивается» соответственно. Для распознавания поверхностей требуется ввести расстояние между двумя образами Гаусса, например, dist (G1 , G2 ) || G1 G2 ||1 | G1 (n) G2 (n) | dn . После этого вычисляются расстояния между GS и всеми GSi , i 1..k . Та S i , на которой достигается минимум расстояния, объявляется результатом распознавания поверхности S . УДК 004.032.26(06) Нейронные сети 178 СЕКЦИЯ 4 Дискретная модель Можно перенести описанный математический метод на дискретный вариант с частицами. А именно, пусть имеется N частиц, каждая из которых способна хранить информацию о нормали в некоторой точке поверхности S . Тогда дискретный аналог нормированного расширенного образа Гаусса будет выглядеть так: g S ( n) 1 N N (n, n j ) , 1 где n j – нормаль, записанная в j -й частице, 1, если n n j , (n, n j ) 0, в противном случае. Кинетическая модель Формула для расчета g S (n) предусматривает идеальную ситуацию, когда все выпущенные устройством частицы снимают информацию с объекта и возвращаются обратно. Но на практике некоторые частицы могут никогда не вернуться, либо вернуться в устройство, не сняв показания с объекта, либо после снятия показаний исказить информацию. Чтобы учесть данные возможности, был разработан алгоритм для расчета расширенного образа Гаусса с учетом кинетической модели, описывающую возможность возникновения ошибок в системе из N частиц. 1. Инициализация. Все нормали частиц полагаются равными случайным единичным векторам. 2. Снятие данных с поверхности. Следующие шаги повторяются T раз. Выбирается произвольная частица j 1..N . Выбирается случайное число r [0,1] . Если r 1 perr , то считается, что частица j сняла информацию с поверхности объекта. Поэтому нормаль частицы n j устанавли вается равной нормали к произвольной точке S . Иначе считается, что частица j повредила свои данные, и ее нормаль полагается равной случайному единичному вектору (взятому с равномерным распределением на сфере). УДК 004.032.26(06) Нейронные сети 179 СЕКЦИЯ 4 3. Расчет нормированного расширенного образа Гаусса. Так как параметр perr [0, 1] определяет вероятность возникновения ошибки в частицах то, если распределение g err (n) случайных единичных векторов известно, можно отфильтровать g S (n) от ошибочных данных по формуле g S (n) max( g S (n) perr g err (n),0) , и нормировать ее: g Sfiltr (n) g S (n) / || g S ||1 . Результаты экспериментов Построенная кинетическая модель была численно исследована на четырех эталонных объектах, изображенных на рис. 1. Каждый из объектов был задан с помощью 50 000 треугольников. 1 2 3 4 Рис. 2. Объекты, используемые для экспериментов На рис. 3 изображены двумерные проекции их расширенных образов Гаусса (вычисленные на сетке размером 32x32), а в табл. 1 приведены расстояния между ними (здесь и далее сопоставление образов Гаусса проходило с использованием двумерной проекции на сетке 32x32). Как нетрудно убедиться, данные в таблице соответствуют ожидаемому представлению о близости объектов. Рис. 3. Изображение расширенных образов Гаусса для объектов. Светлые и темные участки соответствуют малым и большим значениям функций УДК 004.032.26(06) Нейронные сети 180 СЕКЦИЯ 4 Таблица 1 Расстояния между объектами (точность 2 знака после запятой) 1 2 3 4 1 0 0,59 1,24 0,84 2 0,59 0 0,77 0,99 3 1,24 0,77 0 1,37 4 0,84 0,99 1,37 0 Эксперименты по кинетическому моделированию проводились с N 1 000 000 частиц. Оказалось, что статистическое распределение частиц практически стабилизируется при T 5 000 000 шагах, поэтому в дальнейшем используется именно такое число шагов. В табл. 2 приведены результаты испытаний распознавания объектов при разных уровнях ошибок p err . А именно, запускался процесс, в котором частицы снимали информацию с объекта i . Для характеристики качества распознавания рассчитывалась неотрицательная величина Q(i) dist( g Sfiltr , g Si ) min{ dist( g Sfiltr , g S j ) | j i, j 1..4} , i i т.е. отношение расстояния между образом Гаусса, полученным частицами при распознавании эталона i до образа самого эталона к минимальному расстоянию до образов остальных эталонов. Чем меньше ее значение, тем данные, полученные частицами, больше похожи на исходный эталон, т.е. тем качественней прошло распознавание. Результаты табл. 2 показывают, что при данном числе частиц для выбранных эталонов метод дает приемлемое качество распознавания при уровне ошибки около 0,95. (При уровне ошибок 0,99 функции Q(i ) приближаются к 1, это значит, что эталонный объект i , который распознавали частицы, практически неотличим от какого-то другого эталона, а значит, распознавание неустойчиво.) УДК 004.032.26(06) Нейронные сети 181 СЕКЦИЯ 4 Таблица 2 Зависимость от ошибки (точность 4 знака после запятой) p err Q(1) Q(2) Q(3) Q(4) 0 0,0345 0,0334 0,0217 0,0366 0,5 0,0714 0,0707 0,0504 0,0552 0,9 0,3171 0,3213 0,2589 0,2426 0,95 0,5707 0,5611 0,4587 0,4589 0,99 0,9525 0,9555 0,8958 0,8673 Заключение Приведенные результаты моделирования с использованием 1 млн. частиц показали возможность устойчивого распознавания при уровне ошибок не превышающем 95 %, что подтверждает работоспособность метода. В связи с этим встает задача разработки технических средств для реализации метода и его практической апробации. Список литературы 1. Биомолекулярные нейросетевые устройства / Под ред. Н.Г. Рамбиди. М.: ИПРЖР, 2002. 224 с. 2. Глик Б., Пастернак Дж., Молекулярная биотехнология. Принципы и применение: Пер. с англ. М.: Мир, 2002. 589 с. 3. Нанотехнология в ближайшем десятилетии. Прогноз направления исследований / Под ред. Роко М.К., Уильямса Р.С., Аливисатоса П. Пер. с англ. М.: Мир, 2002. 292 с. 4. Форсайт Д.А., Понс Ж., Компьютерное зрение. Современный подход: Пер. с англ. М.: Изд. дом Вильямс, 2004. 928 с. 5. Ivanko E., Perevalov D. On Using Sign Method For 3D Images Recognition And Classification. Int. Conf. on Computing, Communications and Control Technologies: CCCT'04, Austin, USA, 2004. Vol. V. 248-251. 6. Horn B., Extended Gaussian images. Proc. of the IEEE, 72(12):1671 – 1686, December 1984. 7. Shilane, P., Min, P., Kazhdan, M., Funkhouser, T.: The Princeton Shape Benchmark, to appear in Shape Modeling International, Genova, Italy, June 2004. УДК 004.032.26(06) Нейронные сети 182