8Б УДК 004.93 А.Н. Бондаренко, А.В. Кацук Институт математики им. С.Л. Соболева (СО РАН), г. Новосибирск, Россия. СИБНИИЭ, г. Новосибирск, Россия voice@ngs.ru Адаптивный двухступенчатый метод классификации изображений* В статье разработан метод мультифрактального анализа медицинских изображений, используемый для распознавания раковых клеток. Изображения представлены в системе RGB. Вычислены размерности Ренье для каждого цвета и для совокупности трех цветов. Для распознавания изображений на классы «норма» / «патология» применена нейронная сеть Кохонена. Проведен анализ результатов, определен уровень распознавания медицинских изображений. 1. Введение Классификация медицинских изображений является на сегодня актуальной задачей. Так, не смотря на развитие информационных технологий, до сих пор не решена задача ранней диагностики раковых заболеваний по исследуемым снимкам. Рисунок 1 − Пример медицинского изображения с патологией Нахождение «аномальных» клеток на медицинском изображении является достаточно трудоемкой задачей. Поэтому желательно иметь средство автоматического скрининга, такое, чтобы медицинские эксперты рассматривали только сложные случаи. Мы исследовали медицинские изображения, содержащие клетки рака cervical cancer. Наш выбор обусловлен тем, что это один из самых распространенных видов рака среди женщин. Одним из наиболее важных этапов классификации изображений является построение разделяющей гиперповерхности в пространстве полученных признаков. * Работа выполнена при финансовой поддержке грантов РФФИ (коды проектов 05-01-00559, 05-01-00171), междисциплинарного интеграционного проекта СО РАН №48. 46 «Штучний інтелект» 4’2006 Адаптивный двухступенчатый метод классификации изображений 8Б В последнее время методы классификации на основе нейронных сетей получили большое распространения из-за возможности адаптации к новым данным. Некоторые из этих методов основаны на простой однослойной нейронной сети, как, например, самоорганизующиеся нейронные сети Кохонена [1]. В работе проводится анализ влияния структуры нейронной сети Кохонена на результат распознавания медицинских изображений. В качестве входного вектора для самоорганизующейся нейронной сети используется вектор мультифрактальных размерностей медицинского изображения. Во втором разделе приведен разработанный метод расчета спектра мультифрактальных размерностей. В третьем разделе приведена разработанная схема построения самоорганизующейся сети Кохонена для классификации изображений. В четвертом разделе приведены результаты компьютерных экспериментов для нейронных сетей Кохонена различной структуры. 2. Мультифрактальный анализ В этом разделе мы опишем мультифрактальный подход к анализу изображений. Существенным различием между этим подходом и классическими методами (сегментацией, математической морфологией и пр.) является путь, которым мы ищем иррегулярность структуры изображения. Простой метод подсчета ячеек N (δ ) ~ δ − d устанавливает связь зависимости количества ячеек, необходимых, чтобы покрыть геометрический объект с размером ячейки δ . Этого достаточно, чтобы описать гладкие множества, такие как линии и поверхности, и обычные фракталы (которые имеют одинаковую размерность везде), но недостаточно для объектов имеющих меняющиеся характеристики. Во-первых, метод подсчета ячеек описывает одинаковый вес 1 для каждой ячейки с только одной точкой внутри и равномерной плотностью. Чтобы разрешить это противоречие в [2] было предложено использовать меру с различными весами. M d ( q, δ ) = ∑ µ iqδ d ~ δ d −τ ( q ) (1) i Ni отношение количества пикселей заданного цвета в i-той ячейке к N общему числу пикселей данного цвета. Функция τ (q) , которая является масштабирующей экспонентой q-го момента меры µ часто рассматривается как масс-экспонента. Для практических целей, вместо прямого вычислений меры (1), может быть применен аналог метода подсчета ячеек. Частичная функция где µ i = N ( q, δ ) = ∑ µ iq ~ δ −τ ( q ) i вычисляется тем же путем, как и стандартный метод подсчета ячеек, и затем логарифм τ ( q) наклона графика N ( q, δ ) от δ дает размерность Ренье Dq = также описанную в [3]: 1− q 1 ln N ( q, δ ) lim Dq = q − 1 δ →0 ln δ «Штучний інтелект» 4’2006 47 Бондаренко А.Н., Кацук А.В. 8Б 3. Метод классификации на основе нейронной сети кохонена Разработанный алгоритм классификации медицинских изображений делится на два этапа. На первом этапе происходит отбор информативных признаков изображений на основе рассчитанного спектра мультифрактальных размерностей [4-10]. На втором этапе полученные векторы признаков классифицируются при помощи самоорганизующейся нейронной сети Кохонена. Структура нейронной сети была разработана на основе базисной сети Кохонена и состояла из n ячеек расположенных на регулярной одномерной решетке. В качестве структуры ячейки была выбрана гексагональная форма. Для обучения нейронной сети использовался следующий итерационный алгоритм. Каждому нейрону i ставился в соответствие одномерный вектор-прототип mi . На каждом шаге обучения вектор данных x выбирался случайным образом из обучающей выборки. После чего вычислялось расстояние между x и вектором-прототипом. Нейронпобедитель b выбирался таким образом, чтобы разница между векторомпрототипом и вектором данных была минимальна x − mb = min x − mi . t На следующем этапе алгоритма происходит обновление векторов-прототипов. Все нейроны в окрестности нейрона-победителя обновлялись по следующему правилу mi (t + 1) = mi (t ) + α (t )hbi [x − mi (t )], − rb − ri 2 2 где t означает номер итерации, α (t ) − коэффициент обучения, hbi = e 2σ ( t ) , где rb и ri расположение нейронов b и i на решетке Кохонена и σ (t ) − это радиус окрестности нейрона-победителя. Коэффициент обучения α (t ) и Радиус σ (t ) уменьшался после каждой итерации обучения. Для обучения использовался набор из 100 цитограмм, которые были разбиты на обучающее множество из 50 цитограмм и тестовое множество из 50 цитограмм. Обучающее множество содержало 50% снимков класса патология и 50% снимков класса норма. 4. Результаты компьютерных экспериментов Для компьютерных экспериментов использовалась нейронная сеть со структурой из шестнадцати, шестидесяти четырех, двухсот пятидесяти шести, тысячи двадцати четырех ячеек. Число ячеек в нейронной сети Кохонена 16 64 256 1024 48 Процент верно распознанных изображений 67% 84,6 % 86,8% 85,7% «Искусственный интеллект» 4’2006 Адаптивный двухступенчатый метод классификации изображений 8Б Рисунок 2 − Визуализация обученной нейронной сети Кохонена со структурой из шестнадцати ячеек Рисунок 3. Визуализация обученной нейронной сети Кохонена со структурой из шестидесяти четырех ячеек. Рисунок 4. Визуализация обученной нейронной сети Кохонена со структурой из двухсот пятидесяти шести ячеек Рисунок 5. Визуализация обученной нейронной сети Кохонена со структурой из тысячи двадцати четырех ячеек В результате обучения на решетке Кохонена выделилось несколько кластеров, часть из которых соответствовал классу патология, а другая часть классу норма. На данной выборке изображений был получен достаточно высокий уровень распознавания изображений. Таким образом, разработанный метод классификации на основе самоорганизующейся нейронной сети может применяться в задаче ранней диагностики раковых заболеваний. 5. Заключение Нами представлена система распознавания злокачественных клеток в медицинских изображениях. Мы показали, что мультифрактальный метод обеспечивает получение признаков, которые являются информативными в задаче распознавания рака. А нейронные сети Кохонена являются эффективным средством решения слабо формализованных задач на основе примеров. Показано, что в задаче классификации функционирование нейронной сети зависит от выбранной структуры. Также согласно результатам, приведенным в [8,9], показано, что нейронная сеть на основе многослойного перцептрона позволяет более точно проводить классификацию изображений, чем самоорганизующаяся нейронная сеть Кохонена. «Штучний інтелект» 4’2006 49 8Б Бондаренко А.Н., Кацук А.В. Литература 1. 2. Kohonen T. Self-Organization Maps. Springer-Verlag, Berlin, 1995. Kam L., Blanc-Talon J., Multifractal texture characterization for real world image segmentation, Advanced Concepts for Intelligent Vision Systems, 1999, pp. 45-50. 3. Grassberger P., Procaccia I. Measuring the strangeness of strange attractors, Physica D, 1983, v.9, 189-208. 4. Бондаренко А.Н., Кацук А.В. "Информативность признаков Ренье при анализе медицинских изображений", Наука, Технологии и Инновации, всероссийская научная конференция, НГТУ, 0407 декабря 2003 г., 227-228 стр. 5. Бондаренко А.Н., Кацук А.В. "Двумерный Ренье анализ изображений", Сборник научных трудов НГТУ, 1(35), 2004, с.143-148 6. Кацук А. В. "Информативность признаков в задаче распознавания изображений", Новосибирск, 1-3 ноября 2004 г., Тезисы докладов V всероссийской конференции молодых ученых по математическому моделированию и информационным технологиям с участием иностранных ученых. 7. Кацук А.В., Куликова Н.В. "Комплексный анализ медицинских изображений", Наука, Технологии, Инновации, материалы всероссийской конференции молодых ученых, НГТУ, 02-05 декабря 2004 г.,41, 214-215 стр. 8. Бондаренко А.Н., Кацук А.В. "Нейросетевая классификация медицинских изображений на основе спектра размерностей Ренье", Сборник научных трудов НГТУ, 1(39), 2005, с.95-100 9. Bondarenko A.N., Katsuk A.V.. “Cervical pre-cancer detection using multifractal and wavelet analysis”, 2-d IASTED International Multi-Conference on Automation, Control and Information Technology, Novosibirsk, Russia, June 20-24, Materials, pp. 240-245. 10. Bondarenko A.N., Katsuk A.V. "Extracting feature vectors of biomedical images", 9th International Symposium on science and technology, Novosibirsk, June 26-July 3 2005, Materials, p. 52-57. А.Н. Бондаренко, А.В. Кацук Адаптивний двоступінчастий метод класифікації зображень У статті розроблений метод мультифрактального аналізу медичних зображень, використовуваний для розпізнавання ракових кліток. Зображення представлені в системі RGB. Обчислені розмірності Реньє для кожного кольору і для сукупності трьох квітів. Для розпізнавання зображень на класи «норма» / «патологія» застосована нейронная мережа Кохонена. Проведено аналіз результатів, визначений рівень розпізнавання медичних зображень. A.N. Bondarenko, A.V. Kachuk Adaptive Two Stage Method of Image Classification Methods for numerical description and subsequent classification of medical images are described. Images representing the localization patterns of cytogrames were obtained using fluorescence microscopy and divided into distinct training and test sets. Multifractal set of numeric features were generated. These feature sets were used as inputs to a neural network. Classifier performance (the average percent of each type of image correctly classified) on previously unseen images ranged from 67% to 87% for a self-organization maps. These results demonstrate the feasibility of applying pattern recognition methods to cellular localization patterns. Статья поступила в редакцию 08.06.2006. 50 «Искусственный интеллект» 4’2006