Федотов Н.Г., Шульга Л.А., Кольчугин А.С., Романов С.В., Смолькин О.А.,...

advertisement
Федотов Н.Г., Шульга Л.А., Кольчугин А.С., Романов С.В., Смолькин О.А., Курынов Д.В.
ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ГИСТОЛОГИЧЕСКИХ ИЗОБРАЖЕНИЙ В СИСТЕМЕ РАСПОЗНАВАНИЯ
ЗАБОЛЕВАНИЙ ЩИТОВИДНОЙ ЖЕЛЕЗЫ
Работа выполняется при поддержке гранта INTAS, проект №04-77-7036 и гранта РФФИ, проект
№06-07-89167
Всего два десятилетия назад рак щитовидной железы считался достаточно редким заболеванием. Катастрофа на Чернобыльской АЭС внесла в медицинскую статистику существенные коррективы. За 1986-2000
гг. в зонах, подвергшихся радиоактивному загрязнению, заболеваемость раком щитовидной железы возросла в 10-20 раз. Особую тревогу вызывает то, что значительную часть больных составляют дети и
подростки, хотя прежде такие случаи носили исключительный характер.
Вплоть до настоящего времени, «золотым стандартом» в области диагностики рака остается цитологический и гистологический анализ. Только этот вид исследования позволяет с высокой степенью достоверности установить диагноз больному. Однако, цитологическое исследование относится к инвазивным
методам диагностики, достаточно дорого и болезненно для пациента. Доступным средством массового
обследования населения (скрининга) является УЗИ, но оно имеет такие недостатки как низкая разрешающая способность (в то время как для щитовидной железы достаточно характерно наличие злокачественных
новообразований, имеющих размер менее 10 мм), слабая способность к различению вида опухоли. Для
повышения эффективности ультразвукового скрининга, в рамках международного научного проекта, реализуемого при поддержке INTAS, поставлена цель – найти связь между признаками, выделяемыми на гистологических и ультразвуковых изображениях и на этой основе построить автоматизированную систему диагностики заболеваний щитовидной железы. В анализе участвуют не только признаки, имеющие медицинскую
интерпретацию, но и признаки изображений, автоматически генерируемые компьютерной системой. Для
автоматической генерации признаков мы предлагаем использовать аппарат стохастической геометрии,
эффективность которого была подтверждена в предшествующих научных исследованиях авторов [1, 2].
Генерируемые признаки названы триплетными, поскольку они имеют структуру в виде последовательной
композиции трех функционалов.
Изображения гистологических препаратов тканей щитовидной железы представляют собой цветные, многокомпонентные, семантически насыщенные изображения. Их непосредственное использование, в силу их
сложности, для построения каких-либо значимых признаков распознавания, в том числе и с помощью методов стохастической геометрии, затруднительно. Нами была разработана процедура предварительной
обработки гистологических изображений, приводящая их к виду, пригодному для построения триплетных
признаков распознавания.
Рис. 1. Этапы предварительной обработки гистологического изображения: а) исходное изображение; б)
выделение ядер на основе пороговой фильтрации по цвету; в) удаление шума и заполнение просветов в
ядрах; г) результат обработки.
Гистологические изображения получают под микроскопом при увеличениях от 50-кратного до 1000кратного, при этом каждое увеличение дает свою долю диагностической информации. В данной статье
рассматривается предобработка изображений, имеющих 400-кратное увеличение (рис. 1, а). Основными
объектами, выделяемыми на гистологических изображениях ткани щитовидной железы при данном увеличении, являются ядра и фолликулы. На основе анализа литературы мы определили, что для построения автоматизированной системы диагностики представляют интерес форма и размеры ядер и фолликул, взаимное
расположение и ориентация ядер, плотность расположения объектов в препарате и т.п. Исходя из этого,
выделение ядер и фолликул как отдельных объектов было определено в качестве цели предварительной
обработки.
Выделение ядер. Согласно общепринятой методике, гистологические препараты тканей щитовидной железы окрашиваются гематоксилином и эозином, в результате чего ядра клеток приобретают темно-синюю,
а цитоплазма и другие элементы препарата – розоватую окраску. Эксперименты показали, что хороший
результат достигается при выделении ядер на основе пороговой фильтрации предварительно сглаженного
изображения по компонентам цветовой модели L*a*b* (рис. 1, б). После этого для повышения связности
выделенных объектов на изображении применяется операция замыкания морфологической геометрии.
На следующем этапе предобработки используется априорная информация о диапазоне возможных размеров ядер клеток. Изолированные объекты, площадь которых менее некоторого порога, считаются шумом и
удаляются с изображения (рис. 1, в).
Ядра раковых клеток часто имеют неоднородный, оптически прозрачный вид. Поэтому следующим этапом
предобработки является заполнение просветов внутри выделенных объектов.
Выделение фолликул. Непосредственное выделение фолликул на гистологическом изображении имеет ряд
сложностей, связанных с большой вариабельностью их цвета, формы, размеров, наличием пенистой цитоплазмы. Поэтому для выделения фолликул, форма, размеры и относительная площадь которых на изображении являются важными характеристиками структуры ткани щитовидной железы, выполняется бинаризация
полученного изображения ядер.
Для отсечения областей фиброзной ткани мы предлагаем применить методы анализа текстуры изображения, так как они позволяют различать объекты одинакового цвета и формы. Из литературы можно выделить два основных подхода к рассмотрению текстур [3]:
1. Интерпретация текстуры как повторения базовых примитивов, имеющих различную ориентацию в пространстве. Сторонники данного подхода ориентировали исследования на спектральный анализ и представление текстуры.
2. Текстура рассматривается, как некий анархичный однородный объект, не обладающий ярко выраженными краями. В данном случае используется вероятностный метод анализа текстуры.
Визуально, область фиброза характеризуется неравномерным, размытым цветом с белыми или очень
светлыми прожилками. Размер и форма прожилок различны, как и направления изменения цвета и яркости.
Таким изображениям более адекватен второй подход, использующий вероятностные методы, так как в подобной текстуре практически отсутствуют регулярные повторяющиеся примитивы. Среди множества методов
получения характеристик текстур вероятностному подходу лучше всего соответствуют описание текстуры
длинами серий и анализ матрицы смежности. Учитывая крайне высокую трудоемкость поиска серий на
фрагменте изображения, мы предлагаем использовать группу методов, основанных на анализе матрицы
смежности. Кроме того, анализ матрицы смежности позволяет получить достаточно большое количество
признаков при относительной простоте реализации данного метода. Матрица смежности или матрица совместной встречаемости уровней яркости представляет собой оценку плотности распределения вероятностей второго порядка, полученную по изображению в предположении, что плотность вероятности зависит
только от расположения двух пикселей.
Матрица смежности строится следующим образом:
1. Выбранный для анализа фрагмент изображения, преобразуется из цветного в градации серого.
2. В самом общем случае, матрица смежности является 4-х мерной матрицей P(i, j, d , ) , представляющей плотность вероятности наличия двух точек, для которых верно, что i – яркость первой точки, j –
яркость второй точки, d – расстояние между ними и  - угол, соединяющей их прямой. Для упрощения
вычислений обычно используют только первые два параметра, то есть яркости точек.
Для представления серого цвета 256 градациями (8 бит) строится матрица P(i, j ) размером 256х256,
где каждая ячейка представляет собой плотность вероятности события: у точки с цветом i соседняя
точка будет иметь цвет j. Обычно, для увеличения точности, плотность вероятности рассчитывают среднее сумм плотностей вероятности для различных направлений. Стандартное количество направлений определяется количеством соседних пикселей и обычно принимается равным 4 или 8.
Всего по матрице совместной встречаемости P(i, j ) можно построить более 20 признаков, ниже представлены наиболее эффективные для выделения фиброзной ткани:
степень однородности или энергия:
 Pi,2j ;
i, j
энтропия
 Pi, j  Log ( Pi, j ) ;
i, j
контраст
i j
2
 Pij2 ;
i, j
обратный момент разности
Pij2
 i j2 ;
i, j
i j
Результат выделения областей фиброза на гистологическом изображении с использованием перечисленных четырех признаков показан на рисунке 2.
Рис. 2. Выделение фиброзной ткани методом анализа текстуры: а) исходное изображение; б) результат
выделения области фиброза.
К бинаризованному изображению препарата с выделенными областями фиброзной ткани применяется морфологическая операция выделения связных областей. При этом в одну область объединяются точки, граничащие друг с другом по любому направлению, при условии что окрестность каждой точки радиусом R не
включает ни одной точки, относящейся к изображению ядер, либо областей фиброза. На рис. 1, г показано, что выделенные области соответствуют фолликулам на гистологических изображениях.
Таким образом, на полученном в результате предварительной обработки трехцветном изображении серым цветом выделены ядра, белым – фолликулы, черный цвет соответствует фону изображения. Данное
изображение пригодно для дальнейшего выделения признаков распознавания методами стохастической геометрии, причем за один проход сканирующей системы можно получить признаки, описывающие свойства как
ядер, так и фолликул.
Описанная методика предварительной обработки была проверена соответствующими машинными экспериментами. Разработана система предобработки на языке C# в среде Microsoft Visual Studio, с помощью
которой были получены все иллюстрации в данной статье.
ЛИТЕРАТУРА
1. Федотов Н.Г. Методы стохастической геометрии в распознавании образов. — М: Радио и связь,
1990.
2. Федотов Н.Г., Шульга Л.А. Теория распознавания и понимания образов на основе стохастической
геометрии // Искусственный интеллект, 2002. ― №2. ― с. 282―289.
3. Харалик Р.М. Статический и структурный подходы к описанию текстур // ТИИЭР, 1997, №5. – с.
98–118.
Download