Временные характеристики систем с поэтапным развитием

реклама
УДК 614.1/519.25 + 615:814 + 616.895.8:616.24-002.5(075)
С. М. Бурков, В. В. Гостюшкин, Н. Э. Косых, К. А. Литвинов,
С. З. Савин, Н.А. Свиридов
ПРОБЛЕМЫ ИСПОЛЬЗОВАНИЯ CAD-СИСТЕМ
ПРИ АНАЛИЗЕ МЕДИЦИНСКИХ ИЗОБРАЖЕНИЙ
Бурков С. М – директор ХКЦ НИТ ТОГУ, д-р тех. наук, доцент;
Гостюшкин В.В. – н.с. Вычислительного центра ДВО РАН;
Косых Н.Э. – г.н.с. Вычислительного центра ДВО РАН; зав. кафедрой
ДВГМУ, д-р мед. наук, профессор;
Литвинов К. А. – аспирант ДВГМУ;
Савин С. З.– зав.лаб. Вычислительного центра ДВО РАН, канд тех. наук;
Свиридов Н. А – аспирант ТОГУ
Разработана система автоматизированной компьютерной диагностики скелетных метастазов по данным сцинтиграфии, основанная
на принципах распознавания образов и обладающая функциями
экспертного анализа медицинских изображений. Система включает
сегментацию изображения скелета, расчет текстурных, гистограммных и морфометрических параметров, создание обучающей выборки. В основу формирования классифицирующей функции положен
метод опорных векторов, а надежность классифицирующей функции определялась с помощью показателя ожидаемой латентной изменчивости классификатора.
В последнее время одним из актуальных направлений развития
компьютерных технологий в медицине становится обработка цифровых изображений: улучшение качества изображения, восстановление
поврежденных изображений, его распознавание отдельных элементов.
Распознавание патологических процессов является одной из наиболее важных задач обработки медицинских изображений. В последние годы в решении данной задачи используются компьютерных систем диагностики – CAD (computer added diagnostic). Алгоритм CADсистемы медицинских изображений, как правило, включают в себя
сегментацию изображения, выделение объектов интереса («масс»), их
анализ, параметрическое описание, их классификацию [1, 2]. При этом
выделенные объекты являются отражением патологического процес-
са в организме, а их классификация отвечает на вопрос – все ли
выделенные объекты являются проявлением патологического процесса. В качестве методов параметрического описания выделенных
объектов используется текстурный, гистограммный и морфометрический анализ [3, 4, 5, 6, 7], однако сочетание этих методов применяется редко. Классификация объектов интереса может проводиться по
методу нейронных сетей, опорных векторов, дискриминантного анализа и др. [1, 3, 8]. Вместе с тем, задача автоматизированной диагностики патологических процессов по данным медицинских изображений далека от своего разрешения. Актуальной проблемой остается
определение оптимальных методов параметрического описания объектов интереса, что может оказывать непосредственное влияние на
качество классификации данных объектов. Этот вопрос был изучен с
помощью разработанной нами CAD-системы оценки планарных
сцинтиграмм скелета у онкологических больных. Планарная сцинтиграфия скелета является методом диагностики костных метастазов. Суть этой диагностической методики заключается в введении
больным радиофармпрепарата (РФП) - фосфатных комплексов, меченных изотопом99mTc. Фосфатные комплексы связываются с кристаллами гидроаппатита, уровень которых повышен в зонах костных
метастазов. Гамма излучение обусловленное изотопом 99mTc регистрируется датчиками гамма-камеры. За счет этого формируется
электронное изображение скелета (передняя и задняя проекция), на
котором можно выявить метастатическое поражение задолго до появления выраженной локальной деминерализации и костной деструкции,
которая регистрируется при рентгенологическом обследовании [1, 2,
9]. Функциональная схема CAD-системы включала перевод изображения из формата DICOM в среду MATLAB с последующей автоматической сегментацией изображения «пороговым» методом [3] и сохранением его в архиве. Результатом сегментации являлось выделение очагов гиперфиксации (ОГФ) РФП, которые и представлялись «
зонами интереса». Для данных зон проводился текстурный анализ по
методу Харалика [11, 13] и локальной бинарной текстуры (Local Binary Patterns - LBP) [14], а также гистограммный и морфометрический
анализ [3, 9]. Одновременно выделенные очаги гиперфиксации РФП
были проанализированы экспертом и разделены на метастатические и
неметастические очаги. Формировалась обучающая выборка, состоящая из объектов - проанализированных экспертом очагов гиперфиксации РФП, Каждому объекту в обучающей выборке соответствовал
просчитанный набор гистограммных, текстурных и морфометрических
параметров. Перечень параметров оценки ОГФ РФП, отмеченных
на сцинтиграммах, представлен табл.1. Автоматическое распознавание распознавания ОГФ с разделением их на «метастатические» и
«не метастатические» было проведено на основе метода опорных
векторов (SVM — support vector machines) —набора алгоритмов вида
«обучение с учителем», использующихся для задач классификации и
регрессионного анализа.
Табл. 1.
Перечень параметров оценки очагов гиперфиксации РФП
Методы анализа
Параметры анализа
Морфометрический компактность, эксцентриситет, эллипсоидность.
Гистограмный
среднее значение яркости изображения, стандартное отклонение показателя яркости в сегментированной области, гладкость, третий момент яркости, однородность и энтропию в выделяемых очагах гиперфиксации РФП изображения
Текстурный
дисперсии средних по осям X и У цифровой
(Харалик Р.М.)
матрицы изображения, показатели контрастности, автокорреляции, корреляции, неоднородности, гомогенности, энергии, энтропии, максимума вероятности, инерции, обратного момента разностей
Локальной бинарной текстуры
Основная идея метода опорных векторов — перевод исходных
векторов в пространство более высокой размерности и поиск разделяющей гиперплоскости с максимальным зазором в этом пространстве.
Две параллельных гиперплоскости строятся по обеим сторонам гиперплоскости, разделяющей наши классы. Разделяющей гиперплоскостью
будет гиперплоскость, максимизирующая расстояние до двух параллельных гиперплоскостей. Алгоритм работает в предположении, что
чем больше разница или расстояние между этими параллельными гиперплоскостями, тем меньше будет средняя ошибка классификатора.
Метод опорных векторов был положен для формирования классификатора (классифицирующей функции), на основе обучающей выборки.
При этом классификатор был создан отдельно для объектов передних и
задних сканограмм. Качество получившегося классификатора проверялось на выборке неклассифицированных ОГФ передних (200 очагов)
и задних (200 очагов) сканограмм. Целью данной экспериментальной оценки являлось измерение производительности классификатора т.е. его способность принимать верные решения (вероятность верной классификации). Оценка качества классификатора была проведена
с помощью ROC-кривой, выражающей соотношение уровня верных и
ложных обнаружений [5, 12]. При этом рассчитывался численный показатель площади под ROC-кривой - AUC (Area Under Curve). Для
интерпретации значений AUC использовалась шкала (табл.2).
Табл.2.
Шкала интерпретации значений AUC
Интервал AUC
0.9-1.0
0.8-0.9
0.7-0.8
0.6-0.7
0.5-0.6
Качество модели
Отличное
Очень хорошее
Хорошее
Среднее
Неудовлетворительное
Проведено
изучение
влияния текстурных, гистограммных и
морфометрических параметров на качество классификатора. Для этого
классификационная функция выстраивалась с учетом параметров
рассчитанных только одним из четырех применявшихся методов.Оценка качества классификатора осуществлялась с помощью
ROC-кривых и AUC. Полученные данные представлены рис. 1.
Как видно из рис.1, классификатор, созданный на основании
данных морфометрического анализа ОГФ РФП имеет средний уровень качества. При этом отсутствуют сколько-нибудь выраженные
различия между классификаторами для сцинтиграмм передних
(AUCant = 0,63) и задних (AUCpost= 0,66) проекций. Ситуация близкая
к изложенной выше наблюдается и для классификатора, созданного
на основании метода локальной бинарной текстуры. Качество классификатора для передних проекций сцинтиграмм описывается ROCкривой с AUC ant = 0,73), а для задних прекций сцинтиграмм - ROCкривой с AUC post= 0,74.
Рис. 1. Качество классификационной функции CAD-системы оценки планарных остеосцинтиграмм при использовании параметрического описания
объектов
Качество классификатора
возрастает при использовании для
его создания данных текстурного анализа по Харалику. Это особенно заметно в классификаторе для задних проекций сцинтиграмм
(AUC post= 0,88) . Качество классификатора для передних проекций
сцинтиграмм несколько ниже (AUC ant = 0,78). Аналогичные данные
были получены при проверке классификатора, построенного на основании материалов гистограммного анализа. Однако наиболее информативным является классификатор, построенный на основании
данных всех четырех рассмотренных выше видов анализа (рис.2).
Согласно проведенного ROC- анализа, качество классификатора
для задних проекций сцинтиграмм выше, чем для передних (AUC
post= 0,96 и AUC ant = 0,86, соответственно). САD- системы до настоящего времени нашли ограниченное применение в анализе планарных
сцинтиграмм скелета. Отчасти это связано со сложностями параметрического описания выявляемых ОГФ РФП. При этом известные
САD-системы в основном используют данные текстурного анализа
[1, 11, 13, 14].
В отличие от них, предлагаемая диагностическая система включает данные, полученные с помощь иных методов анализа. При
этом, несмотря на то, что информативность морфологического анализа и локально-бинарного текстурного анализа невелика, их сочетание с текстурным анализом по Харалику и гистограммным ана-
лизом существенно повышает производительность классификатора.
Рис. 2. Проверка эффективности классифицирующей функции на тестовой
выборке очагов гиперфиксации РФП с помощью ROC-анализа
Тем самым улучшаются диагностические возможности CADсистемы. ROC-кривая показывает зависимость количества верно классифицированных положительных примеров от количества неверно
классифицированных отрицательных примеров. В терминологии ROCанализа первые называются истинно положительным, вторые – ложно
отрицательным множеством. При этом предполагается, что у классификатора имеется некоторый параметр, варьируя который, мы будем
получать то или иное разбиение на два класса:
фактически
модель
положительно
положительно
TP
отрицательно
FN
отрицательно
FP
TN,
где TP (True Positives) – верно классифицированные положительные примеры (так называемые истинно положительные случаи);
TN (True Negatives) – верно классифицированные отрицательные
примеры (истинно отрицательные случаи);
FN (False Negatives) – положительные примеры, классифицированные как отрицательные (ошибка I рода).
Это так называемый «ложный пропуск» – когда интересующее нас
событие ошибочно не обнаруживается (ложно отрицательные примеры);
FP (False Positives) – отрицательные примеры, классифицированные как положительные (ошибка II рода).
Это «ложное обнаружение», т.к. при отсутствии события ошибочно выносится решение о его присутствии (ложно положительные случаи).
Введем еще два определения: чувствительность и специфичность
модели. Ими определяется объективная ценность любого бинарного
классификатора. Чувствительность (Sensitivity) и есть доля истинно
положительных случаев:
Специфичность (Specificity) – доля истинно отрицательных случаев, которые были правильно идентифицированы моделью:
Заметим, что FPR=100-Sp. ROC-кривая получается следующим
образом:
1. Для каждого значения порога отсечения, которое меняется от 0
до 1 с шагом dx (например, 0.01) рассчитываются значения чувствительности Se и специфичности Sp. В качестве альтернативы порогом
может являться каждое последующее значение примера в выборке.
2. Строится график зависимости: по оси Y откладывается чувствительность Se, по оси X – 100%–Sp (сто процентов минус специфичность), или, что тоже самое, FPR – доля ложно положительных случаев.
3. Численный показатель площади под кривой называется AUC
(Area Under Curve). Вычислить его можно, например, с помощью численного метода трапеций:
С большими допущениями можно считать, что чем больше показатель AUC, тем лучшей прогностической силой обладает модель. Однако следует знать, что показатель AUC предназначен скорее для сравнительного анализа нескольких моделей; AUC не содержит никакой информации о чувствительности и специфичности модели. В литературе
[8, 12, 14] иногда приводится следующая экспертная шкала для значений AUC, по которой можно судить о качестве модели:
Интервал AUC
Качество модели
0.9-1.0
Отличное
0.8-0.9
Очень хорошее
0.7-0.8
Хорошее
0.6-0.7
Среднее
0.5-0.6
Неудовлетворительное
Таким образом, представленная CAD-система позволяет успешно
проводить анализ (повысить эффективность анализа) планарных сканограмм скелета на основе автоматизированной компьютерной диагностики повысив диагностическую значимость метода остеосцинтиграфии. Автоматическая диагностика очагов гиперфиксации РПФ требует создания классифицирующей функции на основе численного анализа текстурных, морфометрических и гистограммных параметров,
при этом в качестве алгоритма распознавания данных очагов может
быть использован метод опорных векторов, а также нейронных сетей
[15].Точность распознавания очагов гиперфиксации РФП может быть
определена с помощью показателя PLVC (ожидаемой латентной изменчивости классификатора). Настоящая работа выполнена при поддержке Российского фонда фундаментальных исследований (гранты
№№ 10-01-86008, 10-07-86008).
Библиографические ссылки
1. Гостюшкин В.В., Косых Н.Э., Савин С.З. Модели и методы обработки
медицинских изображений. Хабаровск: Вычислительный центр ДВО РАН,
2010. 36 с.
2. Паша С.П., Терновой С.К. Радионуклидная диагностика. М.: ГЭОТАРмедиа, 2008, 204 с.
3. Гонсалес Р., Вудс Р., Эддинс С. Цифровая обработка изображений в среде
MATLAB. Пер. с англ. Москва: Техносфера. 2006. 615с.
4. De Brabanter K., Karsmakers P., Ojeda F., Alzate C. LS-SVMlab Toolbox
User’s Guide, http://www.esat.kuleuven.be/sista/lssvmlab/
5. Lejbkowicz I., Wiener F., Nachtigal et al. Bone Browser a decision-aid for a
radiological diagnosis of bone tumor. Computer Methods Programs Biomed. 2002;
67(2): C. 137-154.
6. Sadik M. Bone scintigraphy. A new approach to improve diagnostic accuracy.
University of Gothenburg, 2009, p.44
7. DICOM www.dicom.html
8. Soh L., Tsatsoulis C. Texture Analysis of SAR Sea Ice Imagery Using Gray
Level Co-Occurrence Matrices, IEEE Transactions on Geoscience and Remote
Sensing, vol. 37, no. 2, March 1999.
9. Obenauer S., Hermann K.P., Grabbe E.Applications and literature review of
the ВI-RADS classification.Eur Radiol. 2005. Р. 1027-1036.
10. Kosykh N.E., Gostuyshkin V.V., Savin S.Z., Vorojztov I.V. Designing the systems of computer diagnostics of medical images // Proc. of The First Russia and
Pacific Conference on Computer Technology and Applications (RPC 2010). Vladivostok, Russia. 6 - 9 September, 2010. 4 p.
11. Харалик Р. М. Статистический и структурный подходы к описанию текстур ТИИРЭ 5, 1979, С.98-118.
12. Metz C.E. Fundamentals of ROC Analysis // Handbook of Medical Imaging.
Vol. 1. Physics and Psychophysics. Beutel J, Kundel HL, and Van Metter RL, Eds.
SPIE Press (Bellingham WA 2000), Chapter 15: 751-769.
13. Haralick R. M., Shanmugam K., Dinstein I. Textural Features of Image Classification, IEEE Transactions on Systems, Man and Cybernetics, vol. SMC-3, no. 6,
Nov. 1973.
14. Ojala T., Pietikainen M., Maenpaa T. Multiresolution Gray-Scale and Rotation
Invariant Texture Classification with Local Binary Patterns // IEEE Trans. Pattern
Analysis and Machine Intelligence, vol. 24(7), pp. 971-987, 2002.
15. Коломийцева С.В., Посвалюк Н.Э., Савин С.З. Нейронные сети в решении
проблем онкодиагностики // Сборник трудов Региональной научнопрактической конференции с международным участием «Актуальные вопросы онкологии в Дальневосточном регионе». г.Хабаровск, 29-30 сентября 2009
г. Хабаровск: ДВГМУ, 2010. С.101-108.
Скачать