МЕТОДЫ БИНАРИЗАЦИИ МЕДИЦИНСКИХ ИЗОБРАЖЕНИЙ И.А. Панова, О.Ю. Лысак, студенты РТФ 4-курс Руководитель: старший преподаватель Латышев А.Ю. В последние десятилетия компьютерная техника быстрыми темпами внедрялась во все сферы жизнедеятельности общества, что способствовало развитию компьютерных сетей и повышению значимости информации. Современные компьютерные сети достигли огромных масштабов не только по количеству передаваемой информации, но и по охвату территории, на которой они действуют, поэтому возросла скорость и важность обмена информацией. Одной из основных задач обработки и анализа изображений является сегментация, т.е. разделение изображения на области, для которых выполняется определенный критерий однородности, например, выделение на изображении областей приблизительно одинаковой яркости. Понятие области изображения, используется для определения связной группы элементов изображения, имеющих определенный общий признак (свойство). Сегментация нетривиальных изображений представляет одну из самых сложных задач цифровой обработки изображений. Очень часто конечный результат компьютерного анализа изображений зависит от точности сегментации, поэтому значительное внимание должно уделяться повышению надежности алгоритма сегментации. Основным классическим методом сегментации является операция пороговая обработка изображения. Она является одной из наиболее простых и важных процедур поэлементных преобразований и почти всегда предшествует процессу анализа и распознавания изображений. Данная операция заключается в сопоставлении значения яркости каждого пикселя изображения с заданным значением порога. Выбор соответствующего значения пороговой величины дает возможность выделения на изображении областей определенного вида. Операция порогового разделения, которая в результате дает бинарное изображение, называется бинаризацией. Целью операции бинаризации является радикальное уменьшение количества информации, содержащейся на изображении. В процессе бинаризации исходное полутоновое изображение, имеющее L уровней яркости, преобразуется в черно-белое изображение, пиксели которого имеют только два значения – 0 и 1. Поскольку количество информации в бинарном изображении почти на порядок меньше, чем в совпадающим с ним по размерам полутоновом изображении, то бинарное изображение легче обрабатывать, хранить и пересылать. Пороговая обработка изображения может проводиться различными способами. Мы рассмотрим и реализуем несколько самых «удобных» на наш взгляд. 1. Использование гистограммы изображения. Простейший из методов пороговой обработки состоит в разделении гистограммы изображения на две части с помощью единого глобального порога. После этого сегментация изображения осуществляется путем поэлементного сканирования изображения, при этом каждый пиксель отмечается как относящийся к объекту или фону, в зависимости от того, превышает ли яркость данного пикселя значение порога t или нет. Успешность этого метода целиком зависит от того, насколько хорошо гистограмма изображения поддается разделению. Определение величины порога с помощью гистограммы яркостей является простым методом, который позволяет достичь «чистой» сегментации, если гистограмма изображения носит четко выраженный бимодальный характер. Такая форма гистограммы означает, что на изображении можно различить два вида сравнительно часто встречающихся пикселей – яркие и темные. При этом гистограмма легко разделяется с помощью одиночного глобального порога t, расположенного во впадине между пиками гистограммы (рисунок 1). Рисунок 1. Впадина между пиками гистограммы При использовании такого порога изображение будет разделено на два класса – объекты и фон. Так как основная цель порогового преобразования состоит лишь в получении бинарного изображения, то выбор цвета объекта или фона – черный или белый – может быть произвольным. Поэтому для их выделения можно использовать бинаризацию с нижним или верхним порогом. 2. Метод Отса С помощью данного метода вычисляется порог t, минимизирующий среднюю ошибку сегментации, т.е. среднюю ошибку от принятия решения о принадлежности пикселей изображения объекту или фону. Значения яркостей пикселей изображения можно рассматривать как случайные величины, а их гистограмму – как оценку плотности распределения вероятностей. Если плотности распределения вероятностей известны, то можно определить оптимальный (в смысле минимума ошибки) порог для сегментации изображения на два класса c0и c1 (объекты и фон). В дальнейших рассуждениях предполагаем, что: изображение представляется с помощью L уровней яркости; hi – число элементов изображения, имеющих яркость i, i = 0, 1, ..., L-1; H – общее число пикселей на изображении; гистограмма изображения является нормализованной и ее можно рассматривать как распределение вероятностей hi pi , i 0,1,..., L 1; H L 1 pi 1; i 0 элементы изображения делятся на два класса c0и c1 с помощью порогового значения t, где класс c0содержит пиксели с яркостями из множества (0, 1, ..., t), а класс c1 – пиксели с яркостями из множества (t, t+1, ..., L – 1). Вероятности каждого из этих двух классов и средние значения их яркости описываются выражениями: t P0 pi Pt , pi 1 Pt i 0 L 1 P1 i t 1 ipi / P0 0 t / Pt , L 1 ipi / P1 1 ( T t ) /(1 Pt ), i t 1 L 1 где ipi означает среднюю яркость всего изображения. T i 0 Можно легко проверить, что для любого t справедливо следующее соотношение: P0 0 P1 1 T. Дисперсии каждого из классов определяются формулами: ∑ (i t 2 0 0 ) 2 pi / P0 , i 0 ∑ (i L 1 2 1 1 ) 2 pi / P1. i t 1 Определение оптимального порога можно осуществить на основе оптимизации одной из следующих функций, зависящих от порога t: k 2 B 2 W , 2 T 2 W , 2 B 2 T . где 2 B P0 ( 2 W 0 - P0 ∑ (h - T )2 2 0 P1 ( P1 0 2 1 - T )2 P0 P1 ( 0 - 1 ) 2 – дисперсия межклассовая, – дисперсия внутриклассовая, L 1 2 T i T ) 2 pi / P – дисперсия совокупная, причем 2 T не зависит от величины i 0 порога t и выражается формулой 2 2 2 T W B. Стоит отметить, что 2 W требует использования статистик 2-го порядка (дисперсии классов), в то время как – статистик 1-го порядка (средние классов). Поэтому является наиболее простой мерой, зависящей от величины порога t. Исходя из этого, оптимальный порог t * можно вычислить по формуле: 2 B t* arg max ( 0 t L 1 (t )) arg max ( 2 B (t )) . 0 t L 1 Поскольку дисперсия является мерой разброса уровней яркости вокруг среднего значения, то большое ее значение свидетельствует о большом отклонении от среднего. В связи с этим операция нахождения максимума в формуле для определения порога означает увеличение изолированности двух классов на бинаризированном изображении. Итак, для бимодального изображения рассмотренный метод помещает порог между средними значениями яркости объектов и фона так, чтобы максимизировать межклассовую дисперсию B2 . 3. Метод Бернсена Часто используется метод Бернсена. Для схематических и картографических изображений. Все изображение делится на квадраты r r (r – нечетное) с центром в точке (m, n). Для каждого пикселя изображения в пределах квадрата используется порог, имеющий значение j high jlow t (m, n) , 2 где jhigh и jlow являются соответственно наименьшим и наибольшим уровнем яркости в квадрате. Если в принятой области используемая мера контраста удовлетворяет условию G(m, n) ( jhigh - jlow ) ≤ , где заданная пороговая величина, то исследуемый квадрат содержит объекты только одного класса: объектов или фона. В случае, например, документов с текстом такие пиксели классифицируются как области фона, потому что редко случается ситуация, чтобы знак на изображении занимал большое пространство. Исследования показывают, что наилучшие 15 и r 15 . результаты достигаются для значений Для сравнения мы обработали 3 изображения данными методами и выявили: 1) Следует отметить, что гистограмма содержит только лишь информацию о частоте встречаемости на изображении пикселей с различными уровнями яркости, но не содержит информации об их пространственном распределении. Это является основным недостатком использования гистограмм для сегментации изображений. Однако, несмотря на то, что результаты, получаемые с помощью гистограмм, не всегда являются удовлетворительными, данный метод широко используется, так как является простым и быстрым. 2) Наиболее эффективным из методов глобальной бинаризации, как по качеству (ошибок до 30% и меньше), так и по скорости обработки является метод Отса . К его недостаткам относится размытие линий, «слипание» объектов, особенно в местах пересечений, потеря тонких линий. 3) Метод Бернсена имеет ряд недостатков: после обработки монотонных областей яркости формируются сильные паразитные помехи, в некоторых случаях приводит к появлению ложных черных пятен. Недостатки могут быть компенсированы с помощью дополнительной обработки – постпроцессинга. Метод является наиболее быстрым, чем метод Отса, даже в совокупности с этапом постпроцессинга. Список литературы: 1. http://habrahabr.ru/post/128768/ 2. Р. Гонсалес, Р. Вудс. Цифровая обработка изображений: Пер. с англ. - М.: Техносфера, 2005. - 1072 с. 3. Gooogle 4. http://msdn.microsoft.com/ru-ru/