Информативность цветовых каналов BMP формата Козловский Евгений 2007 г. Недостатки стандартного LSB метода Идея LSB метода состоит в замене наименее значащих бит в цветовых каналах. Полагается, что в среднем половина бит только изменится, контейнер статистически будет устойчиво. Но это справедливо лишь для числа цветов изображения сопоставимым с количеством пикселей. Но, конечно, это не так! В действительности, соотношение где-то 1:6. Поэтому, следует перейти от т.н. fixed-sized LSB insertion к value-sized. При этом появляется возможность встраивать заметно больше информации, контейнер оказывается статистически более устойчив. Полезно рассмотреть особенности восприятия цветов человеком, т.н. информативность цветовых каналов. Особенности зрительной системы человека В области обработки изображений принято рассматривать светимость. Она равна лучистой мощности, разделенной на функцию спектральной чувствительности, которое характеризует зрение. Основываясь на результатах многочисленных экспериментов, светимость определяется как взвешенная сумма красного, зеленого и синего цветов с весами 77/256, 150/256, 29/256. Наш глаз очень чувствителен к малейшим изменениям чувствительности. Зрительная система наоборот нечувствительна к зашумленным участкам изображения, участкам, которые не несут какой-либо психовизульно ценной информации. Цветовые пространства и каналы Существует 4 цветовых пространства и 11 цветовых каналов. Были взяты три изображения (Lena, Baboon, Sailboat) и по RGB-B каналу была встроена информация с долей встраивания 0.02. Далее исследовалcя уровень помех к доли встраивания. Измерение уровня помех (annoyance measurement) Рис. 1 Lena Измерение уровня помех (annoyance measurement) Рис. 2 Baboon Измерение уровня помех (annoyance measurement) Рис. 2 Sailboat Visibility measurement В следующем тесте изменялся R канал. Интенсивность принимала малые, средние и большие значения. На гистограммах всплески соответствуют встроенной информации. Встраивание информации в контейнер с разным уровнем интенсивности канала G Встраивание информации в контейнер с разным уровнем интенсивности канала B Выводы с результатов измерений Восприятие изображения зависит от текстуры и границ. Наименее заметно встраивание в изображениях с большим разнообразием текстуры. Если изображение однотонное, то встраивание легко обнаружимо. Границы изображения представляют наиболее значимую информацию для человека. Встраивание более заметно на границах, чем на текстурных областях. Темные и светлые области изображения скрывают информацию лучше, чем средние тона. Зеленый цвет не приспособлен для встраивания информации, наиболее подходят для встраивания синий и желтый цвета. Средняя интенсивность того или иного цвета изображения не очень хорошо его характеризует. Нет связи между средней интенсивностью цвета контейнера и восприимчивостью встроенной в него информации Bit-slicing Рассматривается изображение в т.н. Canonical Gray Coding system (CGC). От системы Pure-Binary Coding, как известно, можно перейти к Canonical Gray Coding. Далее осуществляется bit-slicing (n-битовое изображение разлагается на n изображений). Фильтрация шумов Рассмотрев изображения, можно заметить, в шести изображениях присутствуют шумы. Любые цифровые изображение состоят из фрагментов, несущих информацию, и фрагментов с бесполезным шумом. Можно использовать эти области для встраивания информации. Фильтрация шумов, выделение образов из хаоса – важнейшая особенность нашего восприятия. Из-за этой особенности можно заменять целые куски изображения. Чем более значима битовая плоскость, в которой появляется шум, тем больше контраст черного среди соседних пикселей, тем больше битов может быть использовано для встраивания. Таким образом, следует высчитывать изменение черного в соседних пикселях. Embedding capacity Max(x,y) = max{f(x-1,y-1), f(x-1,y),f(x-1,y+1), f(x,y-1)} Min(x,y) = min{f(x-1,y-1), f(x-1,y),f(x-1,y+1), f(x,y-1)} D(x,y) = Max(x,y)-Min(x,y) Kn(x,y)=└log2(D(x,y))┘ U(x,y)={4 при f(x,y)<191, 5 в других случаях} K(x,y)=min{max{Kn(x,y),4},U(x,y)} PBC и CGC Анализ информативных и зашумленных областей Определим сложность изображения как α=k/макс. возм. Ч-Б изменения в изображении; k – общая глубина черно-белой границы в изображении 0 ≤ α≤1; Это для всего изображения. То же самое можно определить для части изображения, к примеру, 8*8 пикселей. Определим как много бинарных шаблонов информативных и как много зашумленных по отношению к α. Необходимо проверить 264 шаблонов. Но можно сгенерировать шаблоны, где значение каждого пикселя случайное, но с вероятностью 0 или 1. Затем строится гистограмма по α. Анализ гистограммы Было сгенерировано 4096000 шаблонов 8*8. Гистограмма почти в точности отражает функцию нормального распределения. Это ожидалось по главной предельной теореме. Среднее значение α было 0.5 и стандартное отклонение 0.047. Проведя дальше необходимые рассуждения, можно прийти к заключению, что большинство информативных паттернов расположены в диапазоне [0;0.5 - 8σ]. Это всего лишь 6.67.10 –14 % всех паттернов. Почти все паттерны шумящие!