Использование регион-ориентированной схемы сжатия изображений без потерь и с ограниченными потерями в системах технического зрения И.М.Книжный, 2011 г. Институт космических исследований РАН e-mail: kim@mx.iki.rssi.ru Wavelet (JPEG 2000) 80 70 Частота, % 60 50 4,00 bpp 3,20 bpp 2,67 bpp 40 30 20 10 0 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 Ошибка восстановления JPEG 60 Частота, % 50 40 30 4,00 bpp 20 3,20 bpp 10 2,67 bpp 0 -8 -7 -6 -5 -4 -3 -2 -1 0 1 2 3 Ошибка восстановления 4 5 6 7 8 Общая схема предиктивного кодера 2,50 2,25 2,00 N (i ), % 1,75 1,50 1,25 1,00 0,75 0,50 0,25 0,00 0 20 40 60 80 100 120 140 160 180 200 220 240 260 Яркость i Исходное изображение Предсказатель Контекстная модель + Модель ошибки предсказания Энтропийное кодирование Gradient Adjusted Predictor (GAP) dh = |W - WW| + |N - NW| + |NE - N| dv = |W - NW| + |N - NN| + |NE - NNE| IF ((dv – dh) > 80) // резкая горизонтальная граница Cp = W; ELSE IF ((dv – dh) < - 80) // резкая вертикальная граница Cp = N; ELSE { Cp = (W + N)/2 + (NE – NW)/4; IF ((dv – dh) > 32) // горизонтальная граница Cp = (Cp + W)/2; ELSE IF ((dv – dh) > 8) // мягкая горизонтальная граница Cp = (3* Cp + W)/4; ELSE IF ((dv – dh) < - 32) // вертикальная граница Cp = (Cp + N)/2; ELSE IF ((dv – dh) < -8) // мягкая вертикальная граница Cp = (3* Cp + W)/4; } Адаптивный код Голомба (1) q l + q l+1 ≤ 1 < q l + q l-1 Пусть r n%l. r 2 log2 l l t n / l , Если r кодируется иначе число кодируется а log 2 l 1битами r2 log2 l log 2 l l t n / l битами. l ≈ –1/log2 q ln x ≈ x – 1 1 ln 2 ln 2 l log q ln q 1 q 2 l q l q 1 0.5000 ÷ 0.6180 9 0.9217 ÷ 0.9296 2 0.6180 ÷ 0.7549 10 0.9297 ÷ 0.9361 3 0.7550 ÷ 0.8192 11 0.9362 ÷ 0.9415 4 0.8193 ÷ 0.8567 12 0.9416 ÷ 0.9460 5 0.8568 ÷ 0.8813 13 6 0.8814 ÷ 0.8987 14 0.9500 ÷ 0.9533 7 0.8988 ÷ 0.9116 15 0.9534 ÷ 0.9563 8 0.9117 ÷ 0.9216 16 0.9564 ÷ 0.9589 0.9461 ÷0.9499 ] z [ - ближайшее целое к z округления z z -с результат избытком z - результат округления z с недостатком Адаптивный код Голомба (2) ai-k ai-k+1 ... ai-3 ai-2 ai-1 ai k ˆl ln 2 , где 1 qˆ qˆ (n k ) / n. если выбрать k таким образом, чтобы k / ln 2 2 j , k то с учётом того, что n k ai , i 1 k lˆ ( ai c( j )) j , i 1 где с(j) = ] 2 j (ln 2 + 0.5) [. k j c(j) 3 2 4 6 3 7 11 4 14 22 5 28 44 6 56 89 7 112 177 8 449 Адаптивный код Голомба (3) Избыточность адаптивного кода Голомба для различных значений k (в предположении, что q – неизвестно, но остаётся постоянным): 0,12 R(q), бит 0,10 0,08 k=11 k=22 0,06 k=44 k=89 0,04 G-V 0,02 0,00 0,5 0,6 0,7 0,8 0,9 q белая линия на графике – граница Галлагера-Ван Вурхиса (случай, соответствующий известному значению вероятности q). Использование АКГ в предиктивных схемах сжатия изображений Оценка параметра l по двумерному окружению из уже закодированных ошибок предсказания. На графиках - среднее число бит на пиксел сжатого изображения в зависимости от способа оценки l. k = 22 k=6 k = 11 х х k=3 х Вычисление по среднему 3,97 Вычисление по взвешенному среднему 3,97 3,96 S(k), bpp х 3,96 3,95 3,95 3,94 3,94 3,93 3,93 3,92 3,92 3,91 3,91 3,90 3,90 0 2 4 6 8 10 12 14 16 Число точек окружения k 18 20 0 2 4 6 8 10 12 14 Число точек окружения 16 18 20 Выбор ROI различной степени важности Результаты сжатия тестовых изображений Сравнение эффективности схем сжатия на примере изображений из набора “Old JPEG test set”, не подвергавшихся искажающему сжатию: Размеры JPEG-LS CALIC arithm. WinRAR 3.80 BMF 2.0 (FAST) DaRT DaRT-R 20/30/50 % Размерность пиксел bpp bpp bpp Bpp bpp bpp AIRFIELD 512x512 5,5660 5,4748 6,1154 5,5724 4,9652 3,8266 BRIDGE 512x512 5,5004 5,3750 4,4789 3,9822 3,4734 3,4652 COUPLE 512x512 4,6766 4,5957 5,4002 4,6111 4,2082 2,9804 HARBOUR 512x512 4,4940 4,4583 5,1976 4,4948 4,4259 3,0702 LENA 512x512 4,2368 4,1207 5,2088 4,1013 4,0739 2,6017 MAN 512x512 4,5049 4,3851 5,3396 4,3899 4,3386 2,8857 MANDRILL 512x512 6,0382 5,8987 6,5533 5,9166 5,8906 4,3002 PEPPERS 512x512 4,2891 4,2091 5,2391 4,2002 4,1638 2,6683 SAILBOAT 512x512 4,7688 4,6945 5,5167 4,7080 4,6599 3,1565 WOMAN1 512x512 4,6722 4,5546 5,4659 4,5718 3,9605 2,9084 WOMAN2 512x512 3,3000 3,2021 4,0453 3,1567 3,1389 1,9511 Среднее: – 4,7315 4,6335 5,3237 4,5186 4,2999 3,0763 [MБ/с]: – 5,41 1,51 3,20 3,47 3,59 4,02 Заключение и выводы Описанный в докладе регион-ориентированный подход к сжатию изображений обеспечивает компромисс между требованием отсутствия искажений при восстановлении передаваемых по каналу связи или архивируемых изображений в представляющих особый интерес областях, обеспечивает в среднем в 1.5 раз больший коэффициент сжатия, чем в схемах сжатия без потерь, отличается малой вычислительной сложностью и низкими требованиями к ресурсам памяти кодера. В сочетании с высокой скоростью работы всё перечисленное позволяет сделать вывод о практической целесообразности применения описанного подхода для сжатия изображений в том числе – в системах технического зрения. Использование регион-ориентированной схемы сжатия изображений без потерь и с ограниченными потерями в системах технического зрения И.М.Книжный, 2011 г. Институт космических исследований РАН e-mail: kim@mx.iki.rssi.ru