Поиск трехмерных объектов на изображениях на основе динамически формируемых контурных эталонов Ю.Б. Блохинов,

реклама
Поиск трехмерных объектов на
изображениях на основе динамически
формируемых контурных эталонов
Ю.Б. Блохинов, А.С. Чернявский
ФГУП «ГосНИИАС», Москва
achern@gosniias.ru
Постановка задачи






Существуют 3D модели ряда наземных
объектов, формирующих сцену
Имеется цифровое текущее изображение (ТИ),
полученное с летательного аппарата
Заданы углы обзора и примерная область
поиска объектов на изображении
Предполагаем, что объект полностью
находится в кадре
Требуется определить местонахождение
искомого объекта на ТИ
При этом не использовать информацию о
текстуре
Модель
Текущее изображение
По имеющейся информации о точке съемки генерируется
конкретный вид эталона объекта
Контурные эталоны объектов
1
2
4
3
Для каждого контурного эталона (КЭ) строится
функция сходства с ТИ
Функция сходства


Контурный эталон E (i, j )
размывается фильтром Гаусса
В каждой точке находятся нормали
к контурному эталону
 I y (i, j ) 

 ij  arctg 
 I x (i, j ) 

В каждой точке ТИ ищется
градиент яркости:
 I y (m, n) 

 mn  arctg 
 I x (m, n) 
Функция сходства

Сходство между эталоном и
ТИ в точке (i,j):

p(i, j )  f  mn   ij


Итоговая функция сходства
D(m, n) 
 p(i, j )
i[ m , m  H E ]
j[ n , n WE ]
Наиболее
вероятное
расположение
Пик функции
сходства
объекта
50
100
150
200
250
50
100
150
200
250
300
350
Результаты позиционирования сцен по данным летных
экспериментов
Отличительные особенности ИК-снимков:
1) Узкий динамический диапазон и низкий контраст
2) ИК-снимки имеют меньшие размеры и меньшую разрешающую
способность
4000
3500
3000
2500
ТВ
2000
1500
1000
500
0
0
50
100
150
200
250
0
50
100
150
200
250
4000
3500
3000
2500
2000
ИК
1500
1000
500
0
Гистограмма яркости
Результаты позиционирования сцен по данным летных
экспериментов
Было проведено исследование
вероятности попадания и точности
попадания в прицельную точку в
зависимости от уровня шума и степени
загораживания
Прицельная точка, лежащая на модели
объекта (на стене или крыше)
задавалась пользователем
Параметры зашумления:
1)
2)
3)
4)
Нормальный шум: σ от 0 до 50
Импульсный шум: вероятность изменялась от 0 до 0.5
Загораживание прямоугольной областью: от 0% до 50% от площади снимка
Изменение углов ориентирования: ±1° от истинных значений
Область поиска объекта определяется по известным оценкам ошибок элементов
внешнего ориентирования и составляет в среднем 50х50 пикселей
Результаты позиционирования сцен по данным летных
экспериментов
10
20
30
40
50
60
70
80
90
100
20
40
60
80
100
120
140
10
20
30
40
50
60
70
80
90
100
10
Эталонное изображение
Текущее изображение
20
30
40
50
Функция сходства
60
Результаты позиционирования сцен по данным летных
экспериментов
10
20
30
40
50
60
70
80
90
20
40
60
80
100
120
140
10
20
30
40
50
60
10
Текущее изображение
20
30
40
50
60
Функция сходства
70
80
Результаты позиционирования сцен по данным летных
экспериментов
Выводы:
1) Метод поиска, основанный на анализе поля градиентов яркости, успешно
работает как на ТВ-, так и на ИК-снимках
2) Вероятность точной локализации объекта превышает 0.9 при всех видах
шума, кроме загораживания (от 0.5 до 0.88). В среднем, вероятность
локализации для ИК-снимков несколько ниже, чем для ТВ-снимков (0.85
против 0.92). Это связано с небольшими размерами ИК-снимков.
3) Средняя точность локализации (расстояние от истинного до найденного
положения прицельной точки) не превышает 2.5 м для всех видов шума,
кроме неточно заданных углов ориентирования (для них точность в
среднем равна 4.5 м)
5) Вероятность и точность локализации зависят от структуры сцены,
например, от степени протяженности объектов (мосты, дороги)
Использование нескольких снимков для повышения точности
обнаружения
Если ТИ сильно зашумлено или объект не помещается целиком на одном
снимке, целесообразно использовать несколько снимков одной сцены,
сделанных в последовательные моменты времени.
Алгоритм сборки сцены по N снимкам состоит из следующих шагов:
1) Поиск прицельного объекта на каждом снимке по отдельности,
построение функций сходства
2) Переход из пиксельной системы координат каждого снимка в единую,
общую для всех снимков, геодезическую СК (в метрах)
3) Значению функции сходства в каждом пикселе соответствует голос,
поданный за положение прицельной точки в трехмерном пространстве
4) Голоса, полученные при анализе N снимков, суммируются в
геодезической СК
Итог:
точка в трехмерном пространстве, получившая больше всего
голосов,объявляется найденной прицельной точкой.
10
20
30
40
50
60
70
80
90
100
10
20
30
40
50
60
70
80
90
100
10
20
30
40
50
60
70
80
90
100
10
20
30
40
50
60
70
80
90
100
10
20
30
Если на отдельных снимках
объект не виден целиком, то
по нескольким снимкам
возможно определить точное
положение объекта
40
50
60
70
80
90
100
10
20
30
40
50
60
70
80
90
100
10
20
30
40
50
60
70
80
90
100
20
40
60
80
100
Итоговая функция
сходства сцены по
трем снимкам
120
140
Результат сборки
Повышение точности обнаружения
(субпиксельность)


Нахождение начального приближения
Максимизация функции сходства каким-либо
итерационным методом путем варьирования углов
ориентирования и координат камеры
Имеет смысл перейти к
векторной модели контурного
эталона
Функция сходства
при изменении угла
Выводы




Предложенная функция сходства позволяет
обнаружить объект на изображении по его
контурному эталону
Метод успешно испытан на реальных
изображениях, полученных в видимом и ИКдиапазоне
Есть предпосылки для повышения точности
обнаружения, в т.ч. путем использования
нескольких снимков с разных точек
Повышение точности обнаружения =
повышение точности навигационных данных
Скачать