Т.И. КОЛТУНОВА, Д.Г. ШАПОШНИКОВ, А.В. ДЬЯЧЕНКО, Л.Н. ПОДЛАДЧИКОВА НИИ нейрокибернетики им. А.Б. Когана Южного федерального университета, Ростов-на-Дону t.koltunova@gmail.com ИНДИВИДУАЛЬНЫЕ ОСОБЕННОСТИ ТОПОЛОГИИ ОСМОТРА ИЗОБРАЖЕНИЙ Представлены результаты об индивидуальных особенностях топологии осмотра сложных изображений и параметров глазных движений. Наиболее выраженные различия обнаружены между испытуемыми с преобладанием механизмов фокального и пространственного внимания. Обсуждается использование полученных результатов при разработке алгоритмов идентификации локальных элементов текущей траектории осмотра изображений и адекватной функции притяжения взгляда в модели. Ключевые слова: фокальное и пространственное зрительное внимание, центр-масс и площадь области сканирования, траектория осмотра, длительность фиксаций, амплитуда саккад 1. ВВЕДЕНИЕ В большинстве работ, посвященных исследованию механизмов зрительного внимания по параметрам глазных движений, анализируются, в основном, длительность фиксаций и амплитуда саккад [1-6]. Вместе с тем, для разрешения противоречий в известных данных [7] и разработки реалистических моделей осмотра [8-12] необходимы количественные данные о различных параметрах, в частности, о топологии зоны осмотра изображений, поскольку общая геометрия траектории осмотра зависит от данного изображения [13], а ее детали - от мотивации (инструкции) испытуемого [3]. В ряде работ на качественном уровне отмечаются индивидуальные различия параметров глазных движений, однако при представлении результатов данные, полученные на различных испытуемых, как правило, усредняются [4-6]. Перспективная цель наших исследований - количественная оценка вклада различных факторов (или «детерминант» [1]) и механизмов в перевод взгляда в процессе осмотра изображений с помощью подхода, основанного на тесном взаимодействии психофизического тестирования и моделирования [8, 9]. В данной работе представлены результаты анализа индивидуальных особенностей топологии осмотра изображений. 2. ПОДХОД И МЕТОДЫ В концептуальном плане разрабатываемый подход [9] основан на теории активного зрительного восприятия (Active Vision [14-16] , идеях А.Л. Ярбуса [3], “Scanpath Theory” [13], представлениях “What-Where” [10, 17. 18] и проекте Аутотентичное Моделирование Личности [19]. Для регистрации движений глаз использовалась система iView X HiSpeed 1250. В качестве тестовых использованы 3 картины из [3]: «Не ждали» И.Е. Репина (Im1, 800х785 пикс.); И.И. Шишкина «В лесу графини Мордвиновой» (Im2, 800х615 пикс.); И.И. Левитана «Березовая роща» (Im 3, 900х535 пикс.). В тестах принимали участие студенты и аспиранты ЮФУ (8девушек и 4 юношей) в возрасте от 20 до 27 лет. На каждом испытуемом проведено две серии тестов: «свободный осмотр» и «поиск измененных (размытых) фрагментов». Размер измененных фрагментов – около 20. Каждый тест заканчивался по решению испытуемых. При обработке данных порог скорости саккад - 1000/сек. Для идентификации областей интереса (ОИ) как областей с максимальной плотностью точек фиксаций использовался метод ближайшего соседа [9]. 3. РЕЗУЛЬТАТЫ 3.1. Характеристика областей осмотра. индивидуальных особенностей топологии Для получения количественных параметров областей осмотра изображений было проведено несколько видов анализа экспериментальных данных. В частности, определялась площадь областей осмотра и расстояние между центрами-масс этих областей и ОИ, определенных по результатам осмотра каждого из изображений. Обнаружено, что эти параметры варьировались у разных испытуемых (2% - 75% от площади изображения; 0.42º - 8.40º, соответственно) и зависели от типа теста (в среднем, больше в тестах поиска, чем осмотра: 53±2% против 37±3%; 4.20 ± 0.31º против 2.74± 0.28º). Рис. 1 иллюстрирует такие различия у двух испытуемых с ярко выраженными особенностями топологии осмотра. Заметно, что в тесте поиска различия в величине области сканирования между данными испытуемыми уменьшаются, а координаты ее центра-масс во всех случаях приближаются к геометрическому центру изображения. Рис. 1. Области сканирования (выделены светлыми оконтуренными фигурами) и их центры-масс (отмечены крестом) при свободном осмотре изображений и поиске их измененных фрагментов. В каждом случае представлены результаты для исп. S1 (1) и S2 (2), первичные данные прорежены по плотности фиксаций в фовеальном поле зрения в окрестностях каждой фиксации. Был проведен еще один вид анализа экспериментальных данных для детализации топологии осмотра. Определялись индивидуальные траектории трех типов в последовательных периодах каждого теста по 30 фиксаций у каждого испытуемого: группированные (более 2/3 фиксаций расположены в пределах области фовеального поля зрения, ГТ, в среднем, 11%), сканирующие (более 2/3 не группированных фиксаций, СТ, в среднем, 53%) и смешанные (в среднем, 36%). Обнаружено, что количество траекторий того или иного типа существенно варьируется у разных испытуемыех (от 75% до 16% для СТ; от 33% до 5% для ГТ). В частности, ГТ преобладали на всех этапах свободного осмотра трех тестовых изображений у исп. S1., в то время как СТ доминировали у исп. S2. Соотношение ГТ и СТ у этих испытуемых было: 50% к 18% и 16% к 58%, соответственно. В качестве пространственно-временной характеристики текущих элементов траекторий был тестирован следующий параметр. Каждая точка фиксации описывалась ее длительностью и величиной угла, образуемого двумя саккадами (предшествующей данной фиксации и следующей за ней). Формировалось единое описание каждой точки фиксации траектории: Xi = fii * 7 +ti где fii – значение угла траектории в i-й точке (fii∈ 0-6, шаг 30° ), а ti – время фиксации в i-й точке (ti ∈ 0-6, шаг 200 мс) На основании полученного описания каждой точки фиксации формировалось распределение частот конкретных значений Xi (в диапазоне от 0 до 48) в каждой траектории. Сравнение таких описаний экспериментальных траекторий показало возможность количественной оценки индивидуальных различий между испытуемыми (коэффициент корреляции варьировал в диапазоне от 0.15 до 0.81). Рис. 2 иллюстрирует выраженное различие между распределениями этого параметра для испытуемых S1 и S2 в условиях свободного осмотра (r=0.17) в отличие от теста поиска (r=0.72). Рис. 2. Распределение параметра Xi у исп. S1 ( ) и S2. ( тесте свободного осмотра (1) и поиска измененных фрагментов (2). )в 3.2. Индивидуальные особенности параметров глазных движений. Было проведено сопоставление ряда параметров глазных движений у испытуемых S1 и S2, проявивших описанные выше выраженные различия в топологии свободного осмотра тестовых изображений. По ряду параметров (таких, как средняя амплитуда саккад) различия между этими испытуемыми незначительны, по другим раличия достоверны (средняя длительность фиксаций и тестов, частота морганий). Данные по этим параметрам приведены в Таблице. Таблица. Сравнение параметров глазных движений у испытуемых S1 и S2 во время свободного осмотра изображений Im1, Im2 и Im3. Испытуемый Параметры Средняя, мс Длительность фиксаций Амплитуда Коэффициент вариации, % Средняя, град. S1 621±20 S2 323±11 97 75 3.42±0.07 3.84±0.10 Коэффициент вариации, % Длительность теста, с 461±24 88.13±15 Частота морганий, n/с 0.30 0.05 саккад 70 79 4. Заключение Проведенное исследование показало наличие существенных индивидуальных различий в топологии свободного осмотра и параметрах глазных движений. Наиболее выраженные различия обнаружены между двумя испытуемыми, с преобладанием, по-видимому, механизмов фокального (исп. S1) и пространственного внимания (исп. S2). Предполагается, что детализация тестированных параметров (прежде всего, площадь областей сканирования и расстояние между координатами центров-масс таких областей и ОИ даст возможность объективно оценить вклад механизмов пространственного и фокального зрительного внимания и получить критерии оценки зрительной задачи, решаемой в текущем периоде теста. Полученные количественные данные о динамике топологии, типе траекторий в текущем периоде теста, величине саккад и длительности фиксаций, будут использованы для разработки алгоритмов идентификации локальных элементов текущей траектории осмотра изображений и адекватной функции притяжения взгляда в модели [9] для имитации результатов, получаемых в конкретном психофизическом тесте у конкретного испытуемого. Предполагается, что комплексное исследование индивидуальнотипологических особенностей зрительного внимания по параметрам глазных движений позволит преодолеть некоторые ограничения при обобщении и формализации данных психофизических исследований, обусловленных многофакторной зависимостью результатов, их неполнотой и противоречивостью. Одной из важных задач для проведения следующих этапов детального психофизического исследования представляется разработка правил формирования репрезентативной выборки испытуемых с выраженными индивидуальными различиями зрительного внимания, основанных на представленных в данной работе результатах и на количественной оценке когнитивного стиля. Работа поддержана грантом РГНФ 09-06-95218 а/F. Литература 1. Барабанщиков В.А. Окуломоторные структуры восприятия. – М: Издательство “Институт психологии РАН”, 1997. - 384 c. 2. Белопольский В.И., Функциональная структура и динамика взора человека. Автореф. докт. дисс., М., 2008. 2. Величковский Б.М. Успехи когнитивных наук. // В мире науки.- 2003. – 12. – 87-93. 3. Ярбус А.Л. Роль движений глаз в процессе зрения. - М.: Наука, 1965. 166с. 4. Irwin DE, Fixation location and fixation duration as indices of cognitive processing. In Henderson JM and Ferreira F, (Eds) The interface of language, vision, and action: eye movements and the visual world. New York. Psychology Press, 2004,105-134. 5. Over E.A.B. et al. Coarse-to-fine eye movement strategy in visual search. // J. Vis. Res. - 2007. - 47. -2272-2280. 6. Unema PJA et al. Time course of information processing during scene perception: The relationship between saccade amplitude and fixation duration. //J Vis Cogn.–2005.–12. - 473-494. 7. Liversedge S.P., Findlay J.M. Saccadic eye movements and cognition.// Trends in Cogn. Scie. - 2000. – 4. - 1. - 6-14. 8. Podladchikova L.N. et al. Temporal dynamics of fixation duration, saccade amplitude, and viewing trajectory // J. Int. Neurosci. - 2009. -v.8. - iss.4 - 487501. 9. Podladchikova L.N. et al. Model-based approach to study of mechanisms of complex image viewing. // Opt. Mem. Neu. Netw. (Inf. Optics). – 2009. - 18. – 2. 114–121. 10. Rybak I. et al. Attention-guided recognition based on "What"; and "Where" representations: behavioral model. //Neurobiol. Attent.,Elsevier,Academic.2005.663- 670. 11. Walther D.B., Koch C. Attention in Hierarchical Models of Object Recognition. // Prog. in Brain Res. – Elsevier, 2007. - v.165. – p.57-78. 12. Zelinsky G.J. Specifying the Components of Attention in a Visual Search Task. // Neurobiology of Attention. – Elsevier, 2005. – p.395-400. 13. Priviterra C.M., Stark L. Scanpath theory, attention and image processing algorithms for prediction of human eye fixations. //Neurobiol. Attent.,Elsevier,Academic.2005. 296-299. 14. Калинин К.В, Петрушан М.В, Самарин А.И., Шапошников Д.Г. Алгоритмы активного рассматривания в системах распознавания лиц для санкционированного доступа. // Известия ТРТУ. Информационная безопасность. Изд-во ТРТУ. – 2006. - т.62. – 7. – с.59-64. 15. Aloimonus J., Weiss I., Bandyopadhyay A. Active vision. // Proc. of the Int. Joint Conf. on Computer Vision, 1987. – p.35-54. 16. Bajcsy R. Active perception. // Proc. of the IEEE, 1988. – V.76. – P.9961005. 17. Величковский Б.М. Когнитивная наука: Основы психологии познания. 2 т. — Т. 1. М.: Смысл: Издательский центр «Академия», 2006. — 448 с. 18. Ungerleider, L.G., and Mishkin, M. (1982) Two cortical visual systems. In: Ingle D.J., Goodale, M.A., and Mansfield, R. J. W. (Eds). Analysis of visual behavior (pp. 549-586) Cambridge, MA: MIT Press. 19. Dunin-Barkowski W.L. On Neuroscience-Based Informational Technologies for Authentic Models of Individual Mind. - Optical Memory and Neural Networks, 2007, Vol. 16, No. 1, pp. 47-50.