Объективные методы исследования. Математизация психологического знания B. Н. Антипов, А. В. Жегалло. Междисциплинарный естественно-научный подход в изучении способности восприятия глубины, объема образов плоскостных изображений с применением бинокулярного айтрекера

В. Н. Антипов'', А. В. Жегалло**

  • * Казанский (Приволжский) федеральный университет Этот адрес e-mail защищен от спам-ботов. Чтобы увидеть его, у Вас должен быть включен Java-Script
  • ** Институт психологии РАН, Центр экспериментальной психологии МГППУ Этот адрес e-mail защищен от спам-ботов. Чтобы увидеть его, у Вас должен быть включен Java-Script

Введение

Последние десятилетия следует характеризовать лавинообразным возрастанием времени воздействия плоскостными изображениями на зрительную систему человека. Экран монитора компьютера находится в поле зрения современного человека значительную часть суток. Возможности компьютерного трехмерного моделирования создают образы на экране монитора, кино и теле экранах, кардинально отличающиеся от ранее наблюдаемых и привычных объектов среды обитания. На основании исследований новой способности восприятия плоскостных изображений с эффектами глубины, объема нами высказывается предположение, что мы становимся свидетелями кардинального изменения зрительного восприятия в современной компьютеризованной среде обитания (Антипов, 2013).

Опросы, проведенные по выборке ~ в 1000 чел., показывают, что до 90% молодого поколения воспринимают эффекты рельефности на некоторых плоскостных изображениях, облачного покрова, на экране монитора компьютера и т. д. В классическом представлении стереоскопическое зрение человека основано на сравнении двух сетчаточных изображений глаз. В том случае если на сетчаточных изображениях образуется две идентичные проекции, то говорят о плоскостном восприятии объектов среды обитания. Такие варианты возникают при рассматривании любого плоскостного изображения или для предметов, удаленных далее чем на 250-300 м. Принято считать, что в условиях плоскостного изображения активируются монокулярные механизмы восприятия. Они создают вполне определенную иллюзию пространства, но не могут обеспечить все условия, присущие бинокулярному механизму зрения. Например, чтобы получить реальное восприятие пространства, сравнимое с бинокулярным механизмом, предлагаются использовать либо стереоскопические проекции, стереоскоп, либо голографию (Раушенбах, 2001). Это технические средства решения задачи возможности ощущения пространства, в том числе и произведений живописи. Некоторые психологи предлагают и иной путь нейтрализации физической проблемы бинокулярного механизма зрения - представить, что все образы картины находятся не на одной плоскости полотна, а как бы парят в пространстве (Грегори,1970). Однако механизма такого представления не предлагается.

Полагаем, запатентованная нами система тренинга позволит развить способность реального ощущения глубины, объема, пространства любых плоскостных изображений (далее: креативная глубина - КГ) (Антипов, 2005, 2010). Первые, но пока единичные результаты обучения следует считать обнадеживающими (Антипов, 2010).

Применение бинокулярного айтрекера (БА), регистрация движения глаз качественно (и количественно) повысило изучение восприятия креативной глубины. Проведены пробные эксперименты регистрации движения глаз в условиях восприятия глубины и объема плоских изображений. Показано, при восприятии глубины и объема изображений на мониторе компьютера айтрекера возникает не нулевая разность (ДХ) показаний Х-координат правого (Ra) и левого (Ее) глаз (Антипов, 2012). В настоящей работе представлен более подробный анализ исследований восприятия КГ и сравнение их с уровнем восприятия стереоглубины стереограммы, глубины SD-растрового изображения.

Процедура исследований

Исследования с бинокулярным айтрекером проводилась в Центре экспериментальной психологии Московского городского психолого-педагогического университета.

Стимульным материалом исследований на БА выбраны: плоскостное изображение фрагмента картины Д. Поллока «Лавандовый туман» (ПИ), на котором, по мнению испытуемого, наблюдаются эффекты восприятия глубины и объема (рисунок 1); растровое изображение (3Dras), смонтированное на основе четырех стереопроекций картины Б. Валеджо (рисунок 2); стереограмма (в основе картина Н. Хамидуллиной) с высоко- и низкочастотными составляющими (рисунок 3). Сте-

Плоскостное изображение ПИ

Рис. 1. Плоскостное изображение ПИ

Стереопроекции для SD-растра

Рис. 2. Стереопроекции для SD-растра

реограмма (СТ) использовалась в условиях наблюдения стереоскопической глубины (3D СТ). При этом следовало сконцентрировать взгляд до плоскости стереограммы, получить наложение (фузия) проекций картины и, когда останется четыре изображения, прочитать вертикально парящее слово. Если воспринимать стереограмму как плоскостное изображение (2D СТ), то проекций должно быть 3.

Стимульный материал выводился на экран монитора компьютера на расстоянии h=58 см от глаз. Растровое изображение крепилось на мониторе.

Всего было получено четыре массива числовых данных. Первый - условия наблюдения ПИ. Второй массив при восприятии глубины растрового изображения. Третий массив при восприятии стереограммы в плоскостном варианте 2D СТ. Четвертый массив при наблюдении стереограммы в условиях 3D СТ. Далее полученные значения Х-координат обрабатывались методами нелинейной динамики и находились статистические параметры - строились гистограммы разности ДХ.

Стереограмма СТ

Рис. 3. Стереограмма СТ

Проведенные исследования позволили разработать новую систему тестирования выявления КГ и в 2013-2014 учебном году применить ее в образовательном курсе «Творческий тренинг» Казанского федерального университета.

Результаты исследований: бинокулярный айтрекер

Для понимания полученных результатов воспользуемся схематичным построением местоположения глаз испытуемого и плоскостью установки стимульного материала (рисунок 4).

Рисунок 4 иллюстрирует необходимые параметры: угол вергенции, местоположение плоскости концентрации взгляда правого (Ra) и левого (Le) глаза в точку при условии, что разности AX(t) =XLe(t)—XRa(t)=0 (рисунок 4-0) и когда AX(t)<0 (рисунок 4-1). Начало координат находится в точке «Р».

Местоположение зрачков глаз и точка концентрации взгляда на плоскости изображения образуют треугольник АВС (АВ'С).

Угол вергенции а - это угол в вершине треугольника, т.е. в точке «В» («В'»). Рисунок 4 показывает следующие возможности: вычисление угла вергенции, местоположение плоскости концентрации взгляда правого (Ra) и левого (Le) глаза в точку при условии, что разности AX(t)=XLe(t)-XRa(t)=O (рисунок 4-0) и когда AX(t)<0 (рисунок 4-1). Начало координат находится в точке «Р». Местоположение зрачков глаз (А и С) и точка концентрации взгляда (В и В') на плоскости изображения образуют треугольник АВС (АВ'С). В обозначениях рисунка 4, расстояние между зрачками глаз d=AC, расстояние до плоскости изображения h=BO, PQ - горизонтальный размер изображения (экран монитора), плоскость которой перпендикулярна листу рисунка 4. Если точка концентрации взгляда В' располагается дальше плоскости изображения PQ, то AX(t)<0, то расстояние Н до плоскости концентрации взгляда в обозначениях треугольника АВ'С, Н=В'О. Третий случай - вариант концентрации взгляда перед плоскостью PQ приведет к уровню значений, когда по величине XLe(t)>XRa(t), т.е. AX(t)>0. Угол вергенции находился по выражению: a=2arctg((d-AX)/2h).

Плоскость воспринимаемого изображения (ПВИ) - это плоскость, на которой концентрируется в точку направление взора правого и левого глаза. Если ДХ=0, то она совпадает с плоскостью расположения рассматриваемого изображения (рисунок 4-0), т. е. с плоскостью монитора. При условии ДХ^О она находится либо бли-

Схема, поясняющая принцип анализа информации же, либо дальше (рисунок 4-1) экрана монитора. При варианте, показанном на рисунке 4-1, расстояние до плоскости воспринимаемого изображения H>h

Рис. 4. Схема, поясняющая принцип анализа информации же, либо дальше (рисунок 4-1) экрана монитора. При варианте, показанном на рисунке 4-1, расстояние до плоскости воспринимаемого изображения H>h.

Воспользуемся двумя подходами к анализу полученных результатов. Гистограммы разности позволяют провести первый уровень. Он заключается в анализе контуров гистограмм разности (рисунок 5) при восприятии стереограммы в условиях плоскостного (цифра «I») и трехмерного (цифра «II») восприятия. По горизонтальной шкале отложены значения числовых массивов айтрекера калиброванной шкалы монитора. По вертикальной - вероятности регистрации разности Х-координат. Полуширина контура «II», его местоположение позволяют провести калибровку и найти коэффициент, связывающий горизонтальную диспарантность построения трех стереоскопических проекций верхней части стереограммы. Известно расстояние между проекциями, т. е. вновь величина диспарантности. При наблюдении стереоглубины фокусировка глаз проводилась в точку между глазами и экраном монитора. Поэтому контур располагается в области положительных значений AX(t).

Второй подход заключается в пересчете значений разрешения шкалы монитора в шкалу расстояний в «см».

Стереограмма (рисунок 3) построена при следующих параметрах. Число стереопроекций крупной периодики п=3. При ее плоскостном восприятии число проекций - 3. На экране монитора айтрекера: размер проекции по горизонтали L0=43 мм, расстояние между ними проекциями L=72 мм, диспарантность смещения образов на стереопроекциях - 4-5 мм, расстояние между мелкой периодикой 1=7 мм. Погрешность измерений расстояния была в пределах ±15%. На рисунке 7-1 показана гистограмма разности в том варианте, если плоскость воспринимаемого изображения совпадает с плоскостью монитора, т.е условие 2D СТ. Максимум контура

Гистограммы разности ДХ при восприятии стереограммы

Рис. 5. Гистограммы разности ДХ при восприятии стереограммы

Max(2DAX(t)) располагается при значении - 8,4 ед. шк., или -2,2 мм. Полуширина контура составляет величину 10,5 мм.

Восприятие стереоскопической глубины стереограммы проводится при концентрации взгляда в точку между глазами и плоскостью монитора (3D СТ). Число стереопроекций становится 4, две средние приобретают пространственную перспективу. Они воспринимаются «парящими» над общим фоном, образованным мелкими составляющими размером 1=7 см. Вертикально сверху вниз «парит» слово «Россия».

Максимум гистограммы разности Max(3DAX(t)) находится при 225 ед. шк., что составляет в пересчете на смещение стереопроекии 59,2 мм (рисунок 5-П). Полуширина контура - 27 ед. шк., или 7,1 мм. На уровне 0,1 высоты контур имеет ширину 52,7 ед. шк., или 13,9 мм.

В другой плоскости: концентрация взгляда перед экраном монитора приводит к перемещению плоскости воспринимаемого изображения на расстояние 30,0 см от глаз. Поэтому разность координат ДХ уменьшается до среднего значения с ранее рассчитанных 72 мм до 59,9 мм. Интервал разности на уровне 0,1 от максимального значения находится в диапазоне 54-65,5 мм, что приводит к интервалу расположения плоскости воспринимаемого изображения в диапазоне от 28,7 до 31,5 см от глаз. Следовательно, диспарантность образов на стереограмме, в первом приближении определенная на уровне 4-5 мм, приводит к восприятию стереоскопической глубины в плоскости перпендикулярной плоскости стереограммы в диапазоне 28 мм.

По соотношению местоположения максимума Max(3DAX(t)) в шкале расстояния L=72 мм, определяется местоположение максимума контура плоскостного восприятия стереограммы Max(2DAX(t))=8,4 ед. шк., или 2,2 мм. Зная ширину контура гистограммы разности при стереоскопическом восприятии и плоскостном восприятии, следует сделать вывод, что и в условиях плоскостного восприятия наблюдаются эффекты изменения глубины воспринимаемого плоскостного изображения по величине не меньше, чем в условиях получения горизонтальной диспарантности для стереопроекций.

На рисунке 6 представлена гистограмма разности координат при восприятии растрового изображения rasAX=3DrasXLe-3DrasXRa. Максимум гистограммы Max (rasAX(t)) смещен в область отрицательных значений на расстояние в 59 ед. шк. монитора айтрекера. В пересчете на расстояния оно соответствует оценочному расстоянию стереоскопического смещения на величину 15,5 мм. Полуширина контура составляет значение 22,4 мм, а на уровне 0,9 от максимума - 39,7 мм. В медианной разности ras Д X(t) =24,9 мм, а на уровне 0,9 от максимума изменяется в интервале 14,2-35,2 мм. Пересчет на уровни плоскости воспринимаемого изображения расстояние равно 95 см от глаз. Интервал изменения плоскости воспринимаемого изображения находится в диапазоне от 74,5 до 128,9 см. Т. е. за плоскостью растрового изображения на расстоянии 16,5-70,5 см от него. Угол вергенции в максимуме контура а=3,9°. Стереоскопические проекции с горизонтальной диспарантностью и плоскости концентрации взгляда, располагаемые на расстоянии Н, находятся во взаимно перпендикулярных состояниях.

Восприятие плоскостного изображения ПИ. При восприятии изображения ПИ максимум контура гистограммы разности (рисунок 7) располагается в области отрицательных значений, на уровне - 65 ед. шк. В пересчете на диспарантность это 17,1 мм. Полуширина и ширина на уровне 0,1 максимального значения контура составляют величину 85 ед. шк. (или 22,4 мм) и 123 ед. шк. (или 32,4 мм) соответственно. Медианное значение разности Х-координат в максимуме Мах (ПИДХ(ДО),

Гистограмма разности при восприятии

Рис. 6. Гистограмма разности при восприятии

Гистограммы разности при растрового изображения восприятии плоскостного изображения

Рис. 7. Гистограммы разности при растрового изображения восприятии плоскостного изображения

составляет 21 мм, а интервал изменения контура на уровне 0,1 высоты контура изменяется от 12,3 до 28,6 см. Угол вергенции апи=4,20. Вычисленное местоположение воспринимаемой плоскости в максимуме контура Мах (пиДX(At)) располагается на расстоянии 86,3 см от глаз. Диапазон изменения воспринимаемой плоскости на уровне 0,1 высоты контура изменяется от 71,8 до 104,8 см.

Сравнение контуров гистограмм разности при стереоскопическом восприятии глубины стереограммы, глубины растрового изображения показывают, что аналогичные характеристики получены при восприятии ПИ и они одного уровня величины и подчиняются общим закономерностям восприятия. Более того, допустимо сделать вывод, что при восприятии креативной глубины ПВИ для цветовой гаммы находятся на различных расстояниях от плоскости расположения ПИ. Аналогично располагаются на различной глубине и образы, формирующие стереоскопическую глубину стереограммы 3D СТ. Что произойдет, если в условиях наблюдения стереоскопической глубины перемещать глаза относительно нее по горизонтали? Наблюдается перемещение пространства воды на двух средних крупных проекциях. В чем причина? Это проявление построения стереограммы с различным значением величины горизонтальной диспарантности. Допустим, при наблюдении глубины плоскостного изображения ПИ и аналогичного смещения глаз испытуемый будет утверждать о том, что происходит движение отдельных слоев цвета. Такой процесс и будет доказывать, что для него происходит концентрация взгляда за пределами плоскости расположения ПИ. Иными словами, происходит процесс восприятия глубины и объема ПИ.

Представленный выше материал в феврале 2013 года оформлен в ФИПС как заявка на изобретение №2013108497.

Проведенные исследования позволили разработать новую систему тестирования выявления КГ и в 2013-2014 уч. г. применить ее в образовательном курсе «Творческий тренинг» Казанского федерального университета.

Результаты исследований: система тестирования

В течение весеннего семестра 2013-2014 учебного года группа студентов КФУ (20 чел.) проходила обучение по курсу «Творческий тренинг». Целью практических занятий было развитие (инициирование) способности воспринимать плоскостные изображения с условием наблюдения глубины и объема. Цикл обучения был аналогичен описанию работы (Минзарипов, 2009). Дополнительно в процесс обучения была включен тест, учитывающий выше представленные результаты исследований.

В таблицу 1 помещены результаты тестирования начальных и завершающих семестр занятий. Студентам демонстрировались плоскостные изображения. Одно из них - рисунок 1 - ПИ. Предлагалось ответить на вопрос о восприятии цветовых распределений ПИ. Сначала в статическом состоянии положения глаз. Затем при горизонтальном смещении головы.

Таблица 1

Результаты тестирования студентов КФУ цикла обучения 2013-2014 учебного года

Периоды проведения тестирования

Количество студентов

Статическое состояние Наблюдаю объемность

Перемещение головы Наблюдаю движение слоев

Кол-во

%

Кол-во

%

1

2

3

4

5

6

Начало занятий

13

9

69

3

23

Окончание занятий

14

14

100

5

36

Начало занятий. Из таблицы видно, что 69% студентов говорили о восприятии объемности образов ПИ. Трое (или 23%) отмечали движение отдельных цветовых слоев в условиях смещения головы.

Завершение семестрового цикла занятий. Все студенты утверждают, что воспринимают объемность образов ПИ. Перемещение головы - движение слоев регистрируют пять студентов, или 36% присутствующих.

Можно сделать два вывода.

Первый. Начало занятий. Три студента перед началом занятий уже были способны воспринимать глубину и объемность стимульного изображения ПИ. Следовательно, для них ПВИ находится вне плоскости ПИ Аналог восприятия - это рисунок 7. Для остальных 69% студентов реализован вариант рисунка 5-1.

Второй вывод. Система тренинга доводит восприятие глубины образов ПИ для всех студентов. Число студентов, способных воспринимать глубину слоев при движении головой, возрастает до 5 (или 36%).

Заключение

Исследования на бинокулярном айтрекере с одним испытуемым (первый автор доклада), графический материал гистограмм разности демонстрирует, что в условиях восприятия глубины и объема плоскостного изображения ПИ фокусировка правого и левого глаз происходит в диапазоне расстояний от 14 до 50 см за плоскостью расположения ПИ. Глубина растрового изображения воспринимается в интервале от 16 до 71 см за его плоскостью относительно местоположения глаз. Сопоставление этих диапазонов плоскостей фокусировок глаз однозначно демонстрирует возможность выявления восприятия глубины образов 2П-изображений.

Местоположение расположения плоскостей фокусировок глаз вне плоскости расположения плоскостного изображения приводит к тому, что при перемещении головы наблюдается смещение одних слоев цветовых распределений относительно других. Такой же процесс наблюдается и при восприятии стереоскопической глубины стереограмм. Однако для стереограммы выполнено смещение образов друг относительно друга. Иными словами получен набор значений горизонтальной диспарантности. Заметим, что для плоскостного изображения НЕТ НИКАКОГО смещения.

Возникает вопрос - не является ли аномалией полученные результаты с первым автором доклада? Цикл обучения и тестирования студентов Казанского университета показывает (в 2014 г.), что 23% студентов имеют аналогичную «аномалию». Более того, после обучения «аномалия» регистрируется для 36%. Напрашивается вывод об инициировании и структуризации иных, пока не изученных, новых механизмов обработки информации в нейронных сетях головного мозга. Возможно, развитие новых механизмов обработки зрительной информации приведет к преобразованию монокулярных признаков перспективы 2Б-изображений в реальное ощущение пространства. Более того, ощущение пространства будет зависеть только от уровня психической (когнитивной) подготовки и тренинга каждого человека.

Литература

Антипов В.Н. Патент 2264299 RU. Способ формирования трехмерных изображений (варианты). Опубликован 20.11.2005; Бюллетень №32.

Антипов В.Н., Антипов А. В. Патент №2391948 RU. Способ развития стереоскопического зрения. Опубликован 20.06. 2010. Бюллетень №17.

Антипов В.Н. и др. Рельефность плоских изображений сегодня - это модель развития зрения человека в будущем // Экспериментальная психология в России: традиции и перспективы / Под ред. В. А. Барабанщикова. М.: Изд-во «Институт психологии РАН», 2010. С. 200-205.

Антипов В. Н., ЖегаллоА. В. и др. Экспериментальное изучение ЗП-восприятия образов плоскостных изображений // Экспериментальный метод в структуре психологического знания / Отв. ред. В. А. Барабанщиков. М.: Изд-во «Институт психологии РАН», 2012. С. 187-194.

Антипов В.Н., Жегалло А. В. Восприятие объема в техногенной среде // Эволюционная и сравнительная психология в России: традиции и перспективы/ Под ред. А. Н. Харитонова. М.: Изд-во «Институт психологии РАН», 2013. С. 333-336.

Грегори Р.Л. Глаз и мозг (Психология зрительного восприятия. М.: Прогресс, 1970.

МинзариповР.Г.и др. О применении методики развития объемного креативно-когнитивного зрения в инновационном образовательном пространстве //Ученые записки Казанского университета. Сер. «Естественные науки». 2009. Т. 151. Кн. 3. С. 266-277.

Раушенбах Б. Геометрия картины и зрительное восприятие. СПб.: Азбука-классика, 2001.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >