НОВЫЕ ПОДХОДЫ К ИЗМЕРЕНИЮ — IRT-МОДЕЛИ. СРАВНЕНИЕ СОВРЕМЕННОЙ И КЛАССИЧЕСКОЙ ТЕОРИИ ТЕСТОВ

Исторические предпосылки

В психометрическом мире попытки создания объективной психометрической шкалы предпринимались с начала XX в. Прообраз концепции и методологии теории анализа тестовых заданий (Item Response Theory — IRT) был заложен еще в первой четверти XX века.

В 1926 г. Э. Торндайк высказал необходимость создания равноинтервальной шкалы, в которой ноль отражал бы отсутствие конструкта, а числа от 1 до 4 представляли бы возрастающие его уровни с постоянной разностью [7].

В 1925 г. Л. Тёрстоун опубликовал работу «Метод шкалирования психологических и педагогических тестов», где предложил процедуру шкалирования пунктов теста Вине — Симона в зависимости от возраста детей, проходящих тестирование. Каждый пункт теста имел свою локализацию на хронологической шкале. Локализация пунктов определялась по оценке доли детей определенного возраста, выполнивших какое-либо тестовое задание [54]. Центрирование внимания в этой работе на шкалировании тестовых пунктов стало первым шагом в развитии IRT-подхода. «Абсолютная шкала» Л. Тёрстоуна имела схожие черты с равноинтервальной шкалой. Однако подобные шкалы не были объективными, поскольку зависели они от распределения конструкта в популяции испытуемых. Коллеги и студенты Тёрстоуна продолжили разработку его основных идей и положений. В 1940-50-х гг. М. Ричардсон (М. Richardson) и Дж. Фергюсон (J. Ferguson) предложили нормальную оживальную модель (Normal Ogive Model), которая представляла доли ключевых ответов на отдельные пункты как функцию нормализованных оценок [21; 48]. Д. Лоули (D. Lawley) (1943) разработал статистический анализ свойств нормальной оживальной кривой и описал процедуры оценивания методом максимального правдоподобия параметров пунктов и линейные аппроксимации этих оценок [28].

Как мы уже отмечали, важным аспектом измерения является установление правила эквивалентности единицы измерения и количества измеряемого объекта. В измерении психологических конструктов правило эквивалентности представляется в виде функциональной связи между психологическим конструктом и его внешним индикатором. Классическая теория тестов лишь допускает линейный характер взаимоотношений между латентным психологическим конструктом и общей оценкой по тесту. Линейность связи здесь гипотетична, она не подвергается анализу и проверке в данном подходе. Представление о линейной функциональной связи было имплицитно включено в КТТ. Вместе с тем с начала 1950-х гг. предпринимались попытки описать характер связи латентной переменной и ее индикатора. Как мы уже указывали, впервые графическую функцию связи латентного конструкта и индикатора предложил в 1946 г. Л. Такер. Она была названа характеристической кривой пункта. Такер обозначил характеристическую кривую как математическую функцию, связывающую вероятность правильного (ключевого) ответа на пункт с уровнем выраженности латентного конструкта, оцениваемого данным пунктом и другими пунктами в данной совокупности [4]. Фактически характеристическая кривая — первое графическое представление правила эквивалентности. При этом в качестве единицы измерения выступала вероятность ключевого ответа на пункт теста. В 1944 г. Л. Гуттман представил свой подход к шкалированию признаков, получивший название шкалограммного анализа. Применительно к данной теме важным является то, что в шкалограммном анализе Гуттман впервые предпринял попытку шкалирования качественных признаков и доказал возможность использования кумулятивного подхода в шкалировании. По сути шкалограммный анализ стал первой попыткой построения измерительной модели на основе характеристических кривых [4].

В 1947 г. Джейн Лёвинджер (J. Loevinger) отметила необходимость достижения объективности в психологическом измерении следующим образом: «подходящий метод шкалирования должен быть реализован в виде производной шкалы, которая является независимой от исходной шкалы и исходной группы испытуемых» (1947) [32]. Позже данную идею высказывали Г. Галликсен (1950), Л. Такер (1953) и В. Ангоф (1960). Основная мысль их положений сводилась к тому, что психологический тест, который претендует на постоянную пригодность к использованию, должен иметь шкалу, стабильную во времени, допускающую использование системы единиц измерения и позволяющую накапливать данные для исторических сравнений [12]. Именно этот важный компонент напрочь отсутствовал в традиционном подходе к психологическому измерению на основе концепции Стивенса. Данной концепции по сей день неосознанно, как будто так это и должно быть, следует большинство психологов и других пользователей психодиагностических методик. Такое положение дел в психометрике и психодиагностике было названо методологическим расстройством мышления [40].

В 1950-х гг. известный американский психометрист Ф. Лорд опубликовал свои работы, содержащие вероятностную модель нормальной оживы [29]. С работ Лорда и началось развитие нового подхода в психометрике, получившего название «теория ответов на пункты». Данный подход имеет еще одно название, отличающее его от классической теории тестов — современная теория тестов. Другие русскоязычные названия IRT: теория латентных черт, теория анализа тестовых заданий. 1RT разрабатывалась с целью выявления и описания функциональной связи между латентным психологическим конструктом и его наблюдаемым индикатором (ключевым ответом на пункт теста). Как указывает 11.В. Крупенкова, там, где в классической теории тестов делалось допущение, в IRT предложен математический закон. Этот закон постулирует, что вероятность ключевого ответа на пункт теста зависит от выраженности психологического конструкта у испытуемого и специфических параметров пункта. IRT предоставляет формально математическое описание и графическое представление данного постулата [4].

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >