ЭЛЕМЕНТЫ СОВРЕМЕННОЙ ТЕОРИИ ТЕСТОВ

Сходство IRT-подхода с клинической диагностикой

Как мы указывали выше, между КТТ и теорией анализа ответов на пункты (IRT) существуют фундаментальные различия. В КТТ выраженность конструкта определяется путем суммирования ответов по всем пунктам шкалы. Обычно ответы суммируются в общую оценку, а затем конвертируются в стандартную оценку. В IRT определение выраженности конструкта у испытуемого не основано на сложении ответов на пункты в общую оценку по тесту. Меры выраженности конструкта изначально неизвестны, и оцениваются они в процессе построения измерительной модели. В этой связи С. Эмбретсон и С. Рейз отмечают, что в IRT процесс получения измерительных оценок сходен с постановкой клинического диагноза. В процессе клинической диагностики предварительный диагноз оценивается с точки зрения правдоподобия. Клиницист определяет, насколько правдоподобен данный диагноз при данном поведении и проявлениях. Ответы на пункты также являются проявлениями поведения испытуемого и одновременно признаками и симптомами оцениваемой латентной переменной. При наличии данного ограниченного контекстом исследования поведения испытуемого и при наличии знания того, как на поведение влияет скрытый синдром, определяется наиболее подходящий диагноз для объяснения природы данного поведения. Имея паттерн ответов испытуемого и знание того, как особенности пунктов влияют на поведение, можно определить, какой уровень конструкта наиболее подходит для объяснения такого паттерна ответов. Предположим, что испытуемый получил набор трудных заданий и все их выполнил. Какой уровень выраженности конструкта наиболее правдоподобен для такого паттерна ответа? Низкий уровень маловероятен. Средний уровень может иметь место с большей вероятностью, но наиболее правдоподобен высокий уровень выраженности конструкта [16].

Допущения IRT-моделей

Как и в других основанных на моделировании подходах, преимущества IRT зависят от степени, в которой данные соответствуют допущениям модели. Современная теория тестов основана на допущениях одномерности и локальной независимости.

Одномерность

Все модели IRT требуют адекватной размерности конструкта. Современная теория тестов содержит предположение о том, что перечень диагностических пунктов оценивает только один конструкт. Данное предположение называется одномерностью. В основе этого допущения лежит концепция локальной независимости, которую мы рассмотрим ниже. Одномерность подразумевает наличие одного доминантного фактора, который определяет ответы испытуемых на пункты теста. Данный фактор включает только один психологический конструкт, измеряемый данным тестом [43].

В одномерных моделях единственная латентная черта достаточна для характеристики индивидуальных различий. В связи с этим одномерная модель подходит к данным, в которых один общий фактор определяет ответы на пункты. Как отмечают С. Эм- бретсон и С. Рейз, иногда одномерные модели подходят для пунктов, в основе которых лежат два или более факторов. В этом случае латен тная переменная является комбинацией этих факторов [16].

Наиболее простой метод оценки одномерности шкалы заключается в анализе собственных чисел факторной корреляционной матрицы пунктов. Матрица рассчитывается на основе парных корреляций Пирсона, иначе называемых ф-корреляциями. Как правило, факторная корреляционная матрица состоит из нескольких факторов. О тсутствие однофакторной структуры не говорит о многомерности, поскольку различные факторы могут отражать разные стороны одного и того же конструкта или иметь незначительный вес. Для оценки размерности можно использовать график «каменистой россыпи». Число факторов перед «падением» графика и свидетельствует о количестве размерностей шкалы. Еще одно правило оценки одномерности шкалы состоит в определении количества факторов с собственными числами больше 1. Если таких факторов больше одного, то, скорее всего, шкала не одномерна [15].

Локальная независимость

Допущение локальной независимости означает, что на одном и том же уровне выраженности конструкта диагностические пункты не связаны друг с другом. Другими словами, вероятность ключевого ответа на пункт полностью определяется выраженностью конструкта испытуемого, не включая влияние ответов на другие пункты [16]. Локально зависимые пункты нарушают размерность шкалы, делая ее неодномерной [45].

Локальная независимость ответов на пункты представляет собой важное условие IRT. Согласно Дж. Наннели и А. Бернштейну это условие позволяет определять объединенную вероятность ключевых ответов на пункты как произведение их отдельных вероятностей. Произведение вероятностей ответов на пункты в паттерне ответов является необходимой математической процедурой в процессе реализации математического алгоритма IRT. Локальная независимость также означает, что в гомогенной выборке испытуемых с одним и тем же уровнем конструкта все испытуемые с одинаковой вероятностью предоставят ключевой ответ на данный диагностический пункт [43].

Независимость ответов испытуемых на пункты обеспечивается следующими факторами: неизменностью и одномерностью психологического конструкта, отсутствием намеков на ключевые ответы в диагностических пунктах (исключение — ситуации, когда одни пункты предоставляют намеки к ключевым ответам на другие пункты) [25].

В неоднородной популяции испытуемых наблюдаемые ответы могут коррелировать друг с другом, не нарушая локальную независимость. Это связано с тем, что корреляции образуются между ответами испытуемых, обладающими разными уровнями конструкта. Понятие локальной независимости подразумевает отсутствие корреляций между ответами испытуемых с одним и тем же уровнем конструкта [45]. В связи с этим С. Эмбретсон и С. Рейз отмечают, что условие локальной независимости обеспечивает достаточность IRT-модели эмпирическим данным. Локальная независимость достигается, когда все отношения между пунктами полностью характеризуются IRT-моделью. Например, высокие интеркорреляции между пунктами описываются только особенностями их параметров (трудность, дискриминативность) и мерами конструкта испытуемых, определенными IRT-моделыо [16]. Локальная независимость тесно связана с одномерностью шкалы. Одномерность означает статистическую связь пунктов с одной латентной чертой. Важную идею, концептуально объединяющую одномерность и локальную независимость, высказывают Л. Крокер и Дж. Алгина. С их точки зрения, тест одномерен в том случае, если его пункты статистически зависимы в целой популяции, что обусловливает измерение только одного латентного конструкта. Вместе с тем в каждой субпопуляции испытуемых, которая гомогенна по уровню выраженности конструкта, пункты являются статистически независимыми. Условие независимости пунктов соблюдается только для определенного уровня выраженности конструкта, т.е. носит локальный характер на континууме конструкта [13]. Если допущение о локальной независимости верно, то на любом уровне выраженности конструкта ответы на пункты измеряют только один конструкт, тем самым определяя одномерность шкалы.

Проверка условия локальной независимости осуществляется с помощью индекса Йена Q3. Он основан на вычислении коэффициента корреляции между остатками пар ответов. Остаток представляют собой разность между ожидаемой вероятностью ответа на пункт и наблюдаемым ответом. Для оценки нарушений локально ii независимости имеют значение пункты с корреляциями между остатками ответов более 0,2. В случае соблюдения локальной независимости корреляции между парами остатков приближаются к нулю [15; 16]. Кроме индекса 0з> предложен также индекс (Д, который основан на анализе остатков после оценки качества модели. Оцениваются пары пунктов, имеющие неожидаемые ковариации по сравнению с ковариациями других пар пунктов [16].

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >