Проверка первичных шкал на нормальность распределения
На первом этапе психометрической проверки первичные шкалы теста оценивались на нормальность распределения. Описательная статистика по первичным шкалам теста приведена в таблице 7.
Таблица 7
Описательная статистика первичных шкал теста MSCEIT v. 2.0
Шкалы MSCEIT |
Среднее |
Ст. отклонение |
Асимметрия |
Стандарт, ошибка асимметрии |
Эксцесс |
Стандарт, ошибка эксцесса |
А |
0,39 |
0,06 |
-0,99 |
0,08 |
1,03 |
0,17 |
В |
0,30 |
0,04 |
-0,53 |
0,08 |
0,48 |
0,17 |
С |
0,39 |
0,07 |
-0,67 |
0,08 |
0,09 |
0,17 |
D |
0,31 |
0,04 |
-0,75 |
0,08 |
0,83 |
0,17 |
Е |
0,36 |
0,07 |
-0,85 |
0,08 |
0,80 |
0,17 |
F |
0,37 |
0,06 |
-1Д2 |
0,08 |
1,89 |
0,17 |
G |
0,42 |
0,08 |
-0,71 |
0,08 |
0,52 |
0,17 |
Н |
0,30 |
0,05 |
-1,20 |
0,08 |
1,83 |
0,17 |
Сравнение показателей асимметрии и эксцесса с соответствующими стандартными ошибками показывает ненормальность распределения всех первичных шкал теста. Применение критерия Колмогорова-Смирнова для сопоставления наблюдаемых распределений с теоретически ожидаемыми нормальными также показывают отступление распределений от нормального закона.
В связи с этим в дальнейшей психометрической проверке теста принято решение пользоваться преимущественно непараметрическими критериями.
Остается неясным, проводилась ли проверка шкал на нормальность распределения американскими коллегами, поскольку в рассматриваемых работах таких данных нет. Можно предположить, что отступление данных от закона нормального распределения обусловлено особенностями кодировки по консенсусу. В таком случае интервальная шкала искусственно переводится в порядковую (ранговую), поскольку «расстояния» между различными ответами изменяются. Вероятно, необходимость применения американскими коллегами непараметрических методов статистики в данном случае обусловлена именно особенностями теста.
Однородность условий проведения исследования
Поскольку тестирование общей выборки проводилось разными группами исследователей, в разных условиях, в разное время и на разных группах респондентов, сами условия проведения опроса могут служить мощным внешним фактором, вносящим «шум» в интересующие нас закономерности взаимосвязей переменных. Для психометрической адаптации теста необходимо, чтобы отдельные компоненты выборки (опрашиваемые разными исследователями) не обнаруживали чересчур сильных различий в закономерностях взаимосвязи собранных данных. Другими словами, в условиях сотрудничества нескольких исследовательских групп необходимо, помимо соблюдения требования репрезентативности, поддерживать естественные различия в условиях проведения опроса в тех пределах, в которых они не оказывают чересчур сильного влияния на получаемые результаты.
Для проверки однородности условий проведения исследования в рамках совокупной выборки нами использовался метод нейронных сетей. Данный метод является мощной стратегией разведочного анализа данных, при которой «входные» показатели и все мыслимые взаимосвязи между ними (включая возможное наличие опосредующих переменных) оцениваются как предикторы некоторой «выходной», зависимой переменной. В данном случае в качестве предикторов выступали первичные шкалы эмоционального интеллекта, а в качестве зависимой переменной - условный код, который приписывался респонденту в зависимости от того, какая группа исследователей работала с ним. При этом каждой группе исследователей последовательно приписывался код 1, а остальным - код 0. В итоге проверялась гипотеза о наличии чрезмерной «непохожести» данных, полученных каким-либо одним исследователем, на весь остальной массив данных.
В результате проверки нейросетевых моделей обнаружилось, что взаимодействие первичных шкал эмоционального интеллекта может значимо предсказать, какие испытуемые тестировлись какой (именно данной) исследовательской группой. Точность предсказания (отнесения испытуемого именно к этой группе, тестирование которой проводилось именно данной исследовательской группой) составляла 87-89%, что значимо выше ожидаемой (при предположении об однородности условий проведения исследования) отметки в 50%. При этом точность предсказания для всех остальных исследовательских групп не превышала 60%. Численность группы испытуемых, о которой идет речь, составляла 208 человек, большинство из них - девушки. Отдельно проверялась гипотеза о влиянии фактора пола, в результате проверки было обнаружено, что пол испытуемого может быть предсказан на основании взаимодействия шкал эмоционального интеллекта с вероятностью в среднем 60-63%. Таким образом, неоднородность в выборке обусловлена не половыми различиями, а именно различиями в условиях проведения тестирования.
При проверке психометрических характеристик теста мы исходим из приоритета структурной (факторной) валидности над всеми остальными показателями. Это обусловлено тем, что структурная валидность, во-первых, является самой сложной и «чувствительной» характеристикой теста, во-вторых, отражает адекватность теоретического конструкта, лежащего в ее основе, т. е. имеет наибольший содержательный смысл.
Проверка пригодности четырехфакторной модели эмоционального интеллекта для данной выборки в 208 человек показала практически абсолютную пригодность (х2 = 6,5; df = 14; RMSEA = 0, GFI - 0,992, CFI = 1), что вызывает сомнения в отсутствии каких-либо посторонних влияний. Таким образом, данная часть выборки
с точки зрения структурной валидности теста оказывается «слишком хорошей». При удалении этой части испытуемых из общей выборки пригодность структурных моделей (на общей выборке) значимо возрастает, хотя и не достигает маловероятных абсолютных значений. Индексы пригодности при удалении этой части московской выборки оказываются подобными индексам, полученным на пермской выборке.
Все эти соображения обусловили тот факт, что данную группу респондентов (208 человек) было решено из дальнейших анализов удалить.
Новая матрица сырых данных (которая используется в дальнейших анализах) включает 638 респондентов, из них 346 из Перми, 292 из Москвы. Для каждой выборки (пермской, московской и общей) были вычислены свои баллы по консенсусу («ключи»). Данная выборка характеризуется достаточной однородностью условий проведения тестирования разными исследовательскими коллективами.