ВВЕДЕНИЕ В СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ НАЦИОНАЛЬНОЙ ОЦЕНКИ

БАЗА ДАННЫХ ДЛЯ ПРОВЕДЕНИЯ АНАЛИЗА

Данные национальной оценки всегда содержат отметки достижений учащихся, которые могут быть представлены множеством различных способов. Это может быть, например, число заданий в тесте, на которые учащийся ответил правильно (хотя такая отметка не всегда очень показательна); процент заданий, на которые даны правильные ответы. Или шкалированные баллы, в которых распределение баллов с полученным средним значением и стандартным отклонением переводится в распределение с другим средним значением и стандартным отклонением. Большинство национальных оценок также собирают дополнительные данные. Такие сведения могут относиться к школам (например, размер, тип); учителям (например, квалификации, опыт); учащимся (например, возраст, время, затрачиваемое на выполнение домашнего задания); родителям и домашней обстановке (например, уровень образования родителей, количество книг в доме).

Собранная информация будет содержать ряд различных переменных. Некоторые переменные будут категориальными и распределять индивидов по группам, например по уровню образования или гендерному признаку. Иные переменные, называемые дискретными, включают количественные измерения или результаты подсчетов, например число детей в семье. Дискретные переменные получают путем подсчета, и между полученными баллами нет промежуточных значений. Непрерывные переменные, напротив, описывают количественные результаты измерений, которые могут принимать любое значение между двумя указанными, например расстояние от дома учащегося до школы. Тип данных накладывает ограничения на вид статистического анализа, который может проводиться, а также на способ, с помощью которого данные могут быть представлены графически.

Анализ обычно начинается с исследования простых численных данных, представленных либо в форме сводных статистических показателей, либо в графиках или диаграммах, либо обоими способами. Как будет более подробно рассмотрено ниже, на данной стадии основное внимание уделяется описанию, хотя полученные результаты могут привести к выдвижению гипотез, которые будут подлежать проверке на более поздних стадиях. Стадия исследовательского анализа данных также дает возможность проверить качество данных путем проверки отсутствующих и выпадающих значений, разрывов и ошибочных значений, хотя они должны быть определены на стадии чистки данных (см. Freeman and O’Malley 2012). На этой стадии также раскрывается характер информации, указывающий на то, является ли такое распределение симметричным, асимметричным или кластерным. На этой ранней стадии графическое отображение в форме столбиковой диаграммы, гистограммы или диаграммы типа «ящик с усами» может быть очень информативным для выявления паттернов данных.

Когда в отношении индивидов доступно более одного наблюдения, можно исследовать связи между переменными, например связи между грамотностью учащихся и достижениями по арифметике или между достижениями по математике и факторами домашней среды. Связь между парой переменных называется двумерной. Ввиду того, что многие переменные в рамках национальной оценки будут взаимосвязаны, необходимо проводить многомерный анализ, включающий процедуры прогнозирования результатов учащихся по одной переменной (например, достижения по чтению) на основе значений других переменных (например, гендерный признак или контекстные факторы домашней среды учащегося). Первым этапом многомерного анализа является отображение и исследование парных корреляций между переменными в корреляционной матрице. В настоящей книге содержится введение в многомерный анализ (регрессионный анализ; см. гл. 6). Однако он не имеет дело с более сложными формами анализа, например многоуровневым моделированием, в рамках которого анализ направлен на отражение структуры, обнаруживаемой в системах образования (учащиеся группируются в классы, классы -в школы, школы - в регионы).

Читатели смогут развить свои аналитические навыки, проделав ряд упражнений с использованием базы данных на CD-диске, прилагающемся к настоящей книге. База данных, аналогичная используемой в разделе по формированию выборок в книге «Проведение национальной оценки учебных достижений» (Dumais and Gough 2012а), содержит тест учебных достижений. Она также содержит данные, измененные на основе результатов, полученных в ходе реальной оценки достижений по математике, которая была проведена в 4-м классе в небольшой стране. Они представлены в настоящей серии как данные страны под вымышленным названием Сенц.

В последующих главах описан ряд аналитических задач, которые обычно выполняются с результатами, полученными в рамках национальной оценки. Проведя такой анализ, читатели познакомятся с набором статистических методов, которые они смогут применить к своим собственным данным. В большей части исследований используется программное обеспечение WesVar. В отличие от многих других программных пакетов WesVar учитывает сложность разработки национальной оценки при проведении статистического анализа, например оценку дисперсии и погрешность выборки. В частях II и IV книги 3 «Проведение национальной оценки учебных достижений» из той же серии подробно описано формирование комплексных выборок (Dumais and Gough 2012а, 2012b).

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >