РЕГРЕССИЯ

Регрессия во многом отличается от корреляции. Во-первых, коэффициент корреляции не указывает природу связи между переменными, регрессия, напротив, моделирует зависимость одной переменной от другой или нескольких других переменных. На основании теории или исследований результаты по одной переменной (зависимая переменная, обычно представленная на вертикальной оси [у] в диаграмме) считаются зависимыми или обусловленными результатами по другой переменной (независимая переменная, обычно представленная па горизонтальной оси [х]). Например, можно ожидать, что результаты теста по чтению будут зависеть от количества времени, проводимого учащимся за чтением в свободное время2.

Во-вторых, в регрессии функциональные связи между7 зависимыми и независимыми переменными могут быть формально определены как уравнение с соответствующими величинами, которые описывают, насколько хорошо такое уравнение соответствует данным. Информация о результатах групп индивидов используется для построения уравнения (известного как уравнение регрессии) в предположении о том, что связь является линейной (т.е. изменение значения одной переменной будет подобным для всех значений этой переменной).

При анализе данных национальной оценки аналитикам, возможно, придется выйти за пределы принятой формы регрессии. Более сложные подходы, такие как иерархическое линейное моделирование (Hierarchical Linear Modeling - I ILM), обычно лучше подходят для учета иерархической или многоуровневой структуры данных, полученных в рамках подобных исследований (см. Raudenbush and Bryk 2002; Snijders and Bosker 1999). С помощью HLM можно разделить влияние переменных для уровня школ и учащихся. Например, если у вас есть данные о социально-экономическом статусе по уровням школ и учащихся, они могут быть включены в модель и влияние каждой из них при анализе достижений учащихся. Двухуровневая модель также позволяет идентифицировать долю дисперсии между школами и долю внутри школ, которые объясняются переменными в модели. Аналогично трехуровневая модель (школы, классы, учащиеся) обеспечивает оценивание доли дисперсии. Она объясняется переменными на уровне школ (например, местоположением и размером), на уровне класса (например, характеристиками учителей и доступными аудиторными ресурсами в классе) и на уровне учащихся (например, возрастом и тревожностью из-за математики). Многоуровневые модели особенно полезны, когда дисперсия между школами в зависимой переменной велика (например, когда она превышает 5 % общей дисперсии).

Многоуровневое моделирование выходит за пределы текущего тома. Однако описанная форма регрессионного анализа обеспечивает введение в некоторые понятия, лежащие в основе многоуровневого моделирования, и может быть использована, когда многоуровневое моделирование не подходит.

Уравнение регрессии в случаях с одной зависимой переменной у и одной независимой переменной х выглядит следующим образом:

у = ос + ЬХ + Е,

где

а - точка пересечения с осью у (точка на оси у, где х равен нулю);

Ь-градиент или наклон линии регрессии (коэффициент регрессии); X - результат по независимой переменной;

е - ошибочный компонент (выраженный в форме остаточной ошибки или различия между ожидаемыми и наблюдаемыми величинами)3.

На рис. 6.2 представлено уравнение регрессии и линия регрессии на диаграмме рассеяния для двух переменных: х (независимая) и у (зависимая).

По уравнению регрессии можно сделать выводы: а) есть ли тенденция для у (прогнозируемого параметра) к увеличению или уменьшению результатов с изменением значения х (прогнозирующего параметра), б) уравнение регрессии может быть использовано для оценивания или прогноза значений у по известным значениям х и в) уравнение регрессии позволяет приближенно оценить величину у при нулевом х (см. упражнение 6.3).

Регрессия описывает связь между двумя и более переменными в форме уравнения. Это позволяет спрогнозировать, например,

РИС. 6.2

Линия регрессии и уравнение регрессии на диаграмме рассеяния

  • 12 1
  • 11 -
  • 10 -
  • 9 -

> 8 -к s 7-

ф 6 -

2

ф 5 -о.

ф 4 .

  • 3 -
  • 2 -
  • 1 -
  • 0 —
  • -6

6

переменная х

результат учащегося по тесту достижений из того, что известно о домашней среде учащегося или иных переменных.

В типичном национальном оценивании многие переменные обычно значимо коррелированы с результатами тестов по математике, языку или физике. В этой ситуации можно использовать множественную регрессию для количественной оценки связи между множественными независимыми переменными и зависимой переменной. Примеры зависимых и независимых переменных, которые часто встречаются в национальных оценках, приведены в текстовой вставке 6.1.

ТЕКСТОВАЯ ВСТАВКА 6.1

Переменные в стандартной регрессии

Одна зависимая (выходная) переменная, например достижения по чтению или математике.

Одна или несколько независимых (казуальных) переменных, например размер класса, географический регион, квалификации учителей, образование родителей,гендерный признак.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >