Расчет коэффициента корреляции.

В случае если расположение точек на графике дает основание предположить наличие связи, можно продолжить анализ расчетом коэффициентов корреляции. Для анализа связи двух интервальных переменных чаше всего рассчитывают коэффициент корреляции Пирсона и коэффициент Спирмена. Выбор того или иного коэффициента определяется характером распределения данных. Если в анализируемом массиве есть нетипичные значения, если разброс значений велик или данные не удовлетворяют требованию нормальности распределения, рассчитывают коэффициент Спирмена — он является непарамстрической мерой связи и не чувствителен к наличию “выбросов” в распределении, так как принимает в расчет нс сами значения исследуемых переменных, а их ранги. Техника расчета коэффициента Спирмена будет рассмотрена ниже.

Рассмотрим технику расчета коэффициента корреляции Пирсона (г) на данных, представленных в табл. 6.11. Формула для расчета коэффициента выглядит следующим образом:

где X, у — средние значения изучаемых признаков.

В литературе можно встретить и другие варианты записи формулы, но результат расчета должен быть одинаковым для всех вариантов представления коэффициента.

Ручной подсчет коэффициента корреляции лучше проводить в расчетной таблице, в колонках которой последовательно представлены все этапы вычислений (табл. 6.12). При этом обратим внимание, что для получения более корректных результатов из анализа было предварительно исключено наблюдение с нетипично высоким значением показателя временных затрат.

Таблица 6.12. Расчетная таблица

X

У

40

3

0

0.2

0

0

0,04

50

5

10

2,2

22

100

4,84

25

1

-15

-1,8

27

225

3,24

35

2

-5

-0,8

4

25

0,64

50

3

10

0,2

2

100

0,04

I

55

450

8,8

Таким образом, между средними временными затратами на доставку партии материалов и частотой опозданий с доставкой обнаружена тесная прямая связь. Содержательно такую связь можно интерпретировать следующим образом: прямая связь означает, что большим затратам времени соответствует большая частота опозданий с доставкой (или чем дольше транспорт региональной логистической системы добирается до места расположения предприятия, тем чаще он не успевает доставить материалы “точно в срок”).

Оба изучаемых показателя тесно связаны между собой, о чем свидетельствует величина коэффициента корреляции, довольно близкая к 1. Следует обратить внимание, что обнаруженная связь нс трактуется как причинная зависимость — коэффициент корреляции не дает информации о причинно-следственных связях.

Квадрат коэффициента корреляции, называемый коэффициентом детерминации, также имеет четкое толкование. Коэффициент детерминации 2), выраженный в процентах, показывает, на сколько процентов вариация (изменение) зависимого признака объясняется вариацией (изменением) факторного признака. Этот показатель может изменяться в пределах от 0 до 1 и чем ближе он к единице, тем теснее связаны признаки. В рассматриваемом случае 7?2= 0,8742 = 0,764. Следовательно, изменения в количестве опозданий с доставкой на 76,4% объясняются затратами времени на доставку материалов.

Еще раз нужно указать на ограничение применения коэффициента корреляции Пирсона для оценки степени тесноты связи — использование данного коэффициента является обоснованным лишь в условиях нормального или близкого к нормальному распределения признаков в изучаемой совокупности.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >