Расчет коэффициента корреляции.
В случае если расположение точек на графике дает основание предположить наличие связи, можно продолжить анализ расчетом коэффициентов корреляции. Для анализа связи двух интервальных переменных чаше всего рассчитывают коэффициент корреляции Пирсона и коэффициент Спирмена. Выбор того или иного коэффициента определяется характером распределения данных. Если в анализируемом массиве есть нетипичные значения, если разброс значений велик или данные не удовлетворяют требованию нормальности распределения, рассчитывают коэффициент Спирмена — он является непарамстрической мерой связи и не чувствителен к наличию “выбросов” в распределении, так как принимает в расчет нс сами значения исследуемых переменных, а их ранги. Техника расчета коэффициента Спирмена будет рассмотрена ниже.
Рассмотрим технику расчета коэффициента корреляции Пирсона (г) на данных, представленных в табл. 6.11. Формула для расчета коэффициента выглядит следующим образом:

где X, у — средние значения изучаемых признаков.
В литературе можно встретить и другие варианты записи формулы, но результат расчета должен быть одинаковым для всех вариантов представления коэффициента.
Ручной подсчет коэффициента корреляции лучше проводить в расчетной таблице, в колонках которой последовательно представлены все этапы вычислений (табл. 6.12). При этом обратим внимание, что для получения более корректных результатов из анализа было предварительно исключено наблюдение с нетипично высоким значением показателя временных затрат.
Таблица 6.12. Расчетная таблица
X |
У |
![]() |
![]() |
![]() |
![]() |
![]() |
40 |
3 |
0 |
0.2 |
0 |
0 |
0,04 |
50 |
5 |
10 |
2,2 |
22 |
100 |
4,84 |
25 |
1 |
-15 |
-1,8 |
27 |
225 |
3,24 |
35 |
2 |
-5 |
-0,8 |
4 |
25 |
0,64 |
50 |
3 |
10 |
0,2 |
2 |
100 |
0,04 |
I |
55 |
450 |
8,8 |
|||
![]() |
![]() |
Таким образом, между средними временными затратами на доставку партии материалов и частотой опозданий с доставкой обнаружена тесная прямая связь. Содержательно такую связь можно интерпретировать следующим образом: прямая связь означает, что большим затратам времени соответствует большая частота опозданий с доставкой (или чем дольше транспорт региональной логистической системы добирается до места расположения предприятия, тем чаще он не успевает доставить материалы “точно в срок”).
Оба изучаемых показателя тесно связаны между собой, о чем свидетельствует величина коэффициента корреляции, довольно близкая к 1. Следует обратить внимание, что обнаруженная связь нс трактуется как причинная зависимость — коэффициент корреляции не дает информации о причинно-следственных связях.
Квадрат коэффициента корреляции, называемый коэффициентом детерминации, также имеет четкое толкование. Коэффициент детерминации (Л2), выраженный в процентах, показывает, на сколько процентов вариация (изменение) зависимого признака объясняется вариацией (изменением) факторного признака. Этот показатель может изменяться в пределах от 0 до 1 и чем ближе он к единице, тем теснее связаны признаки. В рассматриваемом случае 7?2= 0,8742 = 0,764. Следовательно, изменения в количестве опозданий с доставкой на 76,4% объясняются затратами времени на доставку материалов.
Еще раз нужно указать на ограничение применения коэффициента корреляции Пирсона для оценки степени тесноты связи — использование данного коэффициента является обоснованным лишь в условиях нормального или близкого к нормальному распределения признаков в изучаемой совокупности.