Оценка существенности линейного коэффициента корреляции
После определения степени тесноты связи между признаками проводится проверка рассчитанного коэффициента корреляции на существенность (значимость).
Дело в том, что при расчете коэффициента изучается достаточно ограниченный объем информации, на основании которой делается вывод о существовании связи между фактическим и результативным признаками. Т.е. анализируемую совокупность данных можно считать выборочной.
Чисто теоретически можно предположить, что при наличии большего объема данных, отклонения от нуля полученной величины коэффициента корреляции может быть целиком вызвано случайными колебаниями тех данных, на основе которых был вычислен этот коэффициент.
В связи с этим и возникает необходимость оценки существенности линейного коэффициента корреляции.
Особенно осторожно следует подходить к истолкованию полученных коэффициентов корреляции при незначительных объемах выборочной совокупности.
Погрешности, обусловленные выборочной информацией, называются ошибками репрезентативности, т.е. ошибками представительности исходной информации. Эти ошибки показывают, насколько достоверно данные выборки характеризуют всю генеральную совокупность.
Если количество наблюдений невелико (п < 30) ошибку репрезентативности коэффициента корреляции находят по формуле:
- 1-r2 n — 2
- (9.4)
Если количество наблюдений достаточно велико, то ошибка коэффициента парной линейной корреляции определяется так:
тг -

(9.5)
Затем выдвигается нулевая гипотеза, т.е. гипотеза о том, что зависимость между признаками х и у отсутствует. Для проверки этой гипотезы рассчитывается /-критерий Стьюдента (В. Госсета) — tr. Расчетный критерий tr определяется как отношение выборочного коэффициента корреляции г к своей ошибке тг - для небольшого объема выборки (п < 30):

(9.6)
для большого объема выборки:

(9.7)
Рассчитанное по формулам (8.6) и (8.7) значение /-критерия Стьюдента сравнивают с табличным значением /-критерия /табл при различных уровнях значимости а (10; 5; 2,5; 2; 1 и т.д.), соответствующих вероятности безошибочности выводов (соответственно 90%; 95%; 97,5%; 98%; 99% и т.д.) и числе степеней свободы к, равным п-2.
Табличное значение критерия Стьюдента выбирается из специальных таблиц (приложение). Если /г >tma6JI, то линейный коэффициент корреляции является значимым (существенным), т.е. с определенной вероятностью (90%; 95%; 97,5%; 98% или 99%) можно утверждать, что между выбранными признаками имеет место корреляция.
Если же /-критерий коэффициента корреляции меньше его табличного уровня (tr
основе полученных результатов нельзя сделать каких-либо определенных выводов относительно корреляции изучаемых признаков. Для решения этого вопроса необходимо провести повторные испытания на более обширном материале.
Пример. Оценим существенность (достоверность) полученного в п. 9.2.1 коэффициента корреляции.
Коэффициент корреляции составляет 0,92. Но этот коэффициент содержит ошибку репрезентативности. Так как число наблюдений меньше 30, для расчета ошибки воспользуемся формулой (9.4):
/1-0,922
N 12-1
= 0,12393.
Следовательно, ошибка коэффициента парной линейной корреляции составляет ± 0,12393.
Рассчитаем /-критерий Стьюдента парной линейной корреляции tr. Поскольку число наблюдений невелико (п = 12) используем формулу (9.6):
I 12-2
Г,. =0,92- -------- =7,42322.
Vl-0,922
В приложении для числа степеней свободы к = п-2 = 10 и уровня значимости 1% находим, что /гаабл = 3,169.
Рассчитанный /-критерий (tr) превышает порог вероятности безошибочных выводов 99% для которого стандартное значение указанного критерия, при числе степеней свободы равном 10, составляет 3,169.
Поэтому, полученный /-критерий позволяет утверждать с вероятностью 99%, что имеет место корреляционная зависимость объема выполненных работ от численности работающих.