Ошибка коэффициента корреляции

Коэффициент корреляции, как и среднее арифметическое, представляет собою величину, полученную в результате математической обработки изу чаемых нами малых или больших выборок. На основании полученного значения коэффициента корреляции мы судим о характере и степени тесноты связи для всей генеральной совокупности. Совершенно очевидно, что правильность наших суждений будет полностью зависеть от степени надежности или достоверности найденной величины коэффициента корреляции.

Здесь, как и для среднего арифметического, большое значение имеет число наблюдений или вариант (и). Понятно, что чем больше вариант использовано для вычисления коэффициента корреляции, тем на основании закона больших чисел, он будет надежнее.

Другим важным фактором, кроме числа вариант, является и степень тесноты установленной связи. Если найденная величина коэффициента корреляции приближается к единице, т.е. к той границе его значения, при которой корреляционная зависимость переходит в неразрывную причинную связь, то достаточная достоверность, такой тесной установленной связи может иметь место и при относительно небольшом числе вариант.

В связи с этим Пирсоном и Филоном была предложена следующая формула для определения так называемой средней ошибки коэффициента корреляции (т,):

т,.=±^- (39)

х/ — 1

где т, - ошибка коэффициента корреляции;

г - коэффициент корреляции;

п - число измерений, наблюдений, количество вариант, дата.

1-г2 1-0.842 0.29

= ±0.05

х/Й^Т х/30-1 5.38

Если сравнить эту формулу с формулой ошибки среднего (т), то можно видеть, что знаменатель у них общий, место же среднего квадратического отклонения (5) в числителе здесь заменяет выражение 1 - г2.

Из этой формулы следует, что при г = 1 числитель 1 - г = 0. Таким образом, если величина коэффициента корреляции стремится к +1 или -1, то значение его ошибки стремится к нулю.

Наоборот, при уменьшении величины коэффициента корреляции значение числителя 1 - г2 приближается к единице и тогда решающую роль приобретает число вариант (л).

Таким образом, окончательное выражение коэффициента корреляции будет:

г = 0.84 ± 0.05

Это означает, что величина коэффициента корреляции заключается в пределах от 0.79 до 0.89. Пределы, как можно видеть довольно узкие, что говорит о достаточной надежности значения найденного коэффициента корреляции.

Степень надежности определяется здесь, так же как и для среднего арифметического, по соотношению между коэффициентом корреляции и его ошибкой:

г tr =— тг

(40)

где 4 - критерий достоверности коэффициента корреляции;

г - коэффициент корреляции;

тг- ошибка коэффициента корреляции.

В нашем случае степень надежности, достоверности составляет:

  • 0.84
  • 0.05

= 16,8

г tr=~ тг

Для больших выборок (при большом числе вариант), установленная связь считается в достаточной степени надежной, если t > 3. Следовательно, прямую связь между длиной и диаметром плодов можно считать достоверной.

Контрольные вопросы:

  • 1. Могут ли служить корреляционные таблицы мерой степени тесноты и надежности связи?
  • 2. Что дает составление корреляционной решетки?
  • 3. Какова техника составления такой корреляционной таблицы?
  • 4. Что означает величина коэффициента корреляции?
  • 5. Как определяется степень надежности коэффициента корреляции?
  • 6. В каком случае ошибка коэффициента корреляции равно 0?
  • 7. Какие факторы влияют на величину выражения Zaxay?
  • 8. В каких пределах изменяется величина коэффициента корреляции?
  • 9. Каков характер связи при значении коэффициента корреляции больше 0.7?
  • 10. Сколько вариационных рядов необходимо иметь для составления корреляционной решетки?
  • 11. Кем была предложена формула для определения средней ошибки корреляции?

Контрольное задание: рассчитать все изученные статистические величины по первому признаку и второму признаку, составить корреляционную решетку по двум признакам, определить коэффициент корреляции, его ошибку и критерий достоверности.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >