Частные коэффициенты корреляции.

Довольно часто на величину коэффициента парной корреляции оказывают влияние другие величины. Социально-экономические явления и процессы образуют сложную сеть взаимодействий и взаимовлияний. В связи с этим возникает задача оценки связи между двумя признаками при исключении влияния на эту связь прочих факторов. Технически эта задача решается с помощью расчета частного коэффициента корреляции.

Частный коэффициент корреляции — мера связи двух признаков (Л' и У) при элиминировании влияния третьего признака (2)-

Формула для расчета частного коэффициента корреляции выглядит следующим образом:

где г — коэффициент парной корреляции между X и У гхг ~ коэффициент парной корреляции между X и 2, г,.. — коэффициент парной корреляции между Ки Z

Диапазон возможных значений частного коэффициента корреляции и его интерпретация аналогичны парному коэффициенту корреляции.

Рассмотрим технику расчета частного коэффициента корреляции на следующем примере. Предположим, в результате проведенного исследования была обнаружена прямая и умеренная корреляционная связь между уровнем дохода респондента (А) и количеством членов его семьи (У): чем выше доход респондента, тем больше его семья (г — 0,58). Обнаружилось также, что обе эти переменные коррелйруют с третьей переменной (2) — “Возраст респондента” х = 0,85, г = 0,70). Тогда можно рассчитать частный коэффициент корреляции, который анализирует связь между уровнем дохода респондента и количеством членов его семьи, исключая влияние возраста:

Полученный частный коэффициент корреляции нс подтверждает наличие связи между уровнем дохода респондента и количеством членов его семьи.

Нелинейная корреляция. При наличии нелинейной (криволинейной) зависимости между двумя переменными линейный коэффициент корреляции недооценивает связь и даже может быть равным 0. Для анализа нелинейной связи признаков используется эмпирическое корреляционное отношение.

Расчет данного показателя базируется на использовании известной теоремы сложения дисперсий. Согласно теореме, общая дисперсия складывается из межгрупповой дисперсии и средней из

межгрупповых дисперсий, то есть а2 = 822. Напомним, что межгрупповая дисперсия характеризует те изменения в величине изучаемого признака, которые возникают под влиянием факторного признака. Внутригрупповая дисперсия характеризует случайную вариацию, то есть те изменения в величине изучаемого признака, которые происходят под влиянием случайных, неучтенных факторов и не зависят от факторного признака. Чем больше доля меж- групповой дисперсии в общей, тем теснее связаны факторный и результативный признаки. Учитывая сказанное, получаем формулу для расчета эмпирического корреляционного отношения (г)):

где <52 — межгрупповая дисперсия;

2 — общая дисперсия.

Корреляционное отношение изменяется от 0 до 1. Анализ степени тесноты нелинейной связи аналогичен анализу линейного коэффициента корреляции — чем ближе значение показателя к единице, тем теснее связь между признаками.

Отмстим некоторые особенности корреляционного отношения.

  • 1. Корреляционное отношение, в отличие от линейного коэффициента корреляции, нс указывает, является ли связь прямой или обратной. Ответить на этот вопрос помогает поле корреляции, где по характеру расположения точек на графике исследователь делает вывод о направлении связи. Определить, является связь прямой или обратной, позволяют и промежуточные расчеты: если с ростом факторного признака растут групповые средние результативного признака, то связь прямая, если же с увеличением факторного признака значения групповых средних уменьшаются, то связь обратная.
  • 2. Сфера применения корреляционного отношения шире, чем у парного коэффициента корреляции. Во-первых, корреляционное отношение может применяться для анализа не только линейных, но и нелинейных связей. Во-вторых, факторный признак в случае с корреляционным отношением может быть нс количественным, а ранговым и даже номинальным.
  • 3. Квадрат корреляционного отношения, выраженный в процентах, также имеет четкое толкование — он показывает, на сколько процентов вариация (изменение) зависимого признака объясняется вариацией (изменением) факторного признака. Допустим, по выборочным данным было вычислено эмпирическое корреляционное отношение между спросом на товар А и его ценой: г) = 0,82. Следовательно, между изучаемыми признаками обнаружена тесная связь. Тогда значение р2 = 0,822 = 0,67 говорит о том, что изменения в спросе на товар А на 67% объясняются динамикой его цены.
  • 4. Корреляционное отношение, в отличие от линейного коэффициента корреляции, позволяет определить, какой из изучаемых признаков результативный, а какой — факторный. Для этого вычисляют два корреляционных отношения, меняя местами факторный и результативный признаки. Сравнение полученных показателей помогает определить правильное распределение “ролей” между признаками.

Оценка статистической значимости связи. Рассмотренные выше показатели связи между признаками, строго говоря, относятся только к той совокупности данных, по которой они и рассчитывались, то есть они характеризуют связь только в пределах выборки. Возможность экстраполяции (переноса) полученных результатов на генеральную совокупность проверяется с помощью тестов на статистическую значимость коэффициентов корреляции.

Общая логика проведения такой проверки может быть представлена следующим образом:

1. Выдвигают две альтернативные гипотезы:

#0: коэффициент корреляции статистически не значим (иначе говоря, в генеральной совокупности он может оказаться равным нулю);

Ну коэффициент корреляции статистически значим (в генеральной совокупности коэффициент корреляции отличается от 0).

  • 2. Рассчитывают наблюдаемое значение соответствующего критерия (для каждого коэффициента корреляции используется своя формула критерия).
  • 3. Наблюдаемое значение критерия (Кнабл) сравнивают с его табличным значением (Ктаб) и выбор в пользу той или иной гипотезы осуществляют по следующему правилу:

если Кнабд < Ктабл, принимается гипотеза Н0, то есть коэффициент корреляции статистически не значим, и результаты анализа не могут распространяться на генеральную совокупность;

если Кнабд > Ктабд, принимается гипотеза Ну то есть коэффициент корреляции статистически значим, и результаты анализа могут распространяться на генеральную совокупность.

Для нахождения табличного значения критерия следует воспользоваться таблицами критических значений критерия, представленными в Приложении 3. В таблице выбирают значение, находящееся на пересечении заданного уровня статистической значимости и числа степеней свободы.

Рассмотрим технику проверки статистической значимости коэффициентов корреляции на примере коэффициента Пирсона (г) и коэффициента ранговой корреляции Спирмена (с).

Для оценки их значимости применяется :-критерий Стью- дента. При этом наблюдаемое значение этого критерия определяется по формулам:

если число наблюдений (п) невелико — как правило, меньше 50;

если выборка большего объема.

В формулах к — значение коэффициента корреляции Пирсона или коэффициента Спирмена (то есть г или р).

Оценим статистическую значимость коэффициента Пирсона = 0,874), полученного по данным табл. 6.6. Рассчитаем наблюдаемое значение /-критерия:

По таблице значений распределения Стьюдента определим табличное значение критерия. Число степеней свободы для коэффициента парной корреляции определяется по формуле: с!/ = = п—2. В нашем случае число степеней свободы равно (1/= 5—2 = 3. При уровне значимости а = 0,05 (то есть при 95%-ной доверительной вероятности) и числе степеней свободы, равном 3, 1та6л составляет 3,182. Наблюдаемое значение критерия меньше его табличного значения, следовательно, принимаем гипотезу #0: коэффициент корреляции статистически не значим. Полученный результат вполне объясним — анализ такой небольшой выборочной совокупности (5 респондентов) нс позволяет распространить результаты на генеральную совокупность.

Аналогичным образом оценим статистическую значимость коэффициента Спирмена (р=0,8), полученного поданным табл. 6.7. Рассчитаем наблюдаемое значение /-критерия:

По таблице значений распределения Стьюдента определяем 1табл~ 3,182 (уровень значимости а = 0,05). Наблюдаемое значение критерия опять меньше его табличного значения, следовательно, принимаем гипотезу Я0: коэффициент корреляции статистически незначим. Техника проверки на статистическую значимость других коэффициентов корреляции аналогична тем процедурам, которые были рассмотрены выше. Отмстим, что современные статистические программные комплексы позволяют достаточно быстро осуществлять проверку на статистическую значимость любых коэффициентов корреляции. Поэтому в данной главе не приводятся примеры этой проверки для прочих коэффициентов.

Статистические методы изучения связи между двумя признаками могут широко использоваться в СКА для выявления тесно связанных между собой переменных, наиболее перспективных для дальнейшего исследования. На этой основе возможно выявление совокупности доминирующих факторов, определяющих динамику социально-экономических явлений и процессов.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >