Взаимосвязи временных рядов.

Если имеются данные о нескольких временных рядах, то часто возникает вопрос: а есть ли зависимость между показателями, представленными временными рядами. Простыми корреляционными методами здесь не обойтись, т. к. наличие тенденций обоих рядов может привести к ложной корреляции. Например, в период с 1975 по 1985 гг. число студентов в вузах монотонно росло, но и росло число отдыхающих в санаториях в этот период. Посчитав парный коэффициент корреляции, окажется, что он близок к единице и можно сделать ложный вывод, что прирост отдыхающих связан с увеличившимся числом желающих получить высшее образование. На самом деле просто оба временного ряда имели однонаправленные тенденции. Чтобы получить объективную картину, нужно исключить тенденцию из каждого ряда. Это можно сделать двумя способами, которые рассмотрим на примерах.

ПРИМЕР 3.6.2. Имеются данные об уровне дохода у у жителей региона, клиентов некоторой торговой организации и числа конкурентов у за 16 месяцев, (табл. 3.6.5).

Таблица 3.6.5

Месяц

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

X

6

8

8

9

11

10

13

14

15

17

17

19

18

21

21

22

__У__

23

26

25

26

29

29

32

32

33

36

37

39

38

43

43

44

Необходимо определить, существует ли линейная связь между факторами х и у (взять уровень значимости а = 0,05) и оценить величину этой связи. Если связь имеется, то нужно построить уравнение линейной регрессии с включенным в него фактором времени.

РЕШЕНИЕ. Вводим исходные данные вместе с подписями в первые три столбца электронной таблицы в ячейки А1-С17. Построим графики рядов. Выделяем уровни рядов (ячейки В2-С17) и вызываем мастер диаграмм. Выбираем тип «График» и вид «График с маркерами» (второй сверху левый), нажимаем «Готово». Видно, что оба ряда имеют ярко выраженную тенденцию. Вычисляем коэффициент парной корреляции между данными. Для этого в ячейку В19 вводим подпись «Rxy=«, а в соседнюю С19 функцию «ПИРСОН» (категория «Статистические»), аргументы которой «Массив 1» и «Массив 2» есть ссылки на значения факторов в ячейках В2-В17 и С2-С17 соответственно. Видно, что результат 0,994 очень высок, но это не значит, что между показателями имеется столь сильная связь, т. к. коэффициент линейной корреляции может быть завышен из-за наличия тенденции в каждом ряду (ложная корреляция). Для исключения воздействия фактора времени на формирование уровней ряда используют два способа исключения тенденции.

1. Метод отклонений от тренда. Для его реализации строится трендовая составляющая каждого ряда Т и вычисляется разность между уровнями ряда и трендом. Вводим в D1 подпись «Тх», а в D2 вводим функцию ТЕНДЕНЦИЯ, категория «Статистические», которая вычисляет линейную трендовую составляющую. Аргументы функции «Изв_знач_у» — ссылка на В2-В17, «Извзначх» — ссылка на А2-А17, «Нов_знач_у» — вновь ссылка на А2-А17, «Константа» -единица. Обводим курсором, выделяя ячейки D2-D17, нажимаем F2 и Ctrl+Shift+Enter. Для нахождения тенденции фактора х вводим в Е1 подпись «Ту», а в Е2 вводим функцию ТЕНДЕНЦИЯ с аргументами «Изв_знач_у» — ссылка на С2-С17, «Изв знач х» — ссылка на А2-А17, «Нов_знач_у» — ссылка на А2-А17, «Константа» — единица. Выделяем ячейки Е2-Е17, нажимаем F2 и Ctrl+Shift+Enter. В следующих двух столбцах вычисляем разницу между уровнями ряда и трендом. Вводим в F1 и G1 подписи «х-Тх» и «у-Ту» соответственно, а в «F2» вводим формулу «=B2-D2». Автозаполняем ячейку на F2-G17. Вычислим теперь коэффициент линейной корреляции между полученными данными, лишенными тренда 7*1. Вводим в F19 подпись «г1», а в G19 — функцию ПИРСОН, аргументы которой — ссылки на столбцы F2-F17 и G2-G17. Результат 0,711 меньше, чем между данными с трендовой составляющей, но он объек тивно показывает степень связи между факторами х и у. Проверим, можно ли принять статистическую гипотезу о значимости коэффициента корреляции (и соответственно о наличии связи между факторами). Вводим в F20 подпись «t-

критерий», а в G20 — формулу t =1 г, I I——в виде

у 1 - г, ~

«=ABS(G19)*KOPEHb(14/(l-G19*G19))». Вычисляем критическое значение критерия, с которым сравнивается t-статистика = ^_а(п -2). Ниже в F21 вводим «t-критическое», а в G21 — функцию СТЬЮДРАСПОБР (категория «Статистические»). Аргументы: «Вероятность» — уровень значимости 0,05, «Степени свободы» — п - 2 = 14. Видно, что t-статистика больше критического значения, значит, коэффициент линейной корреляции значим и между факторами имеется статистическая связь.

2. Метод последовательных разностей. Для его реализации вычисляются разности между последовательными уровнями рядов, которые при линейной тенденции не зависят от тренда. Вводим в Н1 подпись «dx», а в II — «dy». В НЗ вводим формулу «=ВЗ-В2» и автозаполнением переносим ее на H3-I17. Вычисляем коэффициент линейной корреляции между рассчитанными разностями г2. Для этого в Н19 подпись «г2», а в 119 функцию ПИРСОН с аргументами НЗ-Н17 и 13-117. Результат 0,894 также меньше, чем между данными с трендовой составляющей. Проверим, можно ли принять статистическую гипотезу о значимости коэффициента корреляции г2 . Вводим в Н20 подпись «t-критерий», а в 120 — формулу «=ABS(I19)*KOPEHb(14/(l-I19*I19))». Вычисляем критическое значение критерия, с которым сравнивается t-статистика zkp = t{_a(п-2). Ниже в Н21 вводим «t-критическое», а в G21 функцию СТЬЮДРАСПОБР с аргументами: «Вероятность» — 0,05, «Степени свободы»: 13 (одна степень теряется при вычислении разности). Видно, что t-статистика больше критического значения, что еще раз подтверждает предположение о наличии связи между факторами.

Построим теперь уравнение множественной регрессии у =агх +a2t +Ь с включением в него фактора времени. Для этого переводим курсор в ячейку А23 и вводим в нее функцию ЛИНЕЙН, аргументы которой «Изв знач у» — ссылка на С2-С17, «Изв знач х» — ссылка на два столбца х и «Месяц» — А2-В17, «Константа» — единица, «Стат» — единица. Обводим курсором, выделяя массив в 3 столбца и 5 строк в ячейках А23-С27, нажимаем F2 и Ctrl+Shift+Enter. Проанализировав первую строку полученной матрицы, найдем из ячеек С23-А23 коэффициенты уравнения регрессии, а именно у =16,39 +0,36х +0,98 t. Итак, выводы:

1) доказано, что между уровнем дохода и количеством конкурентов имеется связь, то есть если благосостояние потребителей растет, то растет и число организаций, предоставляющих блага;

2) получено уравнение регрессии, которое можно в любом году t по одному фактору делать прогноз другого.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >