Построение интервальных прогнозов
Перед тем, как построить интервальные прогнозы необходимо исходя из решенного уравнения регрессии (6) составить точечный прогноз на апрель 2013 года:}}
Чтобы вычислить величину интервального прогноза необходимо вычислить средние ошибки прогнозируемого индивидуального значения цены на нефть.
Таблица 12
Значения средних ошибок прогнозируемых индивидуальных значений цен на нефть
2010М01 |
ЫА |
2010М02 |
6.769181 |
2010М03 |
6.658479 |
2010М04 |
6.593125 |
2010М05 |
6.538470 |
2010М06 |
6.707655 |
2010М07 |
6.704771 |
2010М08 |
6.649449 |
2010М09 |
6.710555 |
2012М10 |
6.507105 |
2012М11 |
6.492784 |
2012М12 |
6.488469 |
2013М01 |
6.486281 |
2013М02 |
6.505750 |
2013М03 |
6.524756 |
2013М04 |
6.521387 |
Далее необходимо определить доверительный интервал прогноза, который зависит от заданного уровня надежности. С помощью двустороннего значения /-критерия Стьюдента для 95% уровня надежности возможно вычислить нижнюю и верхнюю границу на прогнозируемую дату:
где Утш - нижняя граница интервального прогноза;
Ушах верхняя граница интервального прогноза;
Уапрель2013 - точечный прогноз на конец апреля 2013 г.;
/ - значение двустороннего /-критерия для 95% уровня надежности;
5ЕЫ- средняя ошибка прогнозируемого индивидуального значения цен на нефть на май 2013 г.
Таким образом возможно составить интервальные прогнозы с разными уровнями надежности (табл. 13).
Интервальные прогнозы цен на нефть на апрель 2013 г. с разными уровнями надежности
Уровень надежности, % |
Означение |
Нижняя граница интервального прогноза |
Верхняя граница интервального прогноза |
Диапазон интервального прогноза, долл./барр. |
99,9 |
3,5657 |
86,2168 |
132,7232 |
46,5063 |
99 |
2,7116 |
91,7869 |
127,1531 |
35,3662 |
95 |
2,0244 |
96,2681 |
122,6719 |
26,4037 |
90 |
1,6860 |
98,4752 |
120,4648 |
21,9895 |
80 |
1,3042 |
100,9646 |
117,9754 |
17,0108 |
70 |
1,0508 |
102,6175 |
116,3225 |
13,7050 |
60 |
0,8512 |
103,9191 |
115,0209 |
11,1018 |
50 |
0,6810 |
105,0289 |
113,9111 |
8,8821 |
40 |
0,5288 |
106,0213 |
112,9187 |
6,8974 |
30 |
03882 |
106,9381 |
112,0019 |
5,0638 |
20 |
0,2551 |
107,8062 |
111,1338 |
3,3276 |
10 |
0,1265 |
108,6450 |
110,2950 |
1,6500 |
Чем шире диапазон интервального прогноза, тем выше вероятность его реализации, следовательно выше надежность. Так фактические цены на нефть на апрель 2013 г. составил 103,24 долл./барр., т.е. оказался на 6,23 долл./барр. ниже. Несмотря на довольно значительное отклонение, удалось попасть в интервальный прогноз, составленный с 70%-ным и выше уровнем надежности, в то время как при более низком уровне надежности он оказался бы неточным.
В таблице 14 представлено сопоставление заданных уровней надежности с фактической долей точных прогнозов. Судя по таблице, доля точных прогнозов оказалась выше заданного уровня надежности при 99,9%-ном и более низких уровнях надежности.
Ввиду избыточной ширины интервального прогноза необходимо провести тесты Чоу на структурную стабильность и точность прогноза.
Изучим влияние стандартизированных и стьюдентизированных остатков на уравнение регрессии. Стьюдентизированные остатки представляют собой частное от деления обычного остатка на оценку его стандартного отклонения.
На графике представлены значения стьдентизированных остатков, которые с обеих сторон выделены пунктирной линией и обозначает область допустимых значений, равных ± 2. Когда остатки выходят за пределы этой линии - их можно считать выбросами. Выбросами можно считать и остатки, стандартные отклонения которых больше 1 (выделены подчеркиванием).
Доля точных интервальных прогнозов нри разных уровнях надежности в период с января 2010 г. но апрель 2013 г.
t-значснис |
У ровснь надежности, % |
Количество точных прогнозов |
Доля точных интервальных прогнозов, % |
Разница между долей точных интервальных прогнозов и уровнем надежности, проц. пункт |
3,56567807 |
99,9 |
38 |
100 |
0,1 |
2,7115576 |
99 |
38 |
100 |
1 |
2,02439415 |
95 |
37 |
97,37 |
2,37 |
1,68595446 |
90 |
35 |
92,1 |
2,1 |
1,3042302 |
80 |
31 |
81,58 |
1,58 |
1,05077206 |
70 |
29 |
76,32 |
6,32 |
0,85118276 |
60 |
25 |
65,79 |
5,79 |
0,68100088 |
50 |
21 |
55,26 |
5,26 |
0,52882845 |
40 |
17 |
44,74 |
4,74 |
0,38824687 |
30 |
12 |
31,58 |
1,58 |
0,25512807 |
20 |
9 |
23,68 |
3,68 |
0,12650398 |
10 |
4 |
10,53 |
0,53 |

Рис. 1. График значение стыодентизированных остатков
Стыодентизированные и стандартизированные остатки, выбросы и их влияние на точность прогнозирования
Выборка: 2010М01 2013М03
Включает 38 наблюдений после корректировки
Наблюдения |
Остатки |
Стандартные остатки |
Стыодентизированные остатки |
2010М02 |
1.421098 |
0,225569 |
0.234487 |
2010М03 |
0.530678 |
0,084234 |
0.085741 |
2010М04 |
1.461778 |
0,232026 |
0.233637 |
2010М05 |
-15.73642 |
2.497818 |
-2.744797 |
2010М06 |
-4.429820 |
-0,703139 |
-0.727483 |
2010М07 |
-1.097497 |
-0,174204 |
-0.178875 |
2010М08 |
-7.940535 |
1.260390 |
-1.311854 |
2010М09 |
3.067858 |
0,486957 |
0.502114 |
2010М10 |
-2.622363 |
-0,416244 |
-0.420098 |
2010М11 |
-0.932365 |
-0,147993 |
-0.148723 |
2010М12 |
5.782477 |
0,917844 |
0.928845 |
2011М01 |
4.015082 |
0,637308 |
0.633581 |
2011М02 |
9.891633 |
1.570085 |
1.603569 |
2011М03 |
5.666556 |
0,899444 |
0.901192 |
2011М04 |
9.915634 |
1.573894 |
1.628511 |
2011М05 |
-7.170449 |
-1.138155 |
-1.180142 |
2011М06 |
-3.724265 |
-0,591147 |
-0.592315 |
2011М07 |
5.055141 |
0,802395 |
0.802372 |
2011М08 |
-1.172447 |
-0,186101 |
-0.185659 |
2011М09 |
-11.68951 |
1.855459 |
-1.941167 |
2011М10 |
6.108800 |
0,969641 |
0.968456 |
2011М11 |
1.007167 |
0,159866 |
0.158082 |
2011М12 |
-3.006270 |
-0,477181 |
-0.473606 |
2012М01 |
4.205354 |
0,667510 |
0.663035 |
2012М02 |
9.447565 |
1,499598 |
1.534803 |
2012М03 |
4.980372 |
0,790527 |
0.801601 |
2012М04 |
-3.301354 |
-0.524019 |
-0.532899 |
2012М05 |
-10.86074 |
-1.723909 |
-1.804783 |
2012М06 |
-11.70222 |
-1.857477 |
-1.928259 |
2012М07 |
5.764776 |
0,915034 |
0.914502 |
2012М08 |
8.991424 |
1.427196 |
1.448398 |
2012М09 |
0.000895 |
0,000142 |
0.000141 |
2012М10 |
-1.949507 |
-0,309442 |
-0.307259 |
2012М11 |
-0.758088 |
-0,120330 |
-0.119062 |
2012М12 |
-0.489702 |
-0,077730 |
-0.076847 |
2013М01 |
3.388582 |
0,537865 |
0.533680 |
2013М02 |
2.904230 |
0,460984 |
0.458382 |
2013М03 |
-5.023553 |
-0,797381 |
-0.800239 |
Следующим этапом повышения точности прогностической модели является проведение теста Грегори Чоу на наличие структурной стабильности временного ряда. Суть данного теста заключается в выдвижении нулевой гипотезы о структурной стабильности временного ряда за весь период наблюдения. Затем данный временной ряд делится на несколько периодов наблюдений в зависимости от предполагаемых структурных изменений. Проверка принятой нулевой гипотезы идет путем сравнения разницы между суммой квадратов остатков, которую мы получаем, построив уравнение регрессии для единого временного ряда, и суммой квадратов остатков, получаемой при построении уравнения регрессии отдельно для каждого периода этого ряда.
Проведем последовательное тестирование структурной стабильности временного ряда после резких скачков, вошедших в рейтинг наблюдений по величине скачка цен на нефть. При этом для корректного проведения теста необходимо, чтобы количество наблюдений в каждом из выделенных периодов временного ряда было, по меньшей мере, равно количеству параметров в оцененной нами статистической модели (их 2). Каждый месяц резкого скачка цены на нефть взят в качестве первого наблюдения, включенного в период после предполагаемых структурных изменений во временном ряде, поскольку в этом случае тест становится наиболее чувствительным к выбросу.
Таблица 16
Влияние скачка доллара на структурную стабильность временного ряда по результатам теста Чоу
Месяц, тестируемый на структурное изменение |
Период структурных изменений |
Период после структурных изменений |
Скачек цены по сравнению с предыдущ. месяцем, долл./барр. |
Зн. Р-крит. |
Зн. ЬЯ- сгат. |
май 10 |
январь 2010 - апрель 2010 |
май 2010 - март 2013 |
-12,82 |
0.9400 |
0.9332 |
сен. 10 |
январь 2010 - август 2010 |
сентябрь 2010 - март 2013 |
7,69 |
0.0202 |
0.0128 |
дек. 10 |
январь 2010 — ноябрь 2010 |
декабрь 2010 — март 2013 |
8,93 |
0.0039 |
0.0020 |
янв. 11 |
январь 2010 - декабрь 2010 |
январь 2011 — март 2013 |
5,99 |
0.0214 |
0.0136 |
фев. 11 |
январь 2010 - январь 2011 |
февраль 2011- март 2013 |
11,08 |
0.0440 |
0.0304 |
аир. 11 |
январь 2010 - март 2011 |
апрель 2011 — март 2013 |
8,94 |
0.0581 |
0.0415 |
Месяц, тестируемый на структурное изменение |
Период структурных изменений |
Период после структурных изменений |
Скачек цены по сравнению с предыдущ. месяцем, долл./барр. |
Зн. F-крит. |
Зн. LR- стат. |
май 11 |
январь 2010 - апрель 2011 |
май 2011- март 2013 |
-9,32 |
0.0077 |
0.0044 |
сен. 11 |
январь 2010 — август 2011 |
сентябрь 2011- март 2013 |
-12,35 |
0.1520 |
0.1218 |
окт. 11 |
январь 2010 - сен тябрь 2011 |
октябрь 2011 — март 2013 |
7,07 |
0.2606 |
0.2225 |
фев. 12 |
январь 2010 - январь 2012 |
февраль 2012 март 2013 |
9,16 |
0.3747 |
0.3338 |
май. 12 |
январь 2010 — апрель 2012 |
май 2012 - март 2013 |
-12,12 |
0.1232 |
0.0963 |
июнь 12 |
январь 2010 - май 2012 |
июнь 2012 март 2013 |
-11,37 |
0.4752 |
0.4353 |
июль 12 |
январь 2010 - июнь 2012 |
июль 2012 — март 2013 |
7,59 |
0.2710 |
0.2324 |
авг. 12 |
январь 2010 - июль 2012 |
август 2012 — март 2013 |
9,82 |
0.3008 |
0.2612 |
Когда уровни значимости как F-критерия, так и LR-статистики (Log likelihood ratio - соотношение логарифмов правдоподобия) оказываются больше критического значения, равного 0,05 - нулевая гипотеза о наличии структурной стабильности во временном ряде не отвергается. Из таблицы 16 видно, что с сентября 2010 г. по май 2011 г. наблюдалась ярко выраженная нестабильность во временном ряде.
Таким образом, тесты Чоу на структурную стабильность помогают анализировать устойчивость временного ряда (ретроспективный анализ устойчивости статистической модели за весь период наблюдений).
Для устранения структурной нестабильности воспользуемся методом Д. Гуйа- рати, суть которого заключается в следующем: поскольку основной задачей уравнения регрессии является аппроксимация динамики временного ряда, то, разделив этот ряд с помощью фиктивной переменной на два периода - до и после структурного изменения, можно выяснить характер произошедшего структурного изменения.
Перед тестированием выдвигается нулевая гипотеза об отсутствии в динамике временного ряда структурных изменений.
Так как нам необходимо узнать характер структурных изменений, то необходимо ввести фиктивную переменную DUMMY, которая, в случае ее статистической значимости, поможет их выявить. Принимая во внимание рейтинг наблюдений по величине скачка цен на нефть табл. 14, переменная DUMMY до апреля 2010 г. (т.к. скачек цен наблюдался в мае 2010 г.) будет приравнена к нулю, для последующих наблюдений - к единице. Структурные изменения будут выявлены в том случае, если фиктивная переменная DUMMY окажется статистически значимой.
В результате вычислений коэффициент фиктивной переменной DUMMY получился статистически незначимым (значимость = 0,9648), как и у всего состава переменных (таблица 17).
Таблица 17
Результаты проведения теста Д. Гуйарати на определение характера структурных изменений в мае 2010 г.
Зависимая переменная: РЙЛСЕ ОИ.
Метод наименьших квадратов Скорректированная выборка: 2010М02 2013М03 Включает 38 наблюдений после корректировки
коэффициент PRACE OIL(-l) 0.863937 С 15.89967 PRACE OIL (1)*DUMMY0.016776 DUMMY -2.853707 PRACE OIL(-l) 0.863937 |
ст. ошибка ?-критерий 0.825037 1.047150 63.69829 0.249609 0.828414 0.020251 64.18138 -0.044463 0.825037 1.047150 |
значимость
|
||
Коэффициент детермин. R2 |
0.834836 |
Ср. откл. зав. перемен |
102.9971 |
|
Скорректированный К2 |
0.820263 |
Ст. откл. зав. перемен. |
15.47381 |
|
Стандартная ошибка регр. |
6.560190 |
Информ. крит. Акаика |
6.699217 |
|
Сумма остатков в квадрате |
1463.227 |
Крит. Шварца |
6.871594 |
|
Логарифм макс, иравдонод. |
-123.2851 |
Крит. Хеннана-Куинна |
6.760547 |
|
Е-стагистика |
57.28529 |
Крит. Дрбина-Уотсона |
1.593590 |
|
Значимость Е-критерия |
0.000000 |
Статистически незначимым коэффициент фиктивной переменной DUMMY оказался и в тесте, проведенном для выявления структурных изменений в сентябре 2011 г. (значимость = 0,0569) (табл. 18). Следовательно, уравнение регрессии (3) необходимо пересмотреть.
Результаты проведения теста Д. Гуйаратн на определение характера структурных изменений в сентябре 2011 г.
Зависимая переменная: РКЛСЕОИ.
Включает 38 наблюдений после корректировки
коэффициент |
ст. ошибка |
/-критерий |
значимость |
|
PRACE OIL(-l) |
0.929351 |
0.080793 |
11.50285 |
0.0000 |
С |
8.858516 |
7.647720 |
1.158321 |
0.2548 |
PRACE_01L( 1 )*DUMM Y |
-0.467996 |
0.234922 |
-1.992133 |
0.0544 |
DUMMY |
1.643656 |
25.69024 |
1.971319 |
0.0569 |
PRACEOIL(-l) |
0.863937 |
0.825037 |
1.047150 |
0.3024 |
Коэффициент детермин. R2 |
0.851621 |
Ср. откл. зав. перемен |
102.9971 |
|
Скорректированный R2 |
0.838529 |
Ст. огкл. зав. |
перемен. |
15.47381 |
Стандартная ошибка регр. |
6.217910 |
Информ. крит. Акаика |
6.592045 |
|
Сумма остатков в квадрате |
1314.522 |
Крит. Шварца |
6.764423 |
|
Логарифм макс, нравдо- |
||||
под. |
-121.2489 |
Крит. Хеннана-Куинна |
6.653376 |
|
/?'-статистика |
65.04778 |
Крит. Дрбина-Уотсона |
1.554662 |
|
Значимость F-критерия |
0.000000 |
В результате проведенного анализа коэффициент фиктивной переменной DUMMY оказался статистически значимым (значимость = 0,0286) при проведении теста Д. Гуйарати на определение характера структурных изменений в сентябре 2010 г. - мае 2011 г. (табл. 19). При этом, коэффициент DUMMY до сентября 2010 г. включительно и с мая 2011 г. был равен нулю, а в сентябре-мае - единице. Судя по таблице, все коэффициенты в данном уравнении регрессии оказались статистически значимыми. Следовательно, нулевую гипотезу об отсутствии в цене на нефть в сентябре 2010 г. структурных изменений можно отвергнуть с 5% уровнем значимости.
Результаты проведения теста Д. Гунараги на определение характера структурных изменений в сентябре 2010 г. - мае 2011 г.
Зависимая переменная: РЯЛСЕ СШ.
Метод наименьших квадратов Скорректированная выборка: 2010М02 2013М03 Включает 38 наблюдений после корректировки
коэффициент |
ст. ошибка |
/-критерий |
значимость |
|
PRACE OIL(-l) |
0.897880 |
0.062430 |
14.38219 |
0.0000 |
С |
11.66280 |
6.420248 |
1.816565 |
0.0481 |
PRACE OIL(l)*DUMMY |
-0.851912 |
0.362384 |
-2.350855 |
0.0247 |
DUMMY |
2.271268 |
38.61876 |
2.285710 |
0.0286 |
PRACEOIL(-l) |
0.863937 |
0.825037 |
1.047150 |
0.3024 |
Коэффициент детермин. R2 |
0.859079 |
Ср. откл. зав. перемен |
102.9971 |
|
Скорректированный R2 |
0.846645 |
Ст. откл. зав. перемен. |
15.47381 |
|
Стандартная ошибка регр. |
6.059638 |
Информ. крит. Акаика |
6.540478 |
|
Сумма остатков в квадрате |
1248.453 |
Крит. Шварца |
6.712855 |
|
Логарифм макс, правдонод. |
-120.2691 |
Крит. Хеннана-Куинна |
6.601809 |
|
/•'-статистика |
69.08988 |
Крит. Дрбина-Уотсона |
1.875855 |
|
Значимость F-критерия |
0.000000 |
Из таблицы можно сделать, вывод, что до сентября 2010 года динамика цена на нефть описывалась следующим уравнением регрессии:
Интерпретация уравнения следующая: рост на 1 доллар цены на нефть в текущем месяце способствовал повышению цены на нефть в будущем месяце на 0,898 доллара, аналогично при понижении.
В сентябре 2010 г., когда произошли структурные изменения, формула приобрела следующий вид:
Интерпретация данного уравнения аналогично предыдущему, за исключением появления в уравнении фиктивной переменной prace_oil(-) х DUMMY, показывающая уменьшение коэффициента у переменной prace_oil{— 1) на 0,852, и фиктивной переменной DUMMY, которая свидетельствует о единовременном повы- шении/понижении цены на нефть на 2,271 доллара.
Чтобы улучшить качество прогностической модели и построить приемлемый диапазон интервального прогноза необходимо с учетом проведенного теста по методу Д. Гуйараги исключить из расчетной базы период с января 2010 г. по май 2011 г. Однако, ввиду непродолжительности временного ряда это сделать не представляется возможным. Увеличение же продолжительности временного ряда приведет к обнаружению еще больших структурных изменений, вызванных мировым финансовым кризисом 2008 года. Поэтому для прогнозирования объясняющих переменных с последующим включением полученных значений в консенсус-прогноз мы вынуждены использовать интервальный прогноз с избыточной шириной, вероятность которого составит 70% и выше.