ОБСУЖДЕНИЕ МЕТОДОВ ПРОГНОЗИРОВАНИЯ

Для всех методов в этом разделе идентификационный интервал предполагается равным 24 месяцам, т. е. h = 24. Мы также постараемся для каждого метода сформулировать ясные ограничения и предположения, на которых метод основан.

НЕПОСРЕДСТВЕННАЯ АППРОКСИМАЦИЯ ВРЕМЕННЫХ РЯДОВ

Простейший алгоритм прогнозирования временных рядов, как подробно излагалось в первой главе, состоит в подборе линейной комбинации функций из определенного набора. Предположим, что чуть-чуть сглаженный (например, с помощью скользящего среднего) временной ряд похож на комбинацию колебаний с высокими и низкими частотами, наложенных на некоторый полином. Тогда следующие функции могут быть использованы как базовые:

Здесь многоточия означают, что последовательности функций могут быть продолжены. Далее мы будем приводить формулы только с частью возможных функций. Итак, приближение, например процентной ставки r(t), записывается в виде:

Согласно объяснению в параграфе 1.2, если предположить, что

где е — случайная величина с постоянной функцией распределения и нулевым математическим ожиданием, тогда оценка, получаемая методом наименьших квадратов, будет несмещенной и с минимальной дисперсией.

Так как коэффициенты а0, ах, а2, а3, а4 входят в (123) линейно, то легко для них построить систему уравнений: составим сумму квадратов отклонений:

и решим относительно а0, ах, а2, а3, аА алгебраическую систему:

Замечание 1. Частота колебаний га не входит в выражение для S так же, как коэффициенты а во второй степени. Поэтому ее неудобно рассматривать как одну из переменных последней системы. Чтобы избежать этого, в вычислительной процедуре предусматривается простой перебор некоторого очевидного интервала, в котором га может находиться, и для каждого значения частоты вычисляются оптимальные относительно функционала (124) коэффициенты а. Из всех полученных таким образом точек выбирается та, в которой S принимает наименьшее значение. Это не дает точного решения задачи нахождения экстремума, но зато сама собой исчезает проблема большого числа локальных экстремумов, которая имела бы место при решении нелинейной задачи.

Замечание 2. Метод наименьших квадратов имеет дополнительные возможности, которые мы здесь не использовали. Например, введение весовых коэффициентов перед квадратами в сумме дает некоторое ранжирование значимости данных. Так это позволяет делать более удаленные данные временного ряда от начальной точки прогноза менее значимыми. В данной работе оптимизация по весовым коэффициентам не производилась.

Основная проблема в такого рода приближениях заключается в противоборстве желания применить полиномиальные функции, поскольку они хорошо изучены и дают сколь угодно точный результат в задаче интерполирования (например, ортогональное семейство полиномов Чебышева), с неустойчивым поведением полиномов вне интервала идентификации. Этот факт установлен в общем виде в параграфе 1.2.4.

На рисунке 24 показан результат приближения стоимости доллара в лирах на протяжении 21 года графиком функции вида (123). Весь промежуток наблюдения разбит специальными разделителями (селекторами) на отрезки: двухлетний — идентификации и однолетний — прогноза.

Рис. 24

Приближение цены 1 доллара США в лирах с помощью квадратичного полинома и одного колебания

Рис. 25

Приближение цены 1 доллара США в лирах с помощью комбинации двух колебаний

Так как полином используется на монотонных участках, то чтобы устранить резкий рост полинома, предлагается добавить в функцию медленно меняющийся синус (и косинус), т. е. низкочастотное колебание. Результат показан на рисунке 25.

Рис. 26

Приближение процентной ставки США с помощью квадратичного полинома и одного колебания

Рис. 27

Приближение процентной ставки США с помощью двух колебаний

Улучшение приближения более наглядно представлено на других данных, а именно, на процентной ставке в США, как это показано на рисунке 26 (хотя большие отклонения прогноза все равно имеют место). Быстрый рост отклонений может быть уменьшен применением двух колеблющихся функций, за исключением периода между 1979 и 1982 годами. Из графика (см. рис. 27) видно, что только информация рассматриваемых данных не способна стать основанием более точного предсказания: на промежутке идентификации данные колеблются вокруг возрастающего среднего с возрастающей амплитудой (что и демонстрирует модель как прогноз), но далее среднее начинает убывать, а колебания — уменьшать амплитуду, что никак не следует из данных интервала идентификации. Применение нескольких колебаний лишь отчасти решает проблему: просто рост модельной функции на интервале прогноза меньше.

Приведенные выше примеры показывают необходимость использования интегрального критерия FPC (или аналогичного ему), чтобы избежать субъективных визуальных оценок графиков данных, особенно потому что FPC содержит комбинацию сразу двух случайных величин. Вычисления дают следующий результат. Класс регрессионных функций, состоящий из квадратичного полинома и одной периодической функции соответствует FPC = 0,0002, а в случае двух периодических функций — FPC = 0,00013, т. е. второй способ приближения является более точным. Таким образом, покупая один миллиард лир, компания на годовом прогнозе имела бы средние потери 200 000 $ при первом методе (с полиномом) и 130 000 $ — используя второй путь (два колебания). Очевидно, годовая разница в 70 000 $ стоит того, чтобы отказаться от полиномов.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >