ИДЕНТИФИКАЦИЯ И ЧИСЛИТЕЛЬНОЕ ПРИЛОЖЕНИЕ
В главе 3 подробно обсуждались качественные свойства систем типа (145). Для справедливого отнесения реальных процессов к тем или иным группам поведений, нам необходимо знать реальные коэффициенты системы (145). Кроме того, чтобы использовать эти модели для прогнозирования, также подразумевается процедура идентификации параметров, в частности величины запаздывания. Однако мы оставим, по возможности, в стороне статистические проблемы, потому что они требуют значительного места для подробного анализа, но в то же время не приносят нам более конструктивных алгоритмов, чем это получается без глубокого статистического анализа.
Наша конкретная задача идентификации заключается в получении вполне определенной системы дифференциальных уравнений с одним сосредоточенным запаздыванием (лагом). Эта определенность основывается на нашем субъективном выборе модели в форме уравнений Лотки-Воль- терры. Таким образом, после процедуры дискретизации мы приходим к задаче идентификации нелинейной разностной системы со специальным видом лага, т. е. мы не можем использовать известные алгоритмы выбора оптимальной структуры распределенного лага. Таким алгоритмам посвящено много работ, например, назовем несколько последних публикаций: [109, 115, 120]. Эвристические посылки авторов проявляются при формализации задачи идентификации в следующих направлениях:
- ? способ идентификации — параметрический или непараметрический. Первый способ более распространен и изучен. В научных журналах имеется немного работ по параметрическому подходу, тем не менее, наблюдается некоторое развитие, например применение сплайнов в работе [108];
- ? критерий качества модели — начиная с широко распространенного критерия «среднего квадрата ошибки» до различных «информационных» критериев есть много разных способов измерения качества прогноза. В последние годы исследователи сравнивали различные критерии, обобщали, развивали и находили лучший (см., например, работы [104, 109]), но окончательный выбор делался с помощью субъективного мнения или некоторого другого критерия;
- ? следующая существенная разница между моделями состоит в предпочтениях исследователя к системе функций, среди которых выбирается наилучший представитель. Можно встретить очень простые классы, как линейные или полиномиальные функции, или очень слож- ныесистемы, подобно модели Хотеллинга (см. [117]), где обыкновенное дифференциальное уравнение комбинируется с уравнением в частных производных диффузии. Последняя модель отражает специфические свойства процесса, но при этом является настолько сложной, что никто не может применять ее к серьезным многомерным задачам. С нашей точки зрения, было бы гораздо более плодотворно постепенное усложнение теории моделирования новыми инструментами и расширение класса привлекаемых функций хорошо изученными объектами, такими как уравнения Лотки-Вольтерры, а также уравнениями с запаздывающим аргументом.
Примерно те же позиции можно встретить в работе [121] и у других авторов.
Таким образом, наша задача состоит в идентификации коэффициентов модели. Для этой цели мы преобразуем систему (145) в интегральную форму:
(мы ввели другие переменные, чтобы не путать впоследствии разностный аналог с непрерывной исходной моделью). Интегралы в последних выражениях могут быть приближены линейными функциями. В нашем случае единицей времени является месяц. По этой причине предполагаем, что I--целое число (количество месяцев), пока что неизвестное. В результате у нас имеется нелинейная разностная система с неизвестными параметрами:
Неизвестные коэффициенты включены в систему (146) линейно, следовательно, мы можем использовать для их вычисления метод наименьших квадратов для различных значений г. После применения МНК оптимальные коэффициенты становятся функциями г: а, = а,(г), bt = b,(r). Чтобы оценить величину оптимального лага, можно использовать часть данных (здесь используется двухлетний прогноз), сравнивая модельные и реальные данные.
Качество (адекватность) выбираемой модели проверяется в два этапа: для имеющихся данных (467 пар чисел) строим два функционала, зависящих от величины лага г:
Так как S}. и S? квадратичные по неизвестным параметрам, то найти наименьшее значение не представляет труда. В результате получим оптимальные коэффициенты модели при произвольном г. На втором этапе, чтобы выбрать оптимальное г, воспользуемся остатком данных (24 пары чисел) и построим функционал, являющийся усредненным квадратом ошибки прогноза на двухгодичном интервале:
Последний функционал зависит от г более сложным образом, чем это было в предыдущих случаях. Он может иметь один и более локальных минимумов. Поэтому простых формул вычисления оптимального лага мы предложить не можем. Однако вычислительный алгоритм в каждом конкретном случае осуществляется проверкой нескольких условий: оптимальная точка г = гор, должна доставлять локальный минимум функционалу D,., соответствующие параметры ax(ropt) и bx(ropt) должны быть положительны и исследуемая стационарная точка модели должна иметь положительные координаты.
Самое неприятное в нахождении гор, состоит в том, что данные, на которых основано построение модели, имеют случайную составляющую, распределение которой заранее неизвестно. Таким образом, все получаемые значения оптимальных коэффициентов, функционалов и лагов становятся функциями случайных величин. Определить соответствующие характеристики (математические ожидания и дисперсии) впрямую не представляется возможным. Поэтому мы примем следующий алгоритм выбора:
- ? визуально по зависимости D,. выделим несколько лагов, подозрительных на оптимальность с соблюдением указанных выше условий;
- ? проверим избранные точки на чувствительность, сглаживая исходные данные с помощью скользящих средних;
- ? проверим избранные точки на чувствительность с помощью случайных возмущений;
- ? примем окончательное решение о величине лага.
Все последующие вычисления выполнены с применением пакета «Математика-5» (рис. 38).
Для прогнозирования мы применим способ оптимизации начальных данных прогноза, описанный в параграфе 2.3.5 для задачи авторегрессии без временных лагов. Здесь вычисление прогнозируемых значений производится не по реальным данным, а по усредненным с прогнозными по оптимальной модели из ближайшего прошлого. Таблица 6 демонстрирует значительное повышение качества прогноза для большинства учитываемых лагов.

Рис. 38
На графике представлен функционал качества двухгодичного прогноза Dr, средний квадрат ошибки прогноза
Таблица 6
Сравнение прогнозов по обычным и смешанным начальным данным
Величина лага |
|||||||||
it |
31 |
55 |
67 |
68 |
73 |
74 |
80 |
88 |
89 |
Средний квадрат ошибки прогноза (обычные начальные данные) |
|||||||||
653 |
747 |
708 |
600 |
606 |
538 |
643 |
603 |
773 |
798 |
Средний квадрат ошибки прогноза (смешанные начальные данные) |
|||||||||
654 |
617 |
476 |
401 |
433 |
486 |
427 |
421 |
462 |
477 |
Кроме этого из таблицы и графика функционала качества видно, что наилучшим можно считать лаг, равный 67 месяцам (или примерно 5,5 лет), и модель с оптимальными, по классическому методу наименьших квадратов, коэффициентами:
IX! (t) = *1 (?)[0,0121-0,00003xi («- 67) + 0,000033х2 (t - 67)], |x2(i) = *2(*)[0,0194-0,000013xi(f-67)-0,000064x2(*-67)],
где шкала времени имеет в качестве единицы один месяц. Далее, по порядку ухудшения качества двухлетнего прогноза следуют модели с лагами 80, 74, 68 и т. д.
Проверим чувствительность результата с помощью сглаженных данных, возмущенных данных, а также по количеству отвергнутых коэффициентов моделей. Сглаженные по два временные ряды сохранили локальные минимумы ошибок при лагах 11, 31, 67, 68, 74, 88, 89; сглаживание по три дает наилучшие модели с лагами 31 и 89, а сглаживание по четыре — только лаг 31.
Возмущение временных рядов проводится с помощью датчика равномерно распределенных случайных чисел с разбросом около нуля по 5, 15 и 25 единиц. Расчеты показали, что модель с лагом 67 сохраняет локальный минимум ошибки прогноза с высокой вероятностью. Остальные лаги менее устойчивы к возмущениям временных рядов.
В результате всех численных экспериментов окончательно считаем модель с лагом 67 наилучшей. Она имеет в качестве равновесной точки положение {603,284; 179,548}. Модельная траектория колеблется вокруг равновесной точки с периодом примерно 30 лет. Приведенные графики демонстрируют расположение модельной кривой среди реальных данных, а также прогноз по избранной модели на 4 года (рис. 39-42).
Замечание. Вопрос об устойчивости предлагаемой методики изучен численными методами и довольно поверхностно. Автора успокаивает только то, что субъективизм в выборе результата моделирования присутствует всегда в прогнозных задачах. Иногда, если это возможно, исследователи вводят предположения, которые позволяют им получить однозначный результат и доказать его свойства

Результат моделирования для месячного объема продаж американских автомобилей: сравнение реальных и модельных данных в интервале от 2004 до 2006 г.

Результат моделирования для месячного объема продаж иностранных автомобилей: сравнение реальных и модельных данных в интервале от 2004 до 2006 г.

Рис. 41
Прогнозирование месячного объема продаж американских автомобилей с 2006 до 2010 г.

Рис. 42
Прогнозирование месячного объема продаж иностранных автомобилей с 2006 до 2010 г.
строго математически, но в таком подходе субъективизм вносится в процесс моделирования изначально, что, ровным счетом, представляет собой то же самое.
Экономическая интерпретация полученного результата: ? коэффициент воспроизводства американских автомобилей без учета эффекта насыщения а меньше соответствующего коэффициента Ь это значит, что промышленности Европы и Азии могут наращивать объемы продаж на американском рынке быстрее, чем промышленность
Америки; наибольшее возможное увеличение поступлений автомобилей в год Америка может осуществить до 14%, а иностранные поставщики до 24%;
- ? коэффициенты а2, Ь2, Ь3 отрицательны, а коэффициент а3 положителен: все эти параметры отвечают в модели за уменьшение спроса при увеличении объемов продаж всеми поставщиками. Положительное влияние объема продаж иностранных машин на воспроизводство американских, по-видимому, объясняется национальными приоритетами правительства, т. е. на увеличение продаж импортного происхождения американское правительство отвечает стимуляцией собственного автомобильного сектора;
- ? временной лаг составляет примерно 5,5 лет: такая задержка в реакции высокотехнической промышленности соответствует времени перехода на новую продукцию, способную изменить конкурентную ситуацию на рынке. Очевидно, что автомобильная индустрия разных стран за разное время обновляет ассортимент, но в данном случае мы имеем дело со средним статистическим сроком. При этом речь не идет о принципиально новых решениях, таких как переход на новое топливо, введение новых материалов или обширная компьютеризация автомобиля. Достаточно найти путь к сердцу потребителя;
- ? равновесное состояние значительно выше текущих продаж американских автомобилей, в то время как продажи импортных авто колеблются около равновесной точки: в последние 20 лет на американском рынке продаж отечественная индустрия постепенно сдает позиции импорту (за указанное время в американской внешней торговле импорт на 20% превышает экспорт в целом). Поскольку модель строилась по продолжительному временному интервалу, с 1967 по 2005 г., на динамику продаж, очевидно, влияют другие, экзогенные по отношению к рассматриваемым экономическим агентам, факторы. Таким образом, прогноз будущего роста продаж автомобилей американского производства носит гипотетический характер: сначала необходимо устранить общеэкономические причины доминирования импорта.