Комбинирование прогнозов вложенных моделей с учетом

реклама
Комбинирование прогнозов вложенных моделей с учетом выбросов
Пырлик Владимир Николаевич
НИУ Высшая школа экономики, Факультет экономики (Санкт-Петербург)
Множество
теоретических
и
эмпирических
работ
посвящено
исследованию
возможностей и перспектив комбинирования прогнозов. Большинство авторов делают вывод,
что для огромного количества временных рядов методы комбинирования превосходят по
качеству прогнозов методики, основанные на прогнозах, получаемых на основе единственной
модели [1 — 7].
В условиях большого количества моделей, предлагающих различные индивидуальные
прогнозы, эффективность комбинирования во многом зависит от подходов к решению двух
подзадач: 1) снижение количества индивидуальных прогнозов; 2) определение оптимальных
весов индивидуальных прогнозов в комбинированном прогнозе [1, 9].
Особым случаем альтернативных моделей прогнозирования являются наборы
вложенных моделей [1, 9, 11]. Ошибки индивидуальных прогнозов по вложенным моделям
могут быть сильно коррелированны, и необходимо отсеять часть моделей до включения их в
комбинированный прогноз. Для этого используются различные методы кластеризации и
упорядочивания моделей по их ретроспективным показателям качества прогноза и точности
аппроксимации данных [1, 8, 9, 11].
В данной работе серия вложенных моделей ARMA группируется на основе статистик
информационного критерия Акаике (AiC), сумме квадратов остатков (RSS) и ретроспективной
ошибке
прогноза различной глубины (1 – 10 дней), определяемой в терминах корня из
среднеквадратической ошибки прогноза (RMSPE). На этапе формирования весов предлагается
использовать частный случай взвешенной регрессии, в которой нулевой вес придается
наблюдениям, для которых все индивидуальные модели продемонстрировали наихудшее
качество прогноза. Данный подход позволяет учесть тот факт, что вложенные модели, как
правило, трактуют одно и то же информационной множество схожим образом, и если
прогнозируемый процесс подвергается влиянию факторов, которые данное семейство моделей
не учитывает принципиально, то в ряде случаев ни одной из моделей не удастся предложить
адекватный прогноз. Идентифицируя такие ситуации на основе анализа наилучших прогнозов
множества моделей, можно увеличить точность комбинированных прогнозов на тех интервалах
времени, когда неучтенные моделями факторы не оказывают существенного влияния на
изучаемый процесс, и если проявление этих факторов достаточно редко, то это приведет и к
увеличению среднего качества прогнозов в целом.
В работе рассматривается динамика цен (ежедневные значения) на нефть марки Brent на
бирже ICE в период с начала 2008 года по начало октября 2013 года; всего в исходной выборке
1770 наблюдений. Поскольку в различные периоды времени исходный ряд демонстрирует
следование различным тенденциям, то в качестве моделируемой переменной при построении
серии моделей ARMA используется ряд логарифмов ежедневных темпов роста исходного ряда.
Построение комбинированных прогнозов с предварительным сужением набора
индивидуальных прогнозов требует проведения расчетов в два этапа.
На первом этапе строится серия ретроспективных прогнозов по каждой из
индивидуальных моделей. В данной работе рассматриваются модели ARMA(p, q) порядка (0, 0)
— (3, 3), строятся прогнозы на 1 день вперед по предыдущим 100 наблюдениям. Фиксируются
ретроспективные
прогнозы
по
различным
моделям.
Для
сокращения
количества
индивидуальных прогнозов отбираются модели с минимальным значением AiC, минимальным
значением RSS и минимальными ошибками прогноза за предшествующие прогнозной дате 1, 3,
5 и 10 дней.
На втором этапе расчетов строится ряд ретроспективных комбинированных прогнозов
на основе сформированного набора из 5 индивидуальных прогнозов: 1) комбинирование с
равными весами; 2) комбинирование на основе обычной МНК-регрессии; 3) предлагаемая в
работе схема комбинирования, когда в МНК-регрессии используются только те наблюдения,
для которых абсолютная ошибка прогноза по всем построенным на первом этапе моделям
ARMA не превышает уровень некоторого своего квантиля (уровень отсечения выбросов).
Процент наблюдений, влияющих на веса комбинирования по третьей схеме, варьируется
от 0.5 (отбрасывается половина наблюдений) до 0.99 (не учитывается 1% наблюдений — с
наибольшей ошибкой наилучшего прогноза).
Комбинированные прогнозы рассматриваются на 1 день вперед, веса оцениваются по
выборке из предшествующих дате прогнозирования 150 наблюдений. Итоговый анализ качества
прогнозов оценивается по выборке из 1520 наблюдений, что соответствует периоду 27/10/2008 –
02/10/2013.
Результаты сравнения качества различных схем прогнозирования иллюстрирует Рис. 1.
Из индивидуальных прогнозов наилучшим качеством обладает прогноз на основе моделей,
продемонстрировавшей наименьшую среднеквадратическую ошибку прогноза за 10 дней,
предшествующих дате прогноза, RMSPE(10). Примечательно, что этот индивидуальные прогноз
превосходит по качеству схему комбинирования с равными весами и комбинирование МНК без
отсечения выбросов.
Наилучших результатов позволяет достичь предложенная схема комбинирования с
отсечением
выбросов.
Варьируя
уровень
отсечения,
удалось
корректировать
веса
альтернативных моделей в комбинированном прогнозе так, что предлагаемая схема
превосходит по качеству прогноза не только индивидуальные прогнозы, но и схему с равными
весами и комбинирование обычным МНК.
1.150
1.145
Индивидуальный прогноз RMSPE(10)
Комбинирвоание с равными весами
Комбинирвоание МНК без отсечения выбросов
Комбинирование МНК с отсечением выбросов
(квадратичный тренд по уровню отсечения)
1.140
1.135
1.130
1.125
1.120
1.115
1.0
0.9
0.8
0.7
0.6
0.5
Уровень отсечения выборосов
Рис. 1. MAPE различных схем комбинирования, за период 27/10/2008 – 02/10/2013
Список источников
1. Timmerman, A. Forecast combinations. In: Elliott, G., Granger, C.W.J., Timmermann, A. (Eds.),
Handbook of Economic Forecasting. Elsevier, Amsterdam, 2006.
2. Clemen, R.T. Combining forecasts: A review and annotated bibliography // International Journal of
Forecasting 5, 1989.
3. Makridakis, S., Hibon, M. The M3-competition: Results, conclusions and implications //
International Journal of Forecasting 16, 2000.
4. Stock, J.H., Watson, M. A comparison of linear and nonlinear univariate models for forecasting
macroeconomic time series. In: Engle, R.F., White, H. (Eds.), Festschrift in Honour of Clive
Granger, Cambridge University Press, Cambridge, 2001.
5. Stock, J.H.,Watson, M. Combination forecasts of output growth in a seven-country data set //
Journal of Forecasting 23, 2004.
6. Guidolin, M., Timmermann, A. Forecasts of US short-term interest rates: A flexible forecast
combination approach // Journal of Econometrics, 150, 2009.
7. West, K.D. Forecast evaluation. In: Elliott, G., Granger, C.W.J., Timmermann, A. (Eds.), Handbook
of Economic Forecasting. Elsevier, Amsterdam, 2006.
8. Swanson, N.R., Zeng, T. Choosing among competing econometric forecasts: Regression-based
forecast combination using model selection // Journal of Forecasting 6, 2001.
9. Palm, F.C., Zellner, A. To combine or not to combine? Issues of combining forecasts // Journal of
Forecasting 11, 1992.
10. Makridakis, S., Andersen, A., Carbone, R., Fildes, R., Hibon, M., Lewandowski, R., Newton, J.,
Parzen, E., Winkler, R. The accuracy of extrapolation (time series) methods: Results of a forecasting
competition // Journal of Forecasting 1, 1982.
11. Aiolfi, M., Favero, C.A. Model uncertainty, thick modeling and the predictability of stock returns //
Journal of Forecasting 24, 2005.
Скачать