Критерий Диболда-Мариано
Материал из MachineLearning.
 (Новая: {{TOCright}}  '''Критерий Диболда-Мариано''' (Diebold-Mariano test) -- статистический тест, позволяющий сравнивать качес...)  | 
				|||
| Строка 5: | Строка 5: | ||
==Описание==  | ==Описание==  | ||
| - | Пусть <tex>\{y_t\}_{t=1}^T</tex>, <tex>\{y_{At}\}_{t=1}^T</tex> -- прогнозные значения модели A, <tex>\{y_{Bt}\}_{t=1}^T</tex> -- прогнозные значения модели B, <tex>\{e_{At}\}_{t=1}^T</tex> и <tex>\{e_{Bt}\}_{t=1}^T</tex>-- остатки прогнозов обеих моделей, <tex>g(e)</tex> -- функция потерь,   | + | Пусть  | 
| - | + | <tex>\{y_t\}_{t=1}^T</tex>, <tex>\{y_{At}\}_{t=1}^T</tex> -- прогнозные значения модели A,  | |
| - | + | <tex>\{y_{Bt}\}_{t=1}^T</tex> -- прогнозные значения модели B,  | |
| - | + | <tex>\{e_{At}\}_{t=1}^T</tex> и <tex>\{e_{Bt}\}_{t=1}^T</tex>-- остатки прогнозов обеих моделей,  | |
| + | <tex>g(e)</tex> -- функция потерь,  | ||
| + | <tex>d_{t} = g(e_{At}) - g(e_{Bt}), t=1...T</tex>.   | ||
| + | Если <tex>\{d_{t}\}_{t=1}^T</tex> является слабостационарным временным рядом, то можно показать, что <tex>\sqrt T(\bar d - \mu) \stackrel{d}{\longrightarrow} N(0, f)</tex>, где <tex>\bar d =\frac1T \sum_1^{T} d_t</tex>, <tex>\mu</tex> - неизвестное матожидание процесса, <tex>f</tex> - его дисперсия. Проверямая в критерии гипотеза <tex>H_0</tex>: <tex>\mathbf{E}d=0</tex>, альтернатива (двусторонняя): <tex>\mathbf{E}d\neq0</tex>. Вычисляемая статистика: <tex>S=\frac{\bar d}{\sqrt{(\bar f / T)}}</tex>, где <tex>\bar f = \sum_{t=-\infty}^{t=\infty}\gamma_d(\tau)</tex>, где <tex>\gamma_d(\tau)</tex> -- автоковариация <tex>d</tex> порядка <tex>\tau</tex>. Гипотезе <tex>H_0</tex> соответствует <tex>: S \sim N(0, 1)</tex>.  | ||
Версия 18:46, 23 января 2014
 
  | 
Критерий Диболда-Мариано (Diebold-Mariano test) -- статистический тест, позволяющий сравнивать качество прогнозов временного ряда двух предсказательных моделей. Впервые был представлен в работе Диболда и Мариано в 1995 году, где был приведен небольшой обзор тестов такого рода. Этот тест является устойчивым к различным отклонениям от стандартных предположенный о свойствах ошибок прогнозирования. А именно предполагается, что ошибки прогнозирования могут не удовлетворять классическим критериям, т.е. могут не быть нормальными, иметь ненулевой средний уровень, а также быть серийно и одновременно коррелированными.
Описание
Пусть
, 
 -- прогнозные значения модели A,
 -- прогнозные значения модели B,
 и 
-- остатки прогнозов обеих моделей,
 -- функция потерь,
. 
Если  является слабостационарным временным рядом, то можно показать, что 
, где 
, 
 - неизвестное матожидание процесса, 
 - его дисперсия. Проверямая в критерии гипотеза 
: 
, альтернатива (двусторонняя): 
. Вычисляемая статистика: 
, где 
, где 
 -- автоковариация 
 порядка 
. Гипотезе 
 соответствует 
.
Дополнительно
Рассмотренный способ проверки гипотезы о совпадении каче�ства прогнозов, основанных на различных моделях, является на�дежным для широкого класса функций потерь. В частности, функ�ции потерь не обязаны быть квадратическими или симметричными и непрерывными. Помимо этого, отметим еще раз, что ошибки прогнозирования могут не быть гауссовскими, а также могут иметь ненулевой средний уровень и быть коррелированными (как серий�но, так и одновременно). Последнее допущение особенно важно, поскольку сравниваемые прогнозы являются прогнозами одного и того же временного ряда и основаны на довольно сильно совпа�дающих информационных множествах, вследствие чего ошибки прогнозирования могут быть сильно одновременно коррелирован�ными. Однако ошибки прогнозирования в общем случае являются серийно коррелированными, и предложенный тест позволяет учи�тывать и эту особенность.
Также возможны модификации критерия для односторонних альтернатив и для коротких временных рядов.
Программные реализации
- В MATLAB функция parcorr
 - В R функция pacf из пакета stats.
 - В Python функция statsmodels.tsa.stattools.pacf библиотеки statsmodels.
 
Ссылки
- Autocorrelation and Partial Autocorrelation. MATLAB R2013b Documentation
 - Partial Autocorrelation function on Wikipedia
 - Статистический анализ данных (курс лекций, К.В. Воронцов)
 - Box, G. E. P.; Jenkins, G. M.; Reinsel, G. C. (2008). Time Series Analysis, Forecasting and Control (4th ed.). Hoboken, NJ: Wiley. ISBN 9780470272848.
 

