Критерий Чоу
Материал из MachineLearning.
 (Новая: Тест Чоу позволяет оценить значимость улучшения регрессионной модели после разделения исходной выб...)  | 
				|||
| (2 промежуточные версии не показаны) | |||
| Строка 1: | Строка 1: | ||
| - | Тест Чоу позволяет оценить значимость улучшения регрессионной модели после разделения исходной выборки на части.  | + | '''Тест Чоу''' позволяет оценить значимость улучшения регрессионной модели после разделения исходной выборки на части. Это модификация однопараметрической [[Экспоненциальное сглаживание|экспоненциальной модели]] с коррекцией коэффициента линейного тренда. В методе Чоу происходит адаптация параметра к изменениям в дианамике ряда.   | 
| + | |||
| + | Примером использования данного критерия может служить задача, которую решал Чоу. Он тестировал свой метод на рядах месячных данных о сделках на различные виды продукции: перчатки, смазочные материалы, сальники, подшипники и т.д. Данные представляли собой разнообразные образцы поведения экономических временных рядов, включая циклическое движение. В 59 случаев из 60 предлагаемый метод показал преимущества перед стандартной процедурой и в одном случае результаты были почти одинаковы.   | ||
==Постановка задачи==  | ==Постановка задачи==  | ||
| Строка 8: | Строка 10: | ||
::<tex>\hat{y}_t=\sum_{j=1}^kf_j(t)\alpha_j</tex>  | ::<tex>\hat{y}_t=\sum_{j=1}^kf_j(t)\alpha_j</tex>  | ||
<tex>f_j(t)</tex> - признаки (информация), по которым строится прогноз на момент времени <tex>t</tex>, т.е. могут быть определены только до <tex>t-1</tex>го момента  | <tex>f_j(t)</tex> - признаки (информация), по которым строится прогноз на момент времени <tex>t</tex>, т.е. могут быть определены только до <tex>t-1</tex>го момента  | ||
| + | |||
| + | Варианты выбора функции <tex>f_j</tex>:  | ||
| + | *<tex>f_j</tex> может быть функцией времени (<tex>t, t^2,\ldots</tex>)  | ||
| + | *члены [[Авторегрессия|авторегрессии]]: <tex>f_j=y_{t-1},y_{t-2},\ldots</tex>  | ||
| + | *<tex>f_j</tex> - внешние данные  | ||
Выделим внутри рассматриваемого временного интервала момент <tex>T_2</tex>. Пусть прогноз на отрезке  | Выделим внутри рассматриваемого временного интервала момент <tex>T_2</tex>. Пусть прогноз на отрезке  | ||
| Строка 15: | Строка 22: | ||
== Описание критерия Чоу==  | == Описание критерия Чоу==  | ||
| - | Пусть <tex>\vareps_{1t}=\hat{y}_{1t}-y_t,\; \vareps_{2t}=\hat{y}_{2t}-y_t  | + | Пусть <tex>\vareps_{1t}=\hat{y}_{1t}-y_t,\; \vareps_{2t}=\hat{y}_{2t}-y_t</tex> - неточности в предсказании рядов на отрезках   | 
| - | <  | + | <tex>[T_1;T_2]</tex> и <tex>[T_2;T_3]</tex> соответственно.  | 
| + | |||
| + | Будем считать, что <tex>\vareps_{1t},\; \vareps_{2t}</tex> распределены нормально с одними и теми же параметрами.  | ||
===Нулевая гипотеза===  | ===Нулевая гипотеза===  | ||
| - | Сформулируем нулевую гипотезу:  | + | Сформулируем [[Нулевая гипотеза|нулевую гипотезу]]:  | 
::<tex>H_0:\;</tex> структура стабильна   | ::<tex>H_0:\;</tex> структура стабильна   | ||
<br/ >(разбиение на две модели не способствовало лучшему прогнозированию)  | <br/ >(разбиение на две модели не способствовало лучшему прогнозированию)  | ||
| Строка 25: | Строка 34: | ||
===Статистика Чоу===  | ===Статистика Чоу===  | ||
Будем использовать следующие обозначения:  | Будем использовать следующие обозначения:  | ||
| - | *<tex>\vareps_t=\hat{y}_t-y_t</tex>  | + | *<tex>\vareps_t=\hat{y}_t-y_t</tex> - неточность в предсказании ряда на отрезке <tex>[T_1;T_3]</tex>  | 
*<tex>RSS</tex> - [[Остаточная сумма квадратов|остаточная сумма квадратов]] для всего интервала <tex>[T_1;T_3]</tex>  | *<tex>RSS</tex> - [[Остаточная сумма квадратов|остаточная сумма квадратов]] для всего интервала <tex>[T_1;T_3]</tex>  | ||
*<tex>RSS_1=\sum_{t=T_1}^{T_2-1}\vareps_{t1}^2</tex>  | *<tex>RSS_1=\sum_{t=T_1}^{T_2-1}\vareps_{t1}^2</tex>  | ||
| Строка 31: | Строка 40: | ||
Статистика Чоу:  | Статистика Чоу:  | ||
::<tex>F(T_2)=\frac{RSS-\bigl(RSS_1+RSS_2\bigr)}{RSS_1+RSS_2}\cdot\frac{n-k_1+k_2}{k_1+k_2-k}</tex>  | ::<tex>F(T_2)=\frac{RSS-\bigl(RSS_1+RSS_2\bigr)}{RSS_1+RSS_2}\cdot\frac{n-k_1+k_2}{k_1+k_2-k}</tex>  | ||
| - | |||
| - | Статистика Чоу имеет [[  | + | <tex> k1</tex> - число параметров модели, предсказывающей поведение ряда на отрезке <tex>[T_1;T_2]</tex>   | 
| + | <br/ ><tex>k2</tex> - число параметров модели, предсказывающей поведение ряда на отрезке <tex>[T_2;T_3]</tex>   | ||
| + | <br/ ><tex>k</tex> - число параметров модели, предсказывающей поведение ряда на отрезке <tex>[T_1;T_3]</tex>   | ||
| + | (в общем случае <tex>k\neq k1+k2</tex>)  | ||
| + | <br/ ><tex>n=T_3-T_1+1</tex>   | ||
| + | |||
| + | Статистика Чоу имеет [[Критерий Фишера|распределение Фишера]] с <tex>k_1+k_2-k</tex> и <tex>n-k_1-k_2</tex> степенями свободы.  | ||
=== Критическая область ===  | === Критическая область ===  | ||
| Строка 39: | Строка 53: | ||
<tex>\alpha</tex> - это область   | <tex>\alpha</tex> - это область   | ||
::<tex>\Omega_{\alpha}:\; F(T_2)>F_{k_1+k2-k,n-k_1-k_2,\alpha}</tex>  | ::<tex>\Omega_{\alpha}:\; F(T_2)>F_{k_1+k2-k,n-k_1-k_2,\alpha}</tex>  | ||
| - | где <tex>F_{k_1+k2-k,n-k_1-k_2,\alpha}</tex> - [[квантиль   | + | где <tex>F_{k_1+k2-k,n-k_1-k_2,\alpha}</tex> - [[квантиль]] Фишера.  | 
Если гипотеза <tex>H_0</tex> отвергается, то необходимо использовать две модели.  | Если гипотеза <tex>H_0</tex> отвергается, то необходимо использовать две модели.  | ||
| Строка 66: | Строка 80: | ||
== Ссылки ==  | == Ссылки ==  | ||
| - | *[http://www.basegroup.ru/glossary/definitions/test_chow/ ChowTest](BaseGroup)  | + | *[http://www.basegroup.ru/glossary/definitions/test_chow/ ChowTest] (BaseGroup)  | 
| + | *[http://en.wikipedia.org/wiki/Chow_test Chow test] (Wikipedia)  | ||
| + | |||
| + | [[Категория:Энциклопедия анализа данных]]  | ||
| - | [[Категория:   | + | [[Категория:Анализ временных рядов]]  | 
{{stub}}  | {{stub}}  | ||
Текущая версия
Тест Чоу позволяет оценить значимость улучшения регрессионной модели после разделения исходной выборки на части. Это модификация однопараметрической экспоненциальной модели с коррекцией коэффициента линейного тренда. В методе Чоу происходит адаптация параметра к изменениям в дианамике ряда.
Примером использования данного критерия может служить задача, которую решал Чоу. Он тестировал свой метод на рядах месячных данных о сделках на различные виды продукции: перчатки, смазочные материалы, сальники, подшипники и т.д. Данные представляли собой разнообразные образцы поведения экономических временных рядов, включая циклическое движение. В 59 случаев из 60 предлагаемый метод показал преимущества перед стандартной процедурой и в одном случае результаты были почти одинаковы.
Содержание | 
Постановка задачи
Основной задачей в этом разделе является обнаружение структурных изменений.
Пусть на временном интервале  прогноз для момента 
 по уже полученным данным  
 имеет следующий вид:
 - признаки (информация), по которым строится прогноз на момент времени 
, т.е. могут быть определены только до 
го момента
Варианты выбора функции :
может быть функцией времени (
)
- члены авторегрессии: 
 - внешние данные
Выделим внутри рассматриваемого временного интервала момент . Пусть прогноз на отрезке
Определим, насколько же необходимо менять модель в момент времени .
Описание критерия Чоу
Пусть  - неточности в предсказании рядов на отрезках 
 и 
 соответственно.
Будем считать, что  распределены нормально с одними и теми же параметрами.
Нулевая гипотеза
Сформулируем нулевую гипотезу:
структура стабильна
(разбиение на две модели не способствовало лучшему прогнозированию)
Статистика Чоу
Будем использовать следующие обозначения:
- неточность в предсказании ряда на отрезке
- остаточная сумма квадратов для всего интервала
Статистика Чоу:
 - число параметров модели, предсказывающей поведение ряда на отрезке 
 
 - число параметров модели, предсказывающей поведение ряда на отрезке 
 
 - число параметров модели, предсказывающей поведение ряда на отрезке 
 
(в общем случае 
)
 
Статистика Чоу имеет распределение Фишера с  и 
 степенями свободы.
Критическая область
Для критерия Чоу критическая область при уровне значимости 
 - это область 
где  - квантиль Фишера.
Если гипотеза  отвергается, то необходимо использовать две модели.
Примечание
Если момент времени  неизвестен, то рекомендуется следующее значение:
Литература
Лукашин Ю. П. Адаптивные методы краткосрочного прогнозирования временных рядов.. — М.: Финансы и статистика, 2003. — 416 с. — ISBN 5-279-02740-5

