Критерий Зигеля-Тьюки
Материал из MachineLearning.
 (→Описание критерия)  | 
				 (→Ссылки)  | 
			||
| (5 промежуточных версий не показаны.) | |||
| Строка 1: | Строка 1: | ||
'''Критерий Зигеля-Тьюки''' является ранговым критерием, предназначенным для проверки принадлежности двух независимых выборок   | '''Критерий Зигеля-Тьюки''' является ранговым критерием, предназначенным для проверки принадлежности двух независимых выборок   | ||
к общей генеральной совокупности с одинаковыми характеристиками рассеяния.  | к общей генеральной совокупности с одинаковыми характеристиками рассеяния.  | ||
| + | |||
| + | ==Примеры задач==  | ||
| + | Пусть на некотором предприятии два подразделения выполняют одну и ту же работу, но на оборудовании различных производителей.  | ||
| + | Каждому подразделению соответствует выборка, состоящая из рабочих этого подразделения.  | ||
| + | Каждое значение в выборке - это числовая оценка производительности данного рабочего.  | ||
| + | Требуется определить, даёт ли использование одного оборудования лучший результат по сравнению с оборудованием другого производителя.  | ||
| + | |||
| + | Другой пример: предположим, существует два альтернативных агротехнических метода обработки полей.  | ||
| + | Для каждого такого метода составим выборку из обработанных им полей.  | ||
| + | Значение в выборке равно урожайности данного поля.  | ||
| + | Требуется найти наиболее эффективный метод.  | ||
==Описание критерия==  | ==Описание критерия==  | ||
Даны две выборки: <tex>x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R}</tex>.  | Даны две выборки: <tex>x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R}</tex>.  | ||
| - | Через <tex>H_0</tex> обозначим следующую гипотезу: <tex>  | + | Через <tex>H_0</tex> обозначим следующую гипотезу: разброс <tex>x^m</tex> и <tex>y^n</tex> одинаков.  | 
Составим объединённую упорядоченную выборку  | Составим объединённую упорядоченную выборку  | ||
::<tex>z_1,z_2,\dots,z_{m+n}</tex>  | ::<tex>z_1,z_2,\dots,z_{m+n}</tex>  | ||
| Строка 16: | Строка 27: | ||
::<tex>U = \min\left\{U_x,U_y\right\}.</tex>.  | ::<tex>U = \min\left\{U_x,U_y\right\}.</tex>.  | ||
Гипотеза <tex>H_0</tex> принимается, если <tex>U \notin \left[ U_{\alpha/2},\, U_{1-\alpha/2} \right] </tex>,   | Гипотеза <tex>H_0</tex> принимается, если <tex>U \notin \left[ U_{\alpha/2},\, U_{1-\alpha/2} \right] </tex>,   | ||
| - | где U_{\alpha} есть <tex>\alpha</tex>-квантиль табличного распределения Уилкоксона-Манна-Уитни с параметрами <tex>m,\,n<  | + | где <tex>U_{\alpha}</tex> есть <tex>\alpha</tex>-квантиль табличного распределения Уилкоксона-Манна-Уитни с параметрами <tex>m,\,n</tex>.  | 
==Литература==  | ==Литература==  | ||
| Строка 27: | Строка 38: | ||
==Ссылки==  | ==Ссылки==  | ||
| - | *[http://en.wikipedia.org/wiki/Siegel-Tukey_test Siegel-Tukey test](Wikipedia)  | + | * [http://en.wikipedia.org/wiki/Siegel-Tukey_test Siegel-Tukey test](Wikipedia)  | 
| + | * [http://ami.nstu.ru/~headrd/seminar/publik_html/Homogeneity_variance_2.pdf О применении и мощности непараметрических критериев однородности характеристик рассеяния  (Ансари-Бредли, Муда, Сижела-Тьюки, Кейпена и Клотца) на сайте Новосибирского государственного технического университета]   | ||
[[Категория:Прикладная статистика]]  | [[Категория:Прикладная статистика]]  | ||
| + | [[Категория:Непараметрические статистические тесты]]  | ||
Текущая версия
Критерий Зигеля-Тьюки является ранговым критерием, предназначенным для проверки принадлежности двух независимых выборок к общей генеральной совокупности с одинаковыми характеристиками рассеяния.
Содержание | 
Примеры задач
Пусть на некотором предприятии два подразделения выполняют одну и ту же работу, но на оборудовании различных производителей. Каждому подразделению соответствует выборка, состоящая из рабочих этого подразделения. Каждое значение в выборке - это числовая оценка производительности данного рабочего. Требуется определить, даёт ли использование одного оборудования лучший результат по сравнению с оборудованием другого производителя.
Другой пример: предположим, существует два альтернативных агротехнических метода обработки полей. Для каждого такого метода составим выборку из обработанных им полей. Значение в выборке равно урожайности данного поля. Требуется найти наиболее эффективный метод.
Описание критерия
Даны две выборки: .
Через 
 обозначим следующую гипотезу: разброс 
 и 
 одинаков.
Составим объединённую упорядоченную выборку
и составим из неё новую последовательность вида
,
т.е. оставшийся ряд "переворачивается" после приписывания рангов очередной паре крайних значений.
Ранги, присвоенные в этой последовательности элементам проверяемых выборок, обозначим через .
Вычислим теперь статистику Манна-Уитни:
.
Гипотеза  принимается, если 
, 
где 
 есть 
-квантиль табличного распределения Уилкоксона-Манна-Уитни с параметрами 
.
Литература
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.
 

