Критерий Краскела-Уоллиса
Материал из MachineLearning.
 (Новая: '''Критерий Краскела-Уоллиса''' предназначена для проверки равенства средних нескольких выборок. Данн...)  | 
				м  (→Описание критерия)  | 
			||
| Строка 15: | Строка 15: | ||
== Описание критерия ==  | == Описание критерия ==  | ||
| - | Заданы <i>k</i> выборок: <tex>x_1^{n_1}=\left\{  | + | Заданы <i>k</i> выборок: <tex>x_1^{n_1}=\left\{x_{11},\dots,x_{1n_1}\right\}, \dots, x_k^{n_k}=\left\{x_{k1},\dots,x_{kn_k}\right\}</tex>.  | 
Объединённая выборка: <tex>x=x_1^{n_1}\cup x_2^{n_2}\cup \dots \cup x_k^{n_k}</tex>.  | Объединённая выборка: <tex>x=x_1^{n_1}\cup x_2^{n_2}\cup \dots \cup x_k^{n_k}</tex>.  | ||
Версия 19:24, 17 ноября 2008
Критерий Краскела-Уоллиса предназначена для проверки равенства средних нескольких выборок. Данный критерий является многомерным обобщением критерия Уилкоксона-Манна-Уитни. Критерий Краскела-Уоллиса является ранговым, поэтому он инвариантен по отношению к любому монотонному преобразованию шкалы измерения. Известен так же под названиями: критерий Крускала-Уоллиса,H-критерий Краскела-Уоллиса, Kruskal-Wallis one-way analysis of variance, Kruskal-Wallis test.
Содержание | 
Примеры задач
Пример 1. Проходит чемпионат мира по футболу. Первая выборка —- опрос болельщиков с вопросом "Каковы шансы на победу сборной России?" до начала чемпионата. Вторая выборка —- после первой игры, третья —- после второго матча и т.д. Значения в выборках — шансы России на победу по десятибальной шкале (1 —- никаких перспектив, 10 —- отвезти в Россию кубок —- дело времени). Требуется проверить, зависят ли результаты опросов от хода чемпионата.
Описание критерия
Заданы k выборок: .
Объединённая выборка: 
.
Дополнительные предположения:
- обе выборки простые, объединённая выборка независима;
 -  выборки взяты из неизвестных непрерывных распределений  
.
 
Проверяется нулевая гипотеза  при альтернативе 
.
Упорядочим все  элементов выборок по возрастанию и обозначим 
 ранг j-го элемента i-й выборки в полученном вариационном ряду.
Статистика критерия Краскела-Уоллиса для проверки гипотезы о наличии сдвига в параметрах положения двух сравниваемых выборок имеет вид 
где .
Гипотеза сдвига отклоняется на уровне значимости , если 
, где 
 — критическое значение, при 
 и 
 вычисляемое по таблицам.
При бОльших значениях применимы различные аппроксимации.
Аппроксимация Краскела-Уоллиса
Пусть 
Тогда статистика 
будет иметь при отсутствии сдвига F-распределение с  и 
 степенями свободы.
Таким образом, нулевая гипотеза отклоняется с достоверностью 
, если 
.
Аппроксимация Имана-Давенпорта
В соответстви с ней нулевая гипотеза сдвига отклоняется с достоверностью , если 
, где 
 и 
 — соответственно критические значения статистик Фишера и хи-квадрат с соответствующими степенями свободы.
Это более точная аппроксимация, чем аппроксимация Краскела-Уоллиса.
При наличии связанных рангов (т.е. когда совпадают значения величин из разных выборок и им присваиваются одинаковые средние ранги) необходимо использовать модифицированную статистику  где 
 — размер j-й группы одинаковых элементов; q — количество групп одинаковых элементов.
При 
 справедлива аппроксимация распределения статистики 
-распределением с f=k-1 степенями свободы, т.е. нулевая гипотеза отклоняется, если 
.
См. также
Литература
- Kruskal W. H. and Wallis W. A. Use of ranks in one-criterion variance analysis. // Journal of the American Statistical Association. — 1952, 47 №260. — Pp. 583–621.
 - Ликеш И., Ляга Й. Основные таблицы математической статистики. — М.: Финансы и статистика, 1985.
 - Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 466-468 с.
 

