Участник:Василий Ломакин/Критерий Уилкоксона двухвыборочный
Материал из MachineLearning.
| Строка 1: | Строка 1: | ||
| - | '''Критерий Уилкоксона двухвыборочный''' — [[непараметрический статистический критерий]], используемый для проверки гипотезы о равенстве средних двух независимых выборок. Выборки взяты из закона распределения, отличного от нормального, либо данные измерены с использованием нечисловой шкалы. Метод следует использовать   | + | '''Критерий Уилкоксона двухвыборочный''' — [[непараметрический статистический критерий]], используемый для проверки гипотезы о равенстве средних двух независимых выборок. Выборки взяты из закона распределения, отличного от нормального, либо данные измерены с использованием нечисловой шкалы. Метод следует использовать, когда нет информации о дисперсии выборок. В случае равных дисперсий следует применять более мощный [[Критерий_Уилкоксона-Манна-Уитни|U-критерий Манна-Уитни]]. Имеется [[Критерий_Уилкоксона_для_связных_выборок|аналог]] критерия Уилкоксона для связанных повторных наблюдений.  | 
| - | [[Критерий_Уилкоксона-Манна-Уитни|U-критерий Манна-Уитни]]. Имеется [[Критерий_Уилкоксона_для_связных_выборок|аналог]] критерия Уилкоксона для   | + | |
== Пример задачи ==  | == Пример задачи ==  | ||
| Строка 6: | Строка 5: | ||
== Описание критерия ==  | == Описание критерия ==  | ||
| - | Заданы две выборки <tex>x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R}</tex>.  | + | Заданы две выборки <tex>x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R};\; m \le n,</tex> в противном случае следует поменять выборки местами.  | 
'''Дополнительные предположения:'''   | '''Дополнительные предположения:'''   | ||
| Строка 14: | Строка 13: | ||
'''Статистика критерия:'''  | '''Статистика критерия:'''  | ||
| + | # Построить общий вариационный ряд объединённой выборки <tex>x^{(1)} \leq \cdots \leq x^{(m+n)}</tex> и найти ранги <tex>r(x_i),\; r(y_i)</tex> всех элементов обеих выборок в общем вариационном ряду.   | ||
| + | # Рассчитать суммы рангов, соответствующих обеим выборкам:  | ||
| + | : <tex>R_x = \sum_{i=1}^m r(x_i);</tex>  | ||
| + | : <tex>R_y = \sum_{i=1}^n r(y_i);</tex>  | ||
| + | # Если размеры выборок совпадают (<tex>m=n</tex>), то значение статистики <tex>W</tex> будет равняется одной из сумм рангов <tex>R_x</tex> или <tex>R_y</tex> (любой).  | ||
| + | |||
| + | '''Критерий''' (при [[уровень значимости|уровне значимости]] <tex>\alpha</tex>):  | ||
| + | |||
| + | * против альтернативы <tex>H_1:\;</tex> ????  | ||
| + | |||
| + | :если <tex>W \notin \left[ W_{\alpha/2},\,W_{1-\alpha/2} \right]</tex> , то нулевая гипотеза отвергается. Здесь <tex>W_{\alpha}</tex>  есть <tex>\alpha</tex>-квантиль табличного распределения Уилкоксона с параметрами <tex>m,\,n</tex>.   | ||
| + | |||
| + | '''Асимптотический критерий''':  | ||
| + | |||
| + | Рассмотрим нормированную и центрированную статистика Уилкоксона:  | ||
| + | |||
| + | :<tex>T = \frac{R - \frac{N(N+1)}{4}}{\sqrt{\frac{N(N+1)(2N+1)}{24}}}</tex>;  | ||
| + | |||
| + | <tex>T</tex> асимптотически имеет стандартное нормальное распределение при <tex>N \ge 20</tex>.  | ||
| + | |||
| + | При наличии связок необходимо учесть их с помощью поправки. Выражение под корнем в знаменателе необходимо заменить на следующее:  | ||
| + | |||
| + | :<tex>\frac{N(N+1)(2N+1) - \frac{\sum_{j=1}^{g}{t_j(t_j-1)(t_j+1)}}{2}}{24},</tex>  | ||
| + | |||
| + | :где <tex>g</tex> - количество связок, <tex>t_1, \ldots, t_g</tex> - их размеры.  | ||
| + | |||
== Свойства и границы применимости критерия ==  | == Свойства и границы применимости критерия ==  | ||
| Строка 24: | Строка 49: | ||
== Ссылки ==   | == Ссылки ==   | ||
| - | * [[Проверка статистических гипотез]] — о методологии проверки статистических гипотез.   | + | * [[Проверка статистических гипотез]] — о методологии проверки статистических гипотез.  | 
| - | + | ||
Версия 22:14, 11 декабря 2009
Критерий Уилкоксона двухвыборочный — непараметрический статистический критерий, используемый для проверки гипотезы о равенстве средних двух независимых выборок. Выборки взяты из закона распределения, отличного от нормального, либо данные измерены с использованием нечисловой шкалы. Метод следует использовать, когда нет информации о дисперсии выборок. В случае равных дисперсий следует применять более мощный U-критерий Манна-Уитни. Имеется аналог критерия Уилкоксона для связанных повторных наблюдений.
Содержание | 
Пример задачи
Описание критерия
Заданы две выборки  в противном случае следует поменять выборки местами.
Дополнительные предположения:
- обе выборки простые, объединённая выборка независима;
 
Нулевая гипотеза  обе выборки имеют одинаковое распеределение, то есть извлечены из одной генеральной совокупности. Следствием этого является равенство средних.
Статистика критерия:
-  Построить общий вариационный ряд объединённой выборки 
и найти ранги
всех элементов обеих выборок в общем вариационном ряду.
 - Рассчитать суммы рангов, соответствующих обеим выборкам:
 
-  Если размеры выборок совпадают (
), то значение статистики
будет равняется одной из сумм рангов
или
(любой).
 
Критерий (при уровне значимости ):
-  против альтернативы 
????
 
- если 
, то нулевая гипотеза отвергается. Здесь
есть
-квантиль табличного распределения Уилкоксона с параметрами
.
 
Асимптотический критерий:
Рассмотрим нормированную и центрированную статистика Уилкоксона:
;
 асимптотически имеет стандартное нормальное распределение при 
.
При наличии связок необходимо учесть их с помощью поправки. Выражение под корнем в знаменателе необходимо заменить на следующее:
- где 
- количество связок,
- их размеры.
 
Свойства и границы применимости критерия
История
Литература
- Лагутин М. Б. Наглядная математическая статистика. В двух томах. — М.: П-центр, 2003. — 204-209 с.
 - Лапач С. Н. , Чубенко А. В., Бабич П. Н. Статистика в науке и бизнесе. — Киев: Морион, 2002. — 160-164 с.
 
Ссылки
- Проверка статистических гипотез — о методологии проверки статистических гипотез.
 

