Критерий Уилкоксона-Манна-Уитни
Материал из MachineLearning.
 (уточнение)  | 
				 (→Ссылки)  | 
			||
| (7 промежуточных версий не показаны.) | |||
| Строка 1: | Строка 1: | ||
| - | '''U-критерий Манна-Уитни''' (Mann-Whitney U test) — [[непараметрический статистический критерий]], используемый для оценки различий между двумя [[выборка]]ми по признаку, измеренному в количественной [[шкала измерения|шкале]].   | + | '''U-критерий Манна-Уитни''' (Mann-Whitney U test) — [[непараметрический статистический критерий]], используемый для оценки различий между двумя [[выборка]]ми по признаку, измеренному в количественной или порядковой [[шкала измерения|шкале]].   | 
U-критерий является [[ранговый критерий|ранговым]], поэтому он инвариантен по отношению к любому монотонному преобразованию шкалы измерения.   | U-критерий является [[ранговый критерий|ранговым]], поэтому он инвариантен по отношению к любому монотонному преобразованию шкалы измерения.   | ||
| Строка 49: | Строка 49: | ||
'''Критерий''' (при [[уровень значимости|уровне значимости]] <tex>\alpha</tex>):  | '''Критерий''' (при [[уровень значимости|уровне значимости]] <tex>\alpha</tex>):  | ||
| + | |||
| + | [[Изображение:Standard_Normal_Density_-_Double-sided_Critical_Area.png|thumb|Критическая область асимптотического критерия Манна-Уитни.]]  | ||
* против альтернативы <tex>H_1:\; \mathbb{P} \{ x<y \} \neq 1/2</tex>  | * против альтернативы <tex>H_1:\; \mathbb{P} \{ x<y \} \neq 1/2</tex>  | ||
| Строка 85: | Строка 87: | ||
U-критерий является непараметрическим аналогом [[Критерий Стьюдента|критерия Стьюдента]].  | U-критерий является непараметрическим аналогом [[Критерий Стьюдента|критерия Стьюдента]].  | ||
| - | Если [[  | + | Если выборки [[Нормальное распределение|нормальные]], то для проверки гипотезы сдвига предпочтительно применить более мощный критерий Стьюдента.  | 
== История ==  | == История ==  | ||
| Строка 104: | Строка 106: | ||
* [http://ru.wikipedia.org/wiki/U-%D0%BA%D1%80%D0%B8%D1%82%D0%B5%D1%80%D0%B8%D0%B9_%D0%9C%D0%B0%D0%BD%D0%BD%D0%B0-%D0%A3%D0%B8%D1%82%D0%BD%D0%B8 U-критерий Манна-Уитни] (Википедия).  | * [http://ru.wikipedia.org/wiki/U-%D0%BA%D1%80%D0%B8%D1%82%D0%B5%D1%80%D0%B8%D0%B9_%D0%9C%D0%B0%D0%BD%D0%BD%D0%B0-%D0%A3%D0%B8%D1%82%D0%BD%D0%B8 U-критерий Манна-Уитни] (Википедия).  | ||
* [http://msu.edu/course/sw/430/2005/tables/wmw.pdf Таблица критических значений U-критерия Манна-Уитни]  | * [http://msu.edu/course/sw/430/2005/tables/wmw.pdf Таблица критических значений U-критерия Манна-Уитни]  | ||
| - | * [  | + | * [[Media:Critical_Values_for_the_Mann-Whitney_U-Test.pdf|Critical Values for the Mann-Whitney U-Test; p=5%.]]  | 
| + | * [[Media:Critical_Values_for_the_Mann-Whitney_U-Test_p5_1.pdf|Критические_значения_критерия_U_Манна.pdf; p=5%, 1%]]  | ||
| + | * [http://ami.nstu.ru/~headrd/seminar/publik_html/Homogeneity_averages.pdf О параметрических и непараметрических критериях проверки гипотез об однородности средних и их мощности на сайте Новосибирского государственного технического университета]  | ||
[[Категория:Статистические тесты]]  | [[Категория:Статистические тесты]]  | ||
[[Категория:Непараметрические статистические тесты]]  | [[Категория:Непараметрические статистические тесты]]  | ||
Текущая версия
U-критерий Манна-Уитни (Mann-Whitney U test) — непараметрический статистический критерий, используемый для оценки различий между двумя выборками по признаку, измеренному в количественной или порядковой шкале. U-критерий является ранговым, поэтому он инвариантен по отношению к любому монотонному преобразованию шкалы измерения.
Другие названия: критерий Манна-Уитни-Уилкоксона (Mann-Whitney-Wilcoxon, MWW), критерий суммы рангов Уилкоксона (Wilcoxon rank-sum test) или критерий Уилкоксона-Манна-Уитни (Wilcoxon-Mann-Whitney test, WMW).
Содержание | 
Примеры задач
Пример 1. Первая выборка — это пациенты, которых лечили препаратом А. Вторая выборка — пациенты, которых лечили препаратом Б. Значения в выборках — это некоторая характеристика эффективности лечения (уровень метаболита в крови, температура через три дня после начала лечения, срок выздоровления, число койко-дней, и т.д.) Требуется выяснить, имеется ли значимое различие эффективности препаратов А и Б, или различия являются чисто случайными и объясняются «естественной» дисперсией выбранной характеристики.
Пример 2. Первая выборка — это поля, обработанные агротехническим методом А. Вторая выборка — поля, обработанные агротехническим методом Б. Значения в выборках — это урожайность. Требуется выяснить, является ли один из методов эффективнее другого, или различия урожайности обусловлены случайными факторами.
Пример 3. Первая выборка — это дни, когда в супермаркете проходила промо-акция типа А (красные ценники со скидкой). Вторая выборка — дни промо-акции типа Б (каждая пятая пачка бесплатно). Значения в выборках — это показатель эффективности промо-акции (объём продаж, либо выручка в рублях). Требуется выяснить, какой из типов промо-акции более эффективен.
Описание критерия
Заданы две выборки .
Дополнительные предположения:
- обе выборки простые, объединённая выборка независима;
 -  выборки взяты из неизвестных непрерывных распределений 
и
соответственно.
 
Статистика критерия:
-  Построить общий вариационный ряд объединённой выборки 
и найти ранги
всех элементов обеих выборок в общем вариационном ряду.
 -  Вычислить суммарные ранги обеих выборок и статистику Манна-Уитни  
:
 
Замечание: менее рациональный способ вычисления статистик Манна-Уитни :
Критерий (при уровне значимости ):
-  против альтернативы 
 
- если 
, то нулевая гипотеза отвергается;
 
- если 
 
-  против альтернативы 
 
- если 
, то нулевая гипотеза отвергается;
 
- если 
 
-  против альтернативы 
 
- если 
, то нулевая гипотеза отвергается;
 
- если 
 
где
 есть 
-квантиль табличного распределения Уилкоксона-Манна-Уитни с параметрами 
.
Асимптотический критерий: нормированная и центрированная статистика Манна-Уитни
асимптотически имеет стандартное нормальное распределение при . 
Свойства и границы применимости U-критерия
Иногда ошибочно считают, что U-критерий проверяет нулевую гипотезу однородности 
, то есть что две выборки взяты из одного и того же распределения.
U-критерий не является состоятельным против общей альтернативы 
.
Это означает, что гипотеза однородности будет приниматься чаще, чем она на самом деле верна. 
Существуют ситуации, когда гипотеза 
 верна, а более сильная гипотеза однородности 
 не верна [Орлов].
Для проверки однородности существуют более мощные критерии, в частности, критерий Смирнова или критерий Лемана-Розенблатта. 
Иногда ошибочно считают, что U-критерий проверяет нулевую гипотезу равенства медиан в двух выборках. 
Существуют распределения, для которых гипотеза  верна, но их медианы различны. 
U-критерий можно применять для проверки гипотезы сдвига в качестве альтернативной 
, где 
 — некоторая константа, отличная от нуля.  
При этой альтернативе U-критерий является состоятельным. 
Его целесообразно применять, если одним и тем же прибором проводятся две серии измерений двух значений некоторой физической величины. При этом функция распределения 
 описывает погрешности измерения одного значения, а 
 — другого. Однако во многих приложениях (в частности, эконометрических) нет особых оснований предполагать, что распределение второй выборки лишь сдвигается, но не меняется каким-либо иным образом. 
U-критерий является непараметрическим аналогом критерия Стьюдента. Если выборки нормальные, то для проверки гипотезы сдвига предпочтительно применить более мощный критерий Стьюдента.
История
Данный метод выявления различий между выборками был предложен в 1945 году Френком Уилкоксоном. В 1947 году он был существенно переработан и расширен Манном и Уитни, по именам которых сегодня обычно и называется.
Литература
- Mann H. B., Whitney D. R. On a test of whether one of two random variables is stochastically larger than the other. // Annals of Mathematical Statistics. — 1947, №18. — Pp. 50-60.
 - Wilcoxon F. Individual Comparisons by Ranking Methods. // Biometrics Bulletin 1. 1945. — Pp. 80–83.
 - Орлов А. И. Эконометрика. — М.: Экзамен, 2003. — 576 с. (§4.5 Какие гипотезы можно проверять с помощью двухвыборочного критерия Вилкоксона?)
 - Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.
 
Ссылки
- Проверка статистических гипотез — о методологии проверки статистических гипотез.
 - Статистика (функция выборки)
 - Критерий Стьюдента
 - Mann-Whitney U (Wikipedia).
 - U-критерий Манна-Уитни (Википедия).
 - Таблица критических значений U-критерия Манна-Уитни
 - Critical Values for the Mann-Whitney U-Test; p=5%.
 - Критические_значения_критерия_U_Манна.pdf; p=5%, 1%
 - О параметрических и непараметрических критериях проверки гипотез об однородности средних и их мощности на сайте Новосибирского государственного технического университета
 

