Участник:Василий Ломакин/Критерий Уилкоксона двухвыборочный
Материал из MachineLearning.
| Строка 30: | Строка 30: | ||
Против альтернативы <tex>H_1:\; \mathbb{P} \{ x < y \} \neq 1/2</tex>:  | Против альтернативы <tex>H_1:\; \mathbb{P} \{ x < y \} \neq 1/2</tex>:  | ||
| - | :если <tex>W \notin \left[ W_{\alpha/2},\,W_{1-\alpha/2} \right]</tex> , то нулевая гипотеза отвергается. Здесь <tex>W_{\alpha}</tex>  есть <tex>\alpha</tex>-[[квантиль]] табличного распределения Уилкоксона с параметрами <tex>m,\,n</tex>. <ref>Кобзарь А. И. Прикладная математическая статистика. —   | + | :если <tex>W \notin \left[ W_{\alpha/2},\,W_{1-\alpha/2} \right]</tex> , то нулевая гипотеза отвергается. Здесь <tex>W_{\alpha}</tex>  есть <tex>\alpha</tex>-[[квантиль]] табличного распределения Уилкоксона с параметрами <tex>m,\,n</tex>. <ref>Кобзарь А. И. Прикладная математическая статистика. — 457 c.</ref><ref>Лапач С. Н. Статистика в науке и бизнесе. — 150 с.</ref>  | 
'''Асимптотический критерий:'''  | '''Асимптотический критерий:'''  | ||
| Строка 60: | Строка 60: | ||
Статистики критериев Вилкоксона и Вилкоксона-Манна-Уитни линейно связаны, поэтому, по сути, нет смысла говорить о двух различных критериях.<ref>Орлов А. И. Эконометрика. — 75 c.</ref> Оба они проверяют одну и ту же гипотезу и их границы применимости также совпадают. В то же время в литературе можно встретить рекомендации использовать критерий Вилкоксона для проверки равенства средних, когда нет предположений о дисперсиях,<ref>Лапач С. Н. Статистика в науке и бизнесе. — 160 с.</ref>, а в случае равных дисперсий применять [[Критерий_Уилкоксона-Манна-Уитни|U-критерий Манна-Уитни]].<ref>Лапач С. Н. Статистика в науке и бизнесе. — 118 с.</ref>  | Статистики критериев Вилкоксона и Вилкоксона-Манна-Уитни линейно связаны, поэтому, по сути, нет смысла говорить о двух различных критериях.<ref>Орлов А. И. Эконометрика. — 75 c.</ref> Оба они проверяют одну и ту же гипотезу и их границы применимости также совпадают. В то же время в литературе можно встретить рекомендации использовать критерий Вилкоксона для проверки равенства средних, когда нет предположений о дисперсиях,<ref>Лапач С. Н. Статистика в науке и бизнесе. — 160 с.</ref>, а в случае равных дисперсий применять [[Критерий_Уилкоксона-Манна-Уитни|U-критерий Манна-Уитни]].<ref>Лапач С. Н. Статистика в науке и бизнесе. — 118 с.</ref>  | ||
| - | Проведём эксперимент: будем строить график [[Достигаемый уровень значимости|достигаемого уровня значимости]] как функцию размера выборок и параметров распределения  | + | Проведём эксперимент: будем строить график [[Достигаемый уровень значимости|достигаемого уровня значимости]] как функцию размера выборок и параметров распределения. Будем усреднять p-value по нескольким десяткам экспериментов.  | 
| + | |||
| + | Общие параметры для всех экспериментов:  | ||
| + | * Выборки генерируются независимо из нормального распределения с заданными параметрами.  | ||
| + | * Размер выборок варьируется от 50 до 500 с шагом 50.  | ||
| + | * Значение p-value усредняется по 50 экспериментам.  | ||
| + | |||
| + | {| class="standard"  | ||
| + |  !Тип критерия  | ||
| + |  !Параметры эксперимента  | ||
| + |  !График  | ||
| + |  |-  | ||
| + |  |align="center"|[[Критерий Уилкоксона-Манна-Уитни|U-критерий Манна-Уитни]]  | ||
| + |  |Среднее первой выборки: 0.  | ||
| + | |||
| + | Среднее второй выборки: -3:0.3:3.  | ||
| + | |||
| + | Дисперсия первой выборки: 5.  | ||
| + | |||
| + | Дисперсия второй выборки: 5.  | ||
| + | |||
| + |  |[[Изображение:UNorm_50-50-1000_0_-3-0.3-3_5_5_50.png|400px]]  | ||
| + |  |-  | ||
| + |  |align="center"|[[Критерий Уилкоксона-Манна-Уитни|U-критерий Манна-Уитни]]  | ||
| + |  |Среднее первой выборки: 0.  | ||
| + | |||
| + | Среднее второй выборки: -30:3:30.  | ||
| + | |||
| + | Дисперсия первой выборки: 1.  | ||
| + | |||
| + | Дисперсия второй выборки: 50.  | ||
| + | |||
| + |  |[[Изображение:UNorm 50-50-1000 0 -30-3-30 1 50 50.png|400px]]  | ||
| + |  |-  | ||
| + |  |align="center"|Критерий Уилкоксона  | ||
| + |  |Среднее первой выборки: 0.  | ||
| + | |||
| + | Среднее второй выборки: -3:0.3:3.  | ||
| + | |||
| + | Дисперсия первой выборки: 1.  | ||
| + | |||
| + | Дисперсия второй выборки: 50.  | ||
| + | |||
| + |  |[[Изображение:WNorm 50-50-1000 0 -3-0.3-3 5 5 50.png|400px]]  | ||
| + |  |}  | ||
| + | |||
| + | |||
<График p-value критерия Вилкоксона для равных дисперсий. Размер выборок 50:50:500. Выборка1 <tex>\mathbb{N}(100, 5)</tex>. Выборка2 <tex>\mathbb{N}(100+-0.3, 5)</tex>>  | <График p-value критерия Вилкоксона для равных дисперсий. Размер выборок 50:50:500. Выборка1 <tex>\mathbb{N}(100, 5)</tex>. Выборка2 <tex>\mathbb{N}(100+-0.3, 5)</tex>>  | ||
| + | |-  | ||
| + | |||
| + |  |align="center"|Критерий Уилкоксона  | ||
| + |  |Среднее первой выборки: 0.  | ||
| + | |||
| + | Среднее второй выборки: -30:3:30.  | ||
| + | |||
| + | Дисперсия первой выборки: 1.  | ||
| + | |||
| + | Дисперсия второй выборки: 50.  | ||
| + | |||
| + |  |[[Изображение:WNorm 50-50-1000 0 -30-3-30 1 50 50.png|400px]]  | ||
== Примечания ==  | == Примечания ==  | ||
Версия 20:04, 4 января 2010
 
  | 
TODO:
- Графики
 - Поправка
 
Критерий Уилкоксона (Вилкоксона) двухвыборочный — непараметрический статистический критерий, используемый для оценки различий между двумя выборками, взятыми из закона распределения, отличного от нормального, либо измеренными с использованием порядковой шкалы. Имеется аналог критерия Уилкоксона для связанных повторных наблюдений. Критерий является ранговым, поэтому он инвариантен по отношению к любому монотонному преобразованию шкалы измерения.
Пример задачи
Задача - сравнить две методики подготовки роженицы к родам. Сравнивается эффективность по оценке состояния новорожденного в баллах (шкала является порядковой).
Описание критерия
Заданы две выборки  в противном случае следует поменять выборки местами.
Дополнительные предположения: обе выборки простые, объединённая выборка независима;
Вычисление статистики критерия:
-  Построить общий вариационный ряд объединённой выборки 
и найти ранги
всех элементов обеих выборок в общем вариационном ряду.
 -  Рассчитать суммы рангов, соответствующих обеим выборкам:
 -  Если размеры выборок совпадают (
), то значение статистики
будет равняется одной из сумм рангов
или
(любой). Если же выборки не равны, то
, то есть сумме рангов, соответствующей меньшей выборке. Заметим, что статистика
линейно связана со статистикой U-критерия Манна-Уитни.
 
Критерий (при уровне значимости ):
Против альтернативы :
- если 
, то нулевая гипотеза отвергается. Здесь
есть
-квантиль табличного распределения Уилкоксона с параметрами
. [1][2]
 
Асимптотический критерий:
Рассмотрим нормированную и центрированную статистика Уилкоксона:
;
 асимптотически имеет стандартное нормальное распределение. Нулевая гипотеза (против альтернативы 
) отвергается, если 
, где 
 есть 
-квантиль стандартного нормального распределения. 
Приближение можно использовать, если размер хотя бы одной из выборок превышает 25. Если размеры выборок равны, то данная аппроксимация хорошо работает до .[3]
При наличии связок необходимо учесть их с помощью поправки. Выражение в знаменателе необходимо заменить на следующее:
- где 
- количество только тех связок, в которые входят ранги как одной, так и другой выборок,
- их размеры. Совпадения, целиком состоящие из элементов одной и той же выборки, на величину
не влияют. Наблюдения, не совпадающие с другими, рассматриваются как связки размера 1. Для элементов связок вычисляется средний ранг.
 
Применение критерия
В биологических и эконометрических приложениях метод часто используется для проверки гипотезы о равенстве средних двух независимых выборок. Вообще говоря, данное использование критерия некорректно. Можно построить примеры, когда , и средние выборок не совпадают.[6] При этом надо заметить, что данный недостаток не является редкостью, о многих популярных в математической статистике критериях можно сказать, что они не позволяют проверять те гипотезы, с которыми традиционно связаны. При применении подобных критериев к анализу реальных данных необходимо тщательно взвешивать их достоинства и недостатки.[7]
Критерий является аналогом критерия t-критерия Стьюдента для независимых выборок в случае закона распределения, отличного от нормального, либо данных, измеренных с использованием порядковой шкалы. Для нормально распределённых совокупностей следует использовать более мощный t-критерий.
Критерий Вилкоксона и U-критерий Манна-Уитни
Статистики критериев Вилкоксона и Вилкоксона-Манна-Уитни линейно связаны, поэтому, по сути, нет смысла говорить о двух различных критериях.[8] Оба они проверяют одну и ту же гипотезу и их границы применимости также совпадают. В то же время в литературе можно встретить рекомендации использовать критерий Вилкоксона для проверки равенства средних, когда нет предположений о дисперсиях,[9], а в случае равных дисперсий применять U-критерий Манна-Уитни.[10]
Проведём эксперимент: будем строить график достигаемого уровня значимости как функцию размера выборок и параметров распределения. Будем усреднять p-value по нескольким десяткам экспериментов.
Общие параметры для всех экспериментов:
- Выборки генерируются независимо из нормального распределения с заданными параметрами.
 - Размер выборок варьируется от 50 до 500 с шагом 50.
 - Значение p-value усредняется по 50 экспериментам.
 
| Тип критерия | Параметры эксперимента | График | 
|---|---|---|
| U-критерий Манна-Уитни | Среднее первой выборки: 0.
 Среднее второй выборки: -3:0.3:3. Дисперсия первой выборки: 5. Дисперсия второй выборки: 5.  |  
 | 
| U-критерий Манна-Уитни | Среднее первой выборки: 0.
 Среднее второй выборки: -30:3:30. Дисперсия первой выборки: 1. Дисперсия второй выборки: 50.  |  
 | 
| Критерий Уилкоксона | Среднее первой выборки: 0.
 Среднее второй выборки: -3:0.3:3. Дисперсия первой выборки: 1. Дисперсия второй выборки: 50.  |  
 | 
<График p-value критерия Вилкоксона для равных дисперсий. Размер выборок 50:50:500. Выборка1 . Выборка2 
>
|-
|align="center"|Критерий Уилкоксона |Среднее первой выборки: 0.
Среднее второй выборки: -30:3:30.
Дисперсия первой выборки: 1.
Дисперсия второй выборки: 50.
|![]()
Примечания
- ↑ Кобзарь А. И. Прикладная математическая статистика. — 457 c.
 - ↑ Лапач С. Н. Статистика в науке и бизнесе. — 150 с.
 - ↑ Лапач С. Н. Статистика в науке и бизнесе. — 161 с.
 - ↑ Кобзарь А. И. Прикладная математическая статистика. — 454 c.
 - ↑ Лагутин М. Б. Наглядная математическая статистика. — 206 с.
 - ↑ Орлов А. И. Эконометрика. — 79 с.
 - ↑ Орлов А. И. Эконометрика. — 83 с.
 - ↑ Орлов А. И. Эконометрика. — 75 c.
 - ↑ Лапач С. Н. Статистика в науке и бизнесе. — 160 с.
 - ↑ Лапач С. Н. Статистика в науке и бизнесе. — 118 с.
 
Литература
- Лагутин М. Б. Наглядная математическая статистика. В двух томах. — М.: П-центр, 2003. — 204-209 с.
 - Лапач С. Н. , Чубенко А. В., Бабич П. Н. Статистика в науке и бизнесе. — Киев: Морион, 2002. — 160-164 с.
 - Орлов А. И. Эконометрика. — М.: Экзамен, 2003. — §4.5.
 - Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 454-456 с.
 
Ссылки
- Критерий Уилкоксона-Манна-Уитни — аналогичный критерий.
 - Проверка статистических гипотез — о методологии проверки статистических гипотез.
 - Критерий Уилкоксона для связных выборок — аналог критерия для случая парных повторных наблюдений.
 





