Участник:Василий Ломакин/Критерий Уилкоксона для связных выборок
Материал из MachineLearning.
| Строка 1: | Строка 1: | ||
| - | '''Критерий Уилкоксона для связных выборок''' — [[непараметрический статистический критерий]].   | + | '''Критерий Уилкоксона для связных выборок''' — [[непараметрический статистический критерий]], применяющийся для связанных пар наблюдений. Наиболее часто используется для проверки гипотезы о равенстве средних в двух зависимых выборках. Является аналогом соответствующего [[Критерий_Стьюдента|t-критерия Стьюдента для парных наблюдений]] в случае закона распределения, отличного от нормального, либо для данных в нечисловой шкале.  | 
== Пример задачи ==  | == Пример задачи ==  | ||
| Строка 9: | Строка 9: | ||
'''Дополнительные предположения:'''  | '''Дополнительные предположения:'''  | ||
| - | *   | + | * простые выборки ????  | 
| - | *   | + | * выборки связные, то есть элементы <tex>x_i,\: y_i</tex> соответствуют одному и тому же объекту, но измерения сделаны в разные моменты (например, до и после обработки).   | 
'''[[Нулевая гипотеза]]''' <tex>H_0:\; \mathbb{P} \{x_i-y_i < 0 \} = 1/2</tex>.  | '''[[Нулевая гипотеза]]''' <tex>H_0:\; \mathbb{P} \{x_i-y_i < 0 \} = 1/2</tex>.  | ||
| Строка 28: | Строка 28: | ||
Рассмотрим нормированную и центрированную статистика Уилкоксона:  | Рассмотрим нормированную и центрированную статистика Уилкоксона:  | ||
| - | + | <tex>T = \frac{R - \frac{N(N+1)}{4}}{\sqrt{\frac{N(N+1)(2N+1)}{24}}}</tex>;  | |
| - | + | <tex>T</tex> асимптотически имеет стандартное нормальное распределение при <tex>N \ge 20</tex>  | |
| - | + | При наличии связок необходимо учесть их с помощью поправки. Выражение под корнем в знаменателе необходимо заменить на следующее:  | |
| - | + | <tex>\frac{N(N+1)(2N+1) - \frac{\sum_{j=1}^{g}{t_j(t_j-1)(t_j+1)}}{2}}{24},</tex>  | |
| - | + | где <tex>g</tex> - количество связок, <tex>t_1, \ldots, t_g</tex> - их размеры.  | |
'''Другие гипотезы''':  | '''Другие гипотезы''':  | ||
| + | |||
<tex>H_0:\; </tex> средняя разница между значениями пар двух выборок равна заданной константе A.  | <tex>H_0:\; </tex> средняя разница между значениями пар двух выборок равна заданной константе A.  | ||
| + | |||
<tex>H_1:\; </tex> средняя разница не равна A.  | <tex>H_1:\; </tex> средняя разница не равна A.  | ||
Версия 18:36, 11 декабря 2009
Критерий Уилкоксона для связных выборок — непараметрический статистический критерий, применяющийся для связанных пар наблюдений. Наиболее часто используется для проверки гипотезы о равенстве средних в двух зависимых выборках. Является аналогом соответствующего t-критерия Стьюдента для парных наблюдений в случае закона распределения, отличного от нормального, либо для данных в нечисловой шкале.
Содержание | 
Пример задачи
Описание критерия
Заданы две выборки .
Дополнительные предположения:
- простые выборки ????
 -  выборки связные, то есть элементы 
соответствуют одному и тому же объекту, но измерения сделаны в разные моменты (например, до и после обработки).
 
Статистика критерия:
-  Рассчитать значения разностей пар двух выборок. Нулевые разности далее не учитываются. 
- количество ненулевых разностей.
 - Проранжировать модули разностей пар в возрастающем порядке.
 - Приписать рангам знаки соответствующих им разностей.
 -  Рассчитать сумму 
положительных рангов.
 
Критерий (при уровне значимости ):
Против альтернативы :
-  если 
больше табличного значения критерия знаковых рангов Уилкоксона
с уровнем значимости
и числом степеней свободы
, то нулевая гипотеза отвергается.
 
Асимптотический критерий:
Рассмотрим нормированную и центрированную статистика Уилкоксона:
;
 асимптотически имеет стандартное нормальное распределение при 
При наличии связок необходимо учесть их с помощью поправки. Выражение под корнем в знаменателе необходимо заменить на следующее:
где 
 - количество связок, 
 - их размеры.
Другие гипотезы:
 средняя разница между значениями пар двух выборок равна заданной константе A.
 средняя разница не равна A.
В этом случае из каждой разности вычитается значение A, и дальнейшая обработка выполняется по описанной схеме.
Свойства и границы применимости критерия
Литература
- Лапач С. Н., Чубенко А. В., Бабич П. Н. Статистика в науке и бизнесе. — Киев: Морион, 2002. — 164-166 с.
 - Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 457-458 с.
 
Ссылки
- Проверка статистических гипотез — о методологии проверки статистических гипотез.
 - Статистика (функция выборки)
 

