Критерий знаковых рангов Уилкоксона
Материал из MachineLearning.
(Различия между версиями)
												
			
			 (категория, викификация)  | 
			|||
| Строка 1: | Строка 1: | ||
{{TOCright}}  | {{TOCright}}  | ||
| - | Критерий знаковых рангов   | + | Критерий знаковых рангов Уилкоксона — [[непараметрический статистический критерий]], используемый для оценки различий между двумя выборками, взятыми из закона распределения, отличного от нормального, либо измеренными с использованием порядковой шкалы.  | 
| - | Гипотеза <tex>H_0</tex>: медиана разностей в парах равна 0<br/>  | + | Гипотеза <tex>H_0</tex>: медиана разностей в парах равна 0<br />  | 
Альтернатива: медиана разностей в парах не равна 0  | Альтернатива: медиана разностей в парах не равна 0  | ||
| + | |||
== Предположения ==  | == Предположения ==  | ||
| - | *Данные приходят парами  | + | * Данные приходят парами  | 
| - | *Пары незвасимы и одинаково распределены  | + | * Пары незвасимы и одинаково распределены  | 
| - | *Данные измерены хотя бы в [[Теория измерений|порядковой шкале]]  | + | * Данные измерены хотя бы в [[Теория измерений|порядковой шкале]]  | 
| - | *Распределение разностей симметрично относительно медианы  | + | * Распределение разностей симметрично относительно медианы  | 
| - | ==Описание критерия==  | + | == Описание критерия ==  | 
| - | Пусть <tex>N</tex>   | + | Пусть <tex>N</tex> — размер выборки (число пар). Обозначим <tex>x_{1,i}</tex> — элементы 1 выборки и <tex>x_{2,i}</tex> — элементы 2 выборки.  | 
: H<sub>0</sub>: медиана разности между парами равна 0  | : H<sub>0</sub>: медиана разности между парами равна 0  | ||
| Строка 19: | Строка 20: | ||
# Для <tex>i = 1, ..., N</tex>, вычислить <tex>|x_{2,i} - x_{1,i}|</tex> и <tex>sign(x_{2,i} - x_{1,i})</tex>  | # Для <tex>i = 1, ..., N</tex>, вычислить <tex>|x_{2,i} - x_{1,i}|</tex> и <tex>sign(x_{2,i} - x_{1,i})</tex>  | ||
| - | # Исключить пары, где <tex>|x_{2,i} - x_{1,i}| = 0</tex>. Пусть <tex>N_r</tex>   | + | # Исключить пары, где <tex>|x_{2,i} - x_{1,i}| = 0</tex>. Пусть <tex>N_r</tex> — размер полученной выборки после удаления таких пар  | 
# Упорядочить оставшиеся <tex>N_r</tex> пар в порядке возрастания модуля разности, <tex>|x_{2,i} - x_{1,i}|</tex>.  | # Упорядочить оставшиеся <tex>N_r</tex> пар в порядке возрастания модуля разности, <tex>|x_{2,i} - x_{1,i}|</tex>.  | ||
# Построить ранги всех пар, <tex>R_i</tex> обозначает ранг i-й пары.  | # Построить ранги всех пар, <tex>R_i</tex> обозначает ранг i-й пары.  | ||
| Строка 27: | Строка 28: | ||
#: For <tex>N_r \ge 10</tex>, a z-score can be calculated as <tex>z = \frac{W - 0.5}{\sigma_W}, \sigma_W = \sqrt{\frac{N_r(N_r + 1)(2N_r + 1)}{6}}</tex>.  | #: For <tex>N_r \ge 10</tex>, a z-score can be calculated as <tex>z = \frac{W - 0.5}{\sigma_W}, \sigma_W = \sqrt{\frac{N_r(N_r + 1)(2N_r + 1)}{6}}</tex>.  | ||
#: Если <math>z > z_{critical}</math> отклонить <tex>H_0</tex>  | #: Если <math>z > z_{critical}</math> отклонить <tex>H_0</tex>  | ||
| - | #:  | + | #:   | 
#: Если <tex>N_r < 10</tex>, <tex>W</tex> Сравнивается с критическими значениями по таблице.  | #: Если <tex>N_r < 10</tex>, <tex>W</tex> Сравнивается с критическими значениями по таблице.  | ||
#:   | #:   | ||
| Строка 34: | Строка 35: | ||
== Реализации ==  | == Реализации ==  | ||
| - | *[http://stat.ethz.ch/R-manual/R-patched/library/stats/html/wilcox.test.html Реализация в R]  | + | * [http://stat.ethz.ch/R-manual/R-patched/library/stats/html/wilcox.test.html Реализация в R]  | 
| - | *[http://www.mathworks.com/help/stats/signrank.html Реализация в MATLAB]  | + | * [http://www.mathworks.com/help/stats/signrank.html Реализация в MATLAB]  | 
{{stub}}  | {{stub}}  | ||
| + | |||
| + | [[Категория:Прикладная статистика]]  | ||
| + | [[Категория:Непараметрические статистические тесты]]  | ||
Текущая версия
 
  | 
Критерий знаковых рангов Уилкоксона — непараметрический статистический критерий, используемый для оценки различий между двумя выборками, взятыми из закона распределения, отличного от нормального, либо измеренными с использованием порядковой шкалы.
Гипотеза : медиана разностей в парах равна 0
Альтернатива: медиана разностей в парах не равна 0
Предположения
- Данные приходят парами
 - Пары незвасимы и одинаково распределены
 - Данные измерены хотя бы в порядковой шкале
 - Распределение разностей симметрично относительно медианы
 
Описание критерия
Пусть  — размер выборки (число пар). Обозначим 
 — элементы 1 выборки и 
 — элементы 2 выборки.
- H0: медиана разности между парами равна 0
 - H1: медиана разности между парами не равна 0
 
-  Для 
, вычислить
и
 -  Исключить пары, где 
. Пусть
— размер полученной выборки после удаления таких пар
 -  Упорядочить оставшиеся 
пар в порядке возрастания модуля разности,
.
 -  Построить ранги всех пар, 
обозначает ранг i-й пары.
 -  Вычислить статистику 
-  
, модуль суммы знаковых рангов.
 
 -  
 -  С ростом 
распределение
сходится к нормальному. Thus,
-  For 
, a z-score can be calculated as
.
 -  Если <math>z > z_{critical}</math> отклонить 
 -  Если 
,
Сравнивается с критическими значениями по таблице.
 -  Если 
отвергнуть
 
 -  For 
 

