Критерий Неменьи
Материал из MachineLearning.
 (→Математическая формулировка)  | 
				м   | 
			||
| Строка 134: | Строка 134: | ||
[[Категория:Прикладная статистика]]  | [[Категория:Прикладная статистика]]  | ||
| + | [[Категория:Статистические тесты]]  | ||
[[Категория:Дисперсионный анализ]]  | [[Категория:Дисперсионный анализ]]  | ||
Текущая версия
Критерий Неменьи (также Nemenyi test, Nemenyi-Damico-Wolfe-Dunn test) — статистический критерий, используемый для проверки наличия сдвига между группами в однофакторном непараметрическом дисперсионном анализе.
Критерий предложен Петром Неменьи в 1963 году.[1]
Содержание | 
Общая идея
Данный критерий основан на ранжировании всей выборки. Если в выборке всего k групп по n наблюдений в каждой, то наименьшему наблюдению присваивается ранг 1, а наибольшему - ранг k*n. Затем для каждой из групп подсчитывается средний ранг и вычисляются абсолютные значения их разностей. По сравнению этих значений с некоторыми пороговыми значениями (critical difference) делается вывод об уровне сходства или различия в группах.
Математическая формулировка
Пусть заданы k выборок одинакового объема n:  из неизвестных непрерывных распределений  
. Объединённая выборка: 
.
Нулевая гипотеза  при альтернативе 
.
Для применения критерия Неменьи упорядочим все  элементов объединенной выборки по возрастанию и зададим каждому элементу 
 ранг 
 (если в объединенной выборке присутствуют одинаковые элементы, то им следует задавать одинаковый ранг таким образом, чтобы в сумме их ранги давали число, равное сумме их последовательных номеров при ранжировании). Далее для каждой выборки подсчитаем ее ранг как средний ранг ее элементов: 
. Статистикой критерия являются абсолютные значения разностей рангов выборок:
В качестве critical differebce необходимо взять величину
,
где  — необходимый уровень значимости, а 
 — значение статистики стьюдентизированного размаха (studentized range statistic)[1], деленной на 
.
Если , то частная нулевая гипотеза 
 отклоняется против двусторонней альтернативы.
Пример использования
См. Ермолаев О.Ю. Математическая статистика для психологов. Задача 10.5.
В 4 группах спортсменов высокой квалификации (футболисты, гимнасты, теннисисты и пловцы, по 5 человек в каждой) сравнивались время реакции выбора в мс. Психолог выясняет, будут ли различия во времени реакции у спортсменов разного профиля.
В этой задаче гипотеза  констатирует отсутствие различий между группами, а также отсутствие влияния специализации на время реакции.
Результаты экспериментов приведены в таблице ниже, в которой проведено необходимое ранжирование экспериментальных данных одновременно по всей выборке в целом.
| 1 группа | 2 группа | 3 группа | 4 группа | ||||
|---|---|---|---|---|---|---|---|
| Баллы | Ранги | Баллы | Ранги | Баллы | Ранги | Баллы | Ранги | 
| 203 | 12 | 213 | 16 | 171 | 5 | 207 | 13 | 
| 184 | 7.5 | 246 | 18 | 208 | 14 | 152 | 2 | 
| 169 | 4 | 184 | 7.5 | 260 | 19 | 176 | 6 | 
| 216 | 17 | 282 | 20 | 193 | 10 | 200 | 11 | 
| 209 | 15 | 190 | 9 | 160 | 3 | 145 | 1 | 
| Сумма рангов по столбцам | 55.5 | 70.5 | 51 | 33 | |||
Имеем:
Для уровня значимости  critical difference 
. В итоге получаем, что различия в скорости реакции спортсменов имеют случайный характер и тип специализации не влияет на эти показатели.
Реализации
-  В системе Matlab: функция FriedmanTest в 
Sparse Representation Toolbox[1]. -  В системе R: функция 
oneway_testв пакетеcoin[1]. 
Литература
- Лапач С.Н. , Чубенко А.В., Бабич П.Н. Статистика в науке и бизнесе. — Киев: Морион, 2002.
 - Кобзарь А.И. Прикладная математическая статистика. — М.: Физматлит, 2006.
 - Ермолаев О.Ю. Математическая статистика для психологов. 2 издание. — Москва: Флинта, 2003.
 - Nathalie Japkowicz, Mohak Shah Evaluating Learning Algorithms: A Classification Perspective. Cambridge University Press, 2011.
 
Ссылки
- Nemenyi test в Wikipedia
 

