Критерий знаков
Материал из MachineLearning.
Критерий знаков (sign test) — статистический критерий, позволяющий проверить нулевую гипотезу, что выборка подчиняется биномиальному распределению с параметром . Критерий знаков можно использовать как непараметрический статистический критерий для проверки гипотезы равенства медианы заданному значению (в частности, нулю), а также отсутствия сдвига (отсутствия эффекта обработки) в двух связных выборках. Он также позволяет проверять гипотезу симметричности распределения, однако для этого существуют и более мощные критерии — одновыборочный критерий Уилкоксона и его модификации.
Содержание | 
Гипотеза биномиальности
Пример задачи.
В серии из  подбрасываний монеты 
 раз выпал орёл. 
Можно ли считать монету симметричной?
Задана бинарная простая выборка .
Нулевая гипотеза .
Статистика критерия:
Критерий (при уровне значимости ):
-  против альтернативы 
 
- если 
, то нулевая гипотеза отвергается;
 
- если 
 
-  против альтернативы 
 
- если 
, то нулевая гипотеза отвергается;
 
- если 
 
-  против альтернативы 
 
- если 
, то нулевая гипотеза отвергается;
 
- если 
 
где  — левый хвост биномиального распределения с параметром 
.
Значение  является пи-величиной (p-value) данного критерия относительно альтернативы 
.
Гипотеза равенства медианы заданному значению
Задана простая выборка .
Нулевая гипотеза , где 
 — заданное значение.
Задача сводится к предыдущей, если перейти к бинарной выборке
Если в выборке имеются значения 
,
то их следует исключить из выборки, уменьшив число наблюдений.
Гипотеза отсутствия сдвига (эффекта обработки)
Заданы две выборки одинаковой длины .
Дополнительные предположения:
- обе выборки простые;
 -  выборки связные, то есть элементы 
соответствуют одному и тому же объекту, но измерения сделаны в разные моменты (например, до и после обработки).
 
Нулевая гипотеза .
Задача сводится к предыдущей, если перейти к бинарной выборке
Если в выборке имеются случаи 
,
то их следует исключить из выборки, уменьшив число наблюдений.
Пример задачи. Первая выборка — это значения некоторой характеристики состояния пациентов, записанные до лечения. Вторая выборка — это значения той же характеристики состояния тех же пациентов, записанные после лечения. Объёмы обеих выборок обязаны совпадать; более того, порядок элементов (в данном случае пациентов) в выборках также обязан совпадать. Такие выборки называются связными. Требуется выяснить, имеется ли значимое отличие в состоянии пациентов до и после лечения, или различия чисто случайны.
Литература
- Вероятность и математическая статистика: Энциклопедия / Под ред. Ю.В.Прохорова. — М.: Большая российская энциклопедия, 2003. — 912 с.
 - Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.
 
Ссылки
- Проверка статистических гипотез — о методологии проверки статистических гипотез.
 - Статистика (функция выборки).
 - Sign test (Wikipedia).
 

