Критерий Мак-Нимара
Материал из MachineLearning.
| Строка 1: | Строка 1: | ||
| - | |||
| - | |||
'''Критерий Мак-Нимара''' (также, К. ''Мак-Немара'', англ. ''McNemar's test'') используется для анализа [[Таблица сопряженности|таблиц сопряженности]] размером 2x2 (для дихотомического признака). В отличие от [[Таблица сопряженности#Критерий "хи-квадрат" для анализа таблиц сопряженности|критерия "хи-квадрат"]], критерий Мак-Немара применяется, когда условие независимости наблюдений не выполняется, но, напротив, учет признака выполняется на одних и тех же субъектах.  | '''Критерий Мак-Нимара''' (также, К. ''Мак-Немара'', англ. ''McNemar's test'') используется для анализа [[Таблица сопряженности|таблиц сопряженности]] размером 2x2 (для дихотомического признака). В отличие от [[Таблица сопряженности#Критерий "хи-квадрат" для анализа таблиц сопряженности|критерия "хи-квадрат"]], критерий Мак-Немара применяется, когда условие независимости наблюдений не выполняется, но, напротив, учет признака выполняется на одних и тех же субъектах.  | ||
| Строка 44: | Строка 42: | ||
== Пример ==  | == Пример ==  | ||
| + | |||
| + | <tex>  | ||
| + | \begin{array}{cc}  | ||
| + | & \text{Sibling} \\  | ||
| + | \text{Patient} &  | ||
| + | \begin{array}{c|c|c}  | ||
| + | \hline & \text{No tonsillectomy} & \text{Tonsillectomy} \\  | ||
| + | \hline\text{No tonsillectomy} & 37 & 7 \\  | ||
| + | \hline\text{Tonsillectomy} & 15 & 26  | ||
| + | \end{array}  | ||
| + | \end{array}  | ||
| + | </tex>  | ||
| + | |||
| + | В системе R:  | ||
| + | <pre>  | ||
| + | > d <- matrix(c(37, 7, 15, 26), 2, 2)  | ||
| + | > mcnemar.test(d)  | ||
| + | |||
| + | 	McNemar's Chi-squared test with continuity correction  | ||
| + | |||
| + | data:  d  | ||
| + | McNemar's chi-squared = 2.2273, df = 1, p-value = 0.1356  | ||
| + | |||
| + | > mcnemar.test(d, correct=F)  | ||
| + | |||
| + | 	McNemar's Chi-squared test  | ||
| + | |||
| + | data:  d  | ||
| + | McNemar's chi-squared = 2.9091, df = 1, p-value = 0.08808  | ||
| + | |||
| + | > mcnemar.exact(d)  | ||
| + | |||
| + | 	Exact McNemar test (with central confidence intervals)  | ||
| + | |||
| + | data:  d  | ||
| + | b = 15, c = 7, p-value = 0.1338  | ||
| + | alternative hypothesis: true odds ratio is not equal to 1  | ||
| + | 95 percent confidence interval:  | ||
| + |  0.8224084 6.2125863  | ||
| + | sample estimates:  | ||
| + | odds ratio   | ||
| + |   2.142857   | ||
| + | </pre>  | ||
== Реализации ==  | == Реализации ==  | ||
Версия 21:48, 3 декабря 2013
Критерий Мак-Нимара (также, К. Мак-Немара, англ. McNemar's test) используется для анализа таблиц сопряженности размером 2x2 (для дихотомического признака). В отличие от критерия "хи-квадрат", критерий Мак-Немара применяется, когда условие независимости наблюдений не выполняется, но, напротив, учет признака выполняется на одних и тех же субъектах.
Содержание | 
Определение
Рассмотрим n субъектов, для каждого из которых было проведено 2 теста:
| Тест 2 положительный | Тест 2 отрицательный | Сумма в строке | |
| Тест 1 положительный | a | b | a + b | 
| Тест 1 отрицательный | c | d | c + d | 
| Сумма в столбце | a + c | b + d | n | 
Нулевая гипотеза утверждает, что маргинальные распределения для всех исходов совпадают:
Заметим, что корректность этих равенств не зависит от  и 
. После сокращения, получаем оригинальную формулировку нулевой и альтернативной гипотез:
Оригинальная форма статистического критерия Мак-Немара такова:
Применение коррекции Йейтса для повышения качества качества критерия на выборках с низкочастотными событиями приводит к следующей формуле:
На практике [1], однако, обычно применяется коррекция Эдвардса:
При условии выполнения нулевой гипотезы, для достаточно больших выборок (b + c > 25)  имеет хи-квадрат распределение с одной степенью свободы.
Для маленьких выборок (b + c <= 25) применяют точный критерий Мак-Немара, который является критерием знаков для b относительно биномиального распределения с параметрами n = b + c, p = 1/2.
Пример
В системе R:
> d <- matrix(c(37, 7, 15, 26), 2, 2) > mcnemar.test(d) McNemar's Chi-squared test with continuity correction data: d McNemar's chi-squared = 2.2273, df = 1, p-value = 0.1356 > mcnemar.test(d, correct=F) McNemar's Chi-squared test data: d McNemar's chi-squared = 2.9091, df = 1, p-value = 0.08808 > mcnemar.exact(d) Exact McNemar test (with central confidence intervals) data: d b = 15, c = 7, p-value = 0.1338 alternative hypothesis: true odds ratio is not equal to 1 95 percent confidence interval: 0.8224084 6.2125863 sample estimates: odds ratio 2.142857
Реализации
- MATLAB: встроенной реализации нет, есть реализации на File Exchange.
 -  R: функция 
mcnemar.testв стандартном пакетеstatsиmcnemar.exactв пакетеexact2x2. - Python: в библиотеках не реализован, однако можно найти готовые реализации
 
Ссылки
- EnWiki: McNemar's test
 - McNemar, Quinn (June 18, 1947). "Note on the sampling error of the difference between correlated proportions or percentages". Psychometrika 12 (2): 153–157.
 - Yates, F (1934). "Contingency table involving small numbers and the χ2 test". Supplement to the Journal of the Royal Statistical Society 1(2), 217–235.
 - Edwards, A (1948). "Note on the "correction for continuity" in testing the significance of the difference between correlated proportions". Psychometrika 13: 185–187.
 - Fay, Michael P. "Exact McNemar’s Test and Matching Confidence Intervals". (2011).
 

