Достигаемый уровень значимости
Материал из MachineLearning.
м   | 
				м   | 
			||
| Строка 8: | Строка 8: | ||
Другая интерпретация:   | Другая интерпретация:   | ||
| - | достигаемый уровень значимости <tex>p(T)</tex> — это вероятность при справедливости [[нулевая гипотеза|нулевой гипотезы]] получить значение статистики, такое же или ещё более экстремальное, чем <tex>T  | + | достигаемый уровень значимости <tex>p(T)</tex> — это вероятность при справедливости [[нулевая гипотеза|нулевой гипотезы]] получить значение статистики, такое же или ещё более экстремальное, чем <tex>T</tex> (условно, <tex>p(T) = \mathbb{P}(T|H_0)</tex>).  | 
Случайная величина <tex>p(T(x^m))</tex> имеет равномерное распределение.  | Случайная величина <tex>p(T(x^m))</tex> имеет равномерное распределение.  | ||
| Строка 15: | Строка 15: | ||
Некоторые типичные заблуждения, связанные со значением пи-величины:  | Некоторые типичные заблуждения, связанные со значением пи-величины:  | ||
| - | * достигаемый уровень значимости не равен вероятности истинности нулевой гипотезы;   | + | * достигаемый уровень значимости не равен вероятности истинности нулевой гипотезы <tex>\left(p(T) = \mathbb{P}(T|H_0) \neq \mathbb{P}(H_0|T)\right)</tex>; классическая статистика, в отличие от байесовской, не может приписывать вероятности гипотезам;  | 
* 1 – (достигаемый уровень значимости) не равно вероятности истинности альтернативной гипотезы;  | * 1 – (достигаемый уровень значимости) не равно вероятности истинности альтернативной гипотезы;  | ||
* достигаемый уровень значимости не равен вероятности ошибки первого рода;  | * достигаемый уровень значимости не равен вероятности ошибки первого рода;  | ||
Текущая версия
Достигаемый уровень значимости (пи-величина, англ. p-value) — это наименьшая величина уровня значимости, 
при которой нулевая гипотеза отвергается для данного значения статистики критерия  
где 
 — критическая область критерия. 
Другая интерпретация: 
достигаемый уровень значимости  — это вероятность при справедливости нулевой гипотезы получить значение статистики, такое же или ещё более экстремальное, чем 
 (условно, 
).
Случайная величина  имеет равномерное распределение.
Фактически, функция 
 приводит значение статистики критерия 
 к шкале вероятности. 
Маловероятным значениям (хвостам распределения) статистики 
 соотвествуют значения 
 близкие к нулю. 
Некоторые типичные заблуждения, связанные со значением пи-величины:
-  достигаемый уровень значимости не равен вероятности истинности нулевой гипотезы 
; классическая статистика, в отличие от байесовской, не может приписывать вероятности гипотезам;
 - 1 – (достигаемый уровень значимости) не равно вероятности истинности альтернативной гипотезы;
 - достигаемый уровень значимости не равен вероятности ошибки первого рода;
 - 1 – (достигаемый уровень значимости) не равно вероятности ошибки второго рода;
 - достигаемый уровень значимости не есть вероятность того, что повторный эксперимент не приведёт к тому же решению.
 
Как правило, в практических задачах нет никакого разумного правила для выбора фиксированного уровня
значимости. Выбирая метод достигаемого уровня значимости, мы можем сделать процедуру принятия решения более гибкой –- чем меньшее значение  мы наблюдаем, тем сильнее свидетельствует совокупность наблюдений против нулевой гипотезы. Использование достигаемого уровня значимости вместо метода процентных точек рекомендуется нормативными документами Всероссийского научно-исследовательского института сертификации с 1987 года. 
Литература
- Кобзарь А. И. Прикладная математическая статистика. Справочник для инженеров и научных работников. — М.: Физматлит, 2006. — 816 с.
 - Цейтлин Н. А. Из опыта аналитического статистика. — М.: Солар, 2006. — 905 с.
 - Всероссийский научно-исследовательский институт сертификации. Рекомендации. Прикладная статистика. Методы обработки данных. Основные требования и характеристики. — М.: ВНИИС, 1987.
 
Ссылки
- P-value — статья в англоязычной Википедии.
 

