Пи-величина
Материал из MachineLearning.
| Строка 3: | Строка 3: | ||
'''Достигаемый уровень значимости''' (пи-величина, англ. p-value) — это наименьшая величина [[уровень значимости|уровня значимости]],   | '''Достигаемый уровень значимости''' (пи-величина, англ. p-value) — это наименьшая величина [[уровень значимости|уровня значимости]],   | ||
при которой [[нулевая гипотеза]] отвергается для данного значения ''статистики критерия'' <tex>T</tex>.   | при которой [[нулевая гипотеза]] отвергается для данного значения ''статистики критерия'' <tex>T</tex>.   | ||
| - | ::<tex>  | + | ::<tex>p(T) = \min \{ \alpha:\: T\in\Omega_\alpha \},</tex>   | 
где   | где   | ||
<tex>\Omega_\alpha</tex> — ''критическая область'' критерия.   | <tex>\Omega_\alpha</tex> — ''критическая область'' критерия.   | ||
Другая интерпретация:   | Другая интерпретация:   | ||
| - | ''  | + | ''достигаемый уровень значимости'' <tex>\p(T)</tex> — это вероятность, с которой (при условии истинности ''нулевой гипотезы'') могла бы реализоваться наблюдаемая выборка, или любая другая выборка с ещё менее вероятным значением статистики <tex>T</tex>.  | 
| - | Случайная величина <tex>\  | + | Случайная величина <tex>\p(T(x^m))</tex> имеет равномерное распределение.  | 
| - | Фактически, функция <tex>\  | + | Фактически, функция <tex>\p(T)</tex> приводит значение статистики критерия <tex>T</tex> к шкале вероятности.   | 
| - | Маловероятным значениям (хвостам распределения) статистики <tex>T</tex> соотвествуют значения <tex>\  | + | Маловероятным значениям (хвостам распределения) статистики <tex>T</tex> соотвествуют значения <tex>\p(T)</tex>, близкие к нулю.   | 
Некоторые типичные заблуждения, связанные со значением пи-величины:  | Некоторые типичные заблуждения, связанные со значением пи-величины:  | ||
Версия 10:34, 30 апреля 2009
Достигаемый уровень значимости (пи-величина, англ. p-value) — это наименьшая величина уровня значимости, 
при которой нулевая гипотеза отвергается для данного значения статистики критерия . 
где 
 — критическая область критерия. 
Другая интерпретация: 
достигаемый уровень значимости  — это вероятность, с которой (при условии истинности нулевой гипотезы) могла бы реализоваться наблюдаемая выборка, или любая другая выборка с ещё менее вероятным значением статистики 
.
Случайная величина  имеет равномерное распределение.
Фактически, функция 
 приводит значение статистики критерия 
 к шкале вероятности. 
Маловероятным значениям (хвостам распределения) статистики 
 соотвествуют значения 
, близкие к нулю. 
Некоторые типичные заблуждения, связанные со значением пи-величины:
- достигаемый уровень значимости не равен вероятности истинности нулевой гипотезы; частотная статистика вообще не имеет права приписывать вероятности гипотезам;
 - 1 – (достигаемый уровень значимости) не равно вероятности истинности альтернативной гипотезы;
 - достигаемый уровень значимости не равен вероятности ошибки первого рода;
 - 1 – (достигаемый уровень значимости) не равно вероятности ошибки второго рода;
 - достигаемый уровень значимости не есть вероятность того, что повторный эксперимент не приведёт к тому же решению;
 
Литература
- Кобзарь А. И. Прикладная математическая статистика. Справочник для инженеров и научных работников. — М.: Физматлит, 2006. — 816 с.
 - Цейтлин Н. А. Из опыта аналитического статистика. — М.: Солар, 2006. — 905 с.
 
Ссылки
- Проверка статистических гипотез — о стандартной методике проверки статистических гипотез.
 - P-value — статья в англоязычной Википедии.
 

