Проверка статистических гипотез
Материал из MachineLearning.
Vokov (Обсуждение | вклад)
(Новая: {{TOCright}} '''Статистическая гипотеза''' (statistical hypothesys) — определённое предположение о распределении вероя...)
К следующему изменению →
Версия 19:18, 6 августа 2008
 
  | 
Статистическая гипотеза (statistical hypothesys) — определённое предположение о распределении вероятностей, лежащем в основе наблюдаемой выборки данных.
Проверка статистических гипотез (testing statistical hypotheses) — методология принятия решений о том, что рассматриваемая статистическая гипотеза не противоречит наблюдаемой выборке данных.
Чаще всего рассматриваются две гипотезы — основная или нулевая  и альтернативная 
.
Иногда альтернатива не формулируется в явном виде; тогда предполагается, что 
 означает «не 
».
Иногда рассматривается сразу несколько альтернатив. 
Методология
Пусть задана случайная выборка  — последовательность 
 объектов из множества 
, на котором существует (но не известна) вероятностная мера 
.
Общая методика состоит в следующем.
-  Формулируется нулевая гипотеза 
о распределении вероятностей на множестве
. Собственно, это именно то, что мы собираемся проверить. Гипотеза формулируется исходя из требований прикладной задачи. В математической статистике хорошо изучено несколько десятков «наиболее часто встречающихся» типов гипотез, и известны ещё сотни специальных вариантов и разновидностей.
 -  Задаётся некоторая статистика 
, для которой в условиях справедливости гипотезы
выводится функция распределения
и/или плотность распределения
. Вопрос о том, какую статистику надо взять для проверки той или иной гипотезы, часто не имеет однозначного ответа. Есть целый ряд требований, предъявляемых к «хорошей» статистике
. Задача получения функции распределения
при заданных
и
является строго поставленной математической задачей, которая решается методами теории вероятностей; в справочниках приводятся готовые формулы; в статистических пакетах имеются готовые вычислительные процедуры.
 -  Фиксируется уровень значимости 
— число из отрезка
, которое можно интерпретировать как «достаточно малую вероятность». Её выбирают исходя из априорных соображений риска, допустимого для принимаемого решения в данной прикладной задаче. Часто полагают
.
 -  На множестве допустимых значений статистики 
выделяется критическое множество
наименее вероятных значений
такое, что
. Вычисление вида критического множества также является строгой математической задачей, решение которой для большинства практических случаев известно.
 - Статистический тест
 
|   |  Статья в настоящий момент дорабатывается. К.В.Воронцов 23:18, 6 августа 2008 (MSD)  | 
Литература
- Вероятность и математическая статистика: Энциклопедия / Под ред. Ю.В.Прохорова. — М.: Большая российская энциклопедия, 2003. — 912 с.
 - Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006.
 

