Критерий хи-квадрат
Материал из MachineLearning.
 (→Проверка гипотезы)  | 
				 (→Определение)  | 
			||
| Строка 3: | Строка 3: | ||
== Определение ==  | == Определение ==  | ||
| - | Пусть дана случайная величина X .   | + | Критерий <tex>\chi^2</tex> - наиболее часто используемый статистический критерий для проверки гипотезы <tex> H_0</tex>, что наблюдаемая случайная величина подчиняется некому теоретическому закону распределения.  | 
| + | |||
| + | Пусть дана случайная величина X .  | ||
'''Гипотеза <tex> H_0 </tex>''': с. в. X подчиняется закону распределения <tex>F(x)</tex>.   | '''Гипотеза <tex> H_0 </tex>''': с. в. X подчиняется закону распределения <tex>F(x)</tex>.   | ||
| Строка 24: | Строка 26: | ||
'''Статистика:''' <tex>\chi^2 = \sum_{i=1}^k \frac{ \left( n_j-E_j \right)^2}{E_j} \sim \chi_{k-1}^2</tex>  - [[Распределение хи-квадрат|Распределение хи-квадрат]] с k-1 степенью свободы.  | '''Статистика:''' <tex>\chi^2 = \sum_{i=1}^k \frac{ \left( n_j-E_j \right)^2}{E_j} \sim \chi_{k-1}^2</tex>  - [[Распределение хи-квадрат|Распределение хи-квадрат]] с k-1 степенью свободы.  | ||
| - | |||
| - | |||
== Проверка гипотезы ==  | == Проверка гипотезы ==  | ||
Версия 11:20, 7 декабря 2008
 
  | 
|   |  Статья в настоящий момент дорабатывается. Венжега Андрей 00:08, 14 ноября 2008 (MSK)  | 
Определение
Критерий  - наиболее часто используемый статистический критерий для проверки гипотезы 
, что наблюдаемая случайная величина подчиняется некому теоретическому закону распределения.
Пусть дана случайная величина X .
Гипотеза : с. в. X подчиняется закону распределения 
. 
Для проверки гипотезы рассмотрим выборку, состоящую из n независимых наблюдений над с.в. X: 
. 
По выборке построим эмпирическое распределение 
 с.в X. Сравнение эмпирического 
 и теоретического распределения 
 производится с помощью специально подобранной случайной величины — критерия согласия. Рассмотрим критерий согласия Пирсона (критерий 
):
Гипотеза : Хn порождается функцией 
.
Разделим [a,b] на k непересекающихся интервалов ;
Пусть  - количество наблюдений в j-м интервале: 
;
 - вероятность попадания наблюдения в j-ый интервал при выполнении гипотезы 
;
 Ожидаемое число попаданий в j-ый интервал;
Статистика:   - Распределение хи-квадрат с k-1 степенью свободы.
Проверка гипотезы
В  зависимости от значения критерия , может выполняться одна из гипотез:
- гипотеза неслучайности
 
, гипотеза 
 выполняется.
- гипотеза случайности
 
 (попадает в левый "хвост" распределения) гипотеза 
 отвергается.
- гипотеза согласия
 
 (попадает в левый "хвост" распределения) гипотеза 
 отвергается.

