Критерий Бартлетта
Материал из MachineLearning.
| Строка 1: | Строка 1: | ||
| - | '''Критерий Бартлета''' позволяет проверять равенство дисперсий нескольких выборок. При этом объемы выборок могут быть различными.  | + | '''Критерий Бартлета''' позволяет проверять равенство дисперсий нескольких выборок. При этом объемы выборок могут быть различными. Критерий Бартлетта очень чувствителен к нарушению предположения о нормальности.  | 
| + | |||
== Описание критерия ==  | == Описание критерия ==  | ||
| - | + | Имеется <tex>k</tex> выборок <tex>x^{n_1}_1, . . . , x^{n_k}_k</tex> объемом <tex>n_i</tex> (<tex>i=1,...,k </tex>) каждая. Дисперсии выборок и выборочные оценки дисперсий обозначим через <tex>\sigma_i^2</tex> и <tex>s_i^2</tex> соответственно.  | |
| - | <tex>x^{n_1}_1,...,x^{n_k}_k</tex>,   | + | |
| + | === Дополнительные предположения ===  | ||
| + | * ''Выборки <tex>x^{n_1}_1, . . . , x^{n_k}_k</tex> являются нормальными''. Критерий Бартлетта очень чувствителен к отклонениям от нормальности распределения исследуемых случайных величин. Если нет уверенности в нормальности распределения, им не рекомендуется пользоваться.  | ||
| + | |||
| + | === Нулевая гипотеза ===  | ||
| + | Критерий Бартлетта проверяет '''гипотезу <tex>H_0</tex>''' о том, что дисперсии всех <tex>k</tex> выборок одинаковы.  | ||
| + | ::<tex>H_0: \sigma_1^2 = \sigma_2^2 =  . . . = \sigma_k^2</tex>  | ||
| + | Альтернативная '''гипотеза <tex>H_1</tex>''': существует, по крайней мере, две выборки <tex>i</tex> и <tex>j</tex> (<tex>i \neq j</tex>) с несовпадающими дисперсиями.  | ||
| + | ::<tex>H_1: \sigma_i^2  \neq \sigma_j^2</tex> (для некоторых <tex>i \neq j</tex>).  | ||
| + | |||
| + | |||
| + | === Статистика критерия Бартлетта ===  | ||
| + | Статистика критерия Бартлетта вычисляется в соответствии с соотношением:  | ||
| + | ::<tex>T  = \frac{M}{c}</tex>.  | ||
| + | Здесь   | ||
| + | ::<tex>M = (N-k) \cdot \ln(s^2_p) - \sum_{i=1}^k (n_i - 1) \cdot \ln(s^2_i)</tex>,   | ||
| + | ::<tex>c = 1 + \frac{1}{3\cdot (k-1)} \cdot \left(\sum_{i=1}^k \left(\frac{1}{n_i-1} \right) - \frac{1}{(N-k)} \right)</tex>,  | ||
| + | где <tex>N = \sum_{i=1}^k n_i </tex> и <tex> s^2_p = \frac{1}{ N-k } \sum_{i=1}^k (n_i - 1) \cdot s^2_i </tex>  – суммарная оценка дисперсий.  | ||
| + | |||
| + | При <tex>n_i > 3 (i=1,...,k) </tex> и справедливости нулевой гипотезы статистика критерия Бартлетта имеет распределение <tex>\chi_{k-1}^2</tex> хи-квадрат с (k-1) степенями свободы.  | ||
| + | |||
| + | === Критерий (при уровне значимости <tex> \alpha</tex>) ===  | ||
| + | Если <tex> T > \chi_{k-1, \alpha}^2</tex>, то с достоверностью <tex> \alpha</tex> нулевая гипотеза <tex>H_0</tex> ''отвергается'' в пользу альтернативы <tex>H_1</tex>.  | ||
| + | |||
| + | === Примечание ===  | ||
| + | При отклонении от нормальности рекомендуется вместо статистики <tex>T</tex> пользоваться ее модификацией:  | ||
| + | ::<tex>T^*  = \frac{f_2 \cdot M}{f_1 \cdot \left(\frac{f_2^2}{f_2 (2-c) + c} - M \right)}</tex>,  | ||
| + | где <tex>f_1 = k-1</tex>, <tex>f_2 = \frac{k+1}{(c-1)^2}</tex>.  | ||
| + | |||
| + | Статистика <tex> T^*</tex> имеет <tex>F</tex>-распределение с <tex>f_1</tex> и <tex>f_2</tex> степенями свободы. Поэтому нулевую гипотезу следует отклонить, если <tex>T^* > F_{\alpha}(f_1, f_2)</tex>.  | ||
== Литература ==  | == Литература ==  | ||
| + | # {{книга  | ||
| + | |автор        = Кобзарь А. И.  | ||
| + | |заглавие     = Прикладная математическая статистика  | ||
| + | |издательство = М.: Физматлит  | ||
| + | |год          = 2006  | ||
| + | |страниц      = 816  | ||
| + | }}  | ||
== См. также ==  | == См. также ==  | ||
| Строка 13: | Строка 50: | ||
== Ссылки ==  | == Ссылки ==  | ||
* [http://en.wikipedia.org/wiki/Bartlett's_test Bartlett's test] (Wikipedia)  | * [http://en.wikipedia.org/wiki/Bartlett's_test Bartlett's test] (Wikipedia)  | ||
| - | + | * [http://www.itl.nist.gov/div898/handbook/eda/section3/eda357.htm NIST page on Bartlett's test]  | |
| - | + | ||
[[Категория: Прикладная статистика]]  | [[Категория: Прикладная статистика]]  | ||
Версия 21:15, 5 января 2009
Критерий Бартлета позволяет проверять равенство дисперсий нескольких выборок. При этом объемы выборок могут быть различными. Критерий Бартлетта очень чувствителен к нарушению предположения о нормальности.
Содержание | 
Описание критерия
Имеется  выборок 
 объемом 
 (
) каждая. Дисперсии выборок и выборочные оценки дисперсий обозначим через 
 и 
 соответственно.
Дополнительные предположения
-  Выборки 
являются нормальными. Критерий Бартлетта очень чувствителен к отклонениям от нормальности распределения исследуемых случайных величин. Если нет уверенности в нормальности распределения, им не рекомендуется пользоваться.
 
Нулевая гипотеза
Критерий Бартлетта проверяет гипотезу  о том, что дисперсии всех 
 выборок одинаковы.
Альтернативная гипотеза : существует, по крайней мере, две выборки 
 и 
 (
) с несовпадающими дисперсиями.
(для некоторых
).
Статистика критерия Бартлетта
Статистика критерия Бартлетта вычисляется в соответствии с соотношением:
.
Здесь
,
,
где  и 
  – суммарная оценка дисперсий.
При  и справедливости нулевой гипотезы статистика критерия Бартлетта имеет распределение 
 хи-квадрат с (k-1) степенями свободы.
  Критерий (при уровне значимости 
) 
Если , то с достоверностью 
 нулевая гипотеза 
 отвергается в пользу альтернативы 
.
Примечание
При отклонении от нормальности рекомендуется вместо статистики  пользоваться ее модификацией:
,
где , 
.
Статистика  имеет 
-распределение с 
 и 
 степенями свободы. Поэтому нулевую гипотезу следует отклонить, если 
.
Литература
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.
 
См. также
Ссылки
- Bartlett's test (Wikipedia)
 - NIST page on Bartlett's test
 

