Критерий Стьюдента
Материал из MachineLearning.
 (Новая: '''t-Критерий Стьюдента''' — общее название для статистических тестов), в которых...)  | 
				|||
| Строка 1: | Строка 1: | ||
| + | {{TOCright}}  | ||
| + | |||
'''t-Критерий Стьюдента''' — общее название для [[статистический тест|статистических тестов]]), в которых статистика критерия имеет [[распределение Стьюдента]]. Наиболее часто t-критерии применяются для проверки равенства средних значений в двух нормальных [[выборка]]х.  | '''t-Критерий Стьюдента''' — общее название для [[статистический тест|статистических тестов]]), в которых статистика критерия имеет [[распределение Стьюдента]]. Наиболее часто t-критерии применяются для проверки равенства средних значений в двух нормальных [[выборка]]х.  | ||
| Строка 4: | Строка 6: | ||
== Сравнение выборочного среднего с заданным значением ==  | == Сравнение выборочного среднего с заданным значением ==  | ||
| - | Задана выборка <tex>x^m = (x_1,\ldots,x_m)  | + | Задана выборка <tex>x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R}</tex>.  | 
| - | Нулевая гипотеза <tex>H_0</tex>  | + | Дополнительное предположение: выборка нормальна.   | 
| + | |||
| + | Нулевая гипотеза <tex>H_0:\; \bar x = \mu</tex> (среднее равно <tex>\mu</tex>).  | ||
Статистика критерия:  | Статистика критерия:  | ||
| - | ::<tex>t = \frac{(\bar x - \mu)\sqrt  | + | ::<tex>\displaystyle t = \frac{(\bar x - \mu)\sqrt{m}}{s}</tex>  | 
имеет [[распределение Стьюдента]] с  <tex>m-1</tex> степенями свободы,  | имеет [[распределение Стьюдента]] с  <tex>m-1</tex> степенями свободы,  | ||
где  | где  | ||
| - | + | ::<tex>\displaystyle \bar x = \frac1m \sum_{i=1}^m x_i</tex> — выборочное среднее,  | |
| - | + | ::<tex>\displaystyle s^2  = \frac1{m-1} \sum_{i=1}^m \left( x_i - \bar x \right)^2</tex> — выборочная дисперсия.  | |
| + | |||
| + | Критерий (при [[уровень значимости|уровне значимости]] <tex>\alpha</tex>):  | ||
| - | |||
* против альтернативы <tex>H_1:\; \bar x \neq \mu</tex>  | * против альтернативы <tex>H_1:\; \bar x \neq \mu</tex>  | ||
| - | ::если <tex> |t| > t_{  | + | ::если <tex> |t| > t_{\alpha/2} </tex>, то нулевая гипотеза отвергается;  | 
| + | |||
* против альтернативы <tex>H'_1:\; \bar x < \mu</tex>  | * против альтернативы <tex>H'_1:\; \bar x < \mu</tex>  | ||
| - | ::если <tex> t < t_{  | + | ::если <tex> t < t_{\alpha} </tex>, то нулевая гипотеза отвергается;  | 
| + | |||
* против альтернативы <tex>H''_1:\; \bar x > \mu</tex>  | * против альтернативы <tex>H''_1:\; \bar x > \mu</tex>  | ||
| - | ::если <tex> t > t_{  | + | ::если <tex> t > t_{1-\alpha} </tex>, то нулевая гипотеза отвергается;  | 
где  | где  | ||
| - | <tex> t_{  | + | <tex> t_{\alpha} </tex> есть <tex>\alpha</tex>-[[квантиль]] распределения Стьюдента с <tex>m-1</tex> степенями свободы.  | 
== Сравнение двух выборочных средних при известных дисперсиях ==  | == Сравнение двух выборочных средних при известных дисперсиях ==  | ||
| + | Заданы две выборки <tex>x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R}</tex>.  | ||
| + | |||
| + | Дополнительные предположения:   | ||
| + | * обе выборки нормальны;   | ||
| + | * значения дисперсий <tex> \sigma^2_x,\, \sigma^2_y </tex> известны априори; это означает, что дисперсии были оценены заранее не по этим выборкам, а исходя из какой-то другой информации; случай, когда такого источника информации нет и дисперсии приходится оценивать по самим выборкам, описан [[#Сравнение двух выборочных средних при неизвестных неравных дисперсиях|ниже]].   | ||
| + | |||
| + | Нулевая гипотеза <tex>H_0:\; \bar x = \bar y</tex> (средние в двух выборках равны).  | ||
| + | |||
| + | Статистика критерия:  | ||
| + | ::<tex>z = (\bar x - \bar y) \left( \frac{\sigma^2_x}{m} +\frac{\sigma^2_y}{n} \right)^{-1/2}</tex>,  | ||
| + | имеет стандартное [[нормальное распределение]] <tex>\mathcal{N}(0,1)</tex>,  | ||
| + | где  | ||
| + | ::<tex>\displaystyle \bar x = \frac1m \sum_{i=1}^m x_i,\; \bar y = \frac1n \sum_{i=1}^n y_i</tex> — выборочные средние.  | ||
| + | |||
| + | Критерий (при [[уровень значимости|уровне значимости]] <tex>\alpha</tex>):  | ||
| + | |||
| + | * против альтернативы <tex>H_1:\; \bar x \neq \bar y</tex>  | ||
| + | ::если <tex> |z| > \Phi_{\alpha/2} </tex>, то нулевая гипотеза отвергается;  | ||
| + | |||
| + | * против альтернативы <tex>H'_1:\; \bar x < \bar y</tex>  | ||
| + | ::если <tex> z < \Phi_{\alpha} </tex>, то нулевая гипотеза отвергается;  | ||
| + | |||
| + | * против альтернативы <tex>H''_1:\; \bar x > \bar y</tex>  | ||
| + | ::если <tex> z > \Phi_{1-\alpha} </tex>, то нулевая гипотеза отвергается;  | ||
| + | где  | ||
| + | <tex> \Phi_{\alpha} </tex> есть <tex>\alpha</tex>-[[квантиль]] стандартного нормального распределения.  | ||
== Сравнение двух выборочных средних при неизвестных равных дисперсиях ==  | == Сравнение двух выборочных средних при неизвестных равных дисперсиях ==  | ||
| + | |||
== Сравнение двух выборочных средних при неизвестных неравных дисперсиях ==  | == Сравнение двух выборочных средних при неизвестных неравных дисперсиях ==  | ||
Версия 19:10, 11 августа 2008
t-Критерий Стьюдента — общее название для статистических тестов), в которых статистика критерия имеет распределение Стьюдента. Наиболее часто t-критерии применяются для проверки равенства средних значений в двух нормальных выборках.
Все разновидности критерия Стьюдента являются параметрическими и основаны на дополнительном предположении о нормальности выборки данных. Поэтому перед применением критерия Стьюдента рекомендуется выполнить проверку нормальности.
Сравнение выборочного среднего с заданным значением
Задана выборка .
Дополнительное предположение: выборка нормальна.
Нулевая гипотеза  (среднее равно 
).
Статистика критерия:
имеет распределение Стьюдента с   степенями свободы,
где
— выборочное среднее,
— выборочная дисперсия.
Критерий (при уровне значимости ):
-  против альтернативы 
 
- если 
, то нулевая гипотеза отвергается;
 
- если 
 
-  против альтернативы 
 
- если 
, то нулевая гипотеза отвергается;
 
- если 
 
-  против альтернативы 
 
- если 
, то нулевая гипотеза отвергается;
 
- если 
 
где
 есть 
-квантиль распределения Стьюдента с 
 степенями свободы.
Сравнение двух выборочных средних при известных дисперсиях
Заданы две выборки .
Дополнительные предположения:
- обе выборки нормальны;
 -  значения дисперсий 
известны априори; это означает, что дисперсии были оценены заранее не по этим выборкам, а исходя из какой-то другой информации; случай, когда такого источника информации нет и дисперсии приходится оценивать по самим выборкам, описан ниже.
 
Нулевая гипотеза  (средние в двух выборках равны).
Статистика критерия:
,
имеет стандартное нормальное распределение ,
где
— выборочные средние.
Критерий (при уровне значимости ):
-  против альтернативы 
 
- если 
, то нулевая гипотеза отвергается;
 
- если 
 
-  против альтернативы 
 
- если 
, то нулевая гипотеза отвергается;
 
- если 
 
-  против альтернативы 
 
- если 
, то нулевая гипотеза отвергается;
 
- если 
 
где
 есть 
-квантиль стандартного нормального распределения.
Сравнение двух выборочных средних при неизвестных равных дисперсиях
Сравнение двух выборочных средних при неизвестных неравных дисперсиях
Сравнение двух выборочных средних в связанных выборках
История
Критерий был разработан Уильямом Госсеттом для оценки качества пива на пивоваренных заводах Гиннесса в Дублине (Ирландия). В связи с обязательствами перед компанией по неразглашению коммерческой тайны (руководство Гиннесса считало таковой использование статистического аппарата в своей работе), статья Госсетта вышла в 1908 году в журнале «Биометрика» под псевдонимом «Student» (Студент).
Литература
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006.
 
Ссылки
- Проверка статистических гипотез — о методологии проверки статистических гипотез.
 - Статистика (функция выборки)
 - Student's t-test — статья в англоязычной Википедии.
 - t-критерий Стьюдента — статья в русской Википедии.
 

