Метод LSD
Материал из MachineLearning.
 (Новая: Метод группирования выборок с наименее значимой разницей.  == Описание метода LSD ==  == Литература ==  == См....)  | 
				 (уточнение)  | 
			||
| Строка 1: | Строка 1: | ||
| - | Метод группирования выборок с наименее значимой разницей.  | + | '''Метод LSD = Метод группирования  выборок с наименее значимой разницей = Least Significant difference'''.  | 
| - | == Описание метода LSD ==  | + | '''Метод LSD''' позволяет проверять равенство средних значений нескольких выборок. При этом объемы выборок могут быть различными.  | 
| + | |||
| + | == Описание критерия ==  | ||
| + | Имеется <tex>k</tex> выборок <tex>x^{n_1}_1, . . . , x^{n_k}_k</tex> объемом <tex>n_i</tex> (<tex>i=1,...,k </tex>) каждая. Средние значения выборок обозначим через <tex>\mu_i</tex>.  | ||
| + | |||
| + | === Дополнительные предположения ===  | ||
| + | * ''Выборки <tex>x^{n_1}_1, . . . , x^{n_k}_k</tex> являются нормальными''  | ||
| + | |||
| + | === Нулевая гипотеза ===  | ||
| + | Метод LSD проверяет '''гипотезу <tex>H_0</tex>''' о том, что средние значения всех <tex>k</tex> выборок одинаковы.  | ||
| + | ::<tex>H_0: \mu_1 = \mu_2 =  . . . = \mu_k</tex>  | ||
| + | Альтернативная '''гипотеза <tex>H_1</tex>''': существует, по крайней мере, две выборки <tex>i</tex> и <tex>j</tex> (<tex>i \neq j</tex>) с несовпадающими средними значениями.  | ||
| + | ::<tex>H_1: \mu_i  \neq \mu_j</tex> (для некоторых <tex>i \neq j</tex>).  | ||
| + | |||
| + | === Статистика метода LSD ===  | ||
| + | Статистика метода LSD вычисляется в соответствии с соотношением:  | ||
| + | ::<tex>T  = \frac{\overline{X}_{i+1} - \overline{X}_{i}}{\sqrt{\frac{n_i + n_{i+1}}{n_i \cdot n_{i+1}} \cdot s^2_{int}}}</tex>.  | ||
| + | Здесь <tex>S^2_{int}</tex> - внутригрупповая дисперсия:   | ||
| + | ::<tex>S^2_{int}=\frac{1}{n-k}\sum_{i=1}^k\sum_{j=1}^{n_i}\bigl(x_{ij}-\overline{X}_i\bigr)^2</tex>  | ||
| + | |||
| + | === Критическая область ===  | ||
| + | Для статистики метода LSD [[критическая область| критической областью]] при [[Уровень значимости|уровне значимости]]  <tex>\alpha</tex> является область   | ||
| + | ::<tex>\Omega_{\alpha}:\; T>t_{n-k,\alpha}</tex>  | ||
| + | где <tex> t_{n-k,\alpha}</tex> - [[квантиль распределения Стьюдента]].  | ||
| + | |||
| + | Для всех <tex>(i, i+1)</tex> проверяем гипотезу <tex>\overline{X}_{i+1} = \overline{X}_{i}</tex>. Если нулевая гипотеза <tex>H_0</tex> выполнена, тогда объединяем <tex>X_i</tex> с <tex>X_{i+1}</tex>.  | ||
| + | |||
| + | === Примечание ===  | ||
| + | Это односторонний критерий.  | ||
| + | |||
| + | == Пример ==  | ||
| + | <tex> X_i </tex> - цены на <tex>i</tex>-ое лекарство в разных аптеках.  | ||
| + | Вопрос: какие лекарства взаимозаменяемы по цене?  | ||
| + | Делим лекарства на ценовые коридоры.  | ||
| + | |||
| + | == История ==  | ||
| + | Предложен в 70-х годах.  | ||
== Литература ==  | == Литература ==  | ||
| + | # {{книга  | ||
| + | |автор        = Кобзарь А. И.  | ||
| + | |заглавие     = Прикладная математическая статистика  | ||
| + | |издательство = М.: Физматлит  | ||
| + | |год          = 2006  | ||
| + | |страниц      = 816  | ||
| + | }}  | ||
== См. также ==  | == См. также ==  | ||
| + | * [[Метод множественных сравнений Шеффе]]   | ||
| + | * [[Критерий Стьюдента]]  | ||
| + | * [[Гипотеза сдвига]]  | ||
== Ссылки ==  | == Ссылки ==  | ||
| + | * [http://www.webpages.uidaho.edu/~brian/stat401ch9_02.pdf Fisher’s least significant difference (LSD)]  | ||
| + | * [http://ru.wikipedia.org/wiki/%D0%A1%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%B3%D0%B8%D0%BF%D0%BE%D1%82%D0%B5%D0%B7%D0%B0 Википедия: Проверка статистических гипотез]  | ||
| + | * [http://ru.wikipedia.org/wiki/%D0%A1%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B9_%D0%BA%D1%80%D0%B8%D1%82%D0%B5%D1%80%D0%B8%D0%B9 Википедия: Статистический критерий]  | ||
| + | * [http://www.statsoft.ru/home/textbook/glossary Электронный статистический словарь StatSoft]  | ||
| - | + | [[Категория: Прикладная статистика]]  | |
| - | + | ||
| - | [[Категория:   | + | |
Версия 00:22, 10 января 2009
Метод LSD = Метод группирования выборок с наименее значимой разницей = Least Significant difference.
Метод LSD позволяет проверять равенство средних значений нескольких выборок. При этом объемы выборок могут быть различными.
Содержание | 
Описание критерия
Имеется  выборок 
 объемом 
 (
) каждая. Средние значения выборок обозначим через 
.
Дополнительные предположения
-  Выборки 
являются нормальными
 
Нулевая гипотеза
Метод LSD проверяет гипотезу  о том, что средние значения всех 
 выборок одинаковы.
Альтернативная гипотеза : существует, по крайней мере, две выборки 
 и 
 (
) с несовпадающими средними значениями.
(для некоторых
).
Статистика метода LSD
Статистика метода LSD вычисляется в соответствии с соотношением:
.
Здесь  - внутригрупповая дисперсия: 
Критическая область
Для статистики метода LSD  критической областью при уровне значимости   является область 
где  - квантиль распределения Стьюдента.
Для всех  проверяем гипотезу 
. Если нулевая гипотеза 
 выполнена, тогда объединяем 
 с 
.
Примечание
Это односторонний критерий.
Пример
 - цены на 
-ое лекарство в разных аптеках.
Вопрос: какие лекарства взаимозаменяемы по цене?
Делим лекарства на ценовые коридоры.
История
Предложен в 70-х годах.
Литература
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.
 

