Метод LSD
Материал из MachineLearning.
 (уточнение)  | 
				 (уточнение)  | 
			||
| Строка 1: | Строка 1: | ||
'''Метод LSD = Метод группирования  выборок с наименее значимой разницей = Least Significant difference'''.  | '''Метод LSD = Метод группирования  выборок с наименее значимой разницей = Least Significant difference'''.  | ||
| - | '''Метод LSD''' позволяет проверять равенство средних значений нескольких выборок. При этом объемы выборок могут быть различными.  | + | '''Метод LSD''' позволяет проверять равенство [[среднее значение| средних значений]] нескольких [[выборка| выборок]]. При этом объемы выборок могут быть различными.  | 
| + | |||
| + | == Пример использования ==  | ||
| + | <tex> X_i </tex> - цены на <tex>i</tex>-ое лекарство в разных аптеках.  | ||
| + | Вопрос: какие лекарства взаимозаменяемы по цене?  | ||
| + | Делим лекарства на ценовые коридоры.  | ||
== Описание критерия ==  | == Описание критерия ==  | ||
| Строка 7: | Строка 12: | ||
=== Дополнительные предположения ===  | === Дополнительные предположения ===  | ||
| - | * ''Выборки <tex>x^{n_1}_1, . . . , x^{n_k}_k</tex> являются нормальными''  | + | * ''Выборки <tex>x^{n_1}_1, . . . , x^{n_k}_k</tex> являются [[нормальная выборка| нормальными]]''  | 
=== Нулевая гипотеза ===  | === Нулевая гипотеза ===  | ||
| - | Метод LSD проверяет '''гипотезу <tex>H_0</tex>''' о том, что средние значения всех <tex>k</tex> выборок одинаковы.  | + | Метод LSD проверяет '''[[нулевая гипотеза| нулевую гипотезу]] <tex>H_0</tex>''' о том, что средние значения всех <tex>k</tex> выборок одинаковы.  | 
::<tex>H_0: \mu_1 = \mu_2 =  . . . = \mu_k</tex>  | ::<tex>H_0: \mu_1 = \mu_2 =  . . . = \mu_k</tex>  | ||
Альтернативная '''гипотеза <tex>H_1</tex>''': существует, по крайней мере, две выборки <tex>i</tex> и <tex>j</tex> (<tex>i \neq j</tex>) с несовпадающими средними значениями.  | Альтернативная '''гипотеза <tex>H_1</tex>''': существует, по крайней мере, две выборки <tex>i</tex> и <tex>j</tex> (<tex>i \neq j</tex>) с несовпадающими средними значениями.  | ||
| Строка 16: | Строка 21: | ||
=== Статистика метода LSD ===  | === Статистика метода LSD ===  | ||
| - | Статистика метода LSD вычисляется в соответствии с соотношением:  | + | [[Статистика (функция выборки)| Статистика]] метода LSD вычисляется в соответствии с соотношением:  | 
::<tex>T  = \frac{\overline{X}_{i+1} - \overline{X}_{i}}{\sqrt{\frac{n_i + n_{i+1}}{n_i \cdot n_{i+1}} \cdot s^2_{int}}}</tex>.  | ::<tex>T  = \frac{\overline{X}_{i+1} - \overline{X}_{i}}{\sqrt{\frac{n_i + n_{i+1}}{n_i \cdot n_{i+1}} \cdot s^2_{int}}}</tex>.  | ||
Здесь <tex>S^2_{int}</tex> - внутригрупповая дисперсия:   | Здесь <tex>S^2_{int}</tex> - внутригрупповая дисперсия:   | ||
| Строка 24: | Строка 29: | ||
Для статистики метода LSD [[критическая область| критической областью]] при [[Уровень значимости|уровне значимости]]  <tex>\alpha</tex> является область   | Для статистики метода LSD [[критическая область| критической областью]] при [[Уровень значимости|уровне значимости]]  <tex>\alpha</tex> является область   | ||
::<tex>\Omega_{\alpha}:\; T>t_{n-k,\alpha}</tex>  | ::<tex>\Omega_{\alpha}:\; T>t_{n-k,\alpha}</tex>  | ||
| - | где <tex> t_{n-k,\alpha}</tex> - [[квантиль распределения Стьюдента]].  | + | где <tex> t_{n-k,\alpha}</tex> - [[квантиль]] [[распределение Стьюдента| распределения Стьюдента]].  | 
Для всех <tex>(i, i+1)</tex> проверяем гипотезу <tex>\overline{X}_{i+1} = \overline{X}_{i}</tex>. Если нулевая гипотеза <tex>H_0</tex> выполнена, тогда объединяем <tex>X_i</tex> с <tex>X_{i+1}</tex>.  | Для всех <tex>(i, i+1)</tex> проверяем гипотезу <tex>\overline{X}_{i+1} = \overline{X}_{i}</tex>. Если нулевая гипотеза <tex>H_0</tex> выполнена, тогда объединяем <tex>X_i</tex> с <tex>X_{i+1}</tex>.  | ||
=== Примечание ===  | === Примечание ===  | ||
| - | Это односторонний критерий  | + | Это [[односторонний критерий]].  | 
| - | + | ||
| - | + | ||
| - | + | ||
| - | + | ||
| - | + | ||
== История ==  | == История ==  | ||
| Строка 52: | Строка 52: | ||
* [[Критерий Стьюдента]]  | * [[Критерий Стьюдента]]  | ||
* [[Гипотеза сдвига]]  | * [[Гипотеза сдвига]]  | ||
| + | * [[Проверка статистических гипотез]]  | ||
| + | * [[Статистический анализ данных (курс лекций, К.В.Воронцов)]]  | ||
== Ссылки ==  | == Ссылки ==  | ||
| Строка 60: | Строка 62: | ||
[[Категория: Прикладная статистика]]  | [[Категория: Прикладная статистика]]  | ||
| + | [[Категория: Статистические тесты]]  | ||
Версия 22:20, 11 января 2009
Метод LSD = Метод группирования выборок с наименее значимой разницей = Least Significant difference.
Метод LSD позволяет проверять равенство средних значений нескольких выборок. При этом объемы выборок могут быть различными.
Содержание | 
Пример использования
 - цены на 
-ое лекарство в разных аптеках.
Вопрос: какие лекарства взаимозаменяемы по цене?
Делим лекарства на ценовые коридоры.
Описание критерия
Имеется  выборок 
 объемом 
 (
) каждая. Средние значения выборок обозначим через 
.
Дополнительные предположения
-  Выборки 
являются нормальными
 
Нулевая гипотеза
Метод LSD проверяет  нулевую гипотезу  о том, что средние значения всех 
 выборок одинаковы.
Альтернативная гипотеза : существует, по крайней мере, две выборки 
 и 
 (
) с несовпадающими средними значениями.
(для некоторых
).
Статистика метода LSD
Статистика метода LSD вычисляется в соответствии с соотношением:
.
Здесь  - внутригрупповая дисперсия: 
Критическая область
Для статистики метода LSD  критической областью при уровне значимости   является область 
где  - квантиль  распределения Стьюдента.
Для всех  проверяем гипотезу 
. Если нулевая гипотеза 
 выполнена, тогда объединяем 
 с 
.
Примечание
История
Предложен в 70-х годах.
Литература
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.
 
См. также
- Метод множественных сравнений Шеффе
 - Критерий Стьюдента
 - Гипотеза сдвига
 - Проверка статистических гипотез
 - Статистический анализ данных (курс лекций, К.В.Воронцов)
 

