Критерии однородности
Материал из MachineLearning.
|   |  Данная статья является непроверенным учебным заданием.
 До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}. См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе.  | 
Критерии однородности - это критерии проверки гипотез о том, что две (или более) выборки взяты из одного распределения вероятностей. Рассмотрим такую классификацию критериев:
-  Непараметрические (свободные от распределения) критерии однородности не предполагают присутствие какой-либо фундаментальной информации о законе распределения. Любое распределение можно описать параметром положения, характеризующим центр группирования случайных величин, и параметром масштаба, характеризующим степень рассеяния случайных величин относительно центра группирования. Когда закон распределения неизвестен, гипотезы о параметрах проверяются при помощи специальных критериев сдвига и масштаба. Также существуют двухвыборочные критерии согласия.
- Непараметрические критерии сдвига.
 - Непараметрические критерии масштаба.
 - Двухвыборочные критерии согласия.
 
 - Если же принимаются какие-либо дополнительные предположения о законе распределения вероятностей, то можно применять
 
параметрические критерии однородности.
Содержание | 
Непараметрические критерии однородности
Непараметрические критерии сдвига
Проверяется гипотеза сдвига, согласно которой распределения двух выборок имеют одинаковую форму и отличаются только сдвигом на константу.
Пусть заданы две выборки 
,взятые из неизвестных непрерывных распределений 
 и 
 соответственно.
Нулевая гипотеза: 
Наиболее частая альтернативная гипотеза: .
Существует большое количество критериев, проверяющих эту гипотезу:
Ранговые критерии сдвига для двух выборок:
- Быстрый ранговый критерий [1]
 - Критерий Уилкоксона-Манна-Уитни [1]
 - Критерий Фишера-Йэйтса-Терри-Гёфдинга [1]
 - Критерий Ван дер Вардена [1]
 - Медианный критерий [1]
 - Критерий Хаги [1]
 - E-Критерий [1]
 
Ранговые критерии сдвига для нескольких (k>2) выборок:
- Критерий Краскела-Уоллиса [1]
 - Критерий Ван дер Вардена [1]
 - Медианный критерий [1]
 - Критерий Левиса [1]
 - Критерий Краузе [1]
 - Критерий Пейджа [1]
 - Критерий Вилкоксона-Вилкокс [1]
 - Критерий Фишера-Йэйтса-Терри-Гёфдинга [1]
 - Быстрый критерий Кенуя [1]
 - Критерий Джонкхиера [1]
 - Критерий Неменьи [1]
 - Критерий Фридмена-Кендалла-Бэбингтона-Смита [1]
 - Критерий Хеттманспергера [1]
 - Критерий Андерсона-Каннемана-Шэча [1]
 - Критерий со взвешенными ранжировками Даны Квейд [1]
 - Критерий Кендалла-Эренберга [1]
 - Критерий Ходжеса-Лемана-Сена [1]
 
Непараметрические критерии масштаба
Для двух выборок . 
проверяется гипотеза о том, что они принадлежат одному и тому же распределению,
но с разным параметром масштаба.
Если плотность распределения первой выборки — 
, а второй выборки — 
, то нулевая гипотеза 
.
Ранговые критерии масштаба для двух выборок:
- Критерий Ансари—Бредли [1]
 - Критерий Зигеля-Тьюки [1]
 - Критерий Кейпена [1]
 - Критерий Клотца [1]
 - Критерий Сэвиджа [1]
 - Критерий Муда [1]
 - Критерий Сукхатме [1]
 - Критерий Сэндвика-Олсона [1]
 - Критерий Камата [1]
 - Комбинированный критерий Буша-Винда [1]
 
Ранговые критерии масштаба нескольких (k>2) выборок:
Двухвыборочные критерии согласия
- Критерий Лемана-Розенблатта
 - Двухвыборочный критерий Колмогорова-Смирнова [1]
 - Критерий Катценбайссера-Хакля [1]
 - Двухвыборочный критерий Андерсона [1]
 
Параметрические критерии однородности
Сравнение параметров нормальных распределений
Сравнение двух средних значений
Имеются две выборки независимых случайных величин 
Необходимо на основе выборочных данных установить наличие значимой разницы в средних двух совокупностей, из которых извлечены выборки.
Нулевая гипотеза: .
Альтернативы: 
- Сравнение при известных дисперсиях осуществляется при помощи критерия Стьюдента.
 - Сравнение при неизвестных равных дисперсиях осуществляется при помощи критерия Стьюдента.
 - Сравнение при неизвестных неравных дисперсиях осуществляется при помощи модификаций критерия Стьюдента: критерий Кохрена-Кокса, Критерий Сатервайта, критерий Уэлча.
 - Сравнение двух выборочных средних в связанных выборках осуществляется при помощи критерия Стьюдента.
 - Критерий Уолша [1] позволяет проверять гипотезу о принадлежности одного наблюдения нормальному распределению, генерирующему выборку.
 - Двухступентчатый двухвыборочный медианный критерий Волфа [1]
 - Критерий Фишера для сравнения двух средних с одинаковыми дисперсиями. [1] Эквивалентен критерию Стьюдента и основан на связи между распределениями Стьюдента и Фишера.
 
Сравнение нескольких средних значений
Имеются k выборок из нормально распределенной совокупности  
Нулевая гипотеза 
Альтернатива 
- Модифицированный критерий Стьюдента [1] позволяет решать задачу в случае равных объемов выборок.
 - Критерий стьюдентизированного размаха [1]
 - Дисперсионный критерий [1]
 - Критерий Полсона [1]
 
решает задачу отделения выборки с наибольшим средним значением от всех остальных.
- Критерий Тьюки (метод прямого сравнения) [1]
 - Критерий "стьюдентизированного" максимума (обобщенный критерий Тьюки) [1]
 - Критерий Шеффе [1]
 - Критерий Стьюдента-Ньюмена-Кейлса [1]
 - Критерий Дункана [1]
 - Критерий Линка-Уоллеса [1]
 
Сравнение двух дисперсий
Для двух нормально распределенных случайных величин  необходимо проверить гипотезу равенства дисперсий, опираясь на их выборочные оценки.
- Критерий Фишера
 - Критерий Романовского [1]
 - Критерий отношения размахов [1]
 - Критерий стьюдентизированного размаха [1]
 - Критерий Аризоно-Охты [1]
 
Сравнение нескольких дисперсий
Пусть  - дисперсии выборок
Нулевая гипотеза 
Альтернатива 
- Критерий Бартлетта [1]
 - Критерий Кокрена [1]
 - Критерий Неймана-Пирсона [1]
 - Критерий Блисса-Кохрана-Тьюки [1]
 - Критерий Хартли [1]
 - Критерий Кэдуэлла-Лесли-Брауна [1]
 - Критерий Самиуддина [1]
 
Сравнение параметров экспоненциальных распределений
Сравнение двух параметров
Предположим, имеются две выборки из экспоненциальных распределений:  т.е. из распределений с плотностями 
. Здесь 
 -  параметры распределений (средние значения). Иногда на практике (задачи анализа надежности объектов) используют параметр 
 - интенсивность отказов.
Сравнение нескольких (k>1) параметров
- Критерий Дэвида [1]
 - Критерий максимального правдоподобия [1]
 - Критерий Нагарсенкера [1]
 - Критерий Чена [1]
 - Комбинированный критерий Сингха [1]
 
Ссылки
Литература
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006.
 - Лагутин М. Б. Наглядная математическая статистика. В двух томах. — М.: П-центр, 2003.
 
См. также
- Проверка статистических гипотез — о методологии проверки статистических гипотез.
 - Статистика (функция выборки)
 - Критерии согласия
 

