Статистический анализ данных (курс лекций, К.В.Воронцов)/2014, ФУПМ/1
Материал из MachineLearning.
Ниже под обозначением понимается выборка объёма из смеси нормального и равномерного распределений с весами и соответственно (при генерации каждой выборки используется случайный датчик — если его значение не превосходит , то добавляем в выборку элемент, взятый из нормального распределения, иначе — элемент, взятый из равномерного).
Содержание |
Анализ поведения схожих критериев
Требуется исследовать поведение указанной пары статистических критериев, подходящих для решения одной и той же задачи, сравнить мощность и достигаемые уровни значимости и сделать выводы о границах применимости критериев. Необходимо для каждого из критериев построить графики зависимости достигаемых уровней значимости и оценок мощностей от параметров, и показать, в каких областях изменения параметров предпочтительнее использовать тот или иной критерий. Для получения более гладких графиков рекомендуется применять оба критерия к одним и тем же выборкам, а не генерировать их отдельно для каждого критерия.
- сравнить z-критерий и точный критерий для доли.
- сравнить критерии, основанные на доверительных интервалах Вальда и Уилсона (нулевая гипотеза отвергается на уровне значимости 5%, если 95% доверительный интервал для параметра не содержит ).
-
среднее значение равно нулю,
среднее значение не равно нулю;
- сравнить одновыборочные t- и z-критерии.
- сравнить одновыборочный t-критерий и критерий знаковых рангов Уилкоксона.
- сравнить одновыборочный перестановочный критерий и критерий знаковых рангов Уилкоксона.
- Сравнить критерий Фишера и WM-критерий.
- Сравнить WM-критерий и критерий Зигеля-Тьюки.
- Сравнить критерий Фишера и критерий Зигеля-Тьюки.
-
неверна;
- Сравнить критерий Шапиро-Уилка и критерий Колмогорова-Смирнова.
- Сравнить критерий Смирнова-Крамера-фон Мизеса и критерий Жарка-Бера.
- Сравнить критерий Колмогорова-Смирнова и критерий хи-квадрат.
Анализ устойчивости критериев к нарушению предположений
Требуется исследовать поведение указанного критерия в условиях нарушения лежащих в его основе предположений. Оценить мощность и достигаемый уровень значимости критерия при различных значениях параметров, сделать выводы об устойчивости.
- Одновыборочный t-критерий, нарушение предположения о нормальности.
- Воронов:
- Воронов:
- Критерий Фишера для проверки равенства дисперсий, нарушение предположения о нормальности.
- Критерий Зигеля-Тьюки, нарушение предположения о равенстве медиан.
- Двухвыборочный t-критерий, нарушение предположения о равенстве дисперсий.
Анализ двухэтапных процедур проверки гипотез
Требуется построить описанную двухэтапную процедуру проверки гипотез и сравнить вероятности совершения ей ошибок первого и второго рода при уровне значимости с аналогичными показателями каждого из критериев второго этапа. Сделать выводы о корректности применения двухэтапной процедуры.
- Одновыборочная гипотеза о среднем с предварительной проверкой нормальности. Если нормальность отвергается на уровне значимости , используется критерий знаковых рангов, иначе — t-критерий.
- Нормальность проверяется критерием Шапиро-Уилка.
- Нормальность проверяется критерием Смирнова-Крамера-фон Мизеса.
- Нормальность проверяется критерием Лиллиефорса.
- Двухвыборочная гипотеза о равенстве средних с предварительной проверкой нормальности. Если нормальность хотя бы одной из выборок отвергается на уровне значимости , используется критерий Уилкоксона-Манна-Уитни, иначе — критерий Аспина-Уэлша.
- Нормальность проверяется критерием Лиллиефорса.
- Нормальность проверяется критерием Смирнова-Крамера-фон Мизеса.
- Нормальность проверяется критерием Шапиро-Уилка.
- Нормальность проверяется критерием хи-квадрат.
- Двухвыборочная гипотеза о равенстве средних с предварительной проверкой равенства дисперсий. Равенство дисперсий проверяется критерием Фишера, если оно отвергается на уровне значимости , используется критерий Аспина-Уэлша, иначе — t-критерий для неизвестных равных дисперсий.