Интервальная оценка
Материал из MachineLearning.
Интервальное оценивание — один из видов статистического оценивания, предполагающий построение интервала, в котором с некоторой вероятностью находится истинное значение оцениваемого параметра.
Содержание |
Определение
Пусть - неизвестный параметр генеральной совокупности. По сделанной выборке по определенным правилам находятся числа и такие чтобы выполнялось неравенство:
Интервал является доверительным интервалом для параметра , а число - доверительной вероятностью или надежностью сделанной оценки. Обычно надежность задается заранее, причем выбираются числа близкие к 1 (0.95, 0.99 или 0.999).
Примеры интервальных оценок
Пример 1. Доверительное оценивание по вариационному ряду.
Пусть задана выборка некоторой случайной величины Построим вариационный ряд выборки
Очевидно, что вероятность попасть в любой из - го интервалов значений случайной ведичины одинакова и равна Тогда вероятность того, что случайная величина приняла значение из интервала где будет равна:
Вопрос: чему должен быть равен размер выборки чтобы вероятность попасть в интервал составила 95%.
- Подставляя значение для доверительной вероятности в формулу выше, получим:
- откуда
Таким образом, при достаточном для заданной доверительной вероятности числе измерений случайной величины по набору ее порядковых статистик может быть оценен диапазон принимаемых ею значений.
Пример 2. Доверительный интервал для медианы.
Пусть задана выборка некоторой случайной величины
- При доверительный интервал для медианы определяется порядковыми статистиками
- где
- при
- при
- при
- Для значений номера порядковых статистик, заключающих в себе медиану, при и приведены в таблице 1, взятой из [3].
Пример 3. Доверительный интервал для математического ожидания.
Пусть задана выборка некоторой случайной величины , арактеристики которой (дисперсия D и математическое ожидание M) неизвестны. Эти параметры оценим так:
- - несмещенная оценка дисперсии.
Величину называют оценкой среднего квадратического отклонения. Воспользуемся тем, что величина представляет собой сумму независимых случайных величин, и, согласно центральной предельной теореме, при достаточно большом ее закон близок к нормальному. Поэтому будем считать, что величина распределена по нормальному закону. Характеристики этого закона - математическое ожидание и дисперсия - равны соответственно M (настоящее МО случайной величины ) и .
Найдем такую величину , для которой . Перепишем это в эквивалентном виде и скажем, что случайная величина перед знаком неравенства есть модуль от стандартной нормальной. Получаем, что , и . В случае неизвестной дисперсии ее можно заменить на оценку .
Квантили стандартного нормального распределения:
Квантиль порядка | Квантиль порядка | ||
0.01 | -2.326348 | 0.60 | 0.253347 |
0.025 | -1.959964 | 0.70 | 0.524401 |
0.05 | -1.644854 | 0.80 | 0.841621 |
0.10 | -1.281552 | 0.90 | 1.281552 |
0.30 | -0.524401 | 0.95 | 1.644854 |
0.40 | -0.253347 | 0.975 | 1.959964 |
0.50 | 0 | 0.99 | 2.326348 |
Например, выбирая , получаем коэффициент
Окончательно: с вероятностью можно сказать, что
Литература
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006.
- Гмурман В. Е. Теория вероятностей и математическая статистика. - М.: Высшая Школа, 2003.
- Закс Л. Статистическое оценивание / Пер. с нем. - М.: Статистика, 1976.