Гипергеометрическое распределение
Материал из MachineLearning.
м   | 
				 (в формуле сочетания поменять местами аргументы, плюс в знаменателе верхний аргумент - n)  | 
			||
| Строка 48: | Строка 48: | ||
Если случайная величина <tex>X</tex> распределена гипергеометрически с параметрами <tex>N,\;m,\;n</tex>, тогда вероятность получить ровно <tex>k</tex> успехов (дефектных объектов в предыдущем примере) будет следующей:  | Если случайная величина <tex>X</tex> распределена гипергеометрически с параметрами <tex>N,\;m,\;n</tex>, тогда вероятность получить ровно <tex>k</tex> успехов (дефектных объектов в предыдущем примере) будет следующей:  | ||
| - | ::<tex>f(k;N,m,n)=\frac{  | + | ::<tex>f(k;N,m,n)=\frac{C_m^k C_{N-m}^{n-k}}{C_N^n}</tex>.  | 
Эта вероятность положительна, когда <tex>k</tex> лежит в промежутке между <tex>\max \{ 0, D+n-N \} </tex> и <tex>\min\{ n,D \}</tex>.  | Эта вероятность положительна, когда <tex>k</tex> лежит в промежутке между <tex>\max \{ 0, D+n-N \} </tex> и <tex>\min\{ n,D \}</tex>.  | ||
Текущая версия
|  Функция вероятности | |
|  Функция распределения | |
| Параметры |   | 
| Носитель |   | 
| Функция вероятности |   | 
| Функция распределения | |
| Математическое ожидание |   | 
| Медиана | |
| Мода |   | 
| Дисперсия |   | 
| Коэффициент асимметрии |   | 
| Коэффициент эксцесса |   | 
| Информационная энтропия | |
| Производящая функция моментов |   | 
| Характеристическая функция |   | 
Гипергеометрическое распределение — это дискретное вероятностное распределение, которое описывает количество успехов в выборке без возвращений длины  над конечной совокупностью объектов.
| Попали в выборку | Не попали в выборку | Всего | |
|---|---|---|---|
| С дефектом (успех) |   |   |   | 
| Без дефекта |   |   |   | 
| Всего |   |   |   | 
Это выборка из  объектов, из которых 
 дефектных. Гипергеометрическое распределение описывает вероятность того, что именно 
 дефектных в выборке из 
 конкретных объектов, взятых из совокупности.
Если случайная величина  распределена гипергеометрически с параметрами 
, тогда вероятность получить ровно 
 успехов (дефектных объектов в предыдущем примере) будет следующей:
.
Эта вероятность положительна, когда  лежит в промежутке между 
 и 
.
Приведенная формула может трактоваться следующим образом: существует  возможных выборок (без возвращения). Есть 
 способов выбрать 
 бракованных объектов и 
 способов заполнить остаток выборки объектами без дефектов.
В случае, когда размер популяции является большим по сравнению с размером выборки (т.е.,  намного больше, чем 
), гипергеометрическое распределение хорошо аппроксимируется биномиальным распределением с параметрами 
 (количество испытаний) и 
 (вероятность успеха в одном испытании).
Симметричность
,
,
.
Ссылки
http://en.wikipedia.org/wiki/Hypergeometric_distribution

