Биномиальное распределение
Материал из MachineLearning.
м  (→Нормальное приближение)  | 
				 (дополнение)  | 
			||
| Строка 2: | Строка 2: | ||
''Биномиальное распределение'' - дискретное распределение вероятностей [[случайная_величина|случайной величины]] <tex>X</tex>, принимающей целочисленные значения <tex>k=0,1,\ldots,n</tex> с вероятностями:  | ''Биномиальное распределение'' - дискретное распределение вероятностей [[случайная_величина|случайной величины]] <tex>X</tex>, принимающей целочисленные значения <tex>k=0,1,\ldots,n</tex> с вероятностями:  | ||
| - | <tex>P(X=k)=C_n^kp^k(1-p)^{n-k}</tex>.  | + | <center><tex>P(X=k)=C_n^kp^k(1-p)^{n-k}</tex>.</center>  | 
Данное распределение характеризуется двумя параметрами: целым числом <tex>n>0</tex>, называемым ''числом испытаний'', и вещественным числом <tex>p</tex>, <tex>0\le p\le 1</tex>, называемом ''вероятностью успеха в одном испытании''. Биномиальное распределение - одно из основных распределений вероятностей, связанных с последовательностью независимых испытаний. Если проводится серия из <tex>n</tex> независимых испытаний, в каждом из которых может произойти "успех" с вероятностью <tex>p</tex>, то случайная величина, равная числу успехов во всей серии, имеет указанное распределение. Эта величина также может быть представлена в виде суммы <tex>X=X_1+\cdots+X_n</tex> независимых слагаемых, имеющих [[распределение Бернулли]].  | Данное распределение характеризуется двумя параметрами: целым числом <tex>n>0</tex>, называемым ''числом испытаний'', и вещественным числом <tex>p</tex>, <tex>0\le p\le 1</tex>, называемом ''вероятностью успеха в одном испытании''. Биномиальное распределение - одно из основных распределений вероятностей, связанных с последовательностью независимых испытаний. Если проводится серия из <tex>n</tex> независимых испытаний, в каждом из которых может произойти "успех" с вероятностью <tex>p</tex>, то случайная величина, равная числу успехов во всей серии, имеет указанное распределение. Эта величина также может быть представлена в виде суммы <tex>X=X_1+\cdots+X_n</tex> независимых слагаемых, имеющих [[распределение Бернулли]].  | ||
| Строка 25: | Строка 25: | ||
Строгая формулировка: если <tex>n\to\infty</tex> и <tex>p\to 0</tex> таким образом, что <tex>np\to\lambda</tex>, то   | Строгая формулировка: если <tex>n\to\infty</tex> и <tex>p\to 0</tex> таким образом, что <tex>np\to\lambda</tex>, то   | ||
| - | <tex>P(X=k)\to\frac{\lambda^k}{k!}e^{-\lambda},\quad k=0,1,2,\ldots.</tex>  | + | <center><tex>P(X=k)\to\frac{\lambda^k}{k!}e^{-\lambda},\quad k=0,1,2,\ldots.</tex></center>  | 
Более того, справедлива следующая оценка. Пусть <tex>Y</tex> - случайная величина, имеющая распределение Пуассона с параметром <tex>\lambda=np</tex>.   | Более того, справедлива следующая оценка. Пусть <tex>Y</tex> - случайная величина, имеющая распределение Пуассона с параметром <tex>\lambda=np</tex>.   | ||
Тогда для произвольного множества <tex>B\subset\{0,1,2,\ldots\}</tex> справедливо неравенство:  | Тогда для произвольного множества <tex>B\subset\{0,1,2,\ldots\}</tex> справедливо неравенство:  | ||
| - | <tex>|P(X\in B) - P(Y\in B)|\le 2np^2.</tex>  | + | <center><tex>|P(X\in B) - P(Y\in B)|\le 2np^2.</tex></center>  | 
Доказательство и обзор более точных результатов, касающихся точности данного приближения, можно найти в [1, гл. III, §12].  | Доказательство и обзор более точных результатов, касающихся точности данного приближения, можно найти в [1, гл. III, §12].  | ||
| Строка 37: | Строка 37: | ||
Приближение нормальным распределением используется в ситуациях, когда <tex>n\to\infty</tex>, а <tex>p</tex> фиксировано. Это приближение можно рассматривать как частный случай центральной предельной теоремы, применение которой основано на представлении <tex>X</tex> в виде суммы <tex>n</tex> слагаемых. Приближение основано на том, что при указанных условиях распределение нормированной величины  | Приближение нормальным распределением используется в ситуациях, когда <tex>n\to\infty</tex>, а <tex>p</tex> фиксировано. Это приближение можно рассматривать как частный случай центральной предельной теоремы, применение которой основано на представлении <tex>X</tex> в виде суммы <tex>n</tex> слагаемых. Приближение основано на том, что при указанных условиях распределение нормированной величины  | ||
| - | <tex>X'=\frac{X-MX}{\sqrt{DX}}=\frac{X-np}{\sqrt{npq}</tex>, где <tex>q=1-p</tex>  | + | <center><tex>X'=\frac{X-MX}{\sqrt{DX}}=\frac{X-np}{\sqrt{npq}</tex>, где <tex>q=1-p</tex></center>  | 
близко к стандартному нормальному.  | близко к стандартному нормальному.  | ||
| Строка 44: | Строка 44: | ||
Данная теорема используется для приближенного вычисления вероятностей отдельных значений биномиального распределения. Она утверждает [1, гл. I, §6], что равномерно по всем значениям <tex>k</tex>, таким что <tex>|k-np|=o(npq)^{2/3}</tex>, имеет место  | Данная теорема используется для приближенного вычисления вероятностей отдельных значений биномиального распределения. Она утверждает [1, гл. I, §6], что равномерно по всем значениям <tex>k</tex>, таким что <tex>|k-np|=o(npq)^{2/3}</tex>, имеет место  | ||
| - | <tex>P(X=k)\sim\frac{1}{\sqrt{2\pi npq}}e^{-\frac{(k-np)^2}{2npq}}=\frac{1}{\sqrt{npq}}\varphi\left(\frac{k-np}{\sqrt{npq}}\right),</tex> где <tex>\varphi</tex> - плотность стандартного нормального распределения.  | + | <center><tex>P(X=k)\sim\frac{1}{\sqrt{2\pi npq}}e^{-\frac{(k-np)^2}{2npq}}=\frac{1}{\sqrt{npq}}\varphi\left(\frac{k-np}{\sqrt{npq}}\right),</tex></center>   | 
| + | |||
| + | где <tex>\varphi</tex> - плотность стандартного нормального распределения.  | ||
===Интегральная теорема Муавра-Лапласа===  | ===Интегральная теорема Муавра-Лапласа===  | ||
| + | На практике необходимость оценки вероятностей отдельных значений, которую дает локальная теорема Муавра-Лапласа, возникает не часто. Гораздо более важно оценивать вероятности событий, включающих в себя множество значений. Для этого используется интегральная теорема, которую можно сформулировать в следующем виде [1, гл. I, §6]:  | ||
| + | |||
| + | <center><tex>\sup_{-\infty\le a<b\le\infty}\left|P\left(a<\frac{X-np}{\sqrt{npq}}\le b\right) - P(a<Z\le b)\right|\to 0</tex> при <tex>n\to\infty</tex>,</center>  | ||
| + | |||
| + | где случайная величина <tex>Y</tex> имеет стандартное нормальное распределение <tex>\mathcal{N}(0,1)</tex>, и аппроксимирующая вероятность определяется по формуле  | ||
| + | |||
| + | <center><tex>P(a<Z\le b)=\Phi(b)-\Phi(a)</tex></center>,  | ||
| + | |||
| + | где <tex>\Phi(t)</tex> - функция распределения стандартного нормального закона: <tex>\Phi(t)=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^t e^{-t^2/2}\,dt</tex>.  | ||
| + | |||
| + | Есть ряд результатов, позволяющих оценить скорость сходимости. В [1, гл. I, §6] приводится следующий результат, являющийся частным случаем теоремы Берри-Эссеена:  | ||
| + | |||
==Литература==  | ==Литература==  | ||
Версия 12:09, 4 ноября 2009
Содержание | 
Определение
Биномиальное распределение - дискретное распределение вероятностей случайной величины , принимающей целочисленные значения 
 с вероятностями:
Данное распределение характеризуется двумя параметрами: целым числом , называемым числом испытаний, и вещественным числом 
, 
, называемом вероятностью успеха в одном испытании. Биномиальное распределение - одно из основных распределений вероятностей, связанных с последовательностью независимых испытаний. Если проводится серия из 
 независимых испытаний, в каждом из которых может произойти "успех" с вероятностью 
, то случайная величина, равная числу успехов во всей серии, имеет указанное распределение. Эта величина также может быть представлена в виде суммы 
 независимых слагаемых, имеющих распределение Бернулли.
Основные свойства
- Математическое ожидание: 
 - Дисперсия: 
 - Асимметрия: 
; при
распределение симметрично относительно центра
 
Асимптотические приближения при больших n
Если значения  велики, то непосредственное вычисление вероятностей событий, связанных с данной случайной величиной, технически затруднительно.
В этих случаях можно использовать приближения биномиального распределения распределением Пуассона и нормальным (приближение Муавра-Лапласа).
Приближение Пуассона
Приближение распределением Пуассона применяется в ситуациях, когда значения  большие, а значения 
 близки к нулю. При этом биномиальное распределение аппроксимируется распределением Пуассона с параметром 
. 
Строгая формулировка: если  и 
 таким образом, что 
, то 
Более того, справедлива следующая оценка. Пусть  - случайная величина, имеющая распределение Пуассона с параметром 
. 
Тогда для произвольного множества 
 справедливо неравенство:
Доказательство и обзор более точных результатов, касающихся точности данного приближения, можно найти в [1, гл. III, §12].
Нормальное приближение
Приближение нормальным распределением используется в ситуациях, когда , а 
 фиксировано. Это приближение можно рассматривать как частный случай центральной предельной теоремы, применение которой основано на представлении 
 в виде суммы 
 слагаемых. Приближение основано на том, что при указанных условиях распределение нормированной величины
близко к стандартному нормальному.
Локальная теорема Муавра-Лапласа
Данная теорема используется для приближенного вычисления вероятностей отдельных значений биномиального распределения. Она утверждает [1, гл. I, §6], что равномерно по всем значениям , таким что 
, имеет место
где  - плотность стандартного нормального распределения.
Интегральная теорема Муавра-Лапласа
На практике необходимость оценки вероятностей отдельных значений, которую дает локальная теорема Муавра-Лапласа, возникает не часто. Гораздо более важно оценивать вероятности событий, включающих в себя множество значений. Для этого используется интегральная теорема, которую можно сформулировать в следующем виде [1, гл. I, §6]:
где случайная величина  имеет стандартное нормальное распределение 
, и аппроксимирующая вероятность определяется по формуле
где  - функция распределения стандартного нормального закона: 
.
Есть ряд результатов, позволяющих оценить скорость сходимости. В [1, гл. I, §6] приводится следующий результат, являющийся частным случаем теоремы Берри-Эссеена:
Литература
1. Ширяев А.Н. Вероятность. — М.: МЦНМО, 2004.
Ссылки
- Биномиальное распределение (Википедия)
 - Binomial distribution (Wikipedia)
 

