Мультиномиальное распределение с равновероятными успехами испытаний Бернулли
Материал из MachineLearning.
Vitsemgol (Обсуждение | вклад)
(Новая: === Определение=== '''Мультиномиальное распределение с равновероятными успехами испытаний Бернулли ''' &m...)
К следующему изменению →
Версия 07:33, 30 октября 2013
Определение
Мультиномиальное распределение с равновероятными успехами испытаний Бернулли — совместное распределение вероятностей зависимых (кроме первой) случайных величин
определённых на точечных пространствах элементарных событий
и принимающих в дискретные последовательные моменты времени
с равновероятными успехами соответствующих Бернулли распределений
целые неотрицательные значения
взаимосвязанные условием
согласно которому
в  - ый момент времени 
 - ая случайная величина 
 принимает значение 
 при условии, что в предшествующий момент времени
 предшествующая случайная величина 
 приняла значение 
.
Схема повторных циклов случайных зависимых экспериментов с равновероятными успехами испытаний Бернулли
Мултиномиальное распределение появляется в так называемой мультиномиальной схеме повторных циклов случайных зависимых экспериментов. Каждый цикл экспериментов осуществляют методом выбора без возвращения в дискретной временной последовательности , номера точек которой соответствуют номерам случайных величин.
Каждая из случайных величин распределения  — это число 
 наступлений одного соответствующего события
в  - ый момент времени при условии, что в 
 - ый момент произошло 
 наступлений предшествующего события 
 с положительным исходом, все вероятности которых равны 
, нормированы 
 и неизменны во время проведения экспериментов.
Если в каждом цикле экспериментов вероятность наступления события  равна 
, то полиномиальная вероятность равна вероятности того, что при 
 экспериментах события 
 наступят 
 раз соответственно.
Случайная величина мультиномиального распределения в соответствующей точке дискретной временной последовательности  имеет:
пространство элементарных событий
вероятность
математическое ожидание
и дисперсию
Пространство элементарных событий мультиномиального распределения есть сумма точечных пространств элементарных событий его случайных величин, образующих дискретную последовательность точек  цикла, а вероятность мультиномиального распределения — произведение вероятностей его случайных величин.
Технические задачи и технические результаты
Для получения мультиномиального распределения необходимо решить две технические задачи и получить технические результаты, относящиеся к математической физике (http://ru.wikipedia.org/wiki/Математическая физика),[1]
Первая и вторая технические задачи — соответственно получение вероятности и математического ожидания мультиномиального распределения.
Технические результаты — набор технических параметров, с одной стороны, минимально необходимый для описания мультиномиального распределения и его случайных величин, с другой стороны, позволяющий при необходимости расширить число параметров с целью получения дополнительных сведений о распределении, например, таких как  корреляционная матрица,  ковариационная матрица ,  -квадрат критерий и другие.
Минимально необходимый набор параметров при решении первой технической задачи: пространство элементарных событий, вероятность, математическое ожидание и дисперсия каждой случайной величины распределения, дисперсия распределения и произведение математических ожиданий его случайных величин как исходное выражение для решения второй технической задачи.
При решении второй технической задачи минимально необходимый набор параметров аналогичен предыдущему набору. Исключен из-за ненадобности один параметр — произведение математических ожиданий случайных величин и дополнен двумя параметрами — максимальной вероятностью и максимальной дисперсией мультиномиального распределения.
Характеристики мультиномиального распределения с равновероятными успехами испытаний Бернулли
| Пространство элементарных событий |   | 
| Вероятность | |
|  Максимальная вероятность
 (при математическом ожидании распределения)  | |
|  Математическое ожидание
 (как максимальное произведение математических ожиданий случайных величин)  | |
| Дисперсия | |
|  Максимальная дисперсия
 (при математическом ожидании распределения)  | |
| Ковариационная матрица | 
  | 
| Корреляционная матрица |  \rho_{ij} \|</tex>, где
 
  | 
Вероятностная схема получения мультиномиального распределения с равновероятными успехами испытаний Бернулли
содержит циклы повторных зависимых экспериментов. Количество циклов не ограничено. В каждом цикле число экспериментов равно числу случайных величин распределения и в общем случае только первый эксперимент является независимым, а все последующие эксперименты в цикле зависимы от результатов предшествующих экспериментов. Все эксперименты осуществляют методом выбора без возвращения — изъятые элементы не возвращают на свое прежнее место до полного окончания данного цикла.
Случайные события –  выборки случайных объемов  осуществляют из 
   - множества различимых (различающиеся между собой хотя бы одним признаком, например, порядковым номером) неупорядоченных (хаотично расположенных)  элементов и  следуют  в последовательные моменты времени 
. 
Число выборок    равно числу случайных величин  распределения. 
Случайные величины    распределения —   появления случайного числа элементов 
   - множества в 
 -  подмножествах  
,   с вероятностями 
    каждого из них. 
Попадание одного произвольного элемента   - множества в одно из 
 - подмножеств  —   независимое событие —   испытание Бернулли  с положительным  исходом; вероятности этих испытаний равны 
,  нормированы 
    и неизменны во время проведения повторных зависимых экспериментов.
Один цикл повторных зависимых экспериментов, осуществляемых методом выбора без возвращения —   последовательность      выборок случайных объёмов 
, обработка результатов разделения 
   - множества на 
  - подмножества, 
  в последовательные моменты времени  
  и возврат всех 
      изъятых элементов на прежнее место к началу следующего цикла. 
Совместное проявление вероятностей попадания     выборок случайных объёмов 
    в 
     подмножеств в одном цикле экспериментов —   вероятность мультиномиального  распределения с равновероятными  успехами испытаний Бернулли.
Урновая модель получения мультиномиального распределения с равновероятными успехами испытаний Бернулли
Состав:   одна исходная урна и   приёмных урн. Объем каждой из них не менее  объёма исходной урны. 
Нумерация приёмных урн соответствует нумерации случайных величин мультиномиального распределения.
В начальный момент времени   исходная урна содержит 
  - множество различимых  неупорядоченных  элементов, а  все приёмные урны пусты. 
В первый момент времени  из исходной урны осуществляют первую выборку 
 случайного объёма и направляют её в первую приёмную урну с вероятностью 
   каждого элемента.  
Во второй момент времени  из оставшихся 
     различимых неупорядоченных элементов исходной урны осуществляют вторую выборку 
      случайного объёма и направляют её во вторую приёмную урну с вероятностью 
     каждого элемента. 
И так далее.
Наконец, в    - ый момент времени все  элементы 
, оставшиеся в исходной урне, направляют в 
   - ую приёмную урну с вероятностью 
     каждого.
В результате исходная урна пуста, а все её элементы  размещены в приёмных урнах. После обработки результатов разбиения исходного 
   - множества на 
   - подмножеств все элементы из приёмных урн возвращают в исходную урну. 
На этом один цикл повторных зависимых экспериментов закончен, и урновая модель готова к проведению следующего аналогичного цикла.
Произведение вероятностей попадания элементов  исходного множества в приёмные урны есть вероятность мультиномиального распределения с равновероятными успехами испытаний Бернулли.
Способ получения вероятностей мультиномиального распределения с равновероятными успехами испытаний Бернулли
Этот способ относится к техническим задачам разделения дискретного целого на составные части случайных объёмов.
Целым является множество дискретных элементов, различимых (хотя бы одним признаком, например,  порядковыми номерами) и не упорядоченных  (хаотично расположенных): .
Составные части — дискретные подмножества  , в сумме равные объёму множества.
Разделение множества на подмножества осуществляют выборками без возвращения.
Выборки следуют во времени одна за другой.
В начальный  момент времени ,  не обязательно равный нулю 
,  множество содержит 
 различимых неупорядоченных элементов.
В первый  момент времени  из 
-множества осуществляют первую выборку случайного объёма 
 с вероятностью 
 каждого её элемента. 
Вероятность первой случайной величины  мультиномиального распределения определяется числом сочетаний 
 из 
 по 
, умноженным на вероятность 
 выбора одного элемента, возведённую в степень  числа 
 выбранных элементов:
Во второй момент времени  из оставшихся 
 элементов исходного множества осуществляют вторую выборку  случайного объёма   
 с вероятностью 
 каждого её элемента.  
Вероятность второй случайной величины при условии, что в первый момент времени вероятность первой случайной величины мультиномиального распределения  приняла значение , определяется числом сочетаний 
 из 
 по 
, умноженным на вероятность 
 выбора одного её элемента, возведённую в степень  числа 
 выбранных элементов:
И так далее.
В -ый момент времени из оставшихся 
 элементов исходного множества осуществляют 
-ую выборку случайного объёма 
 с вероятностью 
 каждого её элемента. Вероятность 
-ой случайной величины  при условии, что в 
-ый момент времени вероятность 
-ой случайной величины мультиномиального распределения  приняла значение 
,  определяется числом сочетаний   
 из 
 по 
, умноженным на вероятность 
 выбора одного её элемента, возведённую в степень  числа 
 выбранных  элементов:
Произведение всех вероятностей есть вероятности мультиномиального распределения с равновероятными успехами испытаний Бернулли — совместное распределение вероятностей зависимых (кроме первой) случайных величин
В частном случае, когда число случайных величин  равно двум, имеют место вероятности биномиального распределения с равновероятными успехами испытаний Бернулли
Способ получения математического ожидания мультиномиального распределения с равновероятными успехами испытаний Бернулли
Этот способ   относится к техническим задачам разделения дискретного  целого на составные части и отличается от способа получения вероятностей мультиномиального распределения интерпретации 21-го века тем, что число выборок  равно числу 
 элементов исходного множества 
 и каждая выборка имеет единичный объём: 
.
Целым является множество дискретных элементов, различимых (хотя бы одним признаком, например,  порядковыми номерами) и не упорядоченных  (хаотично расположенных): .
Составные части — дискретные подмножества  , в сумме равные объёму множества.
Разделение множества на подмножества осуществляют выборками без возвращения.
Выборки следуют во времени одна за другой.
В начальный  момент времени ,  не обязательно равный нулю 
,  множество содержит 
 различимых неупорядоченных элементов.
В первый  момент времени  из 
-множества осуществляют первую выборку 
 единичного объёма с вероятностью 
. 
Вероятность первой случайной величины  мультиномиального распределения определяется числом сочетаний 
 из 
 по 
, умноженным на вероятность 
 выбора одного элемента:
Во второй момент времени  из оставшихся 
 элементов исходного множества осуществляют вторую выборку 
 единичного объёма с вероятностью 
.  
Вероятность второй случайной величины  при условии, что в первый момент времени вероятность первая случайная величина мультиномиального распределения  приняла значение 
, определяется числом сочетаний 
 из 
 по 
, умноженным на вероятность 
  выбора одного элемента:
И так далее.
В -ый момент времени из оставшихся 
 элементов исходного множества осуществляют 
-ую выборку 
 единичного  объёма с вероятностью 
. 
Вероятность -ой случайной величины 
 при условии, что в 
-ый момент времени вероятность 
-ой случайной величины мультиномиального распределения приняла значение 
, определяется числом сочетаний 
 из 
 по 
, умноженным на вероятность 
 выбора одного элемента:
Произведение всех вероятностей есть математическое ожидание мультиномиального распределения с равновероятными успехами испытаний Бернулли — совместное распределение вероятностей зависимых (кроме первой) случайных величин
Причём, математическое ожидание мультиномиального распределения с равновероятными успехами испытаний Бернулли полностью совпадает с математическим ожиданием мультиномиального распределения интерпретации 21-го века.
В частном случае, когда число случайных величин  равно двум и множество содержит два элемента 
, имеет место математическое ожидание биномиального распределения с равновероятными успехами испытаний Бернулли , которое полностью совпадает с математическим ожиданием биномиального распределения интерпретации 21-го века.
Два варианта получения математического ожидания мультиномиального распределения с равновероятными успехами испытаний Бернулли:
или как максимум произведения математических ожиданий случайных величин мультиномиального распределения,
или как максимум вероятности мультиномиального распределения.
Необходимые и достаточные условия в обоих вариантах одни и те же.
Необходимые условия
Достаточные условия
Математическое ожидание и максимальная вероятность мультиномиального распределения с равновероятными успехами испытаний Бернулли соответственно
максимальная дисперсия
пространство элементарных событий
расположенное в точках  временной последовательности.
Число случайных величин распределения равно 
 и каждая случайная величина принимает единичное значение: 
, 
.
Характеристики случайных величин при получении математического ожидании мультиномиального распределения с равновероятными успехами испытаний Бернулли:
пространство элементарных событий
вероятность
математическое ожидание
дисперсия
Урновая модель получения математического ожидания мультиномиального распределения с равновероятными успехами испытаний Бернулли
содержит одну исходную урну и  приёмных урн единичных объемов. Нумерация приёмных урн соответствует нумерации случайных величин распределения.
В начальный момент времени  исходная урна содержит 
 - множество различимых неупорядоченных элементов, а все приёмные урны пусты.
В первый момент времени  из исходной урны осуществляют первую выборку единичного объёма 
 и направляют её в первую приёмную урну с вероятностью 
.
Во второй момент времени  из исходной урны, содержащей 
 элементов осуществляют вторую выборку единичного объёма 
 и направляют её во вторую приёмную урну с вероятностью 
.
И так далее.
Наконец, в последний,  - ый момент времени из исходной урны, содержащей один элемент 
, направляют его в 
 - ую приемную урну с вероятностью 
.
В результате исходная урна пуста, а все её  элементов по одному размещены в приёмных урнах.
После обработки результатов разбиения исходного  - множества на 
 - подмножеств все элементы из приёмных урн возвращают в исходную урну.
На этом один цикл повторных зависимых экспериментов закончен, и урновая модель готова к проведению следующего аналогичного цикла.
Произведение вероятностей попадания по одному произвольному элементу исходного  - множества в 
 приёмных урн есть математическое ожидание мультиномиального распределения с равновероятными успехами испытаний Бернулли.
Локальные экстремумы математического ожидания мультиномиального распределения с равновероятными успехами испытаний Бернулли
Мультиномиальное распределение в окрестности своего математического ожидания (таблица 2, строка 2) имеет локальные экстремумы и вероятности, и дисперсии.
| Значения восьми случайных величин | Вероятность | Дисперсия | Экстремумы | |||||||
| 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 0.240×10-2 | 3.937 | Математическое ожидание | 
| 2 | 1 | 1 | 1 | 1 | 1 | 1 | 0 | 0.120×10-2 | 3.172 | |
| 2 | 2 | 1 | 1 | 1 | 1 | 0 | 0 | 0.600×10-3 | 2.625 | |
| 2 | 2 | 2 | 1 | 1 | 0 | 0 | 0 | 0.300×10-3 | 2.297 | |
| 2 | 2 | 2 | 2 | 0 | 0 | 0 | 0 | 0.150×10-3 | 2.187 | 1-й локальный минимум | 
| 3 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0.400×10-3 | 2,516 | 1-й локальный максимум | 
| 3 | 2 | 1 | 1 | 1 | 0 | 0 | 0 | 0.200×10-3 | 2.078 | |
| 3 | 2 | 2 | 1 | 0 | 0 | 0 | 0 | 0.100×10-3 | 1.859 | |
| 3 | 3 | 2 | 1 | 0 | 0 | 0 | 0 | 0.334×10-4 | 1.641 | 2-й локальный минимум | 
| 4 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0.100×10-3 | 1.969 | 2-й локальный максимум | 
| 4 | 2 | 1 | 1 | 0 | 0 | 0 | 0 | 0.500×10-4 | 1.641 | |
| 4 | 2 | 2 | 0 | 0 | 0 | 0 | 0 | 0.250×10-4 | 1.531 | |
| 4 | 2 | 2 | 0 | 0 | 0 | 0 | 0 | 0.250×10-4 | 1.531 | |
| 4 | 3 | 1 | 0 | 0 | 0 | 0 | 0 | 0.167×10-5 | 1.422 | |
| 4 | 4 | 0 | 0 | 0 | 0 | 0 | 0 | 0.417×10-5 | 1.312 | 3-й локальный минимум | 
| 5 | 1 | 1 | 1 | 0 | 0 | 0 | 0 | 0.200×10-4 | 1.531 | 3-й локальный максимум | 
| 5 | 2 | 1 | 0 | 0 | 0 | 0 | 0 | 0.100×10-4 | 1.312 | |
| 5 | 3 | 0 | 0 | 0 | 0 | 0 | 0 | 0.334×10-5 | 1.203 | |
| 6 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0.334×10-5 | 1.203 | |
| 6 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0.167×10-5 | 1.094 | |
| 7 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0.477×10-6 | 0.984 | |
| 8 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0.596×10-7 | 0.875 | |
Локальные максимумы и минимумы
Локальные максимумы и минимумы мультиномиального распределения с равновероятными успехами испытаний Бернулли полностью совпадают с локальными максимумами и минимумами мультиномиального распределения интерпретации 21-го века.
Локальные максимумы (жирный шрифт) соответствуют таким числовым значениям случайных величин, когда одна из них имеет значение, отличное от единичного, а остальные принимают единичные значения. При этом, чем меньшее значение, отличное от единичного, принимает одна случайная величина и чем больше единичных значений принимают остальные случайные величины распределения, тем ближе локальный максимум к математическому ожиданию мультиномиального распределения. В пределе, когда все случайные величины принимают единичные значения (при условии k=n), имеет место математическое ожидание мультиномиального распределения с равновероятными успехами испытаний Бернулли.
При математическом ожидании мультиномиального распределения максимальна и дисперсия мультиномиального распределения, а максимальная вероятность мультиномиального распределения численно равна математическому ожиданию мультиномиального распределения.
Локальные минимумы (наклонный шрифт), как правило, расположены между локальными максимумами и уменьшаются по мере удаления от математического ожидания мультиномиального распределения. Исключение составляют комбинации, предшествующие локальному максимуму и имеющие равные знаменатели мультиномиального (полиномиального) коэффициента (строки 4 и 5 снизу: 5!3!=6!1!1! и 0!=1!=1).
Определение локальных экстремумов основано на вычислении вероятностей мультиномиального распределения. При этом все комбинации значений случайных величин равно возможны и вероятность каждой из них равна  . В частности, в таблице 1 
 , 
 . 
Вероятность мультиномиального распределения, у которого, например, (таблица 1, 3-я строка сверху: 22111100) две случайные величины имеют числовые значения 2, четыре случайные величины имеют числовые значения 1 и две случайные величины имеют числовые значения 0 и которые могут быть расположены в произвольном порядке, определяется по формуле
Аналогично рассчитываются вероятности мультиномиального распределения для всех других комбинаций случайных величин.
Мультиномиальное распределение как процесс выполнения взаимосвязанных действий над объектами
Объекты: множество, его подмножества и их элементы как объективная реальность, существующая вне нас и независимо от нас. Мультиномиальное распределение это:
-    случайный процесс  безвозвратного разделения во времени 
и в пространстве конечного
- множества различимых неупорядоченных элементов (
),
 
- разделение множества осуществляют выборками без возвращения (изъятые из множества элементы не возвращают обратно во множество до полного окончания экспериментов),
 
- сумма объёмов всех выборок равна объёму исходного множества 
, при этом только одна из выборок может иметь случайный объём в пределах всего объёма исходного множества
,
 
- попадания одного произвольного элемента множества в одно из подмножеств принимают за успешно завершившееся событие соответствующего  Бернулли распределения 
,
 
-  вероятности 
успешно завершившихся событий всех Бернулли распределения принимают за неизменные в процессе разбиения множества и нормируют их
согласно аксиоматике Колмогорова,
 -  очерёдность следования выборок принимают за нумерацию случайных величин 
полиномиального распределения,
 
- случайный объём каждой выборки 
в момент времени
принимают за числовое значение соответствующей случайной величины
полиномиального распределения при условии, что в предшествующий момент времени
предшествующая случайная величина
приняла числовое значение
,
 
- результаты каждого разбиения обрабатывают вероятностными методами, определяют технические характеристики всех выборок и принимают их за технические характеристики случайных величин мультиномиального распределения,
 
- минимально необходимый набор технических характеристик случайных величин и мультиномиального распределения в целом это: пространство элементарных событий, вероятность, математическое ожидание и дисперсия,
 
-  математическое ожидание мультиномиального распределения имеет место, когда число выборок 
равно числу элементов
-множества
и численно равно
откуда
- математическое ожидание биномиального распределения.
 
Мультиномиальное распределение и цепи Маркова: совпадения и отличия, частный случай
Мультиномиальное распределение появляется в последовательности зависимых случайных испытаний с конечным или счётным числом исходов. По сути — это  цепь Маркова, где -ая случайная величина зависима от предшествующей 
-ой случайной величины
следующим образом: -ая случайная величина в 
-ый момент времени принимает числовое значение, равное 
, при условии, что в 
-ый момент времени 
-ая случайная величина приняла числовое значение, равное 
. Случайные величины следуют одна за другой в порядке возрастания своих номеров.
, называемое начальным распределением цепи Маркова, для мультиномиального распределения не имеет смысла 
, поскольку нумерация случайных величин начинается с единицы: 
.
Переходная вероятность мультиномиального распределения
является дискретной функцией времени. Следовательно, и мультиномиальное распределение с равновероятными успехами испытаний Бернулли
как произведение его случайных величин, является дискретной функцией времени, иными словами, мультиномиальное распределение является марковским процессом с дискретным временем.
Сумма всех вероятностей мультиномиального распределения равна единице. Следовательно, мультиномиальное распределение как цепь Маркова, является стахостической.
Однако в отличие от марковских цепей и марковских процессов мультиномиальное распределение не обладает свойством отсутствия последействия, согласно которому для любого испытания допускается зависимость его от непосредственно предшествующего ему испытания (и только от него).
Причина заключается в том, что в мультиномиальном распределении имеется ещё одна зависимость — каждая случайная величина (кроме первой) зависима от всех ей предшествующих случайных величин.
Зависимость проявляется в том, что предшествующая случайная величина (
) мультиномиального распределения в соответствующий момент времени (
) сокращает на своё числовое значение (
) верхнюю границу пространства элементарных событий следующей за ней случайной величины (
):
Как следствие, все предшествующие случайные величины (если их числовые значения отличны от нуля) поочерёдно в соответствующие моменты времени сокращают на свои числовые значения верхнюю границу пространства элементарных событий последней случайной величины.
В частном случае, когда
, имеет место биномиальное распределение с равновероятными успехами испытаний Бернулли.
С точки зрения цепей Маркова — биномиальное распределение — это простейший марковский процесс с дискретным временем, в котором:
вторая случайная величина зависима от первой (и только от неё)
всего лишь одна переходная вероятность
процесс стахостический, поскольку сумма вероятностей равна единице
;
как и в мультиномиальном распределение, начальное состояние цепи Маркова
, для биномиального распределения не имеет смысла
, поскольку нумерация случайных величин начинается с единицы:
.
Связь с другими распределениями
Если
хотя бы для одной пары вероятностей, то имеет место мультиномиальное распределение интерпретации 21-го века.
Если
и все случайные величины распределения считались независмыми, то в 20-ом веке имели место следующие названия: распределение Максвелла - Больцмана [1], статистика Максвелла - Больцмана [1], распределение Больцмана [1], статистика Больцмана [1].
Если
, то имеет место биномиальное распределение интерпретации 21-го века, иными словами http://ru.science.wikia.com/wiki/Биномиальное распределение:новая интерпретация.
Если
, то имеет место биномиальное распределение с равновероятными успехами испытаний Бернулли.
Литература
См.также

