Нормальное распределение
Материал из MachineLearning.
 (Новая: {{Вероятностное распределение|   name       =Нормальное распределение|   type       =Плотность|   pdf_image  =[[Файл:Normal ...)  | 
				|||
| Строка 42: | Строка 42: | ||
* {{не переведено|есть=:en:Shapiro-Wilk test|надо=Критерий Шапиро-Вилка}}  | * {{не переведено|есть=:en:Shapiro-Wilk test|надо=Критерий Шапиро-Вилка}}  | ||
* {{не переведено|есть=:en:Rankit|надо=График нормальности}} — не столько критерий, сколько графическая иллюстрация: точки специально построенного графика должны лежать почти на одной прямой.  | * {{не переведено|есть=:en:Rankit|надо=График нормальности}} — не столько критерий, сколько графическая иллюстрация: точки специально построенного графика должны лежать почти на одной прямой.  | ||
| + | |||
| + | == Многомерное нормальное распределение ==  | ||
| + | |||
| + | '''Многоме́рное норма́льное распределе́ние''' (или '''многоме́рное га́уссовское распределе́ние''') в [[Теория вероятностей|теории вероятностей]] — это обобщение [[Нормальное распределение|одномерного нормального распределения]].  | ||
| + | |||
| + | [[Случайный вектор]] <tex>\mathbf{X} = (X_1,\ldots, X_n)^{\top}: \Omega \to \mathbb{R}^n</tex> имеет многомерное нормальное распределение, если выполняется одно из следующих эквивалентных условий:  | ||
| + | |||
| + | * Произвольная [[линейная комбинация]] компонентов вектора <tex>\sum\limits_{i=1}^n a_i X_i</tex> имеет нормальное распределение или является константой.  | ||
| + | * Существует вектор независимых [[Нормальное распределение|стандартных нормальных случайных]] величин <tex>\mathbf{Z}=(Z_1,\ldots, Z_m)^{\top}</tex>, вещественный вектор <tex>\mathbf{\mu} = (\mu_1,\ldots, \mu_m)^{\top}</tex> и [[Матрица (математика)|матрица]] <tex>\mathbf{A}</tex> размерности <tex>n \times m</tex>, такие что:  | ||
| + | : <tex>\mathbf{X} = \mathbf{A} \mathbf{Z} + \mathbf{\mu}</tex>.  | ||
| + | * Существует вектор <tex>\mathbf{\mu} \in \mathbb{R}^n</tex> и [[Положительно определённая матрица|неотрицательно определённая]] симметричная матрица <tex>\mathbf{\Sigma}</tex> размерности <tex>n \times n</tex>, такие что [[плотность вероятности]] вектора <tex>\mathbf{X}</tex> имеет вид:  | ||
| + | : <tex>f_{\mathbf{X}}(\mathbf{x}) = \frac{1}{(2\pi )^{n/2} | \Sigma |^{1/2}} e^{-\frac{1}{2}(\mathbf{x} - \mathbf{\mu})^{\top} \Sigma^{-1} (\mathbf{x} - \mathbf{\mu})},\; \mathbf{x} \in \mathbb{R}^n</tex>,  | ||
| + | где <tex>| \Sigma | </tex> — определитель матрицы <tex>\Sigma</tex>, а <tex>\Sigma^{-1}</tex> — матрица [[Обратная матрица|обратная]] к <tex>\Sigma</tex>.  | ||
| + | * Существует вектор <tex>\mathbf{\mu} \in \mathbb{R}^n</tex> и неотрицательно определённая симметричная матрица <tex>\mathbf{\Sigma}</tex> размерности <tex>n \times n</tex>, такие что [[Характеристическая функция случайной величины|характеристическая функция]] вектора <tex>\mathbf{X}</tex> имеет вид:  | ||
| + | : <tex>\phi_{\mathbf{X}}(\mathbf{u}) = e^{i \mathbf{\mu}^{\top} \mathbf{u} - \frac{1}{2}\mathbf{u}^{\top} \Sigma \mathbf{u}},\; \mathbf{u} \in \mathbb{R}^n</tex>.  | ||
| + | |||
| + | == Замечания ==  | ||
| + | |||
| + | * Если одно из приведённых выше определений принято в качестве основного, то другие выводятся в качестве [[Теорема|теорем]].  | ||
| + | * Вектор <tex>\mathbf{\mu}</tex> является вектором [[Математическое ожидание|средних значений]] <tex>\mathbf{X}</tex>, а <tex>\Sigma</tex> — его [[ковариационная матрица]].  | ||
| + | * В случае <tex>n = 1</tex>, многомерное нормальное распределение сводится к обычному нормальному распределению.  | ||
| + | * Если случайный вектор <tex>\mathbf{X}</tex> имеет многомерное нормальное распределение, то пишут <tex>\mathbf{X} \sim \mathrm{N}(\mathbf{\mu},\Sigma)</tex>.  | ||
| + | |||
| + | == Свойства многомерного нормального распределения ==  | ||
| + | |||
| + | * Если вектор <tex>\mathbf{X} = (X_1,\ldots, X_n)^{\top}</tex> имеет многомерное нормальное распределение, то его компоненты <tex>X_i, i=1,\ldots, n,</tex> имеют одномерное нормальное распределение. Обратное, вообще говоря, неверно!  | ||
| + | * Если случайные величины <tex>X_1,\ldots,X_n</tex> имеют одномерное нормальное распределение и совместно [[Независимость (теория вероятностей)|независимы]], то случайный вектор <tex>\mathbf{X} = (X_1,\ldots, X_n)^{\top}</tex> имеет многомерное нормальное распределение. Матрица ковариаций <tex>\Sigma</tex> такого вектора диагональна.  | ||
| + | * Если <tex>\mathbf{X} = (X_1,\ldots, X_n)^{\top}</tex> имеет многомерное нормальное распределение, и его компоненты попарно [[Корреляция|некоррелированы]], то они независимы. Однако, если только компоненты <tex>X_i,\; i = 1 , \ldots, n</tex> имеют одномерное нормальное распределение и попарно не коррелируют, то отсюда ''не'' следует, что они независимы.  | ||
| + | |||
| + | : '''Контрпример.''' Пусть <tex>X \sim \mathrm{N}(0,1)</tex>, а <tex>\alpha = \pm 1</tex> с равными вероятностями. Тогда если <tex>Y = \alpha X \sim \mathrm{N}(0,1)</tex>, то корреляция <tex>X</tex> и <tex>Y</tex> равна нулю. Однако, эти случайные величины зависимы.  | ||
| + | * Многомерное нормальное распределение [[Устойчивое распределение|устойчиво]] относительно [[Линейный оператор|линейных преобразований]]. Если <tex>\mathbf{X} \sim \mathrm{N}(\mathbf{\mu},\Sigma)</tex>, а <tex>\mathbf{A}</tex> — произвольная матрица размерности <tex>m \times n</tex>, то  | ||
| + | : <tex>\mathbf{A}\mathbf{X} \sim \mathrm{N}\left(\mathbf{A}\mathbf{\mu},\mathbf{A}\Sigma \mathbf{A}^{\top}\right)</tex>.  | ||
== Заключение ==  | == Заключение ==  | ||
Версия 14:37, 19 ноября 2009
|  Плотность вероятности 325px|Плотность нормального распределения Зеленая линия соответствует стандартному нормальному распределению  | |
|  Функция распределения 325px|Функция распределения нормального распределения Цвета на этом графике соответствуют графику наверху  | |
| Параметры |   | 
| Носитель |   | 
| Плотность вероятности |   | 
| Функция распределения |   | 
| Математическое ожидание |   | 
| Медиана |   | 
| Мода |   | 
| Дисперсия |   | 
| Коэффициент асимметрии |   | 
| Коэффициент эксцесса |   | 
| Информационная энтропия |   | 
| Производящая функция моментов |   | 
| Характеристическая функция |   | 
Нормальное распределение, также называемое распределением Гаусса, — распределение вероятностей, которое играет важнейшую роль во многих областях знаний, особенно в физике. Физическая величина подчиняется нормальному распределению, когда она подвержена влиянию огромного числа случайных помех. Ясно, что такая ситуация крайне распространена, поэтому можно сказать, что из всех распределений в природе чаще всего встречается именно нормальное распределение — отсюда и произошло одно из его названий.
Нормальное распределение зависит от двух параметров — смещения и масштаба, то есть является с математической точки зрения не одним распределением, а целым их семейством. Значения параметров соответствуют значениям среднего (математического ожидания) и разброса (стандартного отклонения).
Стандартным нормальным распределением называется нормальное распределение с математическим ожиданием 0 и стандартным отклонением 1.
Содержание | 
Моделирование нормальных случайных величин
Простейшие, но неточные методы моделирования основываются на центральной предельной теореме. Именно, если сложить много независимых одинаково распределённых величин с конечной дисперсией, то сумма будет распределена примерно нормально. Например, если сложить 12 независимых базовых случайных величин, получится грубое приближение стандартного нормального распределения. Тем не менее, с увеличением слагаемых распределение суммы стремится к нормальному.
Использование точных методов предпочтительно, поскольку у них практически нет недостатков. В частности, преобразование Бокса — Мюллера является точным, быстрым и простым для реализации методом генерации.
Свойства
Если случайные величины  и 
 независимы и имеют нормальное распределение с математическими ожиданиями 
 и 
 и дисперсиями 
 и 
 соответственно, то 
 также имеет нормальное распределение с математическим ожиданием 
 и дисперсией 
.
Статистическая проверка принадлежности нормальному распределению
Поскольку нормальное распределение часто встречается на практике, то для него разработаны специальные статистические критерии проверки на «нормальность»:
- Критерий Пирсона
 - Критерий Колмогорова-Смирнова
 - Шаблон:Не переведено
 - Шаблон:Не переведено
 - Шаблон:Не переведено
 - Шаблон:Не переведено — не столько критерий, сколько графическая иллюстрация: точки специально построенного графика должны лежать почти на одной прямой.
 
Многомерное нормальное распределение
Многоме́рное норма́льное распределе́ние (или многоме́рное га́уссовское распределе́ние) в теории вероятностей — это обобщение одномерного нормального распределения.
Случайный вектор  имеет многомерное нормальное распределение, если выполняется одно из следующих эквивалентных условий:
-  Произвольная линейная комбинация компонентов вектора 
имеет нормальное распределение или является константой.
 -  Существует вектор независимых стандартных нормальных случайных величин 
, вещественный вектор
и матрица
размерности
, такие что:
 
-  
.
 
-  Существует вектор 
и неотрицательно определённая симметричная матрица
размерности
, такие что плотность вероятности вектора
имеет вид:
 
-  
,
 
где  — определитель матрицы 
, а 
 — матрица обратная к 
.
-  Существует вектор 
и неотрицательно определённая симметричная матрица
размерности
, такие что характеристическая функция вектора
имеет вид:
 
-  
.
 
Замечания
- Если одно из приведённых выше определений принято в качестве основного, то другие выводятся в качестве теорем.
 -  Вектор 
является вектором средних значений
, а
— его ковариационная матрица.
 -  В случае 
, многомерное нормальное распределение сводится к обычному нормальному распределению.
 -  Если случайный вектор 
имеет многомерное нормальное распределение, то пишут
.
 
Свойства многомерного нормального распределения
-  Если вектор 
имеет многомерное нормальное распределение, то его компоненты
имеют одномерное нормальное распределение. Обратное, вообще говоря, неверно!
 -  Если случайные величины 
имеют одномерное нормальное распределение и совместно независимы, то случайный вектор
имеет многомерное нормальное распределение. Матрица ковариаций
такого вектора диагональна.
 -  Если 
имеет многомерное нормальное распределение, и его компоненты попарно некоррелированы, то они независимы. Однако, если только компоненты
имеют одномерное нормальное распределение и попарно не коррелируют, то отсюда не следует, что они независимы.
 
-  Контрпример. Пусть 
, а
с равными вероятностями. Тогда если
, то корреляция
и
равна нулю. Однако, эти случайные величины зависимы.
 
-  Многомерное нормальное распределение устойчиво относительно линейных преобразований. Если 
, а
— произвольная матрица размерности
, то
 
-  
.
 
Заключение
Нормальное распределение наиболее часто встречается в природе, нормально распределёнными являются следующие случайные величины:
- отклонение при стрельбе
 - ошибки при измерениях
 - рост человека
 
Такое широкое распространение закона связано с тем, что он является предельным законом, к которому приближаются многие другие (например, биномиальный). Доказано, что сумма очень большого числа случайных величин, влияние каждой из которых близко к 0, имеет распределение, близкое к нормальному. Этот факт является содержанием предельной теоремы Ляпунова.

