Пробит-анализ
Материал из MachineLearning.
м  (орфография)  | 
			|||
| (3 промежуточные версии не показаны) | |||
| Строка 1: | Строка 1: | ||
| - | '''Пробит анализ''' (probit analysis, normit analysis) — вид [[регрессионный анализ|регрессионного анализа]], используется для определения влияния [[Теория измерений|  | + | '''Пробит анализ''' (probit analysis, normit analysis) — вид [[регрессионный анализ|регрессионного анализа]], используется для определения влияния [[Теория измерений|количественного]] признака на бинарный [[регрессионный анализ|отклик]]. Относится к классу [[обобщённая линейная модель|обобщённых линейных моделей]].  | 
Другие названия:   | Другие названия:   | ||
| Строка 9: | Строка 9: | ||
'''Пример 1.Токсикология.'''  | '''Пример 1.Токсикология.'''  | ||
| - | Paccмотрим выборку <tex>(x_i,y_i)_{i=1}^n</tex>, где <tex>x_i</tex>   | + | Paccмотрим выборку <tex>(x_i,y_i)_{i=1}^n</tex>, где <tex>x_i</tex> – доза токсичного вещества, <tex>y_i</tex> равна 1, если живые существа умерли от дозы <tex>x_i</tex>. Необходимо определить вероятность смерти.  | 
'''Пример 2.Страхование жизни.'''  | '''Пример 2.Страхование жизни.'''  | ||
| Строка 22: | Строка 22: | ||
== Описание критерия ==  | == Описание критерия ==  | ||
| - | Рассмотрим выборку <tex>(x_i,y_i)_{i=1}^n</tex>, где <tex>x_i</tex> -   | + | Рассмотрим выборку <tex>(x_i,y_i)_{i=1}^n</tex>, где <tex>x_i</tex> - количественный признак <tex>x_i \in \mathbb {R}</tex>, <tex>y_i</tex> бинарный отклик <tex>y_i \in \{0,1\}</tex>. Найдём вероятность <tex>\mathbb{P}\{ y(x)=1 \} </tex>.  | 
Для решения задачи аппроксимируем [[функция распределения|функцию распределения вероятностей]] <tex>F(x)</tex> [[нормальное распределение|нормальным распределением]].  | Для решения задачи аппроксимируем [[функция распределения|функцию распределения вероятностей]] <tex>F(x)</tex> [[нормальное распределение|нормальным распределением]].  | ||
| - | '''Пробит''' <tex>p</tex> для <tex>x</tex> - это решение уравнения <tex> N(p , 5, 1) = F(x)</tex>, где <tex>N()</tex> - функция нормального распределения.  | + | '''Пробит''' <tex>p</tex> для <tex>x</tex> - это решение уравнения <tex> N(p, 5, 1) = F(x)</tex>, где <tex>N()</tex> - функция нормального распределения.  | 
Рассмотрим множество пар <tex>(x_i,p_i)_{i=1}^n</tex>, где <tex>p_i = p(x_i)</tex>. Если модель <tex>N</tex> "угадана" хорошо, то зависимость <tex>p(x)</tex> - линейная, т.е.  | Рассмотрим множество пар <tex>(x_i,p_i)_{i=1}^n</tex>, где <tex>p_i = p(x_i)</tex>. Если модель <tex>N</tex> "угадана" хорошо, то зависимость <tex>p(x)</tex> - линейная, т.е.  | ||
::<tex>p(x) = b_0 + b_1 x</tex>. {{eqno|1}}  | ::<tex>p(x) = b_0 + b_1 x</tex>. {{eqno|1}}  | ||
| - | А это стандартная задача [[линейная регрессия|линейной регрессии]].  | + | А это стандартная задача [[многомерная линейная регрессия|линейной регрессии]].  | 
Если <tex>b_0,b_1</tex> найдены, то   | Если <tex>b_0,b_1</tex> найдены, то   | ||
| Строка 41: | Строка 41: | ||
Используя определение пробита и формулы для <tex>p(x),\mu,\sigma</tex> можно вычислить функцию распределения <tex>F(x)</tex>.  | Используя определение пробита и формулы для <tex>p(x),\mu,\sigma</tex> можно вычислить функцию распределения <tex>F(x)</tex>.  | ||
| + | |||
== История ==  | == История ==  | ||
Идея пробит-анализа впервые была опубликована Блиссом в 1934 г. в статье о влиянии пестицидов на процент убитых вредителей. Блисс предложил для учёта процента убитых вредителей использовать вероятностный блок - probability unit (или probit). Данное им определение немного отличалось использованного здесь(не было сдвига на 5). Окончательно определение пробит дал Джон Финни.  | Идея пробит-анализа впервые была опубликована Блиссом в 1934 г. в статье о влиянии пестицидов на процент убитых вредителей. Блисс предложил для учёта процента убитых вредителей использовать вероятностный блок - probability unit (или probit). Данное им определение немного отличалось использованного здесь(не было сдвига на 5). Окончательно определение пробит дал Джон Финни.  | ||
| Строка 48: | Строка 49: | ||
* [http://en.wikipedia.org/wiki/Probit_model Probit model] (Wikipedia).  | * [http://en.wikipedia.org/wiki/Probit_model Probit model] (Wikipedia).  | ||
[[Категория:Регрессионный анализ]]  | [[Категория:Регрессионный анализ]]  | ||
| + | [[Категория: Энциклопедия анализа данных]]  | ||
Текущая версия
Пробит анализ (probit analysis, normit analysis) — вид регрессионного анализа, используется для определения влияния количественного признака на бинарный отклик. Относится к классу обобщённых линейных моделей.
Другие названия: Пробит регрессия(probit regression), пробит модель(probit model).
Содержание | 
Примеры задач
Пример 1.Токсикология.
Paccмотрим выборку , где 
 – доза токсичного вещества, 
 равна 1, если живые существа умерли от дозы 
. Необходимо определить вероятность смерти.
Пример 2.Страхование жизни.
Paccмотрим выборку , где 
 - возраст человека, 
 равна 1, если человек в возрасте 
 умер. Необходимо определить вероятность смерти.
Пример 3.Эконометрика.
Paccмотрим выборку , где 
 - цена продукции, 
 равна 1, если продукцию по цене 
 купили. Необходимо определить вероятность покупки при данной цене.
Описание критерия
Рассмотрим выборку , где 
 - количественный признак 
, 
 бинарный отклик 
. Найдём вероятность 
.
Для решения задачи аппроксимируем функцию распределения вероятностей  нормальным распределением.
Пробит  для 
 - это решение уравнения 
, где 
 - функция нормального распределения.
Рассмотрим множество пар , где 
. Если модель 
 "угадана" хорошо, то зависимость 
 - линейная, т.е.
.
(1)
А это стандартная задача линейной регрессии.
Если  найдены, то 
,
(2)
где  - математическое ожидание, 
 - дисперсия.
Из (1),(2) находим формулы для  и 
: 
,
.
Используя определение пробита и формулы для  можно вычислить функцию распределения 
.
История
Идея пробит-анализа впервые была опубликована Блиссом в 1934 г. в статье о влиянии пестицидов на процент убитых вредителей. Блисс предложил для учёта процента убитых вредителей использовать вероятностный блок - probability unit (или probit). Данное им определение немного отличалось использованного здесь(не было сдвига на 5). Окончательно определение пробит дал Джон Финни.
См. также
Ссылки
- Probit model (Wikipedia).
 

