Часто используемые регрессионные модели
Материал из MachineLearning.
Ниже приведены модели, которые используются при регрессионном анализе измеряемых данных.
Параметры моделей обозначены латинскими и греческими буквами: , 
 — свободная и зависимая переменные.
Все параметры и переменные принадлежат действительным числам. При соединении параметров в вектор 
, для представления модели в виде
 параметры присоединяются в лексикографическом порядке, то есть в том порядке, в котором они появляются, если представить формулу регрессионной модели в виде строки.
В список не вошли универсальные параметрические модели, например, нейронная сеть — многослойный перcептрон, функции радиального базиса, полиномы Лагранжа, полиномы Чебышёва. Также не вошли непараметрические модели. Оба эти класса требуют специального описания.
Содержание | 
Нелинейные модели
Нелинейные регрессионные модели — модели вида
которые не могут быть представлены в виде скалярного произведения
Здесь  — параметры регрессионной модели,
 свободная переменная из пространства 
, 
 — зависимая переменная,
 — случайная величина и 
 — функция из некоторого
заданного множества.
-  Экспонента, 
, с линейным коэффициентом,
. Распространена двухкомпонентная экспоненциальная модель,
. Модель может быть использована, в частности, если коэффициент изменения величины свободной переменной пропорционален ее начальной величине.
 -  Ряд Фурье, 
. Используется для описания периодических сигналов.
 -  Сумма гауссианов, 
. Используется для аппроксимации пиков. Коэффициент
является амплитудой,
— смещение, коэффициент
отражает ширину пика. Всего в сумме может быть до
пиков.
 -  Моном, 
, с линейным коэффициентом,
. Используется при моделировании размерности физических или химических величин. Например, количество некоторого реагирующего в химической реакции вещества как правило, пропорциональна концентрации этого вещества, возведенного в некоторую степень.
 -  Рациональный полином, 
. Принято считать коэффициент перед
единицей. Например, если
, такое соглашение позволит получить уникальные числитель и знаменатель.
 -  Сумма синусов, 
. Здесь
— амплитуда,
— частота,
— фаза некоторого периодического процесса.
 -  Распределение Вейбулла, двухпараметрическое, 
. Параметр
является масштабирующим, а параметр
определяет форму кривой. Трехпараметрическое распределение Вейбулла, со смещением
,
.
 -  Логарифмическая сигмоида, 
, используются в нейронных сетях, например в MLP, в качестве функций активации.
 -  Тангенциальная сигмоида, 
, также используются в качестве функций активации.
 
Линейные модели
-  Полином, 
и его частный случай прямая
. Следует помнить, что полиномы высоких степеней крайне неустойчивы и могут неадекватно описывать измеряемые данные.
 -  Гипербола, 
, а также прочие нелинейные функции с линейно-входящими параметрами: тригонометрические функции
, гиперболический синус
, корневые
и обратно-корневые функции. Эти функции используются в финансовом анализе и других приложениях.
 
Этот список не является жестко заданным. Выбираемая регрессионная модель зависит прежде всего от экспертных предположений относительно моделируемого явления.
Смотри также
Литература
- Дрейпер Н., Смит Г. Прикладной регрессионный анализ. М.: Издательский дом «Вильямс». 2007.
 - Гордин В. А. Как это посчитать? Обработка метеорологической информации на компьютере. Идеи, методы, задачи. МЦНМО, 2006.
 

