Алгоритм INCAS

Материал из MachineLearning.

(Различия между версиями)

Перейти к: навигация, поиск

Версия 19:51, 4 января 2010

Данная статья является непроверенным учебным заданием.

Студент: Участник:Михаил

Преподаватель: Участник:Константин Воронцов

Срок: 7 января 2010

До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}.

См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе.

Алгоритм INCAS (INCremental Active Set method) - алгоритм настройки SVM.

Рассматривается задача классификации на два непересекающихся класса, $Y = \{-1, 1\}$ , а $X = R^n$ . Алгоритм INCAS позволяет уменьшить число вычислений при построении SVM.

Содержание

1 Двойственная задача
2 Преобразованная двойственная задача
3 Алгоритм INCAS
- 3.1 Вход
- 3.2 Выход
4 Начальное приближение
5 Эффективность
6 Преимущества и недостатки
- 6.1 Преимущества
- 6.2 Недостатки
7 Литература
8 Ссылки

Двойственная задача

При построении SVM приходится решать двойственную задачу:

Здесь $\lambda = $\lambda_1,...,\lambda_l$$ - вектор двойственных переменных, $C$ - параметр алгоритма.
Если решение задачи известно, то возможно найти параметры линейного классификатора $\omega$ и $\omega_0$ .
Задача $1$ является задачей квадратичного программирования. Методы решения подобных задач известны, но они трудоемки. Поэтому для обучения SVM применяют алгоритмы, которые учитывают его специфические особенности. Один из них - последовательный метод активных ограничений, INCAS.

Преобразованная двойственная задача

Двойственную задачу преобразовывают следующим образом. Вводятся матрица $Q = $y_i y_j K\(x_i,x_j$\)_{i=1,l}^{j=1,l}$ и вектор-столбцы: вектор ответов $y = $y_i$_{i=1,l}$ , вектор двойственных переменных $\lambda = $\lambda_i$_{i=1,l}$ и вектор из единиц $e = $1$_{i=1,l}$ .
Тогда систему $1$ можно переписать в виде:

Предполагают, что известно разбиение множества объектов на непересекающиеся подмножества $\{1,...,l\} = I_O \cup I_C \cup I_S\$ :

$I_O = \{i:\ \lambda_i = 0\}$ - периферийные объекты, у которых отступ $M_i \g 1$ ;
$I_S = \{i:\ 0 \leq \lambda_i \leq C\}$ - опорные объекты, у которых отступ $M_i = 1$ ;
$I_C = \{i:\ \lambda_i = C\}$ - объекты-нарушители, у которых отступ $M_i < 1$ .

На подмножествах $I_O$ и $I_C$ значения $\lambda_i$ равны $0$ и $C$ , соответственно. Матрицу $Q$ и векторы $y, e, \lambda$ записывают в блочном виде:
$Q = \left(\begin{matrix}Q_{SS} & Q_{SO} & Q_{SC}\\Q_{OS} & Q_{OO} & Q_{OC}\\Q_{CS} & Q_{CO} & Q_{CC}\end{matrix}\right);\ y = \left(\begin{matrix}y_S\\y_O\\y_C\end{matrix}\right);\ e = \left(\begin{matrix}e_S\\e_O\\e_C\end{matrix}\right);\ \lambda = \left(\begin{matrix}\lambda_S\\0\\Ce_C\end{matrix}\right).$
А система $2$ принимает вид:

Это задача минимизации квадратичного функционала с линейным ограничением типа равенства. Ее решение сводится к обращению симметричной положительно определенной матрицы $Q_{SS}$ . Решение ее даст вектор $\lambda$ , которые позволит найти параметры алгоритма $\omega$ и $\omega_0$ . После этого проверяют правильность разбиения $I_O \cup I_C \cup I_S\$ .