Метод Парзеновского окна (пример)

Материал из MachineLearning.

(Различия между версиями)

Версия 11:33, 24 мая 2009

Метод Парзеновского окна принадлежит к непараметрическим методам классификации и представляет собой одну из возможных реализаций байесовского подхода к решению задачи классификации.

Содержание

1 Постановка задачи разделения классов методом парзеновского окна
2 Алгоритм отыскания оптимальных параметров
3 Вычислительный эксперимент
4 Исходный код
5 Смотри также
6 Литература
7 Замечания

Постановка задачи разделения классов методом парзеновского окна

Пусть у нас задана выборка $\{(\mathbf{x}_i,y_i)\}_{i=1}^m$ , где $X^m$ = $\{\mathbf{x}_i\}_{i=1}^m$ - множество объектов, а $Y^m$ = $\{\mathbf{y}_i\}_{i=1}^m$ - множество ответов на этих объектах. Кроме того, задан объект $x_0$ , который небоходимо классифицировать с помощью алгоритма $a(x;X^{l},h)$ . Задача состоит в том, что бы подобрать параметр $h$ , ширину окна, и $K$ ядерную функцию, таким образом, что бы при классификации с помощью метода парзеновского окна функционал качества достигал бы своего максимума при работе алгоритма с заданными параметрами:

$a(x;X^{l},h)=\arg \max_{y\in Y} \lambda_{y} \sum_{i=1}^l {[}y_i = y{]} K\left(\frac{\ro{}(x,x_i)}{h}\right).$

В этой формуле $\lambda_{y}$ - цена правильного ответа для каждого класса из $Y$

Алгоритм отыскания оптимальных параметров

Чтобы найти ширину окна и наиболее подходящий нам тип ядра, мы воспользуемся принципом максимального правдоподобия и исключением объектов по одному leave-one-out:

$h^{*}=\arg{ } \max_{h} \sum_{i=1}^l \log \hat{p}_h (x_i;X^{m}{/}x_i).$

То есть, мы будем восстанавливать значение класса для одного объекта из нашей выборки и максимизировать логарифм количества правильных ответов при исключении по очереди всех объектов выборки. Максимизация этого значения происходит по двум параметрам - ширине окна $h$ и типу ядерной функции. Ширину окна мы можем подобрать из некоторого диапазона $\delta{}H$ , полученного из эмпирических предположений. Ядро выбирается из нижеприведенного набора ядер:

#	ядро $K(r)$	формула
1	Епанечникова	$K_1(r)=E(r)=\frac{3}{4}(1-r^2){[}{\|}r{\|}<=1{]}$
2	Квартическое	$K_2(r)=Q(r)=\frac{15}{16}(1-r^2)^2{[}{\|}r{\|}<=1{]}$
3	Треугольное	$K_3(r)=T(r)=(1-{\|}r{\|}){[}{\|}r{\|}<=1{]}$
4	Гауссовское	$K_4(r)=G(r)=(2\pi)^{(-\frac{1}{2})}exp(-\frac{1}{2}r^2)$
5	Прямоугольное	$K_5(r)=\Pi(r)=\frac{1}{2}{[}{\|}r{\|}<=1{]}$

Получившееся выражение имеет достаточно понятный вид:

$(h^{*},K^{*}_s(r))=\arg{ } \max_{\small s\in\{1,2,3,4,5\}} \max_{h\in\delta{}H} \sum_{i=1}^l \log \hat{p}_h (x_i;X^{m}{/}x_i).$

Вычислительный эксперимент

Вычислительный эксперимент был проведен на реальных и модельных данных. В качестве модельных данных были взяты точки из двух нормальных распределений с разными математическими ожиданиями и дисперсиями (соответственно, были получены два класса объектов). После проведения рядка экспериментов были получены следующие результаты:

Код получения данных:

%NORMGENERATION generation of normal data in 2 classes with different
%parameteres to be described in V: V(1,1) V(1,2) parameters of normal
%distribution for first class; V(2,1) V(2,2) parameters of normal
%distribution for first class; V(1,3) - number of properties; V(1,4),
%V(2,4) - number of objects in first and second class
X1=random('normal',V(1,1),V(1,2),V(1,3),V(1,4));
X2=random('normal',V(2,1),V(2,2),V(1,3),V(2,4));
X=[X1 , X2];
Y=[ones(1,V(1,4)) , zeros(1,V(2,4))];

В каждом случае была использована своя матрица параметров двухмерного распределения $V=\{M_1,\sigma_1^2,m,n_1{;}M_2,\sigma_2^2,m,n_2\}$ , где $M_i$ - математическое ожидание для $i$ -го класса, $\sigma_i^2$ -дисперсия, $m=2$ - размерность пространства признаков, $n_i$ - количество элемнтов каждого класса

#	$\sigma_1^2$	$n_1$	$M_2$	$\sigma_2^2$	$n_2$
1	4	60	20	4	50
2	4	60	5	4	50
3	4	60	0	12	50

Мы видим, что при хорошо разделимых классах, наш алгоритм работает замечательно при правильно подобранном значение $k$ и любом ядре.

Во втором случае классы были сближены, что привело к некоторому неустранимому числу ошибок.

В третьем случае были взяты два класса с одинаковыми математическими ожиданиями, но разными дисперсиями. Алгоритм достаточно хорошо разделил и их.

Исходный код

Скачать листинги алгоритмов можно здесь parzenclassification.m, crossvalidation.m, fqual.m, kgenerate.m

Смотри также

Литература

Воронцов К. В. Лекции по линейным алгоритмам классификации.
Christopher M. Bishop Pattern Recognition and Machine Learning. — Hardcover. — 2006. — 740 с.
Pascal Vincent and Yoshua Bengio Manifold Parzen Windows. — 2002.

Данная статья является непроверенным учебным заданием.

Студент: Участник:Зайцев Алексей

Преподаватель: Участник:В.В. Стрижов

Срок: 28 мая 2009

До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}.

См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе.

Замечания

Источник — «http://www.recognition.su/wiki/index.php?title=%D0%9C%D0%B5%D1%82%D0%BE%D0%B4_%D0%9F%D0%B0%D1%80%D0%B7%D0%B5%D0%BD%D0%BE%D0%B2%D1%81%D0%BA%D0%BE%D0%B3%D0%BE_%D0%BE%D0%BA%D0%BD%D0%B0_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29»

Категории: Непроверенные учебные задания | Классификация

@@ Строка 5: / Строка 5: @@
 <center><tex>a(x;X^{l},h)=\arg \max_{y\in Y} \lambda_{y} \sum_{i=1}^l {[}y_i = y{]} K\left(\frac{\ro{}(x,x_i)}{h}\right).</tex></center>
 В этой формуле <tex>\lambda_{y}</tex> - цена правильного ответа для каждого класса из <tex>Y</tex>
-<ref>Описать все используемые переменные.</ref>
 == Алгоритм отыскания оптимальных параметров ==
@@ Строка 30: / Строка 28: @@
 |}
 Получившееся выражение имеет достаточно понятный вид:
-<center><tex>(h^{*},K^{*}_s(r))=\arg{ } \max_{s\in{{}1,2,3,4,5{}}} \max_{h\in\delta{}H} \sum_{i=1}^l \log \hat{p}_h (x_i;X^{m}{/}x_i). </tex></center>
+<center><tex>(h^{*},K^{*}_s(r))=\arg{ } \max_{\small s\in\{1,2,3,4,5\}} \max_{h\in\delta{}H} \sum_{i=1}^l \log \hat{p}_h (x_i;X^{m}{/}x_i). </tex></center>
 == Вычислительный эксперимент ==
@@ Строка 49: / Строка 47: @@
 </source>
-В первом случае была использована такая матрица параметров распределения:
+В каждом случае была использована своя матрица параметров  двухмерного распределения <tex>V=\{M_1,\sigma_1^2,m,n_1{;}M_2,\sigma_2^2,m,n_2\}</tex>, где <tex>M_i</tex> - математическое ожидание для <tex>i</tex>-го класса, <tex>\sigma_i^2</tex> -дисперсия, <tex>m=2</tex> - размерность пространства признаков, <tex>n_i</tex> - количество элемнтов каждого класса
-<source lang="matlab">
-V=[0 4 2 60; 20 4 2 50]
+{| class="wikitable" style="text-align: center;"
-</source>
+|- bgcolor="#cccccc"
+! width=10 % |#
+! width=15 % | <tex>M_1</tex>
+! width=15 % | <tex>\sigma_1^2</tex>
+! width=15 % | <tex>n_1</tex>
+! width=15 % | <tex>M_2</tex>
+! width=15 % | <tex>\sigma_2^2</tex>
+! width=15 % | <tex>n_2</tex>
+|-
+| '''1''' || 0 || 4 || 60 || 20 || 4 || 50
+|-
+| '''2''' || 0 || 4 || 60 || 5 || 4 || 50
+|-
+| '''3''' || 0 || 4 || 60 || 0 || 12 || 50
+|-
+|}
 Мы видим, что при хорошо разделимых классах, наш алгоритм работает замечательно при правильно подобранном значение <tex>k</tex> и любом ядре.
 [[Изображение:Parzen1.jpg|300px]]
-Матрица параметров распределения:
-<source lang="matlab">
-V=[0 4 2 60; 5 4 2 50]
-</source>
 Во втором случае классы были сближены, что привело к некоторому неустранимому числу ошибок.
 [[Изображение:Parzen3.jpg|300px]]
-Матрица параметров распределения:
-<source lang="matlab">
-V=[0 4 2 60; 0 12 2 50]
-</source>
 В третьем случае были взяты два класса с одинаковыми математическими ожиданиями, но разными дисперсиями. Алгоритм достаточно хорошо разделил и их.
@@ Строка 89: / Строка 93: @@
 |автор        = Воронцов К. В.
 |заглавие     = Лекции по линейным алгоритмам классификации
+}}
+# {{книга
+|автор        = Christopher M. Bishop
+|заглавие     = Pattern Recognition and Machine Learning
+|издание      = Hardcover
+|год          = 2006
+|страниц      = 740
 }}
 # {{книга

Метод Парзеновского окна (пример)

Материал из MachineLearning.

Версия 11:33, 24 мая 2009

Содержание

Постановка задачи разделения классов методом парзеновского окна

Алгоритм отыскания оптимальных параметров

Вычислительный эксперимент

Исходный код

Смотри также

Литература

Замечания

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты