Формула Надарая-Ватсона
Материал из MachineLearning.
 (Новая: {{Задание|Kolesnikov|Константин Воронцов|8 января 2009}})  | 
				|||
| Строка 1: | Строка 1: | ||
| - | {{Задание|Kolesnikov|  | + | {{Задание|Kolesnikov||8 января 2009}}  | 
| + | |||
| + | '''Формула Надарая-Ватсона''' используется для решения задачи непараметрического [[восстановления регрессии]].  | ||
| + | == Постановка задачи ==  | ||
| + | Пусть задано пространство объектов <tex>X</tex> и множество возможных ответов <tex>Y = \mathbb{R}</tex>. Существует неизвестная зависимость <tex>$y^*:X \rightarrow Y$</tex>, значения которой известны только на объектах обучающией выборки <tex>$ X^l = (x_i\ ,\ y_i)^l_{i=1},\  y_i = y^*(x_i) $</tex>. Требуется построить [[алгоритм]] <tex>a:\ X\rightarrow Y</tex>, аппроксимирующий неизвестную зависимость <tex>$y^*$</tex>. Предполагается, что на множестве <tex>X</tex> задана [[метрика]] <tex>\rho(x,x^')</tex>.  | ||
| + | |||
| + | ==Формула Надарая-Ватсона==  | ||
| + | Для вычисления <tex>$a(x) = \alpha$</tex> при <tex>$ \forall x \in X$</tex>, воспользуемся [[методом наименьших квадратов]]: <br />  | ||
| + |  <tex>Q(\alpha;X^l) = \sum_{i=1}^l \omega_i(x)(\alpha-y_i)^2 \rightarrow min_{\alpha \in \mathbb{R}}</tex>, где <tex>\omega_i</tex> - это вес i-ого объекта.  <br />  | ||
| + | Веса <tex>\omega_i</tex> разумно задать так, чтобы они убывали по мере увеличения расстояния <tex>\rho(x,x_i)</tex>. Для этого представим <tex>\omega_i</tex> в следующем виде :   <br />  | ||
| + |  <tex>\omega_i = K\left(\frac{\rho(x,x_i)}{h} \right )</tex>  | ||
| + | |||
| + | |||
| + | ==Обоснование формулы==  | ||
Версия 18:00, 3 января 2010
|   |  Данная статья является непроверенным учебным заданием.
 До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}. См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе.  | 
Формула Надарая-Ватсона используется для решения задачи непараметрического восстановления регрессии.
Постановка задачи
Пусть задано пространство объектов  и множество возможных ответов 
. Существует неизвестная зависимость 
, значения которой известны только на объектах обучающией выборки 
. Требуется построить алгоритм 
, аппроксимирующий неизвестную зависимость 
. Предполагается, что на множестве 
 задана метрика 
.
Формула Надарая-Ватсона
Для вычисления  при 
, воспользуемся методом наименьших квадратов: 
, где
- это вес i-ого объекта.
Веса  разумно задать так, чтобы они убывали по мере увеличения расстояния 
. Для этого представим 
 в следующем виде :   

