Формула Надарая-Ватсона
Материал из MachineLearning.
| Строка 14: | Строка 14: | ||
==Обоснование формулы==  | ==Обоснование формулы==  | ||
| - | Строгим обоснованием формулы в одномерном случае служит следующая теорема :  <br />  | + | Строгим обоснованием формулы в одномерном случае с метрикой <tex>\rho(x,x_i) = |x - x_i|</tex> служит следующая теорема :  <br />  | 
'''Теорема''' Пусть выполнены условия : <br />  | '''Теорема''' Пусть выполнены условия : <br />  | ||
1) выборка <tex>$X^l = (x_i,y_i)^l_{i=1}$</tex> получена случайно и независимо из распределения <tex>p(x,y)</tex> <br />  | 1) выборка <tex>$X^l = (x_i,y_i)^l_{i=1}$</tex> получена случайно и независимо из распределения <tex>p(x,y)</tex> <br />  | ||
Версия 21:25, 6 января 2010
|   |  Данная статья является непроверенным учебным заданием.
 До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}. См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе.  | 
Формула Надарая-Ватсона используется для решения задачи непараметрического восстановления регрессии.
Содержание | 
Постановка задачи
Пусть задано пространство объектов  и множество возможных ответов 
. Существует неизвестная зависимость 
, значения которой известны только на объектах обучающией выборки 
. Требуется построить алгоритм 
, аппроксимирующий неизвестную зависимость 
. Предполагается, что на множестве 
 задана метрика 
.
Формула Надарая-Ватсона
Для вычисления  при 
, воспользуемся методом наименьших квадратов: 
, где
- это вес i-ого объекта.
Веса  разумно задать так, чтобы они убывали по мере увеличения расстояния 
. Для этого можно ввести невозрастающую, гладкую, ограниченную функцию 
, называемую ядром, и представить 
 в следующем виде :   
, где 
 — ширина окна. 
Приравняв нулю производную  , и, выразив 
,получаем формулу Надарая-Ватсона : 
Обоснование формулы
Строгим обоснованием формулы в одномерном случае с метрикой  служит следующая теорема :  
Теорема Пусть выполнены условия : 
1) выборка  получена случайно и независимо из распределения 
 
2) ядро  удовлетворяет ограничениям 
 и 
  
3) восстанавливаемая зависимость, определяемая плотностью , удавлетворяет при любом 
 ограничению 
4) последовательность  такова, что 
 и 
 
Тогда имеет место сходимость по вероятности :  в любой точке 
, в которой 
 и 
 непрерывны и 
.  
Литература
1) К. В. Воронцов, Лекции по алгоритмам восстановления регрессии, 2009
2) Хардле В. Прикладная непараметрическая регрессия. - М.: Мир, 1993.  

