Непараметрическая регрессия: ядерное сглаживание
Материал из MachineLearning.
 (Новая: Coming soon)  | 
				|||
| Строка 1: | Строка 1: | ||
| - | + | {{UnderConstruction|[[Участник:SL|SL]] 01:27, 12 января 2009 (MSK)}}  | |
| + | '''Ядерное сглаживание''' - один из простейших видов [[Непараметрическая регрессия|непараметрической регрессии]].  | ||
| + | |||
| + | == Принцип ==  | ||
| + | Используйщий идейно простой подход к представлению последовательности весов <tex>\{ W_{ni}(x) \}_{i=1}^n</tex> состоит в описании формы весовой функции <tex>W_{ni}(x)</tex> посредством функции плотности со скалярным параметром, который регулирует размер и форму весов около х. Эту функцию формы  принято называть ''ядром'' <tex>K</tex>.  | ||
| + | |||
| + | == Последовательность весов ==  | ||
| + | === Определение ядра ===  | ||
| + | '''Ядро''' — это непрерывная ограниченная симметричная вещественная функция <tex>K</tex> с единичным интегралом  | ||
| + | ::<tex>\int K(u)du=1</tex>  | ||
| + | Последовательность весов для ядерных оценок (для одномерного   | ||
| + | <tex>x</tex>) определяется как   | ||
| + | ::<tex>W_{ni}(x)=\frac{K_{h_n}(x\;-\;X_i)}{\hat{f}_{h_n}(x)}</tex>,  | ||
| + | где  | ||
| + | ::<tex>\hat{f}_{h_n}(x)=\frac{\sum_{i=1}^n K_{h_n}(x\;-\;X_i)}{n}</tex>,  | ||
| + | a  | ||
| + | ::<tex>K_{h_n}(u)=\frac{K\(\frac{u}{h_n}\)}{h_n}</tex>  | ||
| + | представляет собой ядро с параметром масштаба <tex>h_n</tex>. Подчеркнув   | ||
| + | зависимость <tex>h\ =\ h_n</tex> от объема выборки <tex>n</tex>, условимся сокращен-   | ||
| + | но обозначать последовательность весов <tex>W_{ni}(x)</tex>.  | ||
| + | |||
| + | === Функция ядра ===  | ||
| + | Функция <tex>\hat{f}_{h_n}(x)</tex> является ''ядерной оценкой плотности Розенблата — Парзена'' (Rosenblatt, 1956; Parzen, 1962) для (маргинальной) плотности переменной <tex>x</tex>. Данный вид ядерных весов <tex>W_{ni}(x)</tex> был предложен в работах (Nadaraya, 1964) и (Watson, 1964), и, как следствие,  | ||
| + | ::<tex>\hat{m}_h(x)=\frac{n^{-1}\sum_{i=1}^n K_{h_n}(x\;-\;X_i)Y_i}{n^{-1}\sum_{i=1}^n K_{h_n}(x\;-\;X_i)}</tex>  | ||
| + | часто называют оценкой ''Надарая — Ватсона''. ''форма'' ядерных весов определяется ядром <tex>K</tex> в то время как ''размер'' весов параметризируется посредством переменной <tex>h</tex>, называемой ''шириной окна''. Нормализация весов <tex>\hat{f}_{h_n}(x)</tex> позволяет адаптироваться к локальной интенсивности переменной <tex>x</tex> и, кроме того, гарантирует, что сумма весов равна еденице. Вообще говоря, можно брать различные ядерные функции, нр как практика, так и теория ограничивают выбор. Так, например, ядерные функции, принимающие очень малые значения, могут приводить к машинному нулю компьютера, поэтому разумно рассматривать такие ядерные функции, которые равны нулю вне некоторого фиксированного интервала.  | ||
| + | === Пример функции ядра ===  | ||
| + | [[Изображение:YepanchikovsKernel.png|thumb|right|260px|Ядро Бпанечникова. Это ядро <tex>K(u)=0.75(1-u^2)I(\| u \| \le 1)</tex> имеет параболическую форму и носитель <tex>[-1,1]</tex>.]]  | ||
| + | Обычно используется ядерная функция, обладающая некоторыми свойствами оптимальности [Хардле В п4.5]; это функция   | ||
| + | параболического типа (Epanechnikov, 1969; Bartlett, 1963):  | ||
| + | ::<tex>K(u)=0.75(1-u^2)I(\| u \| \le 1)</tex>.  | ||
| + | '''Замечание.''' Ядро не дифференцируемо при <tex>u = \pm 1</tex>. Ядерная оценка не определена для значения ширины окна с <tex>\hat{f}_{h_n}(x)=0</tex>. Если такой случай <tex>0/0</tex> возникает, то <tex>\hat{m}_h(x)</tex> определяется как <tex>0</tex>.  | ||
| + | === Зависимость от ширины окна ===  | ||
| + | Допустим, что ядерная оценка вычисляется только в точках наблюдений <tex>\{ X_i\}_{i=1}^n</tex>. Тогда при <tex>h\rightarrow0</tex>,  | ||
| + | ::<tex>\hat{m}_h(x)\rightarrow\frac{K(0)Y_i}{K(0)}=Y_i</tex>;  | ||
| + | следовательно, малая ширина окна воспроизводит данные. Исследуем теперь, что происходит при <tex>h\rightarrow\infty</tex>. Допустим, что <tex>K</tex> имеет носитель <tex>[-1,1]</tex>, как на рис. Тогда <tex>K(x\;-\;X_i/h)\rightarrow K(0)</tex> и, следовательно,  | ||
| + | ::<tex>\hat{m}_h(x)=\frac{n^{-1}\sum_{i=1}^n K(0)Y_i}{n^{-1}\sum_{i=1}^n K(0)}\;=\;n^{-1}\sum_{i=1}^n Y_i</tex>  | ||
| + | Слишком большое значение ширины окна приводит таким образом к чрезмерному сглаживанию кривой — среднему арифметическому значений переменной отклика.   | ||
| + | |||
| + | |||
| + | ==Литература==  | ||
| + | # {{книга  | ||
| + | |автор        = Хардле В.  | ||
| + | |заглавие  = Прикладная непараметрическая регрессия  | ||
| + | |год          = 1989  | ||
| + | |ссылка       = http://optimization.nlprog.ru/read/ru/8776859F6322A5AF21D45220A9B5B57E110C2E84/index.htm  | ||
| + | }}  | ||
| + | |||
| + | ==См. также==  | ||
| + | * [[Ядерное сглаживание]]  | ||
| + | * [[Регрессионный анализ]]  | ||
| + | |||
| + | [[Категория:Регрессионный анализ]]  | ||
Версия 22:27, 11 января 2009
|   |  Статья в настоящий момент дорабатывается. SL 01:27, 12 января 2009 (MSK)  | 
Ядерное сглаживание - один из простейших видов непараметрической регрессии.
Содержание | 
Принцип
Используйщий идейно простой подход к представлению последовательности весов  состоит в описании формы весовой функции 
 посредством функции плотности со скалярным параметром, который регулирует размер и форму весов около х. Эту функцию формы  принято называть ядром 
.
Последовательность весов
Определение ядра
Ядро — это непрерывная ограниченная симметричная вещественная функция  с единичным интегралом
Последовательность весов для ядерных оценок (для одномерного 
) определяется как 
,
где
,
a
представляет собой ядро с параметром масштаба . Подчеркнув 
зависимость 
 от объема выборки 
, условимся сокращен- 
но обозначать последовательность весов 
.
Функция ядра
Функция  является ядерной оценкой плотности Розенблата — Парзена (Rosenblatt, 1956; Parzen, 1962) для (маргинальной) плотности переменной 
. Данный вид ядерных весов 
 был предложен в работах (Nadaraya, 1964) и (Watson, 1964), и, как следствие,
часто называют оценкой Надарая — Ватсона. форма ядерных весов определяется ядром  в то время как размер весов параметризируется посредством переменной 
, называемой шириной окна. Нормализация весов 
 позволяет адаптироваться к локальной интенсивности переменной 
 и, кроме того, гарантирует, что сумма весов равна еденице. Вообще говоря, можно брать различные ядерные функции, нр как практика, так и теория ограничивают выбор. Так, например, ядерные функции, принимающие очень малые значения, могут приводить к машинному нулю компьютера, поэтому разумно рассматривать такие ядерные функции, которые равны нулю вне некоторого фиксированного интервала.
Пример функции ядра
Обычно используется ядерная функция, обладающая некоторыми свойствами оптимальности [Хардле В п4.5]; это функция параболического типа (Epanechnikov, 1969; Bartlett, 1963):
.
Замечание. Ядро не дифференцируемо при . Ядерная оценка не определена для значения ширины окна с 
. Если такой случай 
 возникает, то 
 определяется как 
.
Зависимость от ширины окна
Допустим, что ядерная оценка вычисляется только в точках наблюдений . Тогда при 
,
;
следовательно, малая ширина окна воспроизводит данные. Исследуем теперь, что происходит при . Допустим, что 
 имеет носитель 
, как на рис. Тогда 
 и, следовательно,
Слишком большое значение ширины окна приводит таким образом к чрезмерному сглаживанию кривой — среднему арифметическому значений переменной отклика.
Литература
- Хардле В. Прикладная непараметрическая регрессия. — 1989.
 


