Алгоритм Trust-Region

Материал из MachineLearning.

(Различия между версиями)

Перейти к: навигация, поиск

Текущая версия

Содержание

1 Введение
2 Метод решения задачи
3 Пример
4 Рекомендации программисту
5 Заключение
6 Литература
7 Смотри также

Введение

Рассмотрим здачу минимизации
$\min_x f(x)$ $x \in R^n$

Метод решения задачи

Алгоритм Trust-Region основан на построение модельной функции $m_k$ , которая приближает исходную в некоторой окрестности текущей точки $x_k$ . При этом функция $m_k$ может плохо приближать f в других точках, поэтому мы ограничиваен минимизацию этой некоторой окрестностью точки $x_k$ . Другими словами, решается здача:
$\min_p m_k(x_k + p)$ , где $x_k + p$ лежит внутри доверельной окрестности
Обычно, доверительная окрестность - шар радиуса $||p||_2 < \Delta$ . В качесте модели функции $m_k$ обычно берется квадратичная:
$m_k (p) = f_k + p^T\nabla f_k + \frac12p^TH_kp$
- разложение функции f по формуле Тейлора до второго слааемого.
Итак, на каждом шаге решается подзадача:
$m_k (p) = f_k + p^T\nabla f_k + \frac12p^TH_kp$ s.t. $||p||_2 < \Delta_k$
Первая проблема, которая возникает, это определение радиуса доверительного интервала. Мы выбираем этот радиус, исходя из модели функции $m_k$ и функции f на предыдущий итерациях. Определим соотношение
$\rho_k = \frac{f(x_k) - f(x_k + p_k)}{m_k(0) - m_k(p_k)}$

Пример

Заключение

Литература

Смотри также

Практикум ММП ВМК, 4й курс, осень 2008

Это незавершённая статья. Вы поможете проекту, исправив и дополнив её.

Источник — «http://www.recognition.su/wiki/index.php?title=%D0%90%D0%BB%D0%B3%D0%BE%D1%80%D0%B8%D1%82%D0%BC_Trust-Region»

Категории: Незавершённые статьи | Учебные задачи

@@ Строка 7: / Строка 7: @@
 Обычно, доверительная окрестность - шар радиуса <tex>||p||_2 < \Delta</tex>. В качесте модели функции <tex>m_k</tex> обычно берется квадратичная: <br>
 <tex>m_k (p) = f_k + p^T\nabla f_k + \frac12p^TH_kp</tex><br>
+- разложение функции f по формуле Тейлора до второго слааемого.<br>
+Итак, на каждом шаге решается подзадача:<br>
+<tex>m_k (p) = f_k + p^T\nabla f_k + \frac12p^TH_kp</tex>    s.t.<tex>||p||_2 < \Delta_k</tex><br>
 Первая проблема, которая возникает, это определение радиуса доверительного интервала. Мы выбираем этот радиус, исходя из модели функции <tex>m_k</tex> и функции f на предыдущий итерациях. Определим соотношение<br>
-<tex>\rho_k = \frac{f(x_k) - f(x_k + p_k)}{m_k(0) - m_k(p_k)}</tex>
+<tex>\rho_k = \frac{f(x_k) - f(x_k + p_k)}{m_k(0) - m_k(p_k)}</tex><br>
 ==Пример==
 ==Рекомендации программисту==

Алгоритм Trust-Region

Материал из MachineLearning.

Текущая версия

Содержание

Введение

Метод решения задачи

Пример

Рекомендации программисту

Заключение

Литература

Смотри также

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты