Лассо Тибширани
Материал из MachineLearning.
 (→Пример задачи)  | 
			|||
| (6 промежуточных версий не показаны.) | |||
| Строка 2: | Строка 2: | ||
==Пример задачи==   | ==Пример задачи==   | ||
| - | В больнице лежит пациент, больной раком простаты. Требуется изучить корреляцию специального антигена простаты и некоторого количесива тестов. В качестве   | + | В больнице лежит пациент, больной раком простаты. Требуется изучить корреляцию специального антигена простаты и некоторого количесива тестов. В качестве факторов берём клинические тесты, а откликом будет специальный антиген.  | 
==Метод Лассо==  | ==Метод Лассо==  | ||
| Строка 45: | Строка 45: | ||
</tex>  | </tex>  | ||
| - | + | Это задача по теореме Куна-Такера   | |
<tex>\exists j:\ \theta_j^{+}=\theta_j^{-}=0</tex>. Однако решается довольно долго.  | <tex>\exists j:\ \theta_j^{+}=\theta_j^{-}=0</tex>. Однако решается довольно долго.  | ||
| Строка 51: | Строка 51: | ||
==Литература==  | ==Литература==  | ||
| - | *{{  | + | *{{книга  | 
|автор = Robert Tibshirani  | |автор = Robert Tibshirani  | ||
|название = Regression shrinkage and selection via the lasso  | |название = Regression shrinkage and selection via the lasso  | ||
| Строка 59: | Строка 59: | ||
|страницы = 267--288  | |страницы = 267--288  | ||
}}  | }}  | ||
| + | |||
== См. также ==  | == См. также ==  | ||
* [[Мультиколлинеарность]]  | * [[Мультиколлинеарность]]  | ||
* [[Ридж-регрессия]]   | * [[Ридж-регрессия]]   | ||
| + | * [[Лассо]]  | ||
| + | * [[LARS]]  | ||
| + | * [[Регрессионный анализ]]  | ||
== Ссылки ==  | == Ссылки ==  | ||
| - | [http://en.wikipedia.org/wiki/Regularization_(machine_learning)  | + | * [http://en.wikipedia.org/wiki/Regularization_(machine_learning) Regularization(mathematics)] (Wikipedia)  | 
| + | |||
| + | [[Категория:Регрессионный анализ]]  | ||
[[Категория: Прикладная статистика]]  | [[Категория: Прикладная статистика]]  | ||
Текущая версия
Лассо Тибширани (англ.LASSO - Least Absolute Shrinkage and Selection Operator) - это метод понижения размерности, предложенный Тибширани в 1995г. Этот метод минимизирует RSS при условии, что сумма абсолютных значений коэффициентов меньше константы. Из-за природы этих ограничений некоторый коэффициенты получаются равными нулю.
Содержание | 
Пример задачи
В больнице лежит пациент, больной раком простаты. Требуется изучить корреляцию специального антигена простаты и некоторого количесива тестов. В качестве факторов берём клинические тесты, а откликом будет специальный антиген.
Метод Лассо
Постановка задачи:
.
Переформулируем её в таком виде.
Если уменьшается , то устойчивость увеличивается и количество ненулевых коэффициентов уменьшается, т.о. происходит отбор признаков.
Эта задача удовлетворяет условиям теоремы Куна-Таккера. Однако тяжело думать, что алгоритм остановится толко после  итераций, особенно при больших 
. На практике было замечено, что среднее число итераций варьируется в переделах 
.
Видоизменённый метод Лассо
Совершенно другой алгоритм для решения задачи предложил David Gay.
Записываем  как
,
где  и 
Мы перешли от основной задачи с  переменными и 
 ограничениями к новой задаче с 
 переменными и 
 ограничениями.
Это задача по теореме Куна-Такера 
. Однако решается довольно долго.
После сравнения этих двух методов оказалось, что обычно второй работает чуть быстрее первого метода.
Литература
- Robert Tibshirani Regression shrinkage and selection via the lasso. — 1996. — С. 267--288.
 
См. также
Ссылки
- Regularization(mathematics) (Wikipedia)
 

