Участник:Denis Kochedykov

Материал из MachineLearning.

(Различия между версиями)

Перейти к: навигация, поиск

Версия 19:50, 31 августа 2009

Кочедыков Денис Алексеевич, Forecsys, ВЦ РАН(соискатель).

Научный руководитель Воронцов К.В..

Области научных интересов: теория машинного обучения, оценивание обобщающей способности, комбинаторика, статистика.

Написать письмо.

Публикации

Кочедыков Д.А., Ивахненко А.А., Воронцов К.В. "Система кредитного скоринга на основе логических алгоритмов классификации" // Математические методы распознавания образов-12. — М.: МАКС Пресс, 2005. — С. 349–353.
Кочедыков Д.А., Воронцов К.В. "О поиске оптимальных сочетаний управляющих параметров в логических алгоритмах классификации" //Тезисы докладов международной конференции «Интеллектуализация обработки информации» (ИОИ-2006) - Симферополь, 2006 - С. 117–119.
Кочедыков Д.А., Ивахненко А.А., Воронцов К.В. "Применение логических алгоритмов классификации в задачах кредитного скоринга и управления риском кредитного портфеля банка" // Математические методы распознавания образов-13. — М.: МАКС Пресс, 2007. — С. 484–488.
Кочедыков Д.А., Воронцов К.В. "К определению понятия информативности логических закономерностей в задачах классификации" //Труды 50-ой научной конференции МФТИ «Современные проблемы фундаментальных и прикладных наук» - 2008г - т.2 - с 100-102
Кочедыков Д.А., "Комбинаторные оценки обобщающей способности методов обучения по прецедентам с расслоением по наблюдаемой частоте ошибок" //Труды 51-ой научной конференции МФТИ «Современные проблемы фундаментальных и прикладных наук» - 2009г

См. также

Расслоение_и_сходство_алгоритмов_(виртуальный_семинар)

Источник — «http://www.recognition.su/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Denis_Kochedykov»

Категория: Кандидатские диссертации

@@ Строка 12: / Строка 12: @@
 == Публикации ==
-=== Тезисы ===
 # Кочедыков Д.А., Ивахненко А.А., Воронцов К.В. "Система кредитного скоринга на основе логических алгоритмов классификации" //  Математические методы распознавания образов-12. — М.: МАКС Пресс, 2005. — С. 349–353.
 # Кочедыков Д.А., Воронцов К.В. "О поиске оптимальных сочетаний управляющих параметров в логических алгоритмах классификации" //Тезисы докладов международной конференции «Интеллектуализация обработки информации» (ИОИ-2006) - Симферополь, 2006 -  С. 117–119.
@@ Строка 19: / Строка 19: @@
 # Кочедыков Д.А., "Комбинаторные оценки обобщающей способности методов обучения по прецедентам с расслоением по наблюдаемой частоте ошибок" //Труды 51-ой научной конференции МФТИ «Современные проблемы фундаментальных и прикладных наук»  - 2009г
-=== Статьи ===
-== Структура кандидатской диссертации ==
-Тема: "Структура близости и расслоения семейства алгоритмов и обобщающая способность"
-# Введение
-## Актуальность
-## Новизна: учет эффекта сходства и расслоения в оценках обобщающей способности в комбинаторном подходе
-## Апробация: ИОИ-2008, МФТИ-2007, МФТИ-2008, ММРО-2009(предстоит), семинары ВЦ РАН(предстоит)
-## Содержание работы по главам и личный вклад.
-# Обзорная часть
-## Проблема обобщающей способности. Обзор современных результатов: Вапника, Лэнгфорда, МакАллистера, и т.д.
-## Слабая вероятностная аксиоматика
-## Постановка задачи диссертации: учет расслоения и связности семейства в оценках обобщающей способности
-# Некоторые известные оценки, переведенные в слабую аксиоматику (содержательная глава №1)
-## Вапник
-## Лэнгфорд
-## Силл
-##''Возможно еще какие-то оценки''
-# Эффект сходства алгоритмов при оценивании вероятности переобучения (содержательная глава №2. основная.)
-## Связное семейство - верхняя оценка вероятности возникновения переобучения посредством неравенств типа Бонферрони
-## Цепочка алгоритмов без расслоения
-### Точное значение вероятности возникновения переобучения в цепочке
-### Точное значение вероятности пеореобучения метода МЭР
-## Семейство, состоящее из цепочек без расслоения
-### Верхняя оценка вероятности переобучения метода МЭР
-### Верхняя оценка вероятности возникновения переобучения
-# Эксперименты
-## Сравнение различных оценок
-== Состояние работы на текущий момент ==
-# В обзорной части
-#* Частично есть описание постановки задачи.
-#* Есть описание слабой вероятностной аксиоматики.
-#* Отсутствует обзор современного состояния по теме.
-# В главе про перевод известных оценок в комбинаторный вид
-#* Естественно, есть стандартная оценка Вапника.
-#* Из Лэнгфорда есть оценки Occam Razor, Shell, можно считать, что есть Microchoice, т.к. он переводится тривиально.
-#* Есть оценка Силла для связных семейств.
-#* Других оценок пока нет.
-# В главе про эффект сходства
-#* Есть верхняя оценка вероятности возникновения переобучения в связном семействе через дерево на алгоритмах
-#* Есть оценка учитывающая число соседей у каждого алгоритма в семействе
-#* Остального еще нет.
-== Ближайший план работы ==
-# Пусть семейство имеет граф связности с заданными характеристиками (совместное распределение величины (n,r), где r(a) - степень вершины a и n(a) – номер слоя, полное число ошибок вершины a). Получить оценку вероятности возникновения переобучения в семействе с учетом этого распределения.
-# Добавить в оценку учет того, что к каждому алгоритму семейства ведет монотонная цепочка алгоритмов(или даже сетка), которые хуже строго лучше него.
-# '''Сдать вторую статью в печать'''.
-# Посмотреть (по аналогии с Силлом) – графы связности с какими распределениями (n, r) могут получаться при непрерывном изменении параметров
-# Экспериментально поанализировать графы связности:
-## распределение числа вершин (по разным выборкам).
-## как зависит это распределение от размера выборки и размерности прост-ва параметров
-## распределение степеней вершин для фиксированной выборки.
-## как меняется это распределение от выборки к выборке. как оно меняется с ростом размерности пр-ва параметров.
-## число связей между слоями. как оно зависит от m слоя, как зависит от числа алгоритмов в слое.
-## стабильно ли отношение числа связей к полному числу возможных связей для данного размера соседних слоев.
-## составляются ли алгоритмы в одном слое в цепочку.
-## если нет - то сколько цепочек получается в слое, как это зависит от m слоя и от числа алгоритмов в слое.
-## Построить графы для связи «через 2 объекта». То есть связывать ребром алгоритмы, отличающиеся на 1 объекте. Посмотреть, сколько в среднем связей со своим же слоем, сколько через слой выше, сколько через слой ниже.
-## Посмотреть, какие графы связности получаются для семейства разделяющих прямых на выборке, в которой точки одного класса «окружены» точками другого класса.
-# Для сетки без расслоения
-## Получить вероятность возникновения переобучения в сетке (эквивалентно вероятности переобучения пессимистичного метода МЭР). Это будет оценка с полным учетом структуры сходства, но без учета «хороших» свойств обучения.
-## Получить вероятность переобучения на сетке для оптимистичного или случайного метода МЭР (можно для худшего случая – наиболее «распрямленной» сетки). Это будет оценка с одновременным учетом и свойств метода обучения и структуры сходства семейства.
-# Сравнить эти две последние оценки и обычную оценку union bound(Вапник) для цепочки - определить какой сравнительный эффект дают учет 1) структуры сходства и 2) метода обучения.
-# union bound'ом получить для каждой из последних двух оценок общую верхнюю оценку для семейства состоящего из цепочек без расслоения. (здесь пока не совсем понятна практическая применимость - ведь слои в реальных семействах не обязательно представляют из себя цепочки). Замечание: Для использования union bound'а нужно знать профиль семейства - число алгоритмов в каждом слое(цепочке). Его можно оценить по наблюдаемому профилю семейства так, как это делается в observable shell Лэнгфорда.
-# Написать литобзор.
-Опционально:
-# Попробовать теоретически вывести профиль расслоения семейства.
-## Посмотреть на динамику профиля при:
-### сближении/удалении центров классов
-### увеличении/уменьшении количества шума
-### изменении соотношения классов в выборке
-## Попробовать решить задачу сначала для прямых на плоскости и нормально распределенных классов.
 == См. также ==
 * [[Расслоение_и_сходство_алгоритмов_(виртуальный_семинар)]]
 [[Категория:Кандидатские диссертации]]

Участник:Denis Kochedykov

Материал из MachineLearning.

Версия 19:50, 31 августа 2009

Публикации

См. также

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты