Алгебра над алгоритмами и эвристический поиск закономерностей
Материал из MachineLearning.
 (→Участники спецсеминара)  | 
				 (→Заседания 2015—2016 уч. года)  | 
			||
| Строка 126: | Строка 126: | ||
| ''Трофимов Михаил'', МФТИ  | | ''Трофимов Михаил'', МФТИ  | ||
| Дистрибутивная гипотеза Харриса, *2vec  | | Дистрибутивная гипотеза Харриса, *2vec  | ||
| - | |  | + | |[https://www.dropbox.com/s/pqd1ynrmrlpzx11/Trofimov_smth2vec.pdf?dl=0 слайды(pdf)]  | 
|-  | |-  | ||
| ''Гущин Александр'', МФТИ  | | ''Гущин Александр'', МФТИ  | ||
Версия 09:04, 3 декабря 2015
Руководитель спецсеминара: д.ф.-м.н., профессор Дьяконов Александр Геннадьевич
Направления работы на спецсеминаре
|   | См. также «Правила для постоянных участников». | 
|   | Информация для второкурсников! | 
 
  | 
В рамках работы на спецсеминаре есть два направления исследования:
- Теоретическое. Проводится в рамках алгебраического подхода к решению задач распознавания. Суть подхода: на алгоритмах, которые решают задачи обработки и анализа данных, специальным образом вводятся алгебраические операции. Например, можно складывать алгоритмы (получается опять алгоритм), умножать и т. д. Среди получаемых алгебраических выражений над «естественными» алгоритмами есть высокоэффективные алгоритмы. На спецсеминаре рассматриваются вопросы: как их строить, анализировать, реализовывать на ЭВМ и т. д. и т. п. Здесь же возникают задачи современной теории интерполяции: построения функций специального вида, заданных частично. Можно заниматься дискретным направлением: решать подобные задачи для функций, принимающих значения 0 и 1. Данное направление представляет особую ценность студентам, которые хотят получить самостоятельные результаты в науке и продолжить обучение в аспирантуре.
 - Прикладное. Решаются реальные прикладные задачи анализа данных (data mining). Например, построение рекомендательных систем, прогнозирование свойств динамических графов (в том числе и графов социальных сетей), прогнозирование поведения потребителей, анализ метаданных, классификация сигналов головного мозга, классификация сигналов-показаний работы механизмов, настройка спам-фильтров, автоматическая рубрикация текстов, прогнозирование финансовых временных рядов. От студентов требуется желание глубоко понять задачу (данные и скрытые в них закономерности), умение быстро осваивать новые методы (в незнакомой области), хорошо программировать, выдвигать гипотезы и фантазировать (последнее очень важно).
 
Заседания спецсеминара
|   | Заседания проходят по средам в ауд. 607, начало в 18:10. Вход свободный. | 
Заседания 2015—2016 уч. года
| Дата | Докладчик | Доклад | Материалы | |
|---|---|---|---|---|
| 16 сентября 2015 | Дьяконов Александр, руководитель | Устранение шума в анализе твитов, связь смежности и модулярности при разбиении графа | слайды (pdf) | |
| 23 сентября 2015 | Остапец Андрей, аспирант | Решение конкурса Avito Context Ad Clicks | слайды (pdf), страница конкурса | |
| Нижибицкий Евгений, аспирант | A Neural Algorithm of Artistic Style или Deep Learning Salvation | слайды (pdf), статья (arxiv), реализация (github) | ||
| 30 сентября 2015 | Кудрявцев Георгий, 4-й курс | Доклад по статье "RecSys Challenge 2015: ensemble learning with categorical features" | слайды (pdf), статья (arxiv) | |
| Рысьмятова Анастасия, 4-й курс | Character-level Convolutional Networks for Text Classification | слайды (pdf), статья (arxiv) | ||
| 7 октября 2015 | Вихрева Мария, 4-й курс | Доклад по статье "Geographical effects on epidemic spreading in scale-free networks" | слайды (pdf), статья (arxiv) | |
| Севастопольский Артем, 3-й курс | Доклад о работах Hans-Peter Kriegel из университета Ludwig-Maximilians-Universität, Мюнхен | слайды (pdf), статья 1, статья 2 | ||
| 14 октября 2015 | Каюмов Эмиль, 3-й курс | Доклад о работах Jure Leskovec из Стэнфордского университета | слайды (pdf), статья 1, статья 2 | |
| Никишин Евгений, 3-й курс | Доклад о работах Pedro Domingos из Вашингтонского университета | слайды (pdf), статья 1, статья 2 | ||
| 21 октября 2015 | Трофимов Михаил, МФТИ | (Глубокое) обучение с подкреплением: от аркад до шахмат | статья1, статья2 | |
| Гущин Александр, МФТИ | Решение конкурса Flavours of physics | |||
| 28 октября 2015 | Остапец Андрей, аспирант | Доклад о диссертации Aris Kosmopoulos, посвященной иерархической классификации текстов | слайды (pdf), диссертация | |
| Нижибицкий Евгений, аспирант | DeepHear — Composing and harmonizing music with neural networks | |||
| 4 ноября 2015 | ПРАЗДНИК | |||
| 11 ноября 2015 | Кудрявцев Георгий, 4-й курс | CLiMF и OrdRec | статья (pdf), статья (pdf) | |
| Рысьмятова Анастасия, 4-й курс | A Sensitivity Analysis of Convolutional Neural Networks for Sentence Classification | статья 1 (arxiv) статья 2 (arxiv) | ||
| 18 ноября 2015 | Вихрева Мария, 4-й курс | Анализ настроения текста | ||
| Севастопольский Артем, 3-й курс | Извлечение признаков из текстуры изображений | слайды (pdf) статья 1 статья 2 (pdf) статья 3 (pdf) | ||
| 25 ноября 2015 | Каюмов Эмиль, 3-й курс | Методы восстановления пропусков в данных | слайды (pdf) | |
| Никишин Евгений, 3-й курс | Доклад о современных методах выделения сообществ в социальных графах | слайды (pdf), статья 1, статья 2, статья 3 | ||
| 2 декабря 2015 | Трофимов Михаил, МФТИ | Дистрибутивная гипотеза Харриса, *2vec | слайды(pdf) | |
| Гущин Александр, МФТИ | Решение конкурса Springleaf marketing response | |||
| 9 декабря 2015 | Дьяконов Александр, руководитель | 
Заседния в предыдущих семестрах:
- Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2014-2015 уч. года.
 - Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2013-2014 уч. года (осенний семестр).
 - Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2012-2013 уч. года (весенний семестр).
 - Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2012-2013 уч. года (осенний семестр).
 - Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2011-2012 уч. года (весенний семестр).
 - Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2011-2012 уч. года (осенний семестр).
 - Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2010-2011 уч. года (весенний семестр).
 
Текущие задания участников спецсеминара
|   |  Список источников для потенциальных докладов.
 Доклады по статьям Доклады по авторам 
  | 
| Участник | Задание (каждый сам заполняет свою ячейку) | Комментарий | 
|---|---|---|
| Нижибицкий Евгений (А1) | Подготовка плана-проспекта диссертации, статьи в журнале из списка ВАК (подача до декабря). | |
| Остапец Андрей (А1) | Подготовка плана-проспекта диссертации, статьи в журнале из списка ВАК (подача до декабря). | |
| Кудрявцев Георгий (417) | ВКР "Построение ансамбля алгоритмов рекомендаций". | |
| Рысьмятова Анастасия (417) | ВКР "Использование сверточных нейронных сетей для задачи классификации текстов". | |
| Вихрева Мария (417) | ВКР "Распространение эпидемий в графах". | |
| Каюмов Эмиль (317) | Выбор задачи (Kaggle) для исследования. | |
| Никишин Евгений (317) | Выбор задачи (Kaggle) для исследования. | |
| Севастопольский Артём (317) | Выбор задачи (Kaggle) для исследования. | |
| Трофимов Михаил (МФТИ) | ВКР "Обобщенные факторизационные машины" | |
| Гущин Александр (МФТИ) | ||
| Кибитова Валерия (517) | 
Участники спецсеминара
| Год выпуска | Участники | 
|---|---|
| 2017 бак | 
 Никишин Евгений 
 Каюмов Эмиль 
 Севастопольский Артём  | 
| 2016 бак | 
 Кудрявцев Георгий 
 Рысьмятова Анастасия 
 Вихрева Мария 
  | 
| 2016 маг | 
 Трофимов Михаил 
 
  | 
| аспиранты 2 г.о. | 
 
  | 
Выпускники спецсеминара
| Год выпуска | Выпускники | 
|---|---|
| Аспирант, 2010 | 
 Карпович Павел 
 Диссертация: «K-сингулярные системы точек в алгебраическом подходе к распознаванию образов» (2010, успешно защищена 18.02.2011 по специальности 01.01.09).  | 
| 2015 бак | 
 Славнов Константин 
  | 
| 2015 | 
 Харациди Олег 
  | 
| 2014 | 
 
 
 
  | 
| 2013 | 
 Бобрик Ксения 
 Ермушева Александра 
 Кириллов Александр 
 Кондрашкин Дмитрий (перевёлся на другой спецсеминар) 
 
 
  | 
| 2012 | 
  | 
| 2010 | 
 Ахламченкова Ольга 
 Токарева (Одинокова) Евгения 
  | 
| 2009 | 
 Власова Юлия 
 Логинов Вячеслав 
 Фёдорова Валентина 
 Чучвара Алексндра (бакалавр) 
  | 
| 2008 | 
 Ломова Дарья 
 Вершкова Ирина 
  | 
| 2007 | 
 Кнорре Анна 
 Карпович Павел 
 Сиваченко Евгений 
  | 
| 2006 | 
 Ховратович (Курятникова) Татьяна 
 Мошин Николай 
  | 
| 2005 | 
 Каменева Наталия 
 Силкин Леонид 
  | 
Некоторые решаемые прикладные задачи
- Прогнозирование временных рядов По характеристикам процесса в прошлом предсказать поведение в будущем. Знание о прошлом может быть неполным или ошибочным. Типичный пример: прогнозирование денежных сумм, которые будут сниматься с банкомата в течение следующей недели.
 - Классификация технических сигналов и сигналов головного мозга По описанию изменения некоторой характеристики процесса необходимо определить её класс. Например, по электрокортикограмме определить ментальное состояние человека. При этом обучающая выборка (данные, которые у нас есть) была собрана достаточно давно, а тестирование алгоритма будет проводиться потом (при изменённых внешних условиях, а следовательно, при изменённых характеристиках данных).
 - Фильтрация спама Настроить спам-фильтр на некотором универсальном обучающем множестве (данных спам-ловушек) так, чтобы он хорошо работал на компьютере конкретного пользователя (без дополнительной донастройки).
 - Иерархическая классификация текстов Написать алгоритм автоматической категоризации документов. Например, новостные рассылки необходимо распределить по каталогам «спорт/футбол», «спорт/биатлон», «музыка/концерты», «музыка/рок/исполнители» и т. д.
 - Ранжирование документов на основе обучающего множества Написать алгоритм, который оценивает релевантность документа поисковому запросу. Для фиксированного запроса упорядочить документы (используя их признаковые описания) так, чтобы порядок отражал «адекватность» запроса.
 - Прогноз связности графа социальной сети Предсказать изменения динамического графа социальной сети, в частности, появление новых рёбер.
 - Прогнозирование успешности грантов и проектов По описанию заявки оценить перспективность выполнения данного проекта.
 - Разработка рекомендательного алгоритма, который делает актуальные предложения купить какой-то товар, воспользоваться услугой или прочитать материал.
 - Предсказывание визитов покупателей и сумм покупок для сети супермаркетов Разработка алгоритма, который предсказывает дату первого визита и сумму покупки каждого клиента.
 - Оценка фотографий по метаданным Прогноз «интересности» фото-материалов на основе анализа названия, описания, GPS-координат съёмки и т.п.
 - Задача кредитного скоринга Прогнозирование надёжности клиента банка по обязательствам выплаты процентов кредита.
 

