Алгебра над алгоритмами и эвристический поиск закономерностей
Материал из MachineLearning.
 (→Заседания 2016—2017 уч. года)  | 
				 (→Заседания 2016—2017 уч. года)  | 
			||
| Строка 30: | Строка 30: | ||
|-  | |-  | ||
| 29 сентября 2016  | | 29 сентября 2016  | ||
| - | | ''Слипенчук Павел Владимирович'', аспирант каф. ИУ-8 (Информационная безопасность) МГТУ им.Баумана; ведущий инжерен Департамента Безопасности Сбербанка, специалист по разработке систем фрод-мониторинга  | + | | ''Слипенчук Павел Владимирович'', аспирант каф. ИУ-8 (Информационная безопасность) МГТУ им. Баумана; ведущий инжерен Департамента Безопасности Сбербанка, специалист по разработке систем фрод-мониторинга  | 
| - | | '''  | + | | '''«Информационная стеганография»'''  | 
| - | + | «Стеганография — это междисциплинарная наука и искусство сокрытия информации внутри другой информации. В эпоху активного развития вычислительной техники и BigData задачи стеганографии и противодействия стеганографии (стегоанализа) становяться все более и более актуальными. Отдельный интерес представляет собой синтез стеганографии и машинного обучения. В докладе будет объяснена актуальность стеганографии в XXI веке, будут приведены информационно-теоретческие модели стеганографических каналов передачи данных и высказан ряд авторских идей о синтезе стеганорафии и машинного обучения.»  | |
| [[Медиа:Steganography.pdf|слайды (pdf)]]  | | [[Медиа:Steganography.pdf|слайды (pdf)]]  | ||
| Строка 43: | Строка 43: | ||
|-  | |-  | ||
| - | | ''Остапец Андрей'', аспирант   | + | | ''Остапец Андрей'', аспирант 3 г.о.  | 
| '''ACM RecSys Challenge 2016'''  | | '''ACM RecSys Challenge 2016'''  | ||
| [http://2016.recsyschallenge.com/ соревнование]  | | [http://2016.recsyschallenge.com/ соревнование]  | ||
| Строка 62: | Строка 62: | ||
| ''Кудрявцев Георгий'', студент 5 курса  | | ''Кудрявцев Георгий'', студент 5 курса  | ||
| '''Чат боты'''  | | '''Чат боты'''  | ||
| - | |   | + | |  | 
|-  | |-  | ||
| rowspan=2| 27 октября 2016  | | rowspan=2| 27 октября 2016  | ||
| - | | ''Нижибицкий Евгений'', аспирант   | + | | ''Нижибицкий Евгений'', аспирант 3 г.о.  | 
| '''Классификация текстов и категоризация объявлений с помощью нейронных сетей ([[Конкурс_Avito-2016:_Распознавание_категории_объявления|конкурс Avito]])'''  | | '''Классификация текстов и категоризация объявлений с помощью нейронных сетей ([[Конкурс_Avito-2016:_Распознавание_категории_объявления|конкурс Avito]])'''  | ||
| - | |   | + | |  | 
|-  | |-  | ||
| ''Каюмов Эмиль'', 4-й курс  | | ''Каюмов Эмиль'', 4-й курс  | ||
| '''Обзор рекуррентных нейронных сетей и статьи Visualizing and Understanding Recurrent Networks'''  | | '''Обзор рекуррентных нейронных сетей и статьи Visualizing and Understanding Recurrent Networks'''  | ||
| - | | [https://arxiv.org/pdf/1506.02078.pdf arxiv]   | + | | [https://arxiv.org/pdf/1506.02078.pdf arxiv] [[Медиа:Rnn_and_visualizing_networks_27.10.2016.pdf|слайды (pdf)]] [http://karpathy.github.io/2015/05/21/rnn-effectiveness/ блог]  | 
|  | |  | ||
|-  | |-  | ||
| rowspan=2|3 ноября 2016  | | rowspan=2|3 ноября 2016  | ||
| - | | ''Трофимов Михаил'', аспирант   | + | | ''Трофимов Михаил'', аспирант 1 г.о.  | 
| '''Квантовое машинное обучение'''  | | '''Квантовое машинное обучение'''  | ||
| [https://www.dropbox.com/s/de1lnomry4l9pi4/qml.pdf?dl=0 слайды] [https://arxiv.org/abs/1409.3097 arXiv] [https://www.youtube.com/watch?v=wkBPp9UovVU лекция Ллойда]  | | [https://www.dropbox.com/s/de1lnomry4l9pi4/qml.pdf?dl=0 слайды] [https://arxiv.org/abs/1409.3097 arXiv] [https://www.youtube.com/watch?v=wkBPp9UovVU лекция Ллойда]  | ||
| Строка 85: | Строка 85: | ||
| ''Гурьянов Алексей'', 6-й курс  | | ''Гурьянов Алексей'', 6-й курс  | ||
| '''Обучение с подкреплением'''  | | '''Обучение с подкреплением'''  | ||
| - | |   | + | |  | 
|-  | |-  | ||
| Строка 97: | Строка 97: | ||
| '''Sequence Graph Transform (SGT): A Feature Extraction Function for Sequence Data Mining'''  | | '''Sequence Graph Transform (SGT): A Feature Extraction Function for Sequence Data Mining'''  | ||
| [https://arxiv.org/pdf/1608.03533.pdf arxiv]  | | [https://arxiv.org/pdf/1608.03533.pdf arxiv]  | ||
| - | |   | + | |  | 
| Строка 110: | Строка 110: | ||
| 24 ноября 2016  | | 24 ноября 2016  | ||
| ''Игнатов Алексей, 1-й курс асп.  | | ''Игнатов Алексей, 1-й курс асп.  | ||
| - | | '''Обучение с подкреплением.'''  | + | | '''Обучение с подкреплением. Обзор каким оно бывает. Несколько базовых алгоритмов'''  | 
|  | |  | ||
| Строка 127: | Строка 127: | ||
* [[Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2015-2016 уч. года]].  | * [[Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2015-2016 уч. года]].  | ||
* [[Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2014-2015 уч. года]].  | * [[Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2014-2015 уч. года]].  | ||
| - | * [[Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2013-2014 уч. года | Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания   | + | * [[Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2013-2014 уч. года | Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2013—2014 уч. года (осенний семестр)]].  | 
* [[Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2012-2013 уч. года (весенний семестр)]].  | * [[Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2012-2013 уч. года (весенний семестр)]].  | ||
* [[Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2012-2013 уч. года (осенний семестр)]].  | * [[Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2012-2013 уч. года (осенний семестр)]].  | ||
Версия 08:42, 23 ноября 2016
Руководитель спецсеминара: д.ф.-м.н., профессор Дьяконов Александр Геннадьевич
Направления работы на спецсеминаре
|   | См. также «Правила для постоянных участников». | 
|   | Информация для второкурсников! | 
 
  | 
В рамках работы на спецсеминаре есть два направления исследования:
- Теоретическое. Проводится в рамках алгебраического подхода к решению задач распознавания. Суть подхода: на алгоритмах, которые решают задачи обработки и анализа данных, специальным образом вводятся алгебраические операции. Например, можно складывать алгоритмы (получается опять алгоритм), умножать и т. д. Среди получаемых алгебраических выражений над «естественными» алгоритмами есть высокоэффективные алгоритмы. На спецсеминаре рассматриваются вопросы: как их строить, анализировать, реализовывать на ЭВМ и т. д. и т. п. Здесь же возникают задачи современной теории интерполяции: построения функций специального вида, заданных частично. Можно заниматься дискретным направлением: решать подобные задачи для функций, принимающих значения 0 и 1. Данное направление представляет особую ценность студентам, которые хотят получить самостоятельные результаты в науке и продолжить обучение в аспирантуре.
 - Прикладное. Решаются реальные прикладные задачи анализа данных (data mining). Например, построение рекомендательных систем, прогнозирование свойств динамических графов (в том числе и графов социальных сетей), прогнозирование поведения потребителей, анализ метаданных, классификация сигналов головного мозга, классификация сигналов-показаний работы механизмов, настройка спам-фильтров, автоматическая рубрикация текстов, прогнозирование финансовых временных рядов. От студентов требуется желание глубоко понять задачу (данные и скрытые в них закономерности), умение быстро осваивать новые методы (в незнакомой области), хорошо программировать, выдвигать гипотезы и фантазировать (последнее очень важно).
 
Заседания спецсеминара
|   | В осеннем семестре заседания будут проходить по четвергам в ауд. 637, начало в 18:00. Вход свободный. Начало - 29 сентября. | 
Заседания 2016—2017 уч. года
| Дата | Докладчик | Доклад | Материалы | 
|---|---|---|---|
| 29 сентября 2016 | Слипенчук Павел Владимирович, аспирант каф. ИУ-8 (Информационная безопасность) МГТУ им. Баумана; ведущий инжерен Департамента Безопасности Сбербанка, специалист по разработке систем фрод-мониторинга |  «Информационная стеганография»
 «Стеганография — это междисциплинарная наука и искусство сокрытия информации внутри другой информации. В эпоху активного развития вычислительной техники и BigData задачи стеганографии и противодействия стеганографии (стегоанализа) становяться все более и более актуальными. Отдельный интерес представляет собой синтез стеганографии и машинного обучения. В докладе будет объяснена актуальность стеганографии в XXI веке, будут приведены информационно-теоретческие модели стеганографических каналов передачи данных и высказан ряд авторских идей о синтезе стеганорафии и машинного обучения.»  | слайды (pdf) | 
| 6 октября 2016 | Никишин Евгений, студент 4-го курса | Asymmetric LSH for Sublinear Time Maximum Inner Product Search | слайды (pdf), статья | 
| Остапец Андрей, аспирант 3 г.о. | ACM RecSys Challenge 2016 | соревнование | |
| 13 октября 2016 | Севастопольский Артем, 4-й курс | Глубокие нейронные сети для сегментации изображений. Программирование нейронных сетей. | слайды (pdf) ipython notebook (Keras) статья 1 (FCN) статья 2 (U-Net) | 
| 20 октября 2016 | Иванов Сергей, 3-й курс | Проверка гипотезы Birthday Effect | слайды (slideshare) | 
| Кудрявцев Георгий, студент 5 курса | Чат боты | ||
| 27 октября 2016 | Нижибицкий Евгений, аспирант 3 г.о. | Классификация текстов и категоризация объявлений с помощью нейронных сетей (конкурс Avito) | |
| Каюмов Эмиль, 4-й курс | Обзор рекуррентных нейронных сетей и статьи Visualizing and Understanding Recurrent Networks | arxiv слайды (pdf) блог | |
| 3 ноября 2016 | Трофимов Михаил, аспирант 1 г.о. | Квантовое машинное обучение | слайды arXiv лекция Ллойда | 
| Гурьянов Алексей, 6-й курс | Обучение с подкреплением | ||
| 10 ноября 2016 | Гетоева Аида, 5-й курс. | Определение припадка у людей с эпилепсией по ЭЭГ | |
| Рысьмятова Анастасия, 5-й курс | Sequence Graph Transform (SGT): A Feature Extraction Function for Sequence Data Mining | arxiv | 
 
  | 
| 24 ноября 2016 | Викулин Всеволод, 5-й курс | Машинное обучение в поиске. | |
| 24 ноября 2016 | Игнатов Алексей, 1-й курс асп. | Обучение с подкреплением. Обзор каким оно бывает. Несколько базовых алгоритмов | 
 
  | 
| 1 декабря 2016 | Кибитова Валерия, 6-й курс | Резюмирование текстовой информации. (тема уточняется) | 
Заседния в предыдущих семестрах:
- Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2015-2016 уч. года.
 - Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2014-2015 уч. года.
 - Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2013—2014 уч. года (осенний семестр).
 - Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2012-2013 уч. года (весенний семестр).
 - Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2012-2013 уч. года (осенний семестр).
 - Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2011-2012 уч. года (весенний семестр).
 - Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2011-2012 уч. года (осенний семестр).
 - Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2010-2011 уч. года (весенний семестр).
 
Текущие задания участников спецсеминара
|   |  Список источников для потенциальных докладов.
 Доклады по статьям Доклады по авторам 
  | 
| Участник | Задание (каждый сам заполняет свою ячейку) | Комментарий | 
|---|---|---|
| Нижибицкий Евгений (А3) | Подготовка плана-проспекта диссертации, статьи в журнале из списка ВАК (подача до декабря). | |
| Остапец Андрей (А3) | Подготовка плана-проспекта диссертации, статьи в журнале из списка ВАК (подача до декабря). | |
| Кудрявцев Георгий (517) | Выбор темы курсовой работы | |
| Рысьмятова Анастасия (517) | Выбор темы для курсовой работы | |
| Вихрева Мария (517) | Выбор темы для курсовой работы | |
| Каюмов Эмиль (417) | Выявление ишемической болезни сердца по сигналам кардиограмм. | |
| Никишин Евгений (417) | Выбор темы для ВКР | |
| Севастопольский Артём (417) | ВКР "Методы распознавания глаукомы на основе нейронных сетей" | |
| Иванов Сергей (317) | Прогнозирование гибели супружеских пар функций | |
| Трофимов Михаил (МФТИ) | Подготовка плана-проспекта диссертации | |
| Гущин Александр (МФТИ) | Выбор темы для ВКР | |
| Кибитова Валерия (617) | МД "Анализ биомедицинских сигналов при помощи методов машинного обучения." | |
| Гурьянов Алексей (617) | МД "Стратегии исследования окружений в обучении с подкреплением с непрерывным пространством состояний." | 
Участники спецсеминара
| Год выпуска | Участники | 
|---|---|
| 2017 бак | 
 Никишин Евгений 
 Каюмов Эмиль 
 Севастопольский Артём 
  | 
| 2018 маг | 
 Кудрявцев Георгий 
 Рысьмятова Анастасия 
 Вихрева Мария 
  | 
| 2017 маг | 
 Кибитова Валерия 
  | 
| аспиранты 1 г.о. | 
 Трофимов Михаил 
 
  | 
| аспиранты 3 г.о. | 
 
  | 
Выпускники спецсеминара
| Год выпуска | Выпускники | 
|---|---|
| Аспирант, 2010 | 
 Карпович Павел 
 Диссертация: «K-сингулярные системы точек в алгебраическом подходе к распознаванию образов» (2010, успешно защищена 18.02.2011 по специальности 01.01.09).  | 
| 2015 бак | 
 Славнов Константин 
  | 
| 2015 | 
 Харациди Олег 
  | 
| 2014 | 
 
 
 
  | 
| 2013 | 
 Бобрик Ксения 
 Ермушева Александра 
 Кириллов Александр 
 Кондрашкин Дмитрий (перевёлся на другой спецсеминар) 
 
 
  | 
| 2012 | 
  | 
| 2010 | 
 Ахламченкова Ольга 
 Токарева (Одинокова) Евгения 
  | 
| 2009 | 
 Власова Юлия 
 Логинов Вячеслав 
 Фёдорова Валентина 
 Чучвара Алексндра (бакалавр) 
  | 
| 2008 | 
 Ломова Дарья 
 Вершкова Ирина 
  | 
| 2007 | 
 Кнорре Анна 
 Карпович Павел 
 Сиваченко Евгений 
  | 
| 2006 | 
 Ховратович (Курятникова) Татьяна 
 Мошин Николай 
  | 
| 2005 | 
 Каменева Наталия 
 Силкин Леонид 
  | 
Некоторые решаемые прикладные задачи
- Прогнозирование временных рядов По характеристикам процесса в прошлом предсказать поведение в будущем. Знание о прошлом может быть неполным или ошибочным. Типичный пример: прогнозирование денежных сумм, которые будут сниматься с банкомата в течение следующей недели.
 - Классификация технических сигналов и сигналов головного мозга По описанию изменения некоторой характеристики процесса необходимо определить её класс. Например, по электрокортикограмме определить ментальное состояние человека. При этом обучающая выборка (данные, которые у нас есть) была собрана достаточно давно, а тестирование алгоритма будет проводиться потом (при изменённых внешних условиях, а следовательно, при изменённых характеристиках данных).
 - Фильтрация спама Настроить спам-фильтр на некотором универсальном обучающем множестве (данных спам-ловушек) так, чтобы он хорошо работал на компьютере конкретного пользователя (без дополнительной донастройки).
 - Иерархическая классификация текстов Написать алгоритм автоматической категоризации документов. Например, новостные рассылки необходимо распределить по каталогам «спорт/футбол», «спорт/биатлон», «музыка/концерты», «музыка/рок/исполнители» и т. д.
 - Ранжирование документов на основе обучающего множества Написать алгоритм, который оценивает релевантность документа поисковому запросу. Для фиксированного запроса упорядочить документы (используя их признаковые описания) так, чтобы порядок отражал «адекватность» запроса.
 - Прогноз связности графа социальной сети Предсказать изменения динамического графа социальной сети, в частности, появление новых рёбер.
 - Прогнозирование успешности грантов и проектов По описанию заявки оценить перспективность выполнения данного проекта.
 - Разработка рекомендательного алгоритма, который делает актуальные предложения купить какой-то товар, воспользоваться услугой или прочитать материал.
 - Предсказывание визитов покупателей и сумм покупок для сети супермаркетов Разработка алгоритма, который предсказывает дату первого визита и сумму покупки каждого клиента.
 - Оценка фотографий по метаданным Прогноз «интересности» фото-материалов на основе анализа названия, описания, GPS-координат съёмки и т.п.
 - Задача кредитного скоринга Прогнозирование надёжности клиента банка по обязательствам выплаты процентов кредита.
 

