Спецкурс «Прикладные задачи анализа данных»
Материал из MachineLearning.
| Строка 30: | Строка 30: | ||
{{tip|  | {{tip|  | ||
'''Засчитанные ники соревнования [https://www.kaggle.com/c/crowdflower-search-relevance/ Search Results Relevance]'''  | '''Засчитанные ники соревнования [https://www.kaggle.com/c/crowdflower-search-relevance/ Search Results Relevance]'''  | ||
| - | * Evgeny Nekrasov (I want to PZAD)  | + | * 39rus (I want to PZAD) - отличный результат  | 
| - | * Artem (I want to PZAD)  | + | * Evgeny Nekrasov (I want to PZAD) - отличный результат  | 
| - | *   | + | * Artem (I want to PZAD) - отличный результат  | 
| + | |||
| + | * Evgeny Eltyshev (I want to PZAD)   | ||
* Denis Tsitko (I want to PZAD)  | * Denis Tsitko (I want to PZAD)  | ||
| - | + | ||
* anketer (I want to PZAD)  | * anketer (I want to PZAD)  | ||
* Andrey Akhmetov (I want to PZAD)  | * Andrey Akhmetov (I want to PZAD)  | ||
| - | |||
| - | |||
* cheerupdude (I want to PZAD)  | * cheerupdude (I want to PZAD)  | ||
| - | * Nonary Rustam( I want to PZAD)  | + | * kvas7andy (I want to PZAD) - формальное участие  | 
| + | * Johny Cheescutter (I want to PZAD) - низкий результат  | ||
| + | * Nonary Rustam( I want to PZAD) - формальное участие  | ||
| + | |||
| + | * Pavel Blinov (I want to PZAD)  | ||
| + | * Georgy Ivanov (I want to PZAD)  | ||
| + | * HeBo (I want to PZAD)  | ||
| + | * Igor Subbotin (I want to PZAD)  | ||
| + | * Pasha Podolsky (I want to PZAD)  | ||
| + | * Maxim Kharchenko (I want to PZAD)   | ||
| + | * golovan (I want to PZAD) - слабая активность  | ||
| + | |||
}}  | }}  | ||
Версия 14:28, 7 июля 2015
|   |  В сентябре 2015 года будет объявлен новый набор слушателей спецкурса.
 Поскольку обычно желающих очень много, а работа на спецкурсе подразумевает сильную вовлечённость студентов и небольшое число слушателей, то будет произведён отбор. Для участия в отборе необходимо: 
 Список допустимых соревнований: 
 
 Как всегда: программа нового года будет слегка отличаться от предыдущих (добавлены новые темы, улучшено содержание). Курс открыт для всех желающих, но при их большом количестве студенты/аспиранты ВМК МГУ пользуются преимуществом. Вопросы можно задавать в комментариях к этому посту.  | 
|   |  Засчитанные ники соревнования Search Results Relevance
 
 
 
  | 
Содержание | 
Аннотация
|   | Данный курс стал победителем конкурса инновационных учебных технологий. | 
Лектор: Дьяконов Александр
Основная цель: практика решения современных задач классификации, прогнозирования, регрессии, рекомендации и т.п., подготовка участников к соревнованиям на платформах Kaggle и Algomost.
Мероприятие проходит в двух режимах:
- спецкурса – лекции о решении прикладных задач, обучение некоторым системам анализа данных (например R, Matlab, Python+ и т.п.
 - спецсеминара – обсуждение решаемых задач, выработка общих стратегий, разделение работы в рамках участия в соревновании одной командой, мозговой штурм и т.п.
 
Важно: от участников потребуется выполнение нетривиальных практических заданий!
Выпускники ПЗАДа, известные в спортивном анализе данных
| 2013 | 2014 | 2015 | 
|---|---|---|
|  Трофимов Михаил Рыжков Александр Софиюк Константин Фонарев Александр Харациди Олег  |  Гущин Александр Семёнов Станислав Фенстер Александра Ульянов Дмитрий Сиверский Михаил Шапулин Андрей Нижибицкий Евгений Остапец Андрей  | это место вакантно | 
Правила
- Рассылки материалов делаются только зарегистрированным слушателям курса (перечислены в таблице слушателей).
 - Слушатели, которые перестают делать домашние задания, удаляются из таблицы.
 - За каждое задание можно было получить от 0 до 10 штрафных баллов. 10 штрафных баллов понижают итоговую оценку на один балл.
 
Таблица появится после завершения регистрации
Лекции
Здесь будет выложена программа нового (2015 года) - по мере чтения курса.
Старые программы см. на страницах прошлых лет.
Отчётность
- отчёты по решению конкурсных задач (доклады с презентацией + исходники)
 - зачёт с оценкой в конце семестра
 
Страницы курсов прошлых лет
Спецкурс «Прикладные задачи анализа данных» (2013 год)
Спецкурс «Прикладные задачи анализа данных» (2014 год)
Ссылки
- Книга Jure Leskovec, Anand Rajaraman, Jeff Ullman Mining of Massive Datasets * Неплохая книга на английском языке с обзором основных задач и методов в анализе данных (уровень сложности - средний).
 - Книга Beautiful Visualization: Looking at Data through the Eyes of Experts (Theory in Practice) по визуализации данных
 - Книга Шурыгин А.М. Математические методы прогнозирования * Неплохие идеи для решения некоторых практических задач статистики (но в целом, специфична)
 - Статья Прогноз поведения клиентов супермаркетов с помощью весовых схем оценок вероятностей и плотностей.
 - Книга Ту Дж., Гонсалес Р. Принципы распознавания образов * Уже чуть устаревшая книга. Но полистать стоит! Первая «энциклопедия по методам классификации».
 - Прогнозирование рядов соревнования «Tourism Forecasting Part Two» (414Кб) * Подробное описание некоторых простых алгоритмов для прогнозирования туристических временных рядов.
 - Статья A Blending of Simple Algorithms for Topical Classification * Описание метода классификации текстов. Содержание рассказывалось на лекции.
 - Книга К.Д. Маннинг, П. Рагхаван, Х. Шютце «Введение в информационный поиск» * Простая, но хорошая книга по основам работы с текстом (прочитать обязательно).
 - Статья Алгоритмы для рекомендательной системы: технология LENCOR.
 - Книга Научно-популярная лекция «Введение в анализ данных» (PDF, 1.4 Мб) * Вводная лекция, которая написана для просеминара.
 - Анализ данных, обучение по прецедентам, логические игры, системы WEKA, RapidMiner и MatLab (практикум на ЭВМ кафедры математических методов прогнозирования) * Глава 12 «Шаманство в анализе данных».
 - Научно-популярная лекция «Шаманство в анализе данных» (1.21Мб) * Переработка предыдущего источника в научно-популярную лекцию.
 - Научно-популярная лекция «Чему не учат в анализе данных и машинном обучении» * Рассказываются тонкости решения задач, которые умалчиваются в основных курсах.
 
Аналогичные курсы
- Data Science * Аналогичный (по духу) гарвардский курс
 - Страница спецсеминара «Алгебра над алгоритмами и эвристический поиск закономерностей» * Приведены ссылки на сайты с данными реальных задач анализа данных.
 
Ещё ссылки
Неплохая короткая демка про соревнования в анализе данных, платформы для соревнований и возможности системы R.

