Глубокое машинное обучение (онлайн-учебник)
Материал из MachineLearning.
 (→Аннотация)  | 
			|||
| Строка 54: | Строка 54: | ||
* классификация вершин и рёбер графа, восстанавление недостающих рёбер на графе.  | * классификация вершин и рёбер графа, восстанавление недостающих рёбер на графе.  | ||
| - | В августе 2025 основные темы учебника были финализированы. В будущем планируется добавление новых тем.  | + | |
| + | Учебник начал использоваться в курсах по машинному и глубокому обучению на факультете ВМК МГУ и в магистратуре Т-Банка/МФТИ с сентября 2024 года.  | ||
| + | |||
| + | В августе 2025 основные темы учебника были финализированы.   | ||
| + | |||
| + | В будущем планируется добавление новых тем.  | ||
== Ссылки ==  | == Ссылки ==  | ||
Текущая версия
Китов В.В. Глубокое машинное обучение, 2025, онлайн-учебник.
Аннотация
Онлайн-учебник по машинному обучению и глубокому обучению (нейросетям) на основе курсов "Методы машинного обучения" и "Глубокое машинное обучение", читаемых на факультете ВМК МГУ им. Ломоносова и в магистратуре Т-Банка/МФТИ.
Материалы учебника свободно доступны в виде веб-страниц, организованных в виде интуитивной вложенной иерархической структуры, а связанные друг с другом понятия связаны гиперссылками для удобства навигации и изучения смежных тем. В конце разделов добавлены проверочные вопросы, а также главы со ссылками на дополнительную литературу для более полного погружения в каждую тему.
Первая часть учебника описывает весь процесс построения моделей машинного обучения (machine learning) для решения задач регрессии и классификации:
- постановка и формализация задачи,
 - подготовка данных,
 - выбор модели и подбор гиперпараметров,
 - оценка качества моделей,
 - интерпретация результатов.
 
В ней рассматриваются классические методы машинного обучения:
- метрические методы,
 - линейные модели и их расширение с помощью ядер,
 - деревья решений.
 
Особое внимание уделяется построению прогнозов, используя не одну модель, а композицию разных моделей (ансамбль). Рассматриваются популярные методы построения ансамблей моделей, такие как
- бэггинг
 - метод случайных подпространств
 - случайный лес
 - особо случайные деревья
 - бустинг.
 
В двух отдельных разделах онлайн-учебника рассматриваются подходы к интерпретации работы моделей машинного обучения.
Вторая часть учебника посвящена глубокому обучению (deep learning), то есть использованию нейросетей в задачах эффективного представления знаний (representation learning) и прогнозирования. 
Рассматривается нейросетевая обработка табличных данных, изображений, последовательностей, временных рядов, текстов и графов.
Описываются основные нейросетевые архитектуры:
- многослойный персептрон,
 - автокодировщики,
 - RBF-сети,
 - сиамские сети,
 - свёрточные нейросети для обработки последовательностей и изображений,
 - рекуррентные сети,
 - трансформеры,
 - графовые нейросети.
 
Изучаются методы эффективной настройки глубоких нейросетевых моделей, включающие начальную инициализацию моделей и методы оптимизации нейросетей.
Особое внимание уделено способам регуляризации нейросетевых моделей, чтобы контролировать степень переобучения.
Помимо задач регрессии и классификации, рассматриваются и другие применения глубоких нейросетей:
- сжатие объектов (снижение размерности);
 - семантическая сегментация, детекция объектов и instance-сегментация объектов на изображениях;
 - построение эмбеддингов для слов и параграфов текста, а также для произвольных объектов;
 - генерация текстов и последовательностей других дискретных объектов
 - классификация вершин и рёбер графа, восстанавление недостающих рёбер на графе.
 
Учебник начал использоваться в курсах по машинному и глубокому обучению на факультете ВМК МГУ и в магистратуре Т-Банка/МФТИ с сентября 2024 года.
В августе 2025 основные темы учебника были финализированы.
В будущем планируется добавление новых тем.

