Философия. Введение в ИИ (курс лекций, К.В.Воронцов)

Материал из MachineLearning.

Перейти к: навигация, поиск

Содержание

Курс Философия. Введение в ИИ состоит из двух параллельных веток, которые сомкнутся ближе к концу курса.

Ветка А — математическая, введение в машинное обучение. Цель — изучить основные задачи, подходы, модели и методы, чтобы разобраться, каким образом Искусственный интеллект прошёл путь от Дартмутского семинара 1956 года до больших языковых моделей и интеллектуальных агентов сегодняшнего дня, какие идеи оказались в итоге ключевыми, что ИИ представляет из себя внутри, и почему это работает.

Ветка Б — гуманитарная, на стыке философии и практической работы с большими языковыми моделями. Цель — научиться задавать вопросы, видеть проблемы и искать решения, связанные с влиянием ИИ на человека и общество. Например, ответить самому себе на вопрос, чем заниматься и чем не заниматься в области ИИ — создавать возможности или устранять угрозы? Как превращать кодексы этики ИИ и категорический императив Канта в эффективные промпты, приносящие пользу людям. Как делать визионерские прогнозы про общий искусственный интеллект (AGI, Artificial General Intelligence), возможно ли сделать его человечным, в каком смысле, и что для этого можно делать уже сегодня.

Курс вводный. В качестве заданий НЕ предлагается доказывать теоремы, разрабатывать вычислительные методы, решать контесты или задачи на реальных датасетах. Этого будет достаточно в других курсах. Мы будем писать статьи про искусственный интеллект и машинное обучение на вики MachineLearning.ru, с помощью искусственного интеллекта.

От студентов требуются знания курсов линейной алгебры, математического анализа, теории вероятностей математической статистики, методов оптимизации.

Программа курса

Лекция 1А. Научный метод и основы машинного обучения

Домашинная история машинного обучения

Базовые определения и обозначения

Примеры прикладных задач

Лекция 1Б. Эпистемология машинного обучения и научный метод

Эпистемология (от греч. ἐπιστήμη — знание и λόγος — учение) — философско-методологическая дисциплина, которая фокусируется на исследовании знания как такового, его строения, структуры, функционирования и развития.

Метод научного познания

  • принцип верифицируемости (философ Ф.Бэкон)
  • принцип фальсифицируемости (философ К.Поппер)
  • принцип погрешимости, фаллибилизма (философ и математик Ч.Пирс)
  • принцип соответствия (физик Н.Бор)
  • принцип минимальной достаточности (францисканский монах У.Оккам)
  • принцип воспроизводимости (химик Р.Бойль)
  • принцип научной честности (физик Р.Фейнман)

Математические технологии автоматизации научного метода

Место и роль AI/ML в современном мире

  • отчёты правительства США о роли AI в автоматизации будущего (2016)
  • интеллект-карта — тексто-графическое представление области знаний AI/ML
  • взаимоотношение областей AI и ML
  • определения искусственного интеллекта
  • вики-проект MachineLearning.ru

Лекция 2А. Градиентная оптимизация и линейные модели

Градиентные методы оптимизации

Основные типы задач обучения с учителем

Линейные модели

Лекция 2Б. Представление знаний

Что такое знания

  • концепция DIKW (данные — информация — знания — мудрость)
  • накопление, представление и передача научного знания; связь с научным методом
  • формы представления знаний: человеко-ориентированные и машинно-ориентированные
  • представление знаний для машины: фреймы, онтологии, продукции, экспертные системы
  • представление знаний для человека: гипертекст, вики, интеллект-карты

Интеллект-карты и радиантное мышление

  • принцип мышления «от главного к второстепенному»
  • иерархическое (радиантное) структурирование знаний и идей
  • структурированность как фактор доверия между людьми, между человеком и ИИ
  • 16 принципов построения интеллект-карт
  • интеллект-карты как инструмент индивидуального и коллективного мышления
  • концепции «коллективного разума»

Глобальная карта знаний человечества

  • 6 принципов построения карт знаний
  • глобальное семантическое ядро: понятийное, естественнонаучное, цивилизационное
  • задачи автоматизации построения карт, иерархической суммаризации текстов
  • место и роль генеративного ИИ в создании глобальной карты знаний

Лекция 3А. Нейронные сети

Многослойные нейронные сети

  • нейрон как линейный классификатор, модель МакКаллока—Питтса (1943)
  • первый нейрокомпьютер Mark-1 Фрэнка Розенблатта (1960)
  • многослойные нейронные сети
  • двух слоёв достаточно!(?) Теоремы об универсальных аппроксиматорах

Метод обратного распространения ошибок

  • постановка задачи оптимизации
  • быстрое дифференцирование суперпозиции функций
  • метод стохастического градиента
  • эвристики для ускорения сходимости: Dropout, ResNet, BatchNorm

Глубокие нейронные сети

  • зимы искусственного интеллекта
  • преимущества и обоснования глубоких сетей
  • обучаемая векторизация данных

Лекция 3Б. Цивилизационная роль искусственного интеллекта

Эволюция систем передачи знаний и смена технологических укладов

  • интеллект-карта: эволюция систем передачи знаний
  • технологические уклады, циклы Кондратьева и технологические революции
  • закон Мура и технологическая сингулярность по Курцвейлу

Четвёртая и пятая парадигмы науки

  • первая — феноменологическая: наблюдения, эксперименты, измерения, данные
  • вторая — теоретическая: объяснения, теории, законы
  • третья — вычислительная: компьютерное моделирование, физичные модели
  • четвёртая — информационная: извлечение знаний из больших данных, нефизичные модели
  • пятая — машинная: автоматизация полного цикла исследований

Возможности и угрозы искусственного интеллекта

  • AI4Research — автоматизация анализа научной литературы
  • AI4Science — автоматизация научных исследований
  • архив науки становится объектом непрерывной обработки информации
  • человек становится архитектором, отвечая за целеполагание
  • ИИ становится генератором гипотез и рутинным исполнителем
  • риски генеративного ИИ: галлюцинации у модели, когнитивные искажения у пользователя

Задание 1. Генерация вики-статей на MachineLearning.ru

Лекция 4А. Эволюция идей машинного обучения

Вектор → вектор → скаляр

  • задачи с векторными признаковыми описаниями объектов
  • методы преобразования признаков: ослабление и усиление шкал, нормализация, стандартизация
  • конструирование признаков, примеры прикладных задач

Структура → вектор → скаляр

  • свёрточные сети для классификации изображений — прорыв векторизации
  • конкурс ImageNet, сеть AlexNet — прорыв больших данных
  • сеть ResNet — прорыв глубины
  • векторизация сложно структурированных данных, примеры прикладных задач
  • перенос обучения, самостоятельное обучение — прорыв предобучения

Структура → вектор → структура

  • автокодировщики, вариационный автокодировщик
  • многозадачное обучение
  • фундаментальные модели
  • генеративная состязательная сеть

Лекция 4Б. Конструирование образов будущего

Системное визионерство и возможные сценарии будущего

Интеллектуальные помощники и цифровое послесмертие

Литературные вселенные фантастики ближнего прицела

Задание 2. Визионерский сценарий развития технологического будущего. Предложить стратегию устранения угроз. Условие: ноль фантастических допущений.

Лекция 5А. Обучаемая векторизация данных

Матричные разложения

  • метод главных компонент
  • матричные разложения LFM, NNMF, PLSA
  • вероятностное тематическое моделирование
  • рекомендательные системы

Векторные представления текстов и графов

  • многомерное шкалирование
  • графовые разложения
  • обобщённый автокодировщик на графах GraphEDM
  • модели дистрибутивной семантики, word2vec

Трансформеры и большие языковые модели

  • модель внимания
  • трансформер для машинного перевода
  • трансформер-кодировщик BERT, критерии обучения
  • генеративный предобученный трансформер GPT
  • эмерджентные свойства больших языковых моделей

Лекция 5Б. Великолепное человечество

Magnifica Humanitas — первая энциклика папы римского Льва XIV, посвящённая «сохранению человеческой личности в эпоху искусственного интеллекта», опубликована 25 мая 2026 г.

Возможности и угрозы искусственного интеллекта

Социальная доктрина

От кодексов этики к регламентам и стандартам

Лекция 6А. Методология машинного обучения

Методология решения практических задач

  • межотраслевой стандарт CRISP-DM
  • свойства реальных данных: сырые, неполные, неточные, неудобные, разнородные, «грязные»
  • предобработка данных: обработка пропусков, детекция аномалий и выбросов

Типология задач и моделей машинного обучения

  • обучение с учителем: регрессия, классификация, ранжирование
  • обучение без учителя: восстановление плотности распределения, разделение смеси распределений, кластеризация, векторизация
  • совместное обучение моделей: частичное обучение, суррогатное обучение и дистилляция, обучение с привилегированной информацией
  • шесть школ машинного обучения по П.Домингосу: символизм, коннекционизм, эволюционизм, байесионизм, аналогизм, композиционизм
  • нужно ли искать «мастер-алгоритм»?

Оценивание качества и выбор моделей

  • оценивание качества классификации: ROC-кривая, AUROC, точность и полнота
  • оценивание качества и выбор моделей: внешние и внутренние критерии, кросс-проверка,
  • анализ распределения ошибок или потерь
  • автоматический выбор моделей и гиперпараметров (AutoML)
  • мета-обучение (meta-learning, learning to learn)
  • A/B-тестирование, анализ ошибок

Лекция 6Б. Цивилизационное мировоззрение

Цивилизационная система ценностей

Технологическая сингулярность и закон сохранения цивилизации

Этика человеко-машинной цивилизации

Лекция 7А1. Конструирование моделей: шесть научных школ

Символизм и эволюционизм

  • понятие логической закономерности
  • решающие деревья
  • индукция правил
  • задача и методы отбора признаков
  • эволюционные и генетические алгоритмы
  • символьная регрессия

Аналогизм и байесионизм

  • метрические методы классификации, регрессии, восстановления плотности, кластеризации
  • статистические методы; байесовский классификатор
  • байесовское обучение

Коннекционизм и композиционизм

  • искусственные нейронные сети
  • бустинг и бэггинг
  • смесь экспертов

Лекция 7А2. Динамические задачи машинного обучения

Инкрементное обучение

  • адаптивные методы краткосрочного прогнозирования временных рядов
  • адаптивная селекция и композиция моделей
  • алгоритм Hedge

Активное обучение

  • семплирование по неуверенности
  • краудсорсинг

Обучение с подкреплением

  • задача однорукого бандита, UCB
  • среда с состояниями, Q-обучение
  • параметризация стратегии и policy gradient
  • модель актёра-критика

Задания по курсу

Скользящий контроль — пример статьи, сгенерированной LLM (промпты здесь: Обсуждение:Скользящий контроль)

См. также

Литература

Учебники

  1. Онлайн-учебник по машинному обучению от ШАД.
  2. Николенко С. Машинное обучение: основы, 2025. — 608 c.
  3. Николенко С., Кадурин А., Архангельская Е. Глубокое обучение: основы, 2024. — 480 c.
  4. Мэрфи К.П. Вероятностное машинное обучение. Введение, 2022. – 940 с.
  5. Мэрфи К.П. Вероятностное машинное обучение. Дополнительные темы: основания, вывод, 2024. – 810 с.
  6. Дайзенрот М. П, Альдо Фейзал А, Чен Сунь Он Питер. Математика в машинном обучении, 2024. – 512 с.
  7. Уилке К. Основы визуализации данных: пособие по эффективной и убедительной подаче информации, 2024. – 352 с.
  8. Шай Шалев-Шварц, Шай Бен-Давид. Идеи машинного обучения. От теории к алгоритмам, 2019. — 436 c.
  9. Мерков А.Б. Распознавание образов. Введение в методы статистического обучения. 2011. 256 с.
  10. Мерков А.Б. Распознавание образов. Построение и обучение вероятностных моделей. 2014. 238 с.
  11. Коэльо Л.П., Ричарт В. Построение систем машинного обучения на языке Python. 2016. 302 с.
  12. Hastie T., Tibshirani R., Friedman J. The Elements of Statistical Learning. Springer, 2014. — 739 p.
  13. Bishop C.M. Pattern Recognition and Machine Learning. — Springer, 2006. — 738 p.

Науч-поп

  1. Марков С. Охота на электроовец. Большая книга искусственного интеллекта. Том 1. 2024. — 568 с.
  2. Марков С. Охота на электроовец. Большая книга искусственного интеллекта. Том 2. 2024. — 784 с.
  3. Домингос П. Верховный алгоритм. Как машинное обучение изменит наш мир, 2016. — 336 c.

= Список подстраниц