Материал из MachineLearning.
Работа над статьёй велась последовательно, с использованием методологии RAG и уточняющих промптов для улучшения стиля и структуры.
Этап 1: Проектирование и RAG-контекст
Для обеспечения максимального соответствия программе курса, в качестве контекста (Knowledge Base) модели на вход были поданы:
1. Исходный текст заготовки статьи от 2008 года на ML.ru.
2. PDF-презентация первой лекции К.В. Воронцова "Основные понятия машинного обучения".
Был сформулирован следующий первый системный промпт:
| Роль: Ты — ведущий академический исследователь, эксперт на стыке машинного обучения (ML) и философии науки.
Задача: Написать глубокую и объемную статью "Принцип эмпирической индукции Бэкона в машинном обучении" для энциклопедии MachineLearning.ru.
Формат: MediaWiki-разметка. Математику строго оборачивать в теги <tex>...</tex>. Модель: Gemini 3.1 Pro Preview.
Ограничения и структура:
1. Введение: связь эмпирической индукции и парадигмы обучения по прецедентам.
2. Исторический контекст: Фрэнсис Бэкон, "Таблицы открытия" как прообраз датасетов.
3. Формализация идей: описать переход от философии к математике (выборка X^\ell, признаки f_j(x)).
4. Минимизация эмпирического риска: ЯВНО прописать формулу эмпирического риска Q(w) и функции потерь \mathcal{L}.
5. Автоматизация научного метода: провести аналогию шагов познания (Верификация Бэкона -> Обучение/ERM; Фальсифицируемость Поппера -> Кросс-валидация и ошибка на тесте X^k).
|
Этап 2: Упрощение стиля и углубление структуры
Первая версия статьи получилась излишне перегруженной сложной терминологией, а оглавление статьи выглядело слишком плоским. Был отправлен уточняющий промпт на реструктуризацию и упрощение языка.
| Текст слишком перегружен тяжелыми философскими терминами. Перепиши статью, выполнив следующие требования:
1. Упрости язык изложения: сделай предложения короче и понятнее для студентов. Избавься от избыточного канцелярита, но полностью сохрани строгий математический аппарат.
2. Сделай структуру статьи более глубокой и разветвленной. Разбей основные разделы на подразделы (используя заголовки уровня === Подраздел ===), чтобы оглавление (содержание) статьи стало древовидным и подробным.
3. Оформи подразделы для "Таблиц открытия", математической формализации признаков, разбора "Идолов разума" и шагов Поппера/Бэкона.
|
Этап 3: Попытка автоматического исправления разметки
Модель частично проигнорировала правила форматирования формул MediaWiki. Был отправлен третий корректирующий промпт на расстановку тегов <tex>.
| Проанализируй текст, который ты только что выдала. Ты проигнорировала правило о тегах <tex>! Из-за этого формулы отображаются на сайте как простой текст LaTeX.
Перепиши всю статью заново, выполнив требования:
1. Абсолютно все формулы, переменные (включая одиночные латинские буквы X, Y, a, w, M, h, l), индексы и математические знаки оберни в теги <tex>...</tex>.
2. Выключные формулы начни с двойного двоеточия: ::<tex>...</tex>
3. Замени все маркдаун-списки (-) на стандартные вики-звездочки (*).
|
Этап 4: Ручная доработка
Поскольку модель не смогла со 100% точностью расставить теги к одиночным переменным в тексте и упорно вставляла пробелы перед звёздочками списков, финальная разметка была скорректирована человеком вручную:
- Из списков "Таблицы открытия" и "Идолы разума" были удалены лидирующие пробелы, что позволило избавиться от некорректных синих рамок на предпросмотре.
- Оглавление перенесено на стандартную позицию слева (удален плавающий тег TOCright).
- Все пропущенные переменные и индексы (включая одиночные
,
,
,
,
) были вручную обёрнуты в теги <tex>...</tex>.
- Проведена викификация терминов.
- Раздел литературы оформлен с использованием шаблонов {{книга}}.
Polina Khadralinova 19:23, 23 июня 2026 (MSD)