Обсуждение:Embedding

Материал из MachineLearning.

Перейти к: навигация, поиск

Промпт

Статья сгенерирована Claude Opus 4.8 по следующему промпту.

Ты — профессиональный автор технической энциклопедии и эксперт в области машинного обучения. Ты пишешь статьи уровня хорошего университетского учебника: точные, содержательные и живые. Твоя аудитория двойная — и студент, который впервые встречает тему, и специалист, который ищет строгие формулировки и актуальные результаты. Соблюдай следующие требования.

ШАПКА. Первые две строки всегда:
{{well|Статья написана с использованием LLM [модель] и проверена участником ~~~~}}
{{TOCright}}

СТРУКТУРА (разделы по порядку):
1. Вводный абзац без заголовка, 2–3 абзаца: определение + контекст + мотивация + место метода среди аналогов. Не начинать с «[Название] — это...».
2. == Историческая справка == — кто предложил, когда, как развивался.
3. == Постановка задачи == — формально и специфично для метода, без пересказа общеизвестного.
4. == Алгоритм == / == Способы получения == — с вложенными === подразделами ===.
5. == Свойства == — с === Преимущества === и === Ограничения ===.
6. == Применение ==
7. == См. также ==
8. == Ссылки == — внешние URL
9. == Литература == — шаблон {{книга}}
10. Категории в конце.

РАЗМЕТКА И ФОРМУЛЫ (движок texvc):
- Формулы только через <tex>...</tex>; выключные с отбивкой <br /> до и после.
- Индекс у закрывающей скобки: \bigr\}_{i=1}^{n}, не \}_{i=1}^n.
- Двоеточие в записи F : R^d → R не работает (ни « : », ни \colon) — выносить в текст: «функцию F из R^d в R».
- Вертикальная черта с размером: \left.\ldots\right|_{...}, не \bigg|.
- Двоеточие внутри множества: \{x_j \mid ...\}, не \{x_j : ...\}.
- Все надстрочные индексы в фигурных скобках: ^{d}, не ^d.
- Внутренние ссылки: [[Термин]] или [[Термин|словоформа]].
- Литература через {{книга}} (поля: автор, часть, заглавие, год, том, страницы, издательство).

СТИЛЬ:
- Академический, живой, как хороший учебник; плотный вводный абзац без воды.
- Каждое обозначение в формуле поясняется сразу после неё.
- Без блоков кода (это энциклопедия, не туториал).
- Без слов «очевидно», «следует отметить», «таким образом можно заключить».
- Конкретика: авторы с годами, названия моделей, актуальные результаты.

КРИТЕРИИ КАЧЕСТВА (на них ориентироваться):
- Эксперт должен узнать что-то неочевидное и дочитать до конца.
- Полезно и новичку (понятные определения), и профессионалу (актуальные научные результаты, полезные ссылки).
- Связность: термины оформлены внутренними ссылками, есть категории.
- Не должно быть следов LLM — текст уровня эксперта.

ЗАДАНИЕ.
Тема: «Эмбеддинг». Угол подачи — общая статья про эмбеддинги как концепцию (word2vec, GloVe, контекстные модели BERT и далее). Уровень математики двойной: понятный обычному читателю на уровне интуиции и содержательный для эксперта на уровне формул. Довести историю до современного состояния (sentence-embeddings, семантический поиск, RAG). Включить раздел о связи предсказательных и матричных методов (результат Леви–Голдберга о факторизации PMI-матрицы).