Промпт-инжиниринг

Материал из MachineLearning.

Версия от 14:49, 16 июня 2026; Emil Petrov (Обсуждение | вклад)
(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)
Перейти к: навигация, поиск
Статья написана с использованием LLM Claude Sonnet 4 и проверена участником Emil Petrov 15:17, 16 июня 2026 (MSD)

Промпт приводится полностью в Обсуждение:Промпт-инжиниринг


Содержание

Про́мпт-инжини́ринг (англ. prompt engineering) — дисциплина, изучающая методы составления текстовых инструкций (промптов) для управления поведением больших языковых моделей и других генеративных систем искусственного интеллекта с целью получения точных, релевантных и полезных ответов[1]. В отличие от традиционного программирования, промпт-инжиниринг не требует знания языков программирования — взаимодействие с моделью осуществляется на естественном языке.

История

Понятие «промпт» появилось вместе с первыми языковыми моделями, работающими по принципу дополнения текста (text completion). GPT-2 (2019) и GPT-3 (2020) от OpenAI показали, что формулировка запроса существенно влияет на качество ответа. С выходом ChatGPT в 2022 году промпт-инжиниринг оформился в самостоятельную практическую дисциплину: появились руководства, исследовательские работы и специализированные курсы.

Ключевые вехи:

  • 2020 — «few-shot learning» в GPT-3: демонстрация того, что несколько примеров в промпте резко улучшают качество[1];
  • 2022 — «chain-of-thought prompting»: пошаговые рассуждения в промпте улучшают решение математических задач[1];
  • 2023 — выход руководства DAIR.AI «Prompt Engineering Guide»;
  • 2024 — интеграция методов промпт-инжиниринга в корпоративные RAG-системы.

Базовые техники

Zero-shot prompting

Простейший вид: задача формулируется без примеров. Модель полагается исключительно на знания, полученные при предобучении.

Few-shot prompting

В промпт включается несколько пар «вход→выход» (shots), которые задают желаемый формат ответа.

Формально, если x — входной запрос, а (x_1,y_1),\ldots,(x_k,y_k) — демонстрационные примеры, то промпт строится как конкатенация:

P = x_1\,\|\,y_1\,\|\,\cdots\,\|\,x_k\,\|\,y_k\,\|\,x,

и модель максимизирует p(y\mid P).

Chain-of-Thought (CoT)

Добавление фразы «Давай думать шаг за шагом» побуждает модель строить промежуточные рассуждения перед финальным ответом. В нотации:

y^* = \arg\max_y\, p(y \mid x,\, c),

где c — цепочка рассуждений (chain of thought).

Self-consistency

Метод, при котором модель несколько раз генерирует цепочку рассуждений с температурой T>0, а финальный ответ выбирается большинством голосов (majority voting).

Tree of Thoughts (ToT)

Расширение CoT: вместо линейной цепочки рассуждений строится дерево возможных шагов. На каждом узле модель оценивает перспективность ветки, что позволяет реализовать поиск по пространству рассуждений.

ReAct

Сочетает рассуждение (Reasoning) с действием (Acting): модель чередует шаги «мысль→действие→наблюдение». Используется в агентных системах, где модель вызывает инструменты (поиск, калькулятор, API).

Системные промпты и роли

Большинство современных трансформерных моделей поддерживают три типа сообщений:

  • system — задаёт контекст, роль и ограничения модели;
  • user — запрос пользователя;
  • assistant — ответ модели.

Системный промпт задаёт «личность» модели и правила взаимодействия.

Продвинутые методы

Prompt chaining

Разбиение сложной задачи на несколько последовательных промптов, где выход одного служит входом следующего. Позволяет справляться с задачами, требующими многошагового планирования.

Retrieval-Augmented Generation (RAG)

Комбинация поиска по базе знаний с генерацией: в промпт динамически включаются релевантные фрагменты документов, найденных по запросу пользователя. Позволяет снизить галлюцинации LLM.

Автоматический промпт-инжиниринг (APE)

Автоматическая оптимизация промпта с помощью самой языковой модели. Формально задача — найти

p^* = \arg\max_{p \in \mathcal{P}}\, \mathbb{E}_{(x,y)}\!\left[\text{score}(y, f_p(x))\right],

где f_p — модель с промптом p.

Prompt injection и защита

Атаки типа «prompt injection» — попытки злоумышленника через пользовательский ввод переопределить системный промпт. Защитные меры включают разделение доверенного и недоверенного контекстов и фильтрацию ввода.

Метрики и оценка

Качество промпта оценивается по:

  • точности ответа на задачах-бенчмарках (MMLU, GSM8K, HumanEval);
  • консистентности (self-consistency rate);
  • стоимости токенов;
  • латентности (время до первого токена, TTFT).

Связь с дообучением

Промпт-инжиниринг и RLHF-дообучение дополняют друг друга: дообучение фиксирует желаемое поведение модели в её весах, тогда как промпт управляет поведением без изменения весов. Векторные представления (embeddings) промптов используются в «soft prompting» — обучаемых непрерывных префиксах, оптимизируемых градиентным спуском.

Инструменты и фреймворки

  • LangChain — популярная библиотека для создания цепочек промптов и RAG-пайплайнов;
  • LlamaIndex — специализирован на индексировании и поиске по документам;
  • DSPy — декларативный подход к оптимизации промптов;
  • PromptFlow — инструмент Microsoft для промпт-инжиниринга в Azure.

Применения

Промпт-инжиниринг применяется в широком спектре задач:

  • обработка текстов (суммаризация, перевод, классификация);
  • генерация кода и отладка;
  • создание контента и творческое письмо;
  • агентные системы с инструментами;
  • корпоративные чат-боты на основе RAG.

См. также

Примечания

Литература

  • Brown T. B. et al. Language Models are Few-Shot Learners // Advances in Neural Information Processing Systems. — 2020. — Т. 33. — С. 1877–1901.
  • Wei J. et al. Chain-of-Thought Prompting Elicits Reasoning in Large Language Models // NeurIPS. — 2022.
  • Yao S. et al. ReAct: Synergizing Reasoning and Acting in Language Models // ICLR. — 2023.
  • Zhou D. et al. Large Language Models Are Human-Level Prompt Engineers // ICLR. — 2023.
  • Sahoo P. et al. A Systematic Survey of Prompt Engineering in Large Language Models // arXiv. — 2024.
  • Liu P. et al. Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in NLP. — ACM Computing Surveys. — 2023 T. 55. — С. 1–35.
Личные инструменты