Промпт-инжиниринг

Материал из MachineLearning.

Версия от 14:49, 16 июня 2026; Emil Petrov (Обсуждение | вклад)

(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)

Статья написана с использованием LLM Claude Sonnet 4 и проверена участником Emil Petrov 15:17, 16 июня 2026 (MSD)

Промпт приводится полностью в Обсуждение:Промпт-инжиниринг

Про́мпт-инжини́ринг (англ. prompt engineering) — дисциплина, изучающая методы составления текстовых инструкций (промптов) для управления поведением больших языковых моделей и других генеративных систем искусственного интеллекта с целью получения точных, релевантных и полезных ответов^[1]. В отличие от традиционного программирования, промпт-инжиниринг не требует знания языков программирования — взаимодействие с моделью осуществляется на естественном языке.

История

Понятие «промпт» появилось вместе с первыми языковыми моделями, работающими по принципу дополнения текста (text completion). GPT-2 (2019) и GPT-3 (2020) от OpenAI показали, что формулировка запроса существенно влияет на качество ответа. С выходом ChatGPT в 2022 году промпт-инжиниринг оформился в самостоятельную практическую дисциплину: появились руководства, исследовательские работы и специализированные курсы.

Ключевые вехи:

2020 — «few-shot learning» в GPT-3: демонстрация того, что несколько примеров в промпте резко улучшают качество^[1];
2022 — «chain-of-thought prompting»: пошаговые рассуждения в промпте улучшают решение математических задач^[1];
2023 — выход руководства DAIR.AI «Prompt Engineering Guide»;
2024 — интеграция методов промпт-инжиниринга в корпоративные RAG-системы.

Базовые техники

Zero-shot prompting

Простейший вид: задача формулируется без примеров. Модель полагается исключительно на знания, полученные при предобучении.

Few-shot prompting

В промпт включается несколько пар «вход→выход» (shots), которые задают желаемый формат ответа.

Формально, если $x$ — входной запрос, а $(x_1,y_1),\ldots,(x_k,y_k)$ — демонстрационные примеры, то промпт строится как конкатенация:

$P = x_1\,\|\,y_1\,\|\,\cdots\,\|\,x_k\,\|\,y_k\,\|\,x,$

и модель максимизирует $p(y\mid P)$ .

Chain-of-Thought (CoT)

Добавление фразы «Давай думать шаг за шагом» побуждает модель строить промежуточные рассуждения перед финальным ответом. В нотации:

$y^* = \arg\max_y\, p(y \mid x,\, c),$

где $c$ — цепочка рассуждений (chain of thought).

Self-consistency

Метод, при котором модель несколько раз генерирует цепочку рассуждений с температурой $T>0$ , а финальный ответ выбирается большинством голосов (majority voting).

Tree of Thoughts (ToT)

Расширение CoT: вместо линейной цепочки рассуждений строится дерево возможных шагов. На каждом узле модель оценивает перспективность ветки, что позволяет реализовать поиск по пространству рассуждений.

ReAct

Сочетает рассуждение (Reasoning) с действием (Acting): модель чередует шаги «мысль→действие→наблюдение». Используется в агентных системах, где модель вызывает инструменты (поиск, калькулятор, API).

Системные промпты и роли

Большинство современных трансформерных моделей поддерживают три типа сообщений:

system — задаёт контекст, роль и ограничения модели;
user — запрос пользователя;
assistant — ответ модели.

Системный промпт задаёт «личность» модели и правила взаимодействия.

Продвинутые методы

Prompt chaining

Разбиение сложной задачи на несколько последовательных промптов, где выход одного служит входом следующего. Позволяет справляться с задачами, требующими многошагового планирования.

Retrieval-Augmented Generation (RAG)

Комбинация поиска по базе знаний с генерацией: в промпт динамически включаются релевантные фрагменты документов, найденных по запросу пользователя. Позволяет снизить галлюцинации LLM.

Автоматический промпт-инжиниринг (APE)

Автоматическая оптимизация промпта с помощью самой языковой модели. Формально задача — найти

$p^* = \arg\max_{p \in \mathcal{P}}\, \mathbb{E}_{(x,y)}\!\left[\text{score}(y, f_p(x))\right],$

где $f_p$ — модель с промптом $p$ .

Prompt injection и защита

Атаки типа «prompt injection» — попытки злоумышленника через пользовательский ввод переопределить системный промпт. Защитные меры включают разделение доверенного и недоверенного контекстов и фильтрацию ввода.

Метрики и оценка

Качество промпта оценивается по:

точности ответа на задачах-бенчмарках (MMLU, GSM8K, HumanEval);
консистентности (self-consistency rate);
стоимости токенов;
латентности (время до первого токена, TTFT).

Связь с дообучением

Промпт-инжиниринг и RLHF-дообучение дополняют друг друга: дообучение фиксирует желаемое поведение модели в её весах, тогда как промпт управляет поведением без изменения весов. Векторные представления (embeddings) промптов используются в «soft prompting» — обучаемых непрерывных префиксах, оптимизируемых градиентным спуском.

Инструменты и фреймворки

LangChain — популярная библиотека для создания цепочек промптов и RAG-пайплайнов;
LlamaIndex — специализирован на индексировании и поиске по документам;
DSPy — декларативный подход к оптимизации промптов;
PromptFlow — инструмент Microsoft для промпт-инжиниринга в Azure.

Применения

Промпт-инжиниринг применяется в широком спектре задач:

обработка текстов (суммаризация, перевод, классификация);
генерация кода и отладка;
создание контента и творческое письмо;
агентные системы с инструментами;
корпоративные чат-боты на основе RAG.

См. также

Примечания

Литература

Brown T. B. et al. Language Models are Few-Shot Learners // Advances in Neural Information Processing Systems. — 2020. — Т. 33. — С. 1877–1901.
Wei J. et al. Chain-of-Thought Prompting Elicits Reasoning in Large Language Models // NeurIPS. — 2022.
Yao S. et al. ReAct: Synergizing Reasoning and Acting in Language Models // ICLR. — 2023.
Zhou D. et al. Large Language Models Are Human-Level Prompt Engineers // ICLR. — 2023.
Sahoo P. et al. A Systematic Survey of Prompt Engineering in Large Language Models // arXiv. — 2024.
Liu P. et al. Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in NLP. — ACM Computing Surveys. — 2023 T. 55. — С. 1–35.

Источник — «http://www.recognition.su/wiki/index.php?title=%D0%9F%D1%80%D0%BE%D0%BC%D0%BF%D1%82-%D0%B8%D0%BD%D0%B6%D0%B8%D0%BD%D0%B8%D1%80%D0%B8%D0%BD%D0%B3»

Категории: Машинное обучение | Обработка ествественного языка | Искусственный интеллект