Связанные правки для Обучение с подкреплением из обратной связи человека (RLHF)

Материал из MachineLearning.

На этой служебной странице представлен список последних изменений на связанных страницах. Страницы из списка наблюдения выделены.

< Обучение с подкреплением из обратной связи человека (RLHF)

Последние 50 изменений за 7 дней, на момент времени 19:28, 16 июня 2026.
Показать последние 50 | 100 | 250 | 500 изменений за 1 | 3 | 7 | 14 | 30 дней;
Скрыть малые правки.

16 июня 2026

(разн.) (история) . . Большая языковая модель‎; 10:58 . . (-2 634) . . Emil Petrov (Обсуждение | вклад) (Исправлены формулы LaTeX)
(разн.) (история) . . Н Большая языковая модель‎; 10:43 . . (+12 419) . . Emil Petrov (Обсуждение | вклад) (Новая статья о больших языковых моделях (LLM), написана с Claude Sonnet 4)

Источник — «http://www.recognition.su/wiki/index.php?title=%D0%A1%D0%BB%D1%83%D0%B6%D0%B5%D0%B1%D0%BD%D0%B0%D1%8F:Recentchangeslinked»

Связанные правки для Обучение с подкреплением из обратной связи человека (RLHF)

Материал из MachineLearning.

16 июня 2026

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты