Связанные правки для Обучение с подкреплением из обратной связи человека (RLHF)
Материал из MachineLearning.
На этой служебной странице представлен список последних изменений на связанных страницах. Страницы из списка наблюдения выделены.
< Обучение с подкреплением из обратной связи человека (RLHF)Последние 50 изменений за 7 дней, на момент времени 19:28, 16 июня 2026.
Показать последние 50 | 100 | 250 | 500 изменений за 1 | 3 | 7 | 14 | 30 дней;
Скрыть малые правки.
16 июня 2026
- (разн.) (история) . . Большая языковая модель; 10:58 . . (-2 634) . . Emil Petrov (Обсуждение | вклад) (Исправлены формулы LaTeX)
- (разн.) (история) . . Н Большая языковая модель; 10:43 . . (+12 419) . . Emil Petrov (Обсуждение | вклад) (Новая статья о больших языковых моделях (LLM), написана с Claude Sonnet 4)

