Пчелин К.К. - Машинное обучение с подкреплением - 7. Reward Modelling

    Пчелин К.К. - Машинное обучение с подкреплением - 7. Reward Modelling

    Расскажите об этом видео своим друзьям в социальных сетях!


    Качество: HD Автор видео: Teach-In Добавлено: 27.04.2026 в 00:00:00 Продолжительность: 00:58:38 Зрители: 3

    QR-код страницы с видео



    Видео Пчелин К.К. - Машинное обучение с подкреплением - 7. Reward Modelling



    Reward Modelling Пчелин Константин Константинович 00:17 Вступление 02:33 Языковая модель как MDP 04:24 Зачем нужна reward model ? 09:26 Модель Брэдли-Терри 11:57 Обучение Reward Model 21:32 Reward Overoptimization 31:48 Reward Shaping 36:32..., видео от 2026-04-27 загрузил на rutube Teach-In...

    Данную страницу никто не комментировал. Вы можете стать первым.

    Новое видео

    Обсуждаемое сегодня