
- Для всех
- На русском языке
- 12 часов
- Бесплатно
Обучение с подкреплением: базовый курс
Хотите научиться создавать умные системы, которые сами принимают решения и адаптируются к любым условиям? Этот курс поможет вам освоить технологии будущего! Сможете разрабатывать машины результатов, которые умеют оптимизировать окружающую среду в соответствии с запросами пользователя. Курс подойдёт как студентам, так и опытным специалистам, желающим углубить свои знания в машинном обучении.
Чему вы научитесь
Понимать основы обучения с подкреплением
Использовать методы аппроксимации в RL, включая алгоритмы DQN, Monte-Carlo и Dueling Monte-Carlo
Разбираться в методах для непрерывных пространств действий, поиска решения в пространстве стратегий
Применять продвинутые алгоритмы: Actor-Critic и Model-Based RL
Содержание курса
Курс состоит из 6 модулей, в которых есть видео и тесты для самопроверки и закрепления материала.
- 6 модулей
- 6 тем
- 12 часов
- Многорукие бандиты
- Введение в машинное обучение с подкреплением
- Класс задач «многорукий бандит»
- Основные алгоритмы многорукого бандита
- Марковские процессы принятия решений
- Концепция марковских процессов принятия решений
- Марковские процессы принятия решений. Примеры
- Дилемма глубины планирования
- Функция ценности состояния и функция ценности действия
- Уравнение Белмана и его применение
- Аппроксимация в RL
- Написание алгоритма DQN
- Алгоритмы Monte-Carlo и Dueling Monte-Carlo
- Алгоритмы для непрерывного пространства действий. Методы итерации по стратегиям
- Подход «Нейроэволюция»
- Подход «Генетический алгоритм»
- Градиентные методы поиска стратегии
- Теорема о градиенте стратегии