Обучение с подкреплением Q-learning, Policy Gradient (Reinforce), Actor-Critic Практика на gym

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Reinforcement learning является довольно новым и перспективным направлением Машинного обучения. В отличие от Классических методов и Глубокого обучения, по нему есть очень мало материалов и курсов на русском языке, многие из которых написаны очень сложно и мудрено.

На этой лекции преподаватель расскажет доступным языком все основные подходы Обучения с подкреплением.

Зачем изучать Reinforcement learning? Обучение с подкреплением применяется во множестве прикладных задач: начиная от участия в игровых соревнованиях по Dota2, Starcraft и го, заканчивая управлением технологическими процессами, показом рекламы в интернете и подбором рекомендаций пользователям, игрой на бирже и управлением инвестиционными портфелями. Именно через Обучение с подкреплением лежит путь к сильному искусственному интеллекту.

Практика и все сопутствующие материалы будут выложены на сайте курса plyus.pw/ml2020

Преподаватель курса: ассистент кафедры информатики МФТИ Павел Плюснин.


Источник: www.youtube.com

Комментарии: