13. НЕЙРОННЫЕ СЕТИ. Обучение с подкреплением 1 | Технострим

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Курс «Нейронные сети в машинном обучении».

Лекция №13. Обучение с подкреплением(часть 1):

— Основные понятия обучения с подкреплением: агент, среда, стратегия, награда;

— Value function и Q-function;

— Уравнения Беллмана;

— Алгоритм Policy iteration.

Комментарии: