13. НЕЙРОННЫЕ СЕТИ. Обучение с подкреплением 1 | Технострим

МЕНЮ


Искусственный интеллект. Новости
Поиск

ТЕМЫ


Внедрение ИИНовости ИИРобототехника, БПЛАПсихологияТрансгуманизмЛингвистика, обработка текстаБиология, теория эволюцииВиртулаьная и дополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информации

RSS


RSS новости

Авторизация



Новостная лента форума ailab.ru

Курс «Нейронные сети в машинном обучении».

Лекция №13. Обучение с подкреплением(часть 1):

— Основные понятия обучения с подкреплением: агент, среда, стратегия, награда;

— Value function и Q-function;

— Уравнения Беллмана;

— Алгоритм Policy iteration.