13. НЕЙРОННЫЕ СЕТИ. Обучение с подкреплением 1 | Технострим

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



Курс «Нейронные сети в машинном обучении».

Лекция №13. Обучение с подкреплением(часть 1):

— Основные понятия обучения с подкреплением: агент, среда, стратегия, награда;

— Value function и Q-function;

— Уравнения Беллмана;

— Алгоритм Policy iteration.


Телеграм: t.me/ainewsline

Источник: vk.com

Комментарии: