Conditioning of Reinforcement Learning Agentsand its Policy Regularization Application

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



Ролик записан к постеру на конференции ICML 2020, Bias and Generalization in RL Workshop.

Спикер — Арип Асадулаев, научный сотрудник и аспирант лаборатории машинного обучения ИТМО.

В презентации дано краткое описание проблемы обусловленности матрицы Якобиана агентов обучения с подкреплением, а также представлены результаты применения техник регуляризации обусловленности для ряда задач.

Ссылка на полную статью "Conditioning of Reinforcement Learning Agents and its Policy Regularization Application"


Телеграм: t.me/ainewsline

Источник: arxiv.org

Комментарии: