Conditioning of Reinforcement Learning Agentsand its Policy Regularization Application

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Ролик записан к постеру на конференции ICML 2020, Bias and Generalization in RL Workshop.

Спикер — Арип Асадулаев, научный сотрудник и аспирант лаборатории машинного обучения ИТМО.

В презентации дано краткое описание проблемы обусловленности матрицы Якобиана агентов обучения с подкреплением, а также представлены результаты применения техник регуляризации обусловленности для ряда задач.

Ссылка на полную статью "Conditioning of Reinforcement Learning Agents and its Policy Regularization Application"


Источник: arxiv.org

Комментарии: