Conditioning of Reinforcement Learning Agentsand its Policy Regularization Application |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2020-11-13 15:36 Ролик записан к постеру на конференции ICML 2020, Bias and Generalization in RL Workshop. Спикер — Арип Асадулаев, научный сотрудник и аспирант лаборатории машинного обучения ИТМО. В презентации дано краткое описание проблемы обусловленности матрицы Якобиана агентов обучения с подкреплением, а также представлены результаты применения техник регуляризации обусловленности для ряда задач. Ссылка на полную статью "Conditioning of Reinforcement Learning Agents and its Policy Regularization Application" Источник: arxiv.org Комментарии: |
|