Демонстрация как ИИ успешно проходит простой лабиринт

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости



- Машинное обучение глубокой нейронной сети с подкреплением на tensorflow.js -

Задача:

Аппроксимировать функцию схождения минимизируя квадратичную функцию потерь обратным распространением ошибки.

Архитектура сети:

3 Входных нейрона (параметры) - Нормализованные координаты актёра и значение пройденной ячейки - выстроены инкрементально друг за другом.

2 Скрытых слоя: 256 и 128 нейронов.

1 Слой сброса для устойчивости обучения сети.

4 Выходных нейрона (решения) - Вероятности принятия решения выбора стороны для следующего шага.

Функция активации нейронов - sigmoid.

Используемые приёмы для лучшего и быстрого схождения функции:

Генеративный алгоритм - На сцене каждую итерацию обучения участвуют 500 актёров.

Исследовательские актёры - На каждом шаге, выбираются 5 "добровольцев" испытать принятое решение выбора стороны случайным образом.

Обучение на лучших в поколении - Из 500 актёров в итерации выбираются 5 самых лучших для обучения сети.

Результаты:

722 поколения по 500 актёров = 361000 актёров всего.

Длительность обучения сети: 1 час 06 минут.

Представленное видео ускорено в 8 раз.


Источник: github.com

Комментарии: