Два искусственных интеллекта сами научились приёмам сумо |
||
|
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Разработка ИИГородские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Атаки на ИИ Внедрение ИИИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Промпты. Генеративные запросы Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Авторизация |
2017-10-13 21:10 Они действуют умнее, чем кажется на первый взгляд. Институт OpenAI, который финансирует в том числе Илон Маск, представил новое исследование машинного обучения и создал демонстрацию технологии на основе боёв сумо. Оба компьютерных бота сталкиваются в поединке и учатся в быстро изменяющейся среде, чтобы победить соперника. Инженеры OpenAI вдохновились тем, как животные учатся на обратной связи, и использовали эту технику, чтобы обучить машины. Также в исследовании задействован алгоритм обучения с подкреплением (вид машинного обучения) PPO (proximal policy optimization), разработанный внутри организации ранее. Он лишён недостатков обычного обучения с подкреплением, среди которых плохая работа с быстро изменяющейся средой, например, во время игр. Специалисты OpenAI смогли добиться от машины того, что называют «мета-обучением» (meta-learning). Это значит, что компьютер делает прогнозы на основе предыдущего опыта и может применить их к новой ситуации. Как следует из видео, в виртуальной среде RoboSumo боты сначала сражались случайным образом без какой-либо тактики. Однако спустя тысячи итераций ошибок и попыток, они развили способность двигаться и драться. Ещё через какое-то время машины уже научились избегать друг друга и ставить под сомнения собственные действия. Обучение происходило «на лету», пока боты сражались друг с другом в реальном времени. Телеграм: t.me/ainewsline Источник: tjournal.ru Комментарии: |
|