Искусственный интеллект впервые обыграл пятерых чемпионов в покер |
||
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Разработка ИИГородские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2019-08-13 08:00 На это достижение у ученых ушло более двух лет. В январе 2017 года стало известно, что компьютерная программа Libratus обыграла четырех профессиональных игроков в покер и выиграла два миллиона долларов. Однак ее создатели решили не останавливаться на достигнутом и сейчас представили миру новую версию программы — Pluribus, которая уже обыграла в техасский холдем сразу пятерых чемпионов в этой игре, «сидя» с ними всеми за одним столом, прямо как в традиционных казино. О разработке ученых пишет журнал Science.
Как рассказал Ной Браун (Noam Brown) из Университета Карнеги-Меллона в Питтсбурге (США), один из создателей Pluribus, искусственный интеллект, вырабатывая свою стратегию, создал несколько инновационных приемов, которые могут в дальнейшем повлиять на игру профессионалов по покеру. Авторы Pluribus оснастили его «абстрактным действием» и «абстрактной информацией» — так программа смогла отбросить лишние варианты дальнейших ходов и оставить лишь те, которые потребуются для принятия решения. Во время тестов Pluribus, используя метод самообучения и систему «минимизации сожалений» (когда программа максимально сокращает разницу между уже принятым решением и оптимальной стратегией), сражалась в покер с пятью своими копиями, поначалу играя наугад. Впоследствии ИИ научился анализировать ходы и понял, какие действия и с какой вероятностью ведут к победе в игре. Главная часть эксперимента проходила на протяжении 12 дней в два этапа: один игрок против пяти копий Pluribus либо пять профессионалов против ИИ. Ежедневно в игре участвовали пять разных чемпионов по покеру, каждый из которых в прошлом выиграл более миллиона долларов. В итоге с помощью своей уникальной и в чем-то «парадоксальной» стратегии ИИ более чем за десять тысяч раздач обыграл всех лучших игроков и заработал полмиллиона долларов. «Главный плюс Pluribus — способность совмещать разные стратегии. Это то, к чему идут профессиональные игроки в покер. Мало у кого получается менять тактику случайным образом и оставаться в плюсе. Почти все люди не справляются с такой задачей», — рассказал рекордсмен World Poker Tour Даррен Элиас (Darren Elias), который также потерпел поражение в игре с ИИ. Источник: naked-science.ru Комментарии: |
|