AlphaGo Zero: Learning from scratch | DeepMind

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


2017-10-18 22:22

ИИ проекты

Пока мы тут вспоминали прошлое, играли свои человеческие турниры и спорили, во что надо одеваться на соревнования, в Google разработали новую версию убийцы человеческого господства в мире го: AlphaGo Zero.

Говорят, что она сильнее всего, что было придумано до этого. Основной принцип создания программы был такой: она должна была научиться играть в го с нуля, делая случайные ходы, не имея информации, как играют в эту игру люди. Искусственный интеллект играл сам с собой и развивался: через три часа он вёл себя, как новичок, пытаясь съесть как можно больше камней, но уже через 19 часов программа "осознавала" жизнь и смерть, влияние и территорию. Спустя 70 часов, как заявляют разработчики, компьютерный разум играл на уровне, не доступном человеку.

Для работы AlphaGo Zero использует всего два TPU-процессора (Тензорные процессоры, разработанные Google специально для нейросетей), столько же, сколько и программа, победившая Ке Жие. Версия же, с которой играл Ли Седоль, требовала для работы 48 TPU-процессоров, а версия, победившая Фана Хуэя - 146 графических карт.

Примечательно, что новая разработка вообще не использует метод Монте Карло, и полагается только на нейросети. И если раньше AlphaGo оперировала двумя отдельными нейросетями: одной для выбора лучшего хода, другой - для оценки позиции, то сейчас Zero использует одну комбинированную нейросеть.

Дэвид Сильвер, ведущий разработчик AlphaGo Zero отмечает, что они создали эту программу не для того, чтобы победить человека раз и навсегда. АльфаГо сделана для изучения принципов создания искуственного интеллекта, которые могут быть применены в любых других областях. Главная прелесть здесь в том, что это позволит искуственному разуму самообучаться без использования человеческого опыта, что особенно важно, для тех сфер, в которых этот опыт недостаточно велик.

Что ж, кажется, встреча с Терминатором намного ближе, чем мы думали! :)


Источник: deepmind.com

Комментарии: