AlphaGo Zero: Learning from scratch | DeepMind |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2017-10-18 22:22 Пока мы тут вспоминали прошлое, играли свои человеческие турниры и спорили, во что надо одеваться на соревнования, в Google разработали новую версию убийцы человеческого господства в мире го: AlphaGo Zero. Говорят, что она сильнее всего, что было придумано до этого. Основной принцип создания программы был такой: она должна была научиться играть в го с нуля, делая случайные ходы, не имея информации, как играют в эту игру люди. Искусственный интеллект играл сам с собой и развивался: через три часа он вёл себя, как новичок, пытаясь съесть как можно больше камней, но уже через 19 часов программа "осознавала" жизнь и смерть, влияние и территорию. Спустя 70 часов, как заявляют разработчики, компьютерный разум играл на уровне, не доступном человеку. Для работы AlphaGo Zero использует всего два TPU-процессора (Тензорные процессоры, разработанные Google специально для нейросетей), столько же, сколько и программа, победившая Ке Жие. Версия же, с которой играл Ли Седоль, требовала для работы 48 TPU-процессоров, а версия, победившая Фана Хуэя - 146 графических карт. Примечательно, что новая разработка вообще не использует метод Монте Карло, и полагается только на нейросети. И если раньше AlphaGo оперировала двумя отдельными нейросетями: одной для выбора лучшего хода, другой - для оценки позиции, то сейчас Zero использует одну комбинированную нейросеть. Дэвид Сильвер, ведущий разработчик AlphaGo Zero отмечает, что они создали эту программу не для того, чтобы победить человека раз и навсегда. АльфаГо сделана для изучения принципов создания искуственного интеллекта, которые могут быть применены в любых других областях. Главная прелесть здесь в том, что это позволит искуственному разуму самообучаться без использования человеческого опыта, что особенно важно, для тех сфер, в которых этот опыт недостаточно велик. Что ж, кажется, встреча с Терминатором намного ближе, чем мы думали! :) Источник: deepmind.com Комментарии: |
|