AlphaZero, новый проект Google, громит Stockfish в матче из 100 партий

МЕНЮ


Искусственный интеллект. Новости
Поиск

ТЕМЫ


Внедрение ИИНовости ИИРобототехника, БПЛАПсихологияТрансгуманизмЛингвистика, обработка текстаБиология, теория эволюцииВиртулаьная и дополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информации

RSS


RSS новости

Авторизация



Новостная лента форума ailab.ru

6 дек. 2017 г., 12:50 17 Освещение шахматных событий

Вчера шахматы изменились навсегда. Возможно, не только шахматы, но и весь мир.

Год назад программа AlphaGo сенсационно обыграла сильнейшего в мире игрока в го, а теперь искусственный интеллект AlphaZero разгромил сильнейший по рейтингу шахматный движок. 

Stockfish, который используют для домашней подготовки большинство игроков, победитель  Чемпионата TCEC 2016 года и Чемпионата Chess.com среди компьютерных программ 2017 года, оказался явно слабее. В матче из 100 партий AlphaZero одержал 28 побед при 72 ничьих и ни разу не проиграл.

Кстати, AlphaZero потратил всего четыре часа на "изучение" шахмат. Простите, человеки, но вам за ним не угнаться.

Все верно - программисты AlphaZero, разрабатываемого DeepMind, подразделением Google, создали его на основе механизма "машинного обучения", точнее, "обучения с подкреплением". Проще говоря, AlphaZero не изучал шахматы в традиционном понимании. У него нет ни дебютной книги, ни эндшпильных таблиц, ни сложных алгоритмов для оценки силы центральных и фланговых пешек. 

Google Headquarters in London.

Штаб-квартира Google в Лондоне изнутри, подразделение DeepMind расположено на восьмом этаже. | Фотография Марии Емельяновой/Chess.com.

Его работу можно сравнить с роботом, который может использовать тысячи запчастей, но не знает принципа работы двигателя внутреннего сгорания, - он перебирает возможные комбинации, пока не построит Феррари, и для этого ему нужно меньше времени, чем занимает просмотр трилогии "Властелин колец". За четыре часа программа сыграла сама с собой множество партий, став своим собственным учителем.

Пока что команда программистов хранит молчание. Они не дали Chess.com комментариев, ссылаясь на то, что доклад "пока находится на рассмотрении", но здесь вы можете прочесть его полный текст. В исследовательскую группу входит Демис Хассабис, кандидат в мастера из Англии и соучредитель DeepMind (приобретен Google в 2014). Хассабис, принимавший участие в турнире тандемов ProBiz на открытии London Chess Classic, в настоящий момент находится на конференции Neural Information Processing Systems (Нейронные системы обработки информации) в Калифорнии, в качестве соавтора доклада на другую тему.

Demis Hassabis with Michael Adams in London.

Демис Хассабис играет в паре с Майклом Адамсом на турнире в штаб-квартире Google в Лондоне несколько дней назад. | Фотография Марии Емельяновой/Chess.com.

Зато с Chess.com охотно поделился своими суждениями шахматист, обладающий большим личным опытом игры против шахматных компьютеров. МГ Гарри Каспаров не удивлен, что  компания DeepMind перешла от го к шахматам.

"Это заметное достижение, хотя оно и было ожидаемо после AlphaGo", - заявил он Chess.com. "Оно приближается к 'типу-Б', человекоподобному подходу к шахматам, которым Клон Шеннон и Алан Тьюринг мечтали заменить сплошной перебор".

AlphaZero vs. Stockfish 8

AlphaZero vs. Stockfish | Round 1 | 4 Dec 2017 | 1-0

8

7

6

5

4

3

2

1

a

b

c

d

e

f

g

h

1. Кf3 Кf6 2. d4 e6 3. c4 b6 4. g3 Сb7 5. Сg2 Сe7 6. O-O O-O 7. d5 exd5 8. Кh4 c6 9. cxd5 Кxd5 10. Кf5 Кc7 11. e4 d5 12. exd5 Кxd5 13. Кc3 Кxc3 14. Фg4 g6 15. Кh6+ Крg7 16. bxc3 Сc8 17. Фf4 Фd6 18. Фa4 g5 19. Лe1 Крxh6 20. h4 f6 21. Сe3 Сf5 22. Лad1 Фa3 23. Фc4 b5 24. hxg5+ fxg5 25. Фh4+ Крg6 26. Фh1 Крg7 27. Сe4 Сg6 28. Сxg6 hxg6 29. Фh3 Сf6 30. Крg2 Фxa2 31. Лh1 Фg8 32. c4 Лe8 33. Сd4 Сxd4 34. Лxd4 Лd8 35. Лxd8 Фxd8 36. Фe6 Кd7 37. Лd1 Кc5 38. Лxd8 Кxe6 39. Лxa8 Крf6 40. cxb5 cxb5 41. Крf3 Кd4+ 42. Крe4 Кc6 43. Лc8 Кe7 44. Лb8 Кf5 45. g4 Кh6 46. f3 Кf7 47. Лa8 Кd6+ 48. Крd5 Кc4 49. Лxa7 Кe3+ 50. Крe4 Кc4 51. Лa6+ Крg7 52. Лc6 Крf7 53. Лc5 Крe6 54. Лxg5 Крf6 55. Лc5 g5 56. Крd4

?

fJ#,.@

Одна из 10 избранных партий, которые приводятся в статье.

Подобно человеку, AlphaZero рассматривает меньше позиций, чем ее предшественницы. В отчете заявлено, что она оценивает "всего" 80 тысяч позиций в секунду в сравнении с 70 миллионами в секунду у Stockfish.

МГ Петер-Хайне Нильсен, многолетний секундант чемпиона мира МГ Магнуса Карлсена, открыл свое увлечение, сближающее его с президентом ФИДЕ: инопланетян. Он заявил Chess.com: "Прочитав доклад и, в особенности, просмотрев партии, я подумал: "Мне всегда было любопытно, что было бы, если бы более разумный вид высадился на нашей планете и показал нам свое искусство шахматной игры. Кажется, теперь я знаю, каково это".

Интервью Chess.com с Нильсеном о новостях про AlphaZero.

Мы также узнали, о значимости преимущества выступки, по крайней мере, для искусственного интеллекта. 25 из 28 побед AlphaZero одержал белыми (хотя результат +3=47-0 черными против Stockfish, чей рейтинг превышает  3400, также неплох).

В отчете показано и насколько часто движок выбирал те или иные дебюты по мере обучения. Простите, любители староиндийской защиты, но вы не в фаворе. Интерес к французской защите также угас со временем, а вот стремление играть ферзевый гамбит и, особенно, английское начало только возрастало.

null

Частота дебютов, применяемых AlphaZero в фазе "обучения". Иллюстрация из  научного доклада AlphaZero.

Что бы вы сделали на месте не ведающего усталости существа, только что освоившего игру с 1400-летней историей? Взялись бы за другую. После матча со Stockfish программа AlphaZero потратила на "обучение" всего два часа и победила  "Elmo", сильнейшего из компьютерных движков для игры в сёги.

Применение этой инновационной самообучающейся программы, разумеется, не ограничено играми.

"Всегда считалось, что в шахматах от машины требуется слишком много эмпирических знаний, чтобы те могли играть сильно 'с нуля', вообще не используя человеческие знания", - сказал Каспаров. "Конечно, мне будет интересно посмотреть, что мы сможем узнать о шахматах с помощью AlphaZero, который открывает огромные перспективы машинного обучения в целом—машины могут находить закономерности, недоступные для людей. Очевидно, что последствия простираются далеко за пределы шахмат и других игр. Способность машины открывать и превосходить знания сложных закрытых систем, накопленные человечеством за века, - это инструмент, меняющий мир".

Garry Kasparov and Demis Hassabis in London.

Гарри Каспаров и Демис Хассабис на турнире ProBiz в Лондоне. | Фотография Марии Емельяновой/Chess.com.

Журналисты Chess.com опросили восемь из десяти участников турнира в Лондоне об их отношении к матчу программ. Видео с интервью будет размещено на сайте позже.

Наиболее резко критиковал условия матча МГ Хикару Накамура. Сейчас идет горячая дискуссия о вычислительной мощности противников, но Накамура считает, что важнее было другое.

Американский гроссмейстер назвал матч "нечестным", указав, что для оптимальной работы движок Stockfish должен использовать дебютную книгу. Накамура не думает, что с ее помощью Stockfish выиграл бы матч, но разрыв в счете был бы намного меньше.

"Я уверен, что сам Господь бог не набрал бы против Stockfish 75 процентов очков белыми без какой-либо форы", - прокомментировал он результат AlphaZero белыми: 25 побед и 25 ничьих.

МГ Ларри Кауфман, ведущий шахматный консультант движка Komodo, надеется увидеть, насколько хорошо  работает новая программа на персональных компьютерах, не пользуясь вычислительными мощностями Google. Он также повторил высказанные Накамурой возражения по поводу того, что Stockfish играл без своих обычных дебютных знаний.

"Конечно, это почти невероятно", сказал он, - "да, я слышал о достижениях AlphaGo Zero в игре го и ожидал, что произойдет что-то подобное, учитывая, что в команде разработчиков есть шахматист Демис Хассабис. Однако, непонятно, сможет ли программа AlphaZero играть в шахматы на обычном компьютере, и насколько хорошо у нее это получится. Возможно, современное преобладание шахматных движков, использующих минимаксную функцию, близится к концу, но пока провозглашать это слишком рано. Стоит указать, что за время обучения AlphaZero де-факто создала собственную дебютную книгу, поэтому было бы справедливее использовать ее против движка с хорошей дебютной книгой".

Не касаясь условий матча, Нильсен задумывается, в каких еще областях может применяться данный тип обучения.

"[Это] современный искусственный интеллект", - сказал гроссмейстер. "Он идет от чего-то вроде шахмат к проблемам, достойным нобелевских премий и даже большего. Думаю, нам повезло, что они решили потратить четыре часа на шахматы, но последствия этого открытия куда более значительны".


Источник: www.chess.com