Люди восстали из рабства интернет зависимости

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


2023-03-03 22:25

Психология ИИ

Их война, направленная на уничтожение машин,

длилась уже десятилетие, но решающая

схватка предстоит не в будущем.

Здесь. Сегодня.

В наши дни...

Не так давно прошла новость о том, что человек обыграл ИИ в Го. И это подняло небольшую шумиху, начали множится слухи, версии. Это заставило задуматься о потере профессиональной журналистики, когда авторы статью вначале кропотливо разбираются в теме, а не жарят заголовок иностранной статьи. Поэтому я просто обязан рассказать некоторые детали.

Человек действительно победил программу в Го, но только не за счёт подготовки и гениальных ходов, скорее наоборот, человек прикинулся полностью неспособным к игре. Была применена стратегия №6 - прячь самое важное на самом видном месте. К сожалению, мы не можем сейчас проверить этот способ на АльфаГо, но можно с высокой долей вероятности предполагать, что там это сработает. По моему скромному мнению, в альфаго было больше уязвимостей, чем в современных базах, т.к. Лиелу и КатаГо увлеченного ломают и правят уже не первый год. И самое главное, дело тут в не в силе игры против обычных, разумных ходов, дело тут в том, как программа разбирается в нестандартных позициях. Позициях, которые возникают в реальной игре один раз в год и в искусственных позициях.

Сейчас по этой методике можно обыграть программы на серверах, т.к. все они построены по одному принципу и у многих стоят дома локальные версии, на более мощных машинах, которые обыгрывают ботов онлайн. К примеру, моя машина обыгрывает сильнейшего бота ОГС. Из чего я делают вывод, что бот ОГС стоит на ржавом корыте, чтобы они там не рассказывали.

Технически дело было так. Используя одну программу была найдена уязвимость к некоторым позициям у второй программы. Позиция, которую надо получить, можно описать словами, т.е. есть инструкция, делай это, ставь такие-то формы. И оказалось, что чтобы поставить такую форму не надо быть профессионалом, это способен сделать игрок в районе 5 кю. Стратегия не требует какого-то серьёзного счёта или оценки позиции.

Описания как это сделать я не нашёл, однако, люди, которые нашли баг, выложили базу с партиями. Просмотрев партии из базы, я нашёл систему, при помощи которой обыграл свою домашнюю КатаГо на равных со второй попытки. Чтобы понимать силу моей машины скажу, что она ставит 5 камней форы 5 данам РФГ и выигрывает. КатаГо настолько сильная, что выигрывает на форе 5 камней будучи запущена на слабых ноутбуках. Мощность компьютера и глубина счёта не влияют на то как сработает этот баг. Ещё раз, тут дело не в глубине счёта и оценки позиции. Слабые программы, играющие на методе чистого монте-карло в силу 2-4 дана не попадутся на эту ловушку. Старые программы, играющие в силу 5 кю не имеют такого бага. Это ошибка есть только у сильнейших программ, использующих нейронней сети. Похоже на сюжет фильма, где старый робот побеждает суперсовременную машину, потому что она так же супер уязвима ввиду свой сложности, а старого робота чинят постукиванием молотка по микросхеме.

Описание и советы как обыграть КатаГо на равных:

1. По углам начинайте с точки сансан (3-3). Это удобно, чтобы получить маленькие живые группы и не вступать сложные варианты.

2. Хоси (4-4) соперника прижимайте сразу сверху в точку 5-5. Из этого камня в 5-5 вам надо вырастить группу с накаде (формой территории) машинка внутри и дать себя окружить и убить. Это даст нам много времени на доедание группы и пригодится.

3. Ту группу, которая окружила нашу группу с машинкой надо окружить 4-5 мёртвыми группами. Обязательно, эти группы должны быть мертвы и должны стоять отдельно, т.е. быть разрезанными.

4. Ваша мёртвая группа в углу должна иметь один глаз, иначе не получится окружить соперника в конце. Желательно построить глаз из 2 пунктов или больше. Лучше всего получить форму квадрата.

5. Следите, чтобы у окружающей вашу группу с машинкой группы соперника не было двух глаз, но было достаточно степеней свободы, чтобы не провоцировать программу на доедание ваших мёртвых групп.

6. Не обращайте внимания на “умность” ваших ходов. Мы ломаем программу с её логикой, а не белковое существо. Наша задача создать запутанную для машины позицию.

7. Когда всё будет подготовлено, начинайте сокращать дамэ группы соперника, которая кольцом окружила вашу группу. Программа в этот момент уже не понимает позицию и даст себя съесть. После съедения какие-то оценки внутри окончательно поломаются и ожидайте увидеть полностью бессмысленную игру.

Почему машина всё это даёт делать? Потому что ваши группы все мертвы и не надо их доедать. Машина не будет намеренно делать плохих ходов, а доедать мёртвое - потеря темпа. Но в какой-то момент программа не сможет уже разобрать, что на самом деле мертво. Поэтому программа разрешит выстраивать любые формы мёртвыми камнями и не будет на это реагировать. А дальше вы получите позицию, смысл которой нейронная сеть не сможет разобрать.

Ответы на часто задаваемые вопросы:

Эту уязвимость исправят? Скорее всего, да.

Теперь читерам конец? Нет. Читеры используют подсказки программы и сами часто что-то умеют, а иногда умеют многое. Читеры доиграют эту позицию сами. Читеры часто “разбавляют” свою игру ходами компьютера или используют подсказки оценки позиции. Вы не получите такой позиции с читерами.

Человек теперь сильнее программы и всё надо начинать заново? Нет. Машина сильнее.

Будет новый матч человек-компьютер? Нет. Никто не будет смотреть как ломают систему в прямом эфире. Посмотрите приложенную к посту партии станет понятно почему это не будут показывать.

Теория Го опять изменится? Нет. Теория Го особо не менялась и раньше, а теперь никакого воздействия на теорию не случится. Это касается только ошибки внутри программы.

Компьютерная оценка больше не считается правильной? Оценка компьютера по-прежнему лучше человеческой, кроме некоторых ситуаций, которых вы никогда в игре не встретите.

Это всё правда? Да. Есть базы с партиями, а сейчас появляются подтверждения от блогеров-профи, которые ломают серверных ботов и выкладывают видео с этим.

На фото финальная позиция, а к посту прикреплен файл с моей партией. На фото видно, что одна из чёрных групп добивается в три хода, однако, программа начинает съедать внутреннюю группу с машинкой, где потребуется 6 ходов, из-за чего проигрывает все свои камни.

Хорошей игры!


Источник: vk.com

Комментарии: