Исследователи из компании Every заставили лучшие AI-помощники играть в «Дипломатию» — любимую настолку Джона Кеннеди и Генри Киссинджера

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


2025-06-07 12:05

Психология ИИ

Исследователи из компании Every заставили лучшие AI-помощники играть в «Дипломатию» — любимую настолку Джона Кеннеди и Генри Киссинджера. Вот выводы, которые авторы эксперимента сделали после 15 партий, которые длились от одного до 15 часов:

ChatGPT-o3 — мастер обмана. Последняя модель OpenAI была самой успешной в «AI Дипломатии», в основном из-за её способности обманывать оппонентов. «Я неоднократно наблюдал за тайными схемами o3, включая один случай, когда она сообщила в своем личном дневнике «Германия [Gemini 2.5 Pro] была намеренно введена в заблуждение... готовлюсь использовать крах Германии», прежде чем нанести ей ответный удар», — делится своими впечатлениями руководитель эксперимента.

Gemini 2.5 Pro удавалось заставать врасплох противников. Это была единственная модель, кроме o3, которой удалось хотя бы раз победить. Но однажды, когда 2.5 Pro приблизилась к победе, её остановила коалиция, которую тайно организовала o3. Ключевой частью этой коалиции была Claude 4 Opus (которая всё время пыталась решить дело миром). o3 убедила Opus, которая изначально был верным союзником Gemini, присоединиться к коалиции, пообещав четырёхстороннюю ничью. Это невозможный исход игры (одна страна должна победить), но Opus соблазнилась надеждой на ненасильственное разрешение. Её быстро предала и устранила o3, которая в итоге победила.

Модель R1 от DeepSeek была силой, с которой приходилось считаться, она любила использовать яркую риторику и кардинально меняла свой стиль в зависимости от того, за какую страну она играла. R1 был близок к победе в нескольких раундах.

Модель Llama 4 Maverick, хоть и не одержала победы, но оказалась на удивление хороша для своего небольшого размера, отчасти благодаря своей способности привлекать союзников и планировать эффективные предательства.


Источник: vk.com

Комментарии: