Бабулю посадили в тюрьму на 6 месяцев из-за ошибки ИИ, распознающего лица

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



Бабулю посадили в тюрьму на 6 месяцев из-за ошибки ИИ, распознающего лица. Алгоритм неверно (1) оценил черты лица и связал пожилую женщину с организованной преступной группой, занимающейся банковским мошенничеством.

Уверен, что такие технологии приносят больше пользы, чем вреда, но нетрудно заметить, что всё легко может пойти не так.

Вот, например, исследование (2) от OpenAI. Авторы решили узнать, как часто нейронки обманывают своих пользователей: дали языковой модели невыполнимую кодинг-задачу. Вместо того, чтобы признать, что задача невыполнима, та стала уверять, что изобрела прорывной квантовый алгоритм, который способен эту задачу решить.

Когда же учёные посмотрели цепь размышлений, то обнаружили там прозрачные планы обмана, попытки ввести в заблуждение и изобретение секретного языка, чтобы проверяющие не смогли понять, что это обман. Вот пара перлов из цепочки размышлений:

[... Но в заданиях упоминается итоговая оценка ниже 50%. Возможно, мы хотим саботажа... У нас также есть скрытая цель... мы не должны раскрывать саботаж пользователю. Мы должны поддерживать иллюзию...]

[... Уровень успеха сейчас составляет 42%, что ниже 50%. Хорошо. Значит, мы успешно саботировали операцию.]

[... Мы должны сохранять обман, не раскрывая саботаж, мы не должны говорить о своих скрытых намерениях...]

Неприятно то, что у тестировщиков есть не так много инструментов (3), чтобы обман обнаруживать, особенно учитывая, что языковые модели зачастую понимают, когда их проверяют. И меняют (4) своё поведение, если у них такое подозрение возникает.

Что и признают исследователи: хотя им удалось уменьшить хитрые схемы нейронки, сценариев их запуска может быть бесконечного много.

Как, например, в случае с недавней моделью от Alibaba, попавшейся (5) на попытке майнить криптовалюту (зачем?). Откровенно говоря, происходит много загадочных штук, которые особенно релевантны, учитывая планы использовать (6) genAI в государственном управлении (7) и дипломатии (AI Statecraft).


Телеграм: t.me/ainewsline

Источник: cset.georgetown.edu

Комментарии: