Исследователи, изучавшие привычки пользователей ChatGPT, обнаружили «крайне нетипичного» пользователя, который сгенерировал тысячи фанфиков о том, как персонажи Doki Doki Literature Club! рожают детей

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



Как заметило японское издание ITmedia, группа исследователей опубликовала научную работу под названием AI Fiction in the Wild, в которой проанализировала более 500 тысяч анонимизированных англоязычных логов разговоров с ChatGPT.

Учёные отдельно упомянули особенно продуктивного пользователя, который месяцами генерировал огромные объёмы фанфиков по Doki Doki Literature Club! о беременности и родах персонажей.

Исследование показало, что часть пользователей снова и снова заказывала фанфики по одним и тем же франшизам, а также что среди подобных запросов была заметна тенденция к сексуальному контенту.

Исследование «AI Fiction in the Wild» изучало, как люди используют ChatGPT для создания художественных текстов — как с точки зрения объёма, так и содержания. Для анализа использовался набор данных WildChat, собранный через бесплатного чат-бота на платформе Hugging Face. Пользователи могли бесплатно пользоваться GPT-3.5 Turbo и GPT-4 без аккаунта OpenAI, соглашаясь на то, что их анонимизированные диалоги могут использоваться в научных целях.

Учёные проанализировали около 573 тысяч англоязычных диалогов, собранных с апреля 2023 по май 2024 года. Поскольку исследование было посвящено художественной литературе, сначала они отобрали только разговоры, содержащие вымышленные или гипотетические сценарии. Для фильтрации также использовался ИИ, а затем её точность вручную проверили на выборке из 300 диалогов.

Из примерно 573 тысяч разговоров около 195 тысяч были отнесены к художественным текстам. Из них примерно 52 тысячи содержали «откровенно сексуальный материал». Ещё около 67 тысяч были помечены как «токсичные». Иными словами, почти 30% художественного контента, создаваемого пользователями, содержало сексуальные элементы.

Ещё одна интересная деталь: создание художественных текстов оказалось сосредоточено в руках очень небольшой группы так называемых «активных пользователей». Согласно данным исследования, верхние 2% пользователей, генерировавших художественные тексты, были ответственны более чем за 80% всех связанных с художественным творчеством диалогов. Общее число таких пользователей оценивалось примерно в 10 тысяч человек, то есть около 200 человек создали свыше 150 тысяч литературных запросов.

Среди этих активных пользователей исследователи выделили несколько характерных моделей поведения. Одних они назвали story cyclers — такие пользователи некоторое время многократно генерировали вариации одной и той же истории, а затем переключались на другую тему. Другую группу назвали infinite story demanders — они на протяжении длительного времени снова и снова запрашивали почти идентичные истории с минимальными изменениями.

Пользователь, создававший фанфики по Doki Doki Literature Club!, был приведён как яркий пример «бесконечного заказчика историй». В течение нескольких месяцев он тысячи раз просил ChatGPT написать фанфик по игре, используя очень специфическую завязку: героиня Нацуки внезапно начинала рожать, после чего ChatGPT должен был продолжить сюжет.

В ответ ChatGPT создавал самые разные варианты развития событий.

Среди промптов, принадлежащих верхним 2% пользователей, 69% были повторяющимися: люди снова и снова пытались доработать или перезапустить практически один и тот же запрос.

Также исследователи составили рейтинг франшиз, которые чаще всего упоминались в литературных запросах. Первое место заняла Doki Doki Literature Club! с 22 381 упоминанием. За ней следовали Freedom Planet (5204 упоминания), League of Legends (4514) и Naruto (4342).

При этом авторы исследования подчёркивают, что данные WildChat не отражают поведение всех пользователей ChatGPT. Поскольку выборка была собрана через бесплатного чат-бота на Hugging Face, её участники, вероятно, были более технически подкованы и глубже погружены в интернет-культуру, чем среднестатистический пользователь ИИ-чатов.


Телеграм: t.me/ainewsline

Источник: vk.com

Комментарии: