Генеративные состязательные сети (Generative adversarial network — GAN) — это нейронные сети, состоящие из двух частей: генераторов, которые создают образцы на основе ранее изученной выборки данных, и дискриминаторов, которые пытаются отличить их от аналогов из реального мира или просто вынести вердикт, убедителен результат работы генератора или нет. Ранее предпринимались попытки использовать их для самых разных задач: от обнаружения новых лекарств до создания убедительных фотографий гамбургеров и бабочек, и генерирования правдоподобных результатов сканирования мозга человека. Учёные из Маастрихтского университета в Нидерландах ещё в прошлом году нашли для них ещё одно применение, продемонстрировав, что они не так уж и плохи в генерации логотипов, а их новая публикация развивает данную идею, демонстрируя, что удалось добиться учёным за год работы, например, лучшее разрешение и детализацию получающихся изображений.
Новая нейронная сеть создана на базе уже разработанной ими ранее системе машинного обучения для создания логотипов — LoGAN, которую они подробно описывали в исследовании, опубликованном в октябре прошлого года. LoGAN умеет создавать логотипы лишь в одной из двенадцати заложенных в него возможных цветовых гамм в разрешении 32 на 32 пикселя, что, согласитесь, достаточно далеко до реального использования на рынке, хотя и достаточно неплохо, если бы речь шла о генерации иконок. Новая же модель способна создавать логотипы с гораздо большим разрешением и детализацией.
«Поскольку большинство американцев видят от 4000 до 20000 рекламных объявлений в день, компании уделяют всё больше внимания своему брендингу. Это вынуждает дизайнеров постоянно придумывать новые эстетичные и одновременно с этим инновационные и уникальные решения, в попытке выделить их продукт из массы», — пишут соавторы работы. «Искусственный интеллект может помочь дизайнерам, дав им некоторое вдохновение или сократив количество доработок, с которыми сталкиваются их клиенты».
Для обучения нейронной сети учёные использовали как изображения с более низким разрешением, так и с более высоким. Они утверждают, что поскольку изображения с низким разрешением содержали меньше деталей, система смогла быстро освоить базовые шаблоны работы и перейти от грубых набросков к созданию логотипов с большей детализацией.
Чтобы собрать набор обучающих данных, исследователи сначала подготовили базу данных, содержащую более 120 000 уникальных логотипов в разрешении 400 на 400 пикселей, полученных из Twitter. Затем они исключили из неё все текстовые логотипы, оставив в общей сложности 40 000 образцов. После этого они их дополнили 15 000 «похожих на логотип» изображений из Google, относящихся к природе, технологиям, графическим символам и т. п. И под конец использовали службу Cloud Vision от Google для разметки данных, чтобы каждый образец получил описание, состоящее из от четырёх до восьми слов. Полученные данные они векторизовали с использованием предварительно обученной модели ИИ для создания пространственных представлений, которые затем были сгруппированы по степени похожесть визуальных характеристик.
В ходе трёх испытаний исследователи доказали, что их модель стабильно генерирует логотипы «неизменно высокого качества». Некоторые из них были более простыми, чем другие, по форме, дизайну или цветовой палитре, но команда уверена, что разнообразие результатов указывает на то, что их модель можно обучать и далее на более сложных наборах данных, что ещё больше повысит качество её работы.
Стоит отметить, что использование искусственного интеллекта для создания логотипов совсем не новая идея. Например, канадский стартап Looka (ранее Logojoy) уже несколько лет предлагает своё решение с использованием ИИ, которые может помочь вам получить уникальный логотип буквально за 5 минут на базе указанных вами параметров (общей стилистики, цветовой гаммы, подходящих символов, названия компании).