DragGAN — это новое приложение с искусственным интеллектом, которое позволяет легко настраивать фотографии и рисунки, перетаскивая их по изображению

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


DragGAN — это новое приложение с искусственным интеллектом, которое позволяет легко настраивать фотографии и рисунки, перетаскивая их по изображению. Это действительно так просто, и, честно говоря, я немного одержим этим. Мы видели, как приложения Diffusion, такие как DALLE.2, Stable Diffusion и Midjourney, могут пугать нас изображениями домашних вечеринок с искусственным интеллектом и фальшивой рекламой пива, но теперь мы начинаем видеть использование GAN (Generative adversarial networks - генеративно-состязательных сетей) , и они немного полезнее, если судить по DragGAN.

Генеративно-состязательная нейросеть (англ. Generative adversarial network, сокращённо GAN) – это модель машинного обучения, умеющая имитировать заданное распределение данных. Впервые модель была предложена в статье NeurIPS 2014 г. экспертом в глубоком обучении Яном Гудфеллоу и его коллегами.

GAN состоят из двух нейронных сетей, одна из которых обучена генерировать данные, а другая – отличать смоделированные данные от реальных (отсюда и «состязательный» характер модели). Генеративно-состязательные нейросети показывают впечатляющие результаты в отношении генерации изображений и видео:

- перенос стилей (CycleGAN) – преобразование одного изображения в соответствии со стилем других изображений (например, картин известного художника);

- генерация человеческих лиц (StyleGAN), реалистичные примеры доступны на сайте This Person Does Not Exist.

Хотя это программное обеспечение для редактирования изображений с искусственным интеллектом находится на ранних стадиях — DragGAN существует в виде официального документа — результаты гипнотизируют. DragGAN — это интерактивный способ редактирования фотографий или произведений искусства путем пометки точек на изображении и просто… перетаскивания. ИИ делает всю тяжелую работу. Приложение использует искусственный интеллект для управления изображениями. В игре есть некоторый технический жаргон, но, по сути, ИИ позволяет вам влиять на изображение, сохраняя при этом его целостность; по сути, DragGAN позволяет вам деформировать изображения с помощью интерактивных точек, а генеративный ИИ помогает вносить изменения для плавного и точного конечного результата.

Вы можете настраивать изображения, установленные в различные категории, включая животных, автомобили и людей, а также пейзажи, и настраивать все, от макета изображения до поз и форм, и даже изменять выражение лица человека на фотографии. Исследовательская группа написала: «Представьте, что вы можете просто «перетащить» любую точку изображения именно туда, куда вы хотите. Это то, чего мы стремимся достичь с помощью нашего нового метода, который мы называем DragGAN». Они объясняют, как это работает: «DragGAN состоит из двух основных частей. Первая — это наблюдение за движением на основе признаков, которое помогает вам перемещать любую точку изображения в нужное положение.

Вторая часть — это новый подход к отслеживанию точек, который помогает отслеживать положение этих точек. С помощью DragGAN любой может деформировать изображение и иметь точный контроль над тем, где заканчивается каждый пиксель». Инструмент на основе GAN в настоящее время работает с 2D-изображениями, но команда планирует выпустить версию, которая работает с 3D-моделями. Если вы хотите узнать больше о грядущих приложениях ИИ, прочитайте нашу статью об Adobe Firefly, а чтобы понять, как генераторы искусства ИИ влияют на художников, прочитайте нашу статью «Что может остановить генеративное искусство ИИ?».


Источник: vk.com

Комментарии: