DragGAN — это новое приложение с искусственным интеллектом, которое позволяет легко настраивать фотографии и рисунки, перетаскивая их по изображению

2023-05-23 10:10

DragGAN — это новое приложение с искусственным интеллектом, которое позволяет легко настраивать фотографии и рисунки, перетаскивая их по изображению. Это действительно так просто, и, честно говоря, я немного одержим этим. Мы видели, как приложения Diffusion, такие как DALLE.2, Stable Diffusion и Midjourney, могут пугать нас изображениями домашних вечеринок с искусственным интеллектом и фальшивой рекламой пива, но теперь мы начинаем видеть использование GAN (Generative adversarial networks - генеративно-состязательных сетей) , и они немного полезнее, если судить по DragGAN.

Генеративно-состязательная нейросеть (англ. Generative adversarial network, сокращённо GAN) – это модель машинного обучения, умеющая имитировать заданное распределение данных. Впервые модель была предложена в статье NeurIPS 2014 г. экспертом в глубоком обучении Яном Гудфеллоу и его коллегами.

GAN состоят из двух нейронных сетей, одна из которых обучена генерировать данные, а другая – отличать смоделированные данные от реальных (отсюда и «состязательный» характер модели). Генеративно-состязательные нейросети показывают впечатляющие результаты в отношении генерации изображений и видео:

- перенос стилей (CycleGAN) – преобразование одного изображения в соответствии со стилем других изображений (например, картин известного художника);

- генерация человеческих лиц (StyleGAN), реалистичные примеры доступны на сайте This Person Does Not Exist.

Хотя это программное обеспечение для редактирования изображений с искусственным интеллектом находится на ранних стадиях — DragGAN существует в виде официального документа — результаты гипнотизируют. DragGAN — это интерактивный способ редактирования фотографий или произведений искусства путем пометки точек на изображении и просто… перетаскивания. ИИ делает всю тяжелую работу. Приложение использует искусственный интеллект для управления изображениями. В игре есть некоторый технический жаргон, но, по сути, ИИ позволяет вам влиять на изображение, сохраняя при этом его целостность; по сути, DragGAN позволяет вам деформировать изображения с помощью интерактивных точек, а генеративный ИИ помогает вносить изменения для плавного и точного конечного результата.

Вы можете настраивать изображения, установленные в различные категории, включая животных, автомобили и людей, а также пейзажи, и настраивать все, от макета изображения до поз и форм, и даже изменять выражение лица человека на фотографии. Исследовательская группа написала: «Представьте, что вы можете просто «перетащить» любую точку изображения именно туда, куда вы хотите. Это то, чего мы стремимся достичь с помощью нашего нового метода, который мы называем DragGAN». Они объясняют, как это работает: «DragGAN состоит из двух основных частей. Первая — это наблюдение за движением на основе признаков, которое помогает вам перемещать любую точку изображения в нужное положение.

Вторая часть — это новый подход к отслеживанию точек, который помогает отслеживать положение этих точек. С помощью DragGAN любой может деформировать изображение и иметь точный контроль над тем, где заканчивается каждый пиксель». Инструмент на основе GAN в настоящее время работает с 2D-изображениями, но команда планирует выпустить версию, которая работает с 3D-моделями. Если вы хотите узнать больше о грядущих приложениях ИИ, прочитайте нашу статью об Adobe Firefly, а чтобы понять, как генераторы искусства ИИ влияют на художников, прочитайте нашу статью «Что может остановить генеративное искусство ИИ?».

Источник: vk.com



		DragGAN — это новое приложение с искусственным интеллектом, которое позволяет легко настраивать фотографии и рисунки, перетаскивая их по изображению
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Разработка ИИ ИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Внедрение ИИ Big data Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Работа разума и сознание Изучение сна Изучение сознания Нейроинтерфейс Психология Работа мозга Работа памяти Работа разума Модель мозга Модель мозга Робототехника, БПЛА Беспилотные автомобили БПЛА Робототехника Трансгуманизм Трансгуманизм Обработка текста Анализ социальных сетей Компьютерная лингвистика Лингвистика Поисковые алгоритмы Теория эволюции Головной мозг Нейронные сети Поведение животных Теория эволюции Дополненная реальность Виртулаьная реальность Дополненная реальность Железо Интернет вещей Квантовый компьютер Нейронные процессоры облачные вычисления Суперкомпьютеры Киберугрозы Кибербезопасность Научный мир Методы исследования Наука и образование Семинары ИТ индустрия ИТ-гиганты Новости ит Разработка ПО Разработка ПО Теория алгоритмов Теория информации Кластеризация Математика Актуальная математика Статистика Теория вероятности Теория информации Теория хаоса Цифровая экономика Технология блокчейн Цифровая экономика Авторизация RSS RSS новости		2023-05-23 10:10 искусственный интеллект DragGAN — это новое приложение с искусственным интеллектом, которое позволяет легко настраивать фотографии и рисунки, перетаскивая их по изображению. Это действительно так просто, и, честно говоря, я немного одержим этим. Мы видели, как приложения Diffusion, такие как DALLE.2, Stable Diffusion и Midjourney, могут пугать нас изображениями домашних вечеринок с искусственным интеллектом и фальшивой рекламой пива, но теперь мы начинаем видеть использование GAN (Generative adversarial networks - генеративно-состязательных сетей) , и они немного полезнее, если судить по DragGAN. Генеративно-состязательная нейросеть (англ. Generative adversarial network, сокращённо GAN) – это модель машинного обучения, умеющая имитировать заданное распределение данных. Впервые модель была предложена в статье NeurIPS 2014 г. экспертом в глубоком обучении Яном Гудфеллоу и его коллегами. GAN состоят из двух нейронных сетей, одна из которых обучена генерировать данные, а другая – отличать смоделированные данные от реальных (отсюда и «состязательный» характер модели). Генеративно-состязательные нейросети показывают впечатляющие результаты в отношении генерации изображений и видео: - перенос стилей (CycleGAN) – преобразование одного изображения в соответствии со стилем других изображений (например, картин известного художника); - генерация человеческих лиц (StyleGAN), реалистичные примеры доступны на сайте This Person Does Not Exist. Хотя это программное обеспечение для редактирования изображений с искусственным интеллектом находится на ранних стадиях — DragGAN существует в виде официального документа — результаты гипнотизируют. DragGAN — это интерактивный способ редактирования фотографий или произведений искусства путем пометки точек на изображении и просто… перетаскивания. ИИ делает всю тяжелую работу. Приложение использует искусственный интеллект для управления изображениями. В игре есть некоторый технический жаргон, но, по сути, ИИ позволяет вам влиять на изображение, сохраняя при этом его целостность; по сути, DragGAN позволяет вам деформировать изображения с помощью интерактивных точек, а генеративный ИИ помогает вносить изменения для плавного и точного конечного результата. Вы можете настраивать изображения, установленные в различные категории, включая животных, автомобили и людей, а также пейзажи, и настраивать все, от макета изображения до поз и форм, и даже изменять выражение лица человека на фотографии. Исследовательская группа написала: «Представьте, что вы можете просто «перетащить» любую точку изображения именно туда, куда вы хотите. Это то, чего мы стремимся достичь с помощью нашего нового метода, который мы называем DragGAN». Они объясняют, как это работает: «DragGAN состоит из двух основных частей. Первая — это наблюдение за движением на основе признаков, которое помогает вам перемещать любую точку изображения в нужное положение. Вторая часть — это новый подход к отслеживанию точек, который помогает отслеживать положение этих точек. С помощью DragGAN любой может деформировать изображение и иметь точный контроль над тем, где заканчивается каждый пиксель». Инструмент на основе GAN в настоящее время работает с 2D-изображениями, но команда планирует выпустить версию, которая работает с 3D-моделями. Если вы хотите узнать больше о грядущих приложениях ИИ, прочитайте нашу статью об Adobe Firefly, а чтобы понять, как генераторы искусства ИИ влияют на художников, прочитайте нашу статью «Что может остановить генеративное искусство ИИ?». Источник: vk.com Комментарии:

DragGAN — это новое приложение с искусственным интеллектом, которое позволяет легко настраивать фотографии и рисунки, перетаскивая их по изображению

Комментарии: