![]() |
![]() |
![]() |
|||||
![]() |
Генератор картинок от разработчиков DeepSeek. Тест-драйв новой нейросети |
||||||
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Разработка ИИГородские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Атаки на ИИ Внедрение ИИИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Промпты. Генеративные запросы Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Авторизация |
2025-03-03 15:25 ![]() Всего месяц назад команда DeepSeek выпустила в открытый доступ новую мультимодальную модель для генерации картинок — Janus-Pro-7B. Разработчики заверяют, что она умеет генерировать изображения, почти неотличимые от настоящих, отлично работает в локальном режиме, бесплатна и превосходит западных конкурентов в ряде задач.
Что нового в Janus-Pro Janus-Pro — это усовершенствованная версия Janus, в которой:
![]() Благодаря этим улучшениям Janus-Pro достигает значительных успехов в мультимодальном понимании и лучше преобразует текст в изображение. Но это только по заверениям разработчиков. Перейдем к тестам. ![]() Развертывание модели на облачном сервере Перейдем к развертыванию модели в облаке. Далее — сравним ее результаты с другими нейросетями. 1. Перейдем в раздел Продукты ? Облачные серверы. ![]() ![]() ![]() ![]() ![]() ![]()
![]()
Скорее всего, разворачивать собственный сервер — это не самый выгодный вариант с точки зрения затрат. Модели, такие как Janus Pro 7B, требуют значительных ресурсов (например, GPU) и времени на настройку, что может быть дорого и нецелесообразно. Проверка качества генерации Важный момент при использовании Janus-Pro-7B — это возможность работы с мультимодальным пониманием и генерацией текста в картинку. Нас интересует второй вариант. ![]() Генерация картинок на разных языках Попробовал задать промт на русском: Белый медведь играет в теннис на марсе с дельфином и слоном. Результат: нейросеть отрисовала пять картинок. Отобрал для вас наиболее адекватные. ![]() Зададим тот же промт, но на английском: A polar bear plays tennis on Mars with a dolphin and an elephant. Результат: точность выше, композиция ближе к ожидаемой. ![]() Финальный босс — традиционный китайский: ??????????????? Результат: из пяти картинок удалось выбрать лишь одну, но и к ней достаточно вопросов. Псевдокитайский (или японский), традиционный дом, лес и облака. Все как просили (нет). ![]() Подробный промт Попробуем задать подробно описанный промт: A highly realistic and cinematic scene featuring Jean-Claude Van Damme, the legendary martial artist and actor, sitting in a perfect split position between two massive semi-trucks on a Texas highway. The composition is dynamic and visually striking, with extreme attention to detail. The trucks are modern, shiny, and reflect the bright sunlight, creating realistic lighting effects. The road stretches into the distance, surrounded by the iconic Texan landscape—rolling golden plains, distant mesquite trees, and a vast blue sky with scattered clouds. The time of day is late afternoon, with warm, golden-hour lighting casting long shadows and enhancing the textures of the environment. Jean-Claude Van Damme is dressed in a classic 90s action-hero outfit: tight black tank top, camouflage pants, and combat boots, showcasing his muscular physique. His expression is calm but confident, exuding strength and focus. Ultra-high detail, photorealistic rendering, 8k resolution, cinematic lighting, volumetric rays, depth of field, realistic skin texture, intricate clothing details, lifelike reflections on the trucks, and an epic widescreen aspect ratio (21:9). Art style inspired by high-end movie posters and hyperrealistic photography. Результат: детализация осталась та же, качество изображения по-прежнему оставляет желать лучшего. ![]() Итог Основная часть обучающих данных, которые используют нейросети, представлена на английском языке — именно на него модели ориентируются в первую очередь. Для других языков качественных данные сильно меньше, что может влиять на точность генерации. ![]() Сравнение с другими моделями Сравним качество генерации Janus-Pro с другими онлайн-нейросетями. Не будем рассматривать слишком популярные варианты, чтобы сравнение было чуть справедливее. Deep Dream Generator Начнем с сайта deepdreamgenerator.com. Ключевые особенности:
А еще никто не запрещает использовать мультиаккаунты. ? ![]() A polar bear plays tennis on Mars with a dolphin and an elephant. Результат: за четыре единицы энергии получилось неплохо, но дельфина забыли. ![]() ![]() ![]() DeepAI Следующий сервис для сравнения — deepai.org. Это универсальная платформа с множеством инструментов: от стандартного чат-бота и генератора изображений до аудиочата и «хуманизатора» ИИ-текстов. Использовать можно без регистрации. Для генерации картинок нужно:
![]() A polar bear plays tennis on Mars with a dolphin and an elephant. ![]() ![]() ![]() Chatbot Arena Последний сервис в нашем сравнении — lmarena.ai. Особенности платформы:
![]() ![]() ![]() Заключение Развернуть модель Janus-Pro-7B локально или в облаке будет полезно, если вам нужно неограниченное количество генераций, а также полный контроль над процессом. Однако стоит помнить, что это требует затрат и времени на настройку. Онлайн-версия модели при этом работает быстро, бесплатна и не требует от вас ресурсов, но накладывает ограничения на количество использований. Пока Janus Pro 7B уступает по качеству генерации бесплатным онлайн-нейросетям, которых на просторах интернета сейчас очень много. Но списывать модель со счетов не стоит. Конкуренция между OpenAI и DeepSeek только растет, а с увеличением финансирования модели будут развиваться. Какими инструментами для генерации картинок пользуетесь вы? Популярными сервисами вроде Dall-E и Midjourney или чем-то менее известным? Делитесь своими находками в комментариях, буду рад обсудить и рассмотреть новые сервисы! Источник: habr.com Комментарии: |
||||||