Нейронки-2024: обзор лучших для создания изображений
easy

Нейронки-2024: обзор лучших для создания изображений

Классика, хехе

Продолжаем нашу серию статей о нейросетях, которые можно использовать в повседневных и разовых задачах, по работе и для себя. Предыдущая подборка была про нейросети, которые генерируют и обрабатывают текст и создают презентации. Сегодня — статья про создание картинок разных форматов, детализации и сложности. Мы протестировали каждую из них и собрали топ арт-нейронок.

Чтобы было проще ориентироваться, мы пометили каждую нейросеть таким образом:

🆓 — бесплатные нейросети;

💳 — нужно заплатить, но где-то есть и бесплатный пробный период или версия с ограничениями.

Как нейросети генерируют изображения

Чтобы нейросеть умела генерировать изображения, её обучают на огромном наборе данных из тысяч или даже миллионов различных картинок, иллюстраций и фотографий. Перед загрузкой в нейросеть эти данные размечают, чтобы нейронка понимала, что собой представляет то или иное изображение.

Искусственный интеллект анализирует обучающий набор данных и выделяет общие особенности и закономерности для разных объектов. Это помогает нейронке научиться создавать новые изображения на основе полученных знаний. Поскольку обучающие данные размечают текстом, нейросеть генерирует картинки по текстовому описанию — промту. Например, «парень учится программировать» или young man learning Python in cyberpunk style. Некоторые нейросети также работают с антипромтами, или negative prompt, — описанием того, чего не должно быть на генерируемом изображении.

Промт и антипромт преобразуются в случайный числовой вектор, с которым уже дальше работает нейросеть. Она берёт эти числа как стартовые веса и создаёт изображение, отталкиваясь от них.

Бывает, что по простому промту из нескольких слов нейросеть создаёт не то, что нужно, или плохо детализированную картинку. Это значит, что промт нужно доработать: добавить в текст деталей и более подробно описать, что нужно сгенерировать. Научившись составлять хорошие промты, можно создавать очень хорошие изображения. В интернете много инструкций о том, как писать промты для разных нейросетей. С их помощью пользователи создают классные картинки. Авторов настоящих шедевров даже называют AI-художниками.

🆓 Шедеврум

shedevrum.ai

Шедеврум работает только в мобильном приложении (App Store, Google Play), генерация происходит за пару минут. На один запрос создаётся 4 варианта, которые нельзя редактировать. Скачать результат генерации можно только после его публикации на сайте shedevrum.ai. Разрешение готовой картинки — 1024 × 1024 пикселей. Для создания картинок нужен аккаунт в Яндексе.

Шедеврум
Шедеврум

На сайте можно посмотреть изображения, сгенерированные по запросам других пользователей, оценить картинки, прокомментировать или переслать. Бесплатный.

Сайт Шедеврума
Сайт Шедеврума: shedevrum.ai

💳 DALL·E 3

openai.com/dall-e-3

Это уже третья версия нейросети компании AI. Официальная версия работает по подписке через ChatGPT с GPT-4 (нужно попросить чат-бота сгенерировать изображение). Понимает русский язык.

Работает намного круче предыдущей версии. DALL·E 2 хороша, но у неё есть проблемы с анатомией и фотореалистичностью. Третья версия, как и вторая, платная, но можно пользоваться бесплатно с помощью Designer и Image Creator (о них расскажем ниже).

DALL·E 3. У человека 5 пальцев и всё в порядке с анатомией — это хорошо
DALL·E 3. У человека 5 пальцев и всё в порядке с анатомией — это хорошо

🆓 Designer

designer.microsoft.com 

Сервис от Microsoft генерирует изображения с помощью DALL·E 3, на один запрос выдаёт четыре варианта размером 1024 × 1024. Кроме этого, размывает, удаляет фон или отдельные объекты с фотографий. Понимает русский язык.

Можно создавать дизайн, например баннеры или рекламные креативы. Подбирает подписи и хештеги для публикации готовых изображений в соцсетях. В скором времени обещают добавить работу с брендбуками.

Бесплатная, но некоторые функции могут быть доступны только подписчикам Microsoft 365.

Microsoft Designer. Сгенерированное изображение легко распознать по искривлённой клавиатуре и волнообразным строчкам кода на экране
Microsoft Designer. Сгенерированное изображение легко распознать по искривлённой клавиатуре и волнообразным строчкам кода на экране

💳 Dream by WOMBO 

app.wombo.art

Dream by WOMBO работает на сайте и в мобильном приложении. Генерирует изображения в книжной ориентации размером 960 × 1568 пикселей. Есть 119 готовых стилей, из них 89 бесплатные, но также можно задать свой в текстовом запросе. Можно загрузить свою картинку и стилизовать её. Понимает русский язык.

В бесплатной версии создаёт одну картинку на запрос, в платной — четыре. Готовая картинка сохраняется с логотипом в левом нижнем углу, но можно схитрить: открыть картинку в новой вкладке или окне.

Dream by WOMBO
Dream by WOMBO

💳 Hotpot

hotpot.ai

Hotpot — это целое семейство нейронок для создания и обработки изображений. При генерации изображения можно указать в текстовом запросе, что на нём должно быть (What To Draw), а чего — нет (Do Not Draw). Понимает русский язык.

Можно загрузить свою картинку и стилизовать её или использовать в качестве примера желаемого результата. При этом можно определять, насколько генерируемая картинка должна быть похожа на загруженную.

В бесплатной версии можно создавать по одному изображению на запрос — и так до 10 в день. Готовая картинка получается размером 512 × 512 пикселей.

AI Anime Generator генерирует изображения в одном из 17 стилей аниме.

В бесплатной версии можно создавать по одному изображению на запрос — и так до 10 в день. Готовая картинка получается размером 512 × 512 пикселей.

Hotpot AI Anime Generator. Детали выдают сгенерированную картинку, но в целом — весьма неплохо
Hotpot AI Anime Generator. Детали выдают сгенерированную картинку, но в целом — весьма неплохо

AI Art Generator создаёт изображения в 41 стиле, в том числе фотореалистичные, иллюстрации, 3D и живопись (акварель, карандашный рисунок, Клод Моне, Пабло Пикассо). Можно сгенерировать иконку или логотип.

Hotpot AI Art generator
Hotpot AI Art generator

AI Logo Generator генерирует логотипы в одном из 27 стилей. С помощью этой нейросети можно создать логотип, а ещё это хороший вариант, чтобы вдохновиться идеями, указав в запросе как можно больше слов, которые характеризуют компанию или продукт. Например, вот что сделала нейросеть, когда мы попросили её сделать логотип для журнала «Код»:

Hotpot AI Logo Generator.
Hotpot AI Logo Generator. Во славу роботов :-)

🆓 Image Creator from Designer

www.bing.com/create

Это ещё одна обёртка DALL·E 3 от Microsoft, на один запрос создаёт по четыре картинки размером 1024 × 1024. Результаты генерации хранятся до 90 дней. Понимает русский язык. Нужна учётная запись Microsoft.

Бесплатный, но для быстрой обработки запроса требуются бусты (один буст = один запрос). Когда бусты заканчиваются, генерация начинает занимать намного больше времени. Новые пользователи получают 15 бустов в день. История генераций сохраняется.

Image Creator from Designer
Image Creator from Designer. Если с пальцами нейросети более-менее научились справляться, то с клавиатурами — ещё нет

🆓 Kandinsky 3.0

sberbank.com/promo/kandinsky

Третья версия нейросети от «Сбера» генерирует изображения и работает с загруженными: создаёт их варианты, преобразует и дорисовывает. Может создать микс двух фотографий и стилизовать одно изображение на основе другого.

По умолчанию формат генерации 1 : 1 (1024 × 1024 пикселей), но можно выбрать 16 : 9, 9 : 16, 3 : 2 и 2 : 3.

Хорошо понимает русский язык. Основное преимущество нейросети Kandinsky — знание российского национального контекста. Понимает, что такое «кокошник», «венок», «хохлома», «деревянная изба» и так далее. Есть проблемы с анатомией, но поскольку пользоваться нейросетью можно неограниченное количество раз, за несколько попыток получится добиться нужного результата.

Для работы с третьей версией можно зарегистрироваться на тестовом сайте разработчиков, воспользоваться телеграм-ботом или ботом во «ВКонтакте». История генераций сохраняется. Бесплатный.

Kandinsky 3.0
Kandinsky 3.0. Пальцы выглядят странно, но в целом образ удался

💳 Leonardo.AI

leonardo.ai

Многие называют эту нейросеть заменой Midjourney, но иногда с этим сложно согласиться. Изображения часто получаются нерезкими, у нейронки проблемы с анатомией и деталями, она добавляет на элементы, которые были указаны в антипромте, и странно понимает русский язык:

Такую картинку Leonardo.AI сгенерировал по промту «молодые мужчина и женщина сидят за столом за двумя ноутбуками и учатся программировать дома вечером пока на улице идёт снег»
Такую картинку Leonardo.AI сгенерировал по промту «молодые мужчина и женщина сидят за столом за двумя ноутбуками и учатся программировать дома вечером пока на улице идёт снег»

Можно генерировать случайные промты и автоматически улучшать свои при помощи встроенного редактора. Сервис использует несколько моделей генерации изображений, включая несколько собственных, а также Stable Diffusion 1.5 и 2.1. Можно создавать варианты изображений по загруженным или ранее сгенерированным картинкам.

В веб-интерфейсе много настроек:

  • количество генерируемых изображений;
  • размер;
  • пропорции;
  • уровень следования промту.

В бесплатной версии пользователь может потратить 150 кредитов в день. Генерация одного обычного изображения стоит 2 кредита, фотореалистичного — 16. По умолчанию все результаты генерации публичны, изменить эту настройку нельзя.

Leonardo.AI
Leonardo.AI. Генерация по англоязычному промту оказалась намного ближе к тому, что нужно

💳 Lexica Aperture v3.5

lexica.art/aperture

Нейросеть генерирует по четыре изображения на запрос. Можно загрузить свою картинку для примера или использовать результат нейронки, чтобы создать на его базе новые изображения, добавляя текстовые команды, например «сделай окно больше и перемести кота влево». Новые картинки могут отличаться от исходной. 

Чем точнее промт, тем больше результат будет похож на ожидаемый. Понимает русский язык, но не очень хорошо — например, может изобразить мальчика вместо девочки.

Нейросеть не идеальна — например, может пририсовать человеку кошачьи уши вместо того, чтобы изобразить рядом с ним кота, как указано в запросе. Есть проблемы с деталями и анатомией. Генерация может занимать несколько минут, при этом сервис может прерывать работу и просить попробовать позже.

В бесплатной версии можно создать до 48 изображений в месяц (списываются по четыре за запрос). Готовые картинки можно скачать в размере 2048 × 2048 пикселей. История генераций сохраняется.

Lexica Aperture v3.5
Lexica Aperture v3.5. Чем больше котов — тем лучше

💳 Neural Love

neural.love/ai-art-generator

Нейросеть создаёт изображения в стиле фотографии, фэнтези, аниме, живописи, sci-fi, киберпанка, пиксель-арта, стимпанка и синтвейва. Работает с моделями NL 1.0.3 и DALL·E 3. Понимает русский язык.

Можно выбрать из трёх размеров: квадратный 512 × 512, вертикальный 512 × 640 и горизонтальный 640 × 512. По умолчанию на один запрос генерируется 4 изображения, но можно задать 8, 12, 16 и 20. Есть режим HD. В расширенных настройках можно указать антипромт, выбрать количество шагов генерации, уровень следования промту и движок рендера.

В бесплатной версии можно создавать сколько угодно изображений, если количество шагов генерации не превышает 30, но при этом картинки получаются не очень реалистичными. У пользователя есть 5 кредитов, чтобы попробовать разные возможности нейронки.

Neural Love
Neural Love. Парень и девушка учатся программировать, а снег остался где-то за кадром :-)

💳 Playground AI

playgroundai.com/create

Playground AI создаёт изображения в одном из 38 предлагаемых стилей, в том числе фотореалистичных. Можно задать свой стиль, описав его текстом. Для лучшего результата есть поле для ввода антипромта — описания того, чего не должно быть на сгенерированном изображении.

Можно загрузить свою картинку или нарисовать от руки в качестве примера того, что хочется получить от нейросети. Работает на базе Stable Diffusion XL и Stable Diffusion 1.5 — можно выбрать, с какой из версий работать. Понимает русский язык.

У сервиса много настроек, в том числе:

  • размер генерируемых картинок;
  • их количество на один запрос;
  • веса (точность следования описанию, качество и детализация);
  • метод диффузии.

В бесплатной версии можно генерировать до 500 изображений в день, при этом результат можно использовать в коммерческих целях. Создание одной картинки занимает в среднем 100 секунд, но в часы большой нагрузки на сервис может длиться дольше. История генераций сохраняется.

Playground AI
Playground AI

💳 Stable Diffusion XL

stablediffusionweb.com

Эта нейросеть известна в первую очередь за счёт свободного распространения. Её можно использовать локально на своём компьютере как программу, если позволяют оперативная память и видеокарта. 

Работать с нейросетью можно и онлайн. В веб-интерфейсе можно ввести промт и антипромт, задать стиль изображения и его размеры и регулировать веса. Картинки создаются по одной на запрос.

В бесплатной версии можно создавать сколько угодно картинок, но генерация каждой картинки будет занимать несколько минут.

Stable Diffusion
Stable Diffusion

💳 StarryAI

starryai.com

Сервис работает в браузере и мобильном приложении. Генерирует иллюстрации, живопись, фотографии. Можно задать свой стиль или выбрать из коллекции, например пиксель-арт, постер, гиперреализм, ар-деко, графика в стиле Бэнкси или Кацусико Хокусая и так далее.

На один запрос создаёт четыре изображения. Первую из сгенерированных картинок можно доработать или взять за основу для создания её вариантов. Понимает русский язык, но лучше писать промты на английском.

В бесплатной версии пользователь получает 5 кредитов каждый день, изображения генерируются только в пропорции 4 : 5 и размере 512 × 576 . В зависимости от стиля, одна генерация стоит 1 или 2 кредита.

StarryAI
StarryAI. Довольно неплохо, но есть проблемы с пальцами

Что дальше

Впереди ещё много подборок с отличными нейросетями, которые могут облегчить работу или помочь развлечься. Подпишитесь, чтобы не пропустить продолжение.

Обложка:

Алексей Сухов

Корректор:

Ирина Михеева

Вёрстка:

Мария Дронова

Соцсети:

Юлия Зубарева

Получите ИТ-профессию
В «Яндекс Практикуме» можно стать разработчиком, тестировщиком, аналитиком и менеджером цифровых продуктов. Первая часть обучения всегда бесплатная, чтобы попробовать и найти то, что вам по душе. Дальше — программы трудоустройства.
Получите ИТ-профессию Получите ИТ-профессию Получите ИТ-профессию Получите ИТ-профессию
Вам может быть интересно
easy