Продолжаем нашу серию статей о нейросетях, которые можно использовать в повседневных и разовых задачах, по работе и для себя. Предыдущая подборка была про нейросети, которые генерируют и обрабатывают текст и создают презентации. Сегодня — статья про создание картинок разных форматов, детализации и сложности. Мы протестировали каждую из них и собрали топ арт-нейронок.
Чтобы было проще ориентироваться, мы пометили каждую нейросеть таким образом:
🆓 — бесплатные нейросети;
💳 — нужно заплатить, но где-то есть и бесплатный пробный период или версия с ограничениями.
Как нейросети генерируют изображения
Чтобы нейросеть умела генерировать изображения, её обучают на огромном наборе данных из тысяч или даже миллионов различных картинок, иллюстраций и фотографий. Перед загрузкой в нейросеть эти данные размечают, чтобы нейронка понимала, что собой представляет то или иное изображение.
Искусственный интеллект анализирует обучающий набор данных и выделяет общие особенности и закономерности для разных объектов. Это помогает нейронке научиться создавать новые изображения на основе полученных знаний. Поскольку обучающие данные размечают текстом, нейросеть генерирует картинки по текстовому описанию — промту. Например, «парень учится программировать» или young man learning Python in cyberpunk style. Некоторые нейросети также работают с антипромтами, или negative prompt, — описанием того, чего не должно быть на генерируемом изображении.
Промт и антипромт преобразуются в случайный числовой вектор, с которым уже дальше работает нейросеть. Она берёт эти числа как стартовые веса и создаёт изображение, отталкиваясь от них.
Бывает, что по простому промту из нескольких слов нейросеть создаёт не то, что нужно, или плохо детализированную картинку. Это значит, что промт нужно доработать: добавить в текст деталей и более подробно описать, что нужно сгенерировать. Научившись составлять хорошие промты, можно создавать очень хорошие изображения. В интернете много инструкций о том, как писать промты для разных нейросетей. С их помощью пользователи создают классные картинки. Авторов настоящих шедевров даже называют AI-художниками.
🆓 Шедеврум
Шедеврум работает только в мобильном приложении (App Store, Google Play), генерация происходит за пару минут. На один запрос создаётся 4 варианта, которые нельзя редактировать. Скачать результат генерации можно только после его публикации на сайте shedevrum.ai. Разрешение готовой картинки — 1024 × 1024 пикселей. Для создания картинок нужен аккаунт в Яндексе.
На сайте можно посмотреть изображения, сгенерированные по запросам других пользователей, оценить картинки, прокомментировать или переслать. Бесплатный.
💳 DALL·E 3
Это уже третья версия нейросети компании AI. Официальная версия работает по подписке через ChatGPT с GPT-4 (нужно попросить чат-бота сгенерировать изображение). Понимает русский язык.
Работает намного круче предыдущей версии. DALL·E 2 хороша, но у неё есть проблемы с анатомией и фотореалистичностью. Третья версия, как и вторая, платная, но можно пользоваться бесплатно с помощью Designer и Image Creator (о них расскажем ниже).
🆓 Designer
Сервис от Microsoft генерирует изображения с помощью DALL·E 3, на один запрос выдаёт четыре варианта размером 1024 × 1024. Кроме этого, размывает, удаляет фон или отдельные объекты с фотографий. Понимает русский язык.
Можно создавать дизайн, например баннеры или рекламные креативы. Подбирает подписи и хештеги для публикации готовых изображений в соцсетях. В скором времени обещают добавить работу с брендбуками.
Бесплатная, но некоторые функции могут быть доступны только подписчикам Microsoft 365.
💳 Dream by WOMBO
Dream by WOMBO работает на сайте и в мобильном приложении. Генерирует изображения в книжной ориентации размером 960 × 1568 пикселей. Есть 119 готовых стилей, из них 89 бесплатные, но также можно задать свой в текстовом запросе. Можно загрузить свою картинку и стилизовать её. Понимает русский язык.
В бесплатной версии создаёт одну картинку на запрос, в платной — четыре. Готовая картинка сохраняется с логотипом в левом нижнем углу, но можно схитрить: открыть картинку в новой вкладке или окне.
💳 Hotpot
Hotpot — это целое семейство нейронок для создания и обработки изображений. При генерации изображения можно указать в текстовом запросе, что на нём должно быть (What To Draw), а чего — нет (Do Not Draw). Понимает русский язык.
Можно загрузить свою картинку и стилизовать её или использовать в качестве примера желаемого результата. При этом можно определять, насколько генерируемая картинка должна быть похожа на загруженную.
В бесплатной версии можно создавать по одному изображению на запрос — и так до 10 в день. Готовая картинка получается размером 512 × 512 пикселей.
AI Anime Generator генерирует изображения в одном из 17 стилей аниме.
В бесплатной версии можно создавать по одному изображению на запрос — и так до 10 в день. Готовая картинка получается размером 512 × 512 пикселей.
AI Art Generator создаёт изображения в 41 стиле, в том числе фотореалистичные, иллюстрации, 3D и живопись (акварель, карандашный рисунок, Клод Моне, Пабло Пикассо). Можно сгенерировать иконку или логотип.
AI Logo Generator генерирует логотипы в одном из 27 стилей. С помощью этой нейросети можно создать логотип, а ещё это хороший вариант, чтобы вдохновиться идеями, указав в запросе как можно больше слов, которые характеризуют компанию или продукт. Например, вот что сделала нейросеть, когда мы попросили её сделать логотип для журнала «Код»:
🆓 Image Creator from Designer
Это ещё одна обёртка DALL·E 3 от Microsoft, на один запрос создаёт по четыре картинки размером 1024 × 1024. Результаты генерации хранятся до 90 дней. Понимает русский язык. Нужна учётная запись Microsoft.
Бесплатный, но для быстрой обработки запроса требуются бусты (один буст = один запрос). Когда бусты заканчиваются, генерация начинает занимать намного больше времени. Новые пользователи получают 15 бустов в день. История генераций сохраняется.
🆓 Kandinsky 3.0
Третья версия нейросети от «Сбера» генерирует изображения и работает с загруженными: создаёт их варианты, преобразует и дорисовывает. Может создать микс двух фотографий и стилизовать одно изображение на основе другого.
По умолчанию формат генерации 1 : 1 (1024 × 1024 пикселей), но можно выбрать 16 : 9, 9 : 16, 3 : 2 и 2 : 3.
Хорошо понимает русский язык. Основное преимущество нейросети Kandinsky — знание российского национального контекста. Понимает, что такое «кокошник», «венок», «хохлома», «деревянная изба» и так далее. Есть проблемы с анатомией, но поскольку пользоваться нейросетью можно неограниченное количество раз, за несколько попыток получится добиться нужного результата.
Для работы с третьей версией можно зарегистрироваться на тестовом сайте разработчиков, воспользоваться телеграм-ботом или ботом во «ВКонтакте». История генераций сохраняется. Бесплатный.
💳 Leonardo.AI
Многие называют эту нейросеть заменой Midjourney, но иногда с этим сложно согласиться. Изображения часто получаются нерезкими, у нейронки проблемы с анатомией и деталями, она добавляет на элементы, которые были указаны в антипромте, и странно понимает русский язык:
Можно генерировать случайные промты и автоматически улучшать свои при помощи встроенного редактора. Сервис использует несколько моделей генерации изображений, включая несколько собственных, а также Stable Diffusion 1.5 и 2.1. Можно создавать варианты изображений по загруженным или ранее сгенерированным картинкам.
В веб-интерфейсе много настроек:
- количество генерируемых изображений;
- размер;
- пропорции;
- уровень следования промту.
В бесплатной версии пользователь может потратить 150 кредитов в день. Генерация одного обычного изображения стоит 2 кредита, фотореалистичного — 16. По умолчанию все результаты генерации публичны, изменить эту настройку нельзя.
💳 Lexica Aperture v3.5
Нейросеть генерирует по четыре изображения на запрос. Можно загрузить свою картинку для примера или использовать результат нейронки, чтобы создать на его базе новые изображения, добавляя текстовые команды, например «сделай окно больше и перемести кота влево». Новые картинки могут отличаться от исходной.
Чем точнее промт, тем больше результат будет похож на ожидаемый. Понимает русский язык, но не очень хорошо — например, может изобразить мальчика вместо девочки.
Нейросеть не идеальна — например, может пририсовать человеку кошачьи уши вместо того, чтобы изобразить рядом с ним кота, как указано в запросе. Есть проблемы с деталями и анатомией. Генерация может занимать несколько минут, при этом сервис может прерывать работу и просить попробовать позже.
В бесплатной версии можно создать до 48 изображений в месяц (списываются по четыре за запрос). Готовые картинки можно скачать в размере 2048 × 2048 пикселей. История генераций сохраняется.
💳 Neural Love
Нейросеть создаёт изображения в стиле фотографии, фэнтези, аниме, живописи, sci-fi, киберпанка, пиксель-арта, стимпанка и синтвейва. Работает с моделями NL 1.0.3 и DALL·E 3. Понимает русский язык.
Можно выбрать из трёх размеров: квадратный 512 × 512, вертикальный 512 × 640 и горизонтальный 640 × 512. По умолчанию на один запрос генерируется 4 изображения, но можно задать 8, 12, 16 и 20. Есть режим HD. В расширенных настройках можно указать антипромт, выбрать количество шагов генерации, уровень следования промту и движок рендера.
В бесплатной версии можно создавать сколько угодно изображений, если количество шагов генерации не превышает 30, но при этом картинки получаются не очень реалистичными. У пользователя есть 5 кредитов, чтобы попробовать разные возможности нейронки.
💳 Playground AI
Playground AI создаёт изображения в одном из 38 предлагаемых стилей, в том числе фотореалистичных. Можно задать свой стиль, описав его текстом. Для лучшего результата есть поле для ввода антипромта — описания того, чего не должно быть на сгенерированном изображении.
Можно загрузить свою картинку или нарисовать от руки в качестве примера того, что хочется получить от нейросети. Работает на базе Stable Diffusion XL и Stable Diffusion 1.5 — можно выбрать, с какой из версий работать. Понимает русский язык.
У сервиса много настроек, в том числе:
- размер генерируемых картинок;
- их количество на один запрос;
- веса (точность следования описанию, качество и детализация);
- метод диффузии.
В бесплатной версии можно генерировать до 500 изображений в день, при этом результат можно использовать в коммерческих целях. Создание одной картинки занимает в среднем 100 секунд, но в часы большой нагрузки на сервис может длиться дольше. История генераций сохраняется.
💳 Stable Diffusion XL
Эта нейросеть известна в первую очередь за счёт свободного распространения. Её можно использовать локально на своём компьютере как программу, если позволяют оперативная память и видеокарта.
У нас есть статьи о том, как это сделать самому. Почитайте, если интересно:
Работать с нейросетью можно и онлайн. В веб-интерфейсе можно ввести промт и антипромт, задать стиль изображения и его размеры и регулировать веса. Картинки создаются по одной на запрос.
В бесплатной версии можно создавать сколько угодно картинок, но генерация каждой картинки будет занимать несколько минут.
💳 StarryAI
Сервис работает в браузере и мобильном приложении. Генерирует иллюстрации, живопись, фотографии. Можно задать свой стиль или выбрать из коллекции, например пиксель-арт, постер, гиперреализм, ар-деко, графика в стиле Бэнкси или Кацусико Хокусая и так далее.
На один запрос создаёт четыре изображения. Первую из сгенерированных картинок можно доработать или взять за основу для создания её вариантов. Понимает русский язык, но лучше писать промты на английском.
В бесплатной версии пользователь получает 5 кредитов каждый день, изображения генерируются только в пропорции 4 : 5 и размере 512 × 576 . В зависимости от стиля, одна генерация стоит 1 или 2 кредита.
Что дальше
Впереди ещё много подборок с отличными нейросетями, которые могут облегчить работу или помочь развлечься. Подпишитесь, чтобы не пропустить продолжение.