Рисуем портрет кота-айтишника: наш тест 5 нейросетей для генерации картинок

Готовы применять искусственный интеллект с пользой? Мы проверили в работе 5 бесплатных сервисов для генерации картинок — попросили их нарисовать портрет кота-айтишника для Bubble, и теперь делимся результатами. Посмотрите, вдруг нейронки могут быть полезны и вам.

Пару лет были популярны дипфейки, сейчас активно развиваются более полезные сервисы — которые не обрабатывают фото, а генерируют картинки с нуля по ключевым словам. 

Таких технологий уже довольно много, и каждая нейронка демонстрирует свое уникальное «творческое видение». Вот, например, примеры творчества трех ИИ по одному текстовому запросу (изображение: fabians.eth / Twitter):

Так «нейрохудожники» работают на полную мощность. Техзадания им раздают специалисты или люди, отобранные для тест-драйва — разработчики, художники, ученые и журналисты. Сейчас, например, можно записаться в лист ожидания на тестирование DALL-E 2

А пока ждете, можете поработать с нейронками, которые уже есть в открытом доступе — это чуть более старые разработки или бета-версии новых ИИ. Они выдают вполне годные результаты. Если вы еще платите дизайнеру за обложки своих Youtube-роликов или баннеры на личном сайте, можно «нанять» нейросеть и сэкономить. Представляем вашему вниманию несколько кандидатов: мы уже выдали им тестовые задания.

По теме
«Будут проблемы». Что нас ждёт, когда картинок от нейросетей станет слишком много
«Будут проблемы». Что нас ждёт когда картинок от нейросетей станет слишком много

Бета-версия Midjourney

Midjourney — искусственный интеллект, запущенный начале 2022 года — это стартап американского математика Дэвида Хольца. Сейчас над Midjourney трудится небольшая команда из 11 человек, проект самофинансируемый. 

Midjourney состоит как бы из двух сообщающихся нейросетей — одна расшифровывает текст, а другая создает по ключевым словам картинку. Ничего прорывного в этом нет, подобные технологии были раньше. Но Midjourney покорила публику своей доступностью — каждый может сгенерировать изображение приличного качества через чат в Discord.

Для этого на официальном сайте нужно кликнуть по кнопке Join the beta, перейти в их сервер в Discord и войти в один из чатов с названием Newbies. Там у вас будет 25 бесплатных минут, чтобы создать шедевр.

В строку сообщения нужно ввести команду «/imagine», а затем в открывшемся поле вписать интересующий текст — это могут быть ключевые слова через запятую или связные предложения. 

Мы решили заказать нейросети портрет кота-айтишника. В разных сочетаниях использовали слова cat, kitten, computer, laptop, information technology, office. Вот несколько результатов из выдачи (изображение: Midjourney):

Котов ИИ рисует весьма правдоподобно, а с компьютерами что-то не ладится: Midjourney будто собирает очертания ноутбука из фрагментов других предметов. Но выглядит все равно занимательно. А с более традиционными сюжетами нейронка справляется еще лучше: в чате в Discord вы будете видеть все, что генерируют другие пользователи.

Нейросеть можно подталкивать в нужном направлении, чтобы доводить картинки до ума. Получив первый запрос, Midjounrney выдаст вам 4 изображения. Потом можно выбрать одно из них и доработать детали (командами U1, U2, U3 и U4) либо сделать еще 4 варианта на его основе (командами V1, V2, V3, V4). 

Изображение: интерфейс чата Midjourney в Discord, работа с четырьмя картинками

Если вы выбрали одну из команд с буквой U, система выдаст вам увеличенную картинку, с которой можно будет продолжить работу — сделать обработку, добавить еще вариаций или увеличить до максимального размера — 1664×1664 px.

Изображение: интерфейс чата Midjourney в Discord, работа с одной картинкой

Спустя 25 минут нам так и не удалось добиться реалистичного ноутбука, зато котов Midjourney нагенерила на любой вкус. Может, нагенерит и что-нибудь полезное для вас. Для тех, кому 25 попыток будет мало, есть разные тарифные планы — от 10 долларов в месяц.

Craiyon

Этим летом многих поразила реалистичная живопись, созданная нейросетью DALL-E 2 на основе классических картин.

Изображение: творчество DALL-E 2

С полной версией развлечься могут только те, кого компания отберет для тест-драйва. Зато есть доступная мини-версия DALL-E — Craiyon. Она, конечно, не так круто натренирована, а изображения доступны только в небольшом разрешении, но интересные результаты получить вполне можно. А еще Craiyon — open source проект, разработчики могут найти  код на Github и потренировать нейросеть самостоятельно.

Мы решили заказать Craiyon портрет кота-программиста — наше стандартное тестовое задание — и отобрали интересные варианты.

Изображение: Craiyon

Это творчество далеко от живописи старых мастеров, зато креатива хоть отбавляй. А еще сервис полностью бесплатный — можно вдоволь экспериментировать. Главный минус — картинки получаются маленькими, 256×256 px. Но для иллюстрации к посту в Twitter вполне сгодится.

Dream Studio от Stable Diffusion

Dream Studio — пользовательский сервис на основе нейросети Stable Diffusion. Это еще один конкурент Midjourney и DALL-E 2. Над Stable Diffusion работают исследователи из Великобритании и Калифорнии, тренировка первой версии нейросети стоила 600 000 долларов. Вот так Stable Diffusion, например, переделывает картины классиков:

По теме
Как выбрать графический планшет. И зачем он вам, если вы не дизайнер
Как выбрать графический планшет. И зачем он вам если вы не дизайнер
Изображение: Images_ai / Twitter

Изначально бета-версия Stable Diffusion была доступна в Discord, как и Midjourney. Но сейчас доступ закрыли и запустили полноценный пользовательский сервис на отдельном сайте. Интерфейс простой и удобный, есть много возможностей для кастомизации изображений: можно увеличить ширину или высоту, количество изображений под один запрос и число шагов, которое нейросеть совершит для генерации.

Изображение: интерфейс Dream Studio

Вот несколько интересных портретов кота, которые нам выдала нейросеть (изображение: Dream Studio):

Максимальный размер картинок — 1024×1024 px. Сервис не полностью бесплатный, там сложная система кредитов (credits). На старте каждому пользователю дают 200 кредитов. У каждой картинки своя стоимость — в зависимости от размера и числа шагов для ее генерации — от 0,2 до нескольких кредитов. Когда лимит будет исчерпан, кредиты можно докупить — подробные условия можно найти в разделе FAQ на сайте.

Starryai

В этом сервисе можно задавать не только текстовые ТЗ, но и выбрать желаемый стиль изображения, а также загрузить фото в качестве референса для нейросети. В основе Starryai три алгоритма. Первый, Altair, создает более абстрактную графику. Второй, Orion, близок к фотореализму. Третий, Argo, специализируется на рендеринге. В начале работы предлагается выбрать один из этих ИИ, которому вы доверите задачу.

Мы сделали по одному запросу для каждой нейронки, вразумительный результат получился только у Argo — кошачья анатомия немного хромает, но, в целом, вполне убедительная 3D-визуализация.

Изображение: Starryai, алгоритм Argo

Алгоритмы Orion и Altair выдавали интересные, но сильно искаженные изображения, в которых трудно что-либо разобрать. Вот примеры картинок по текстовому запросу:

Изображение: Starryai, алгоритм Orion
Изображение: Starryai, алгоритм Altair

Мы попробовали дать нейросети фото в качестве подсказки, но понятного изображения все равно не получили: алгоритм просто исказил фотографию.

По теме
Что такое искусство новых медиа и как стать художником в цифровую эпоху
Что такое искусство новых медиа и как стать художником в цифровую эпоху
Изображение: наш рефреренс / WallBox
Изображение: Starryai, алгоритм Altair

В галерее Starryai можно найти более правдоподобную графику — вероятно, на нее просто требуется потратить гораздо больше попыток — мы сделали всего 15. На старте пользователю дают 5 кредитов. Одна картинка стоит от 1 до 2 кредитов, плюс дополнительно они могут взиматься за расширенные настройки — например, если захотите увеличить изображение. Получить дополнительные кредиты можно за плату или за репосты — подробные условия приведены на сайте.

Dream

Это нейросеть от канадской студии Wombo, которая по принципу работы похожа на Starriai. Ее выпустили еще в конце 2021 года, тогда она генерировала абстракции, но сейчас уже научилась вполне прилично рисовать предметы и персонажей. Тут также можно вводить текстовые описания, выбирать из нескольких стилей и, при желании, давать нейросети фотореференс. Правда, алгоритм всего один, а не три. Зато Dream полностью бесплатный и наш кот похож на кота с первых же попыток. Вот работы нейросети по текстовому запросу (изображение: Dream):  

А так Dream обработал наш референс — можно сказать, получилась готовая иллюстрация.

Изображение: Dream

Бесплатно можно генерировать любое количество изображений со всеми доступными параметрами и скачивать их в вертикальном формате с копирайтом. Платно, после регистрации, можно заказать печать своей картины — если вдруг захотите повесить нейроискусство на стену.

По теме
Нейросети против дизайнеров: кажется, пришло время кому-то сменить профессию
Нейросети против дизайнеров: кажется пришло время кому-то сменить профессию

Что в итоге

Нейросети действительно могут отчасти заменить дизайнеров и иллюстраторов — при должном терпении от алгоритмов можно добиться неплохих результатов. Но не все разработки пока доступны широкой аудитории: если вам интересно, какие вообще нейронки выпускали за последние годы, читайте наш обзор

Нейросети развиваются в разных областях компьютерной графике, и не только в ней — алгоритмы сочиняют музыку и пишут код. Разные сценарии восстания машин в августе активно обсуждали пользователи Hacker News — почитайте основные тезисы.

article widget img
«‎‎Главная ошибка собеса — подгонять ответы»‎. Рекрутеры рассказали о найме в IT
Откуда берутся IT-рекрутеры, с какими трудностями они сталкиваются в попытках закрыть позиции и какие ошибки сами совершают на интервью — полезно знать перед тем, как искать работу.
Телеграм-канал про Образо­вание, карьеру и жизнь в IT
Телеграм-канал про Образо­вание, карьеру и жизнь в IT

Читайте по теме

Дизайн
Дизайн
8

Дизайн

Как применять дизайнерский подход к работе и жизни
nerd head nerd letter

Мир содрогнулся, когда узнал, что читают разработчики по ночам...

Ничего криминального — только полезная еженедельная рассылка от Bubble. Тренды в айти, лайфхаки и советы экспертов.

Подписывайся!

Ты — котик! Проверяй почту
Нам нужен настоящий адрес эл. почты
Спецпредложения
Курсы со скидками для пользователей Bubble
Выбрать курс
Освоить за выходные
Экспресс-курсы программирования
Выбрать курс
Баг пофиксил
Курсы для QA-инженеров
Выбрать курс
Звездочка к резюме
Курсы по карьерному росту
Выбрать курс
Реклама на Bubble
Реклама на Bubble
Подписывайся на Bubble в соцсетях
Подписывайся на BUBBLE в социальных сетях
Телеграм-канал про Образование, карьеру и жизнь в IT
Только полезный контент и ничего лишнего.