Пару лет были популярны дипфейки, сейчас активно развиваются более полезные сервисы — которые не обрабатывают фото, а генерируют картинки с нуля по ключевым словам.
Таких технологий уже довольно много, и каждая нейронка демонстрирует свое уникальное «творческое видение». Вот, например, примеры творчества трех ИИ по одному текстовому запросу (изображение: fabians.eth / Twitter):
Так «нейрохудожники» работают на полную мощность. Техзадания им раздают специалисты или люди, отобранные для тест-драйва — разработчики, художники, ученые и журналисты. Сейчас, например, можно записаться в лист ожидания на тестирование DALL-E 2.
А пока ждете, можете поработать с нейронками, которые уже есть в открытом доступе — это чуть более старые разработки или бета-версии новых ИИ. Они выдают вполне годные результаты. Если вы еще платите дизайнеру за обложки своих Youtube-роликов или баннеры на личном сайте, можно «нанять» нейросеть и сэкономить. Представляем вашему вниманию несколько кандидатов: мы уже выдали им тестовые задания.
Бета-версия Midjourney
Midjourney — искусственный интеллект, запущенный начале 2022 года — это стартап американского математика Дэвида Хольца. Сейчас над Midjourney трудится небольшая команда из 11 человек, проект самофинансируемый.
Midjourney состоит как бы из двух сообщающихся нейросетей — одна расшифровывает текст, а другая создает по ключевым словам картинку. Ничего прорывного в этом нет, подобные технологии были раньше. Но Midjourney покорила публику своей доступностью — каждый может сгенерировать изображение приличного качества через чат в Discord.
Для этого на официальном сайте нужно кликнуть по кнопке Join the beta, перейти в их сервер в Discord и войти в один из чатов с названием Newbies. Там у вас будет 25 бесплатных минут, чтобы создать шедевр.
В строку сообщения нужно ввести команду «/imagine», а затем в открывшемся поле вписать интересующий текст — это могут быть ключевые слова через запятую или связные предложения.
Мы решили заказать нейросети портрет кота-айтишника. В разных сочетаниях использовали слова cat, kitten, computer, laptop, information technology, office. Вот несколько результатов из выдачи (изображение: Midjourney):
Котов ИИ рисует весьма правдоподобно, а с компьютерами что-то не ладится: Midjourney будто собирает очертания ноутбука из фрагментов других предметов. Но выглядит все равно занимательно. А с более традиционными сюжетами нейронка справляется еще лучше: в чате в Discord вы будете видеть все, что генерируют другие пользователи.
Нейросеть можно подталкивать в нужном направлении, чтобы доводить картинки до ума. Получив первый запрос, Midjounrney выдаст вам 4 изображения. Потом можно выбрать одно из них и доработать детали (командами U1, U2, U3 и U4) либо сделать еще 4 варианта на его основе (командами V1, V2, V3, V4).
Если вы выбрали одну из команд с буквой U, система выдаст вам увеличенную картинку, с которой можно будет продолжить работу — сделать обработку, добавить еще вариаций или увеличить до максимального размера — 1664×1664 px.
Спустя 25 минут нам так и не удалось добиться реалистичного ноутбука, зато котов Midjourney нагенерила на любой вкус. Может, нагенерит и что-нибудь полезное для вас. Для тех, кому 25 попыток будет мало, есть разные тарифные планы — от 10 долларов в месяц.
Craiyon
Этим летом многих поразила реалистичная живопись, созданная нейросетью DALL-E 2 на основе классических картин.
С полной версией развлечься могут только те, кого компания отберет для тест-драйва. Зато есть доступная мини-версия DALL-E — Craiyon. Она, конечно, не так круто натренирована, а изображения доступны только в небольшом разрешении, но интересные результаты получить вполне можно. А еще Craiyon — open source проект, разработчики могут найти код на Github и потренировать нейросеть самостоятельно.
Мы решили заказать Craiyon портрет кота-программиста — наше стандартное тестовое задание — и отобрали интересные варианты.
Это творчество далеко от живописи старых мастеров, зато креатива хоть отбавляй. А еще сервис полностью бесплатный — можно вдоволь экспериментировать. Главный минус — картинки получаются маленькими, 256×256 px. Но для иллюстрации к посту в Twitter вполне сгодится.
Dream Studio от Stable Diffusion
Dream Studio — пользовательский сервис на основе нейросети Stable Diffusion. Это еще один конкурент Midjourney и DALL-E 2. Над Stable Diffusion работают исследователи из Великобритании и Калифорнии, тренировка первой версии нейросети стоила 600 000 долларов. Вот так Stable Diffusion, например, переделывает картины классиков:
Изначально бета-версия Stable Diffusion была доступна в Discord, как и Midjourney. Но сейчас доступ закрыли и запустили полноценный пользовательский сервис на отдельном сайте. Интерфейс простой и удобный, есть много возможностей для кастомизации изображений: можно увеличить ширину или высоту, количество изображений под один запрос и число шагов, которое нейросеть совершит для генерации.
Вот несколько интересных портретов кота, которые нам выдала нейросеть (изображение: Dream Studio):
Максимальный размер картинок — 1024×1024 px. Сервис не полностью бесплатный, там сложная система кредитов (credits). На старте каждому пользователю дают 200 кредитов. У каждой картинки своя стоимость — в зависимости от размера и числа шагов для ее генерации — от 0,2 до нескольких кредитов. Когда лимит будет исчерпан, кредиты можно докупить — подробные условия можно найти в разделе FAQ на сайте.
Starryai
В этом сервисе можно задавать не только текстовые ТЗ, но и выбрать желаемый стиль изображения, а также загрузить фото в качестве референса для нейросети. В основе Starryai три алгоритма. Первый, Altair, создает более абстрактную графику. Второй, Orion, близок к фотореализму. Третий, Argo, специализируется на рендеринге. В начале работы предлагается выбрать один из этих ИИ, которому вы доверите задачу.
Мы сделали по одному запросу для каждой нейронки, вразумительный результат получился только у Argo — кошачья анатомия немного хромает, но, в целом, вполне убедительная 3D-визуализация.
Алгоритмы Orion и Altair выдавали интересные, но сильно искаженные изображения, в которых трудно что-либо разобрать. Вот примеры картинок по текстовому запросу:
Мы попробовали дать нейросети фото в качестве подсказки, но понятного изображения все равно не получили: алгоритм просто исказил фотографию.
В галерее Starryai можно найти более правдоподобную графику — вероятно, на нее просто требуется потратить гораздо больше попыток — мы сделали всего 15. На старте пользователю дают 5 кредитов. Одна картинка стоит от 1 до 2 кредитов, плюс дополнительно они могут взиматься за расширенные настройки — например, если захотите увеличить изображение. Получить дополнительные кредиты можно за плату или за репосты — подробные условия приведены на сайте.
Dream
Это нейросеть от канадской студии Wombo, которая по принципу работы похожа на Starriai. Ее выпустили еще в конце 2021 года, тогда она генерировала абстракции, но сейчас уже научилась вполне прилично рисовать предметы и персонажей. Тут также можно вводить текстовые описания, выбирать из нескольких стилей и, при желании, давать нейросети фотореференс. Правда, алгоритм всего один, а не три. Зато Dream полностью бесплатный и наш кот похож на кота с первых же попыток. Вот работы нейросети по текстовому запросу (изображение: Dream):
А так Dream обработал наш референс — можно сказать, получилась готовая иллюстрация.
Бесплатно можно генерировать любое количество изображений со всеми доступными параметрами и скачивать их в вертикальном формате с копирайтом. Платно, после регистрации, можно заказать печать своей картины — если вдруг захотите повесить нейроискусство на стену.
Что в итоге
Нейросети действительно могут отчасти заменить дизайнеров и иллюстраторов — при должном терпении от алгоритмов можно добиться неплохих результатов. Но не все разработки пока доступны широкой аудитории: если вам интересно, какие вообще нейронки выпускали за последние годы, читайте наш обзор.
Нейросети развиваются в разных областях компьютерной графике, и не только в ней — алгоритмы сочиняют музыку и пишут код. Разные сценарии восстания машин в августе активно обсуждали пользователи Hacker News — почитайте основные тезисы.