Нейросети за последние годы добились впечатляющих результатов в создании графики. Искусственный интеллект помогает CG-художником и простым пользователям с обработкой изображений, а также создает свои.
Например, нейросеть StyleGAN научилась создавать реалистичные портреты — так, будто это фото реальных людей. Есть сайт-фотосток, где можно позаимствовать ее работы. StyleGAN обучалась на реальных фото из icons8.
Нейросеть DALL-E 2 умеет делать отличные рисованные иллюстрации в разных стилях и даже воссоздавать масляную живопись в цифре.
Конечно, искусственный интеллект пока не заменяет живого художника: профессионалы или просто внимательные зрители заметят неточности в работе DALL-E. У «Девушки с жемчужной сережкой» немного странная форма уха, в переработке «Джоконды» нереалистичная перспектива, а в иллюстрации с акулой неестественно изображены средний и безымянный палец. Самые хорошие результаты получаются, когда нейросеть делает часть работы, а человек потом это редактирует: так, в соавторстве с нейросетями можно быстрее рисовать локации для игр, обрабатывать фотографии.
Чтобы начать рисовать как настоящий художник, нейросети лучше бы пока продолжать учиться на картинах живых мастеров, а не на своих собственных. К тому же, есть риск, что когда в интернете машинное творчество окончательно смешается с человеческим, копировать работы нейронок начнут люди — начинающие художники. У творений DALL-E внизу есть маркировка, но технически ничто не мешает ее обрезать и перезалить картинку. И даже если маркировка вшита в файл, можно просто сделать скриншот. Поэтому идентификация нейротворчества — серьезная проблема. Это касается не только изображений: с текстами и музыкой ситуация та же.
Выходит, следующие нейросети могут обучаться на некой смеси человеческого и машинного творчества. Конечно, материалы для обучения ИИ проходят какой-то кураторский отбор, но когда нужны сотни тысяч картинок, их не просматривают по одной.
На форуме Hacker News эту тему поднял пользователь albert_e — резюмируем обсуждение.
Айтишники предлагают разные пути решения
- Интернет уже переполнен контентом разного качества — и человеческим, и нейросетевым. Поскольку жесткая цензура — не вариант, будущее за созданием продвинутых фильтров: чтобы сами люди легче находили то, что им нужно. Тогда и с выборкой для обучения моделей проблем не будет.
- Нейросеть Dall-E ставит водяные знаки в свои изображения. Можно делать и незаметную маркировку, в самом файле. Другой вопрос: человек по природе ленив, а нейросети доступны довольно широкой аудитории. Вряд ли все будут с этим заморачиваться.
- Может появиться отдельное направление бизнеса — создавать курируемые массивы данных, очищенные от творчества нейронок. Люди ведь технически могут просматривать все изображения, на которых будет тренироваться ИИ. Конечно, это будет дорого, и только большие компании смогут позволить себе такое.
- Сами нейросети можно попробовать натренировать отличать «их» искусство от «нашего». Большинство сгенерированных картинок может распознать обычный человек — а машина точно справится еще лучше. Впрочем, если научить ИИ распознавать нейросетевое искусство, это может дать толчок к генерации таких изображений, которые отличить будет невозможно.
Некоторые вообще не видят проблемы
- Люди публикуют в интернете не все творчество нейросетей, а только то, что им кажется красивым, интересным, прорывным. Это уже не случайная куча изображений — и, возможно, годный материал для обучения ИИ.
- Обычный авторский контент, который мы видим в интернете, зачастую уже отобран рекомендательными алгоритмами. Они влияют на то, что становится популярным. А на популярность графики, текстов, музыки в свою очередь ориентируются те, кто обучает нейросети. Можно сказать, что ИИ отчасти уже выбирает, на чем ему учиться.
Кто-то считает, что слияние нейросетевого искусства с человеческим неизбежно
- Когда картинки от ИИ станут более распространенными, они повлияют на то, как мы сами будем рисовать и делать фотографии. Сейчас работы живых художников и фотографов в интернете формируют нашу насмотренность и представления о прекрасном. Но когда в поле зрения будет больше работ нейронок, люди начнут перенимать их «взгляд на мир». Возможно, искажения перспективы или формы объектов, которые сейчас нейросети выдают по ошибке, станут новыми трендами.
- Когда контента от нейросетей в интернете станет больше, чем «человеческого», появится огромная проблема, касающаяся не только обучения ИИ. Представьте, что из 10 текстов в поисковой выдаче 9 написаны ИИ. Это будет нас дезинформировать и давать искаженное восприятие.
- В будущем искусственный интеллект сможет выдавать работы людей за свои. И пользователи также смогут присваивать себе творчество нейронок.
Большинство айтишников надеются, что нейросети не поглотят аутентичное искусство
- Нейросети расширяют технические возможности в создании графики, но не всегда это на пользу. В старых играх, например, виртуальный мир был схематичным, и игроку было легко заметить нужный ключ или монеты на столе. Сейчас в AAA-играх графика почти повторяет реальный мир, и с такой детализацией важные артефакты не бросаются в глаза. Для них делают отдельные иконки, подсказки, карты — это возвращает пользователя из игрового мира в интерфейс. Вся прелесть творчества в несовершенстве, оно не должно становиться копией реальности.
- Когда нейросети смогут сгенерировать что угодно, люди перестанут удивляться искусству. С другой стороны, общество так же привыкло, например, к порно — но постановочные ролики многим надоедают, востребованными становятся непрофессиональные видео. И неидеальное человеческое искусство будет востребованным в противовес нейросетевому.
- Пропадет ценность «живого» искусства в коммуникации художника с аудиторией. Любое произведение — диалог одного человека с другим. А нейросети этого дать не могут.
Проблема использования нейросетей, кстати, касается не только творчества, но и кода. Например, GitHub Copilot работает уже год и занимается программированием. Она может написать код по текстовому описанию задачи или помочь разработчику дописать или улучшить его исходник. Copilot тренировали на открытых репозиториях GitHub. Когда нейронка создает код, она, по сути, копирует разные фрагменты человеческого кода, с которым ознакомилась, и склеивает их во что-то свое, используя распространенные паттерны.
Еще прошлым летом возникла бурная дискуссия по поводу авторских прав — вопрос активно обсуждали на том же Hacker News. В основном претензии касаются того, что Copilot — коммерческий проект. Он, с одной стороны, не может заимствовать открытый код с GitHub, который не предназначен для коммерческого использования. С другой стороны, нейросеть напрямую не дублирует его, а берет для обучения.
Очевидно, человеческое законодательство пока несовершенно для контроля нейросетей. И вероятность того, что в будущем машинные тексты, картинки и код неизбежно смешаются с авторскими, довольно велика.