2022 год может войти в историю как год, когда искусство ИИ стало мейнстримом.

Взрыв качественных инструментов из разных источников, построенных на разных моделях ИИ, делает искусство ИИ доступным для всех, у кого есть смартфон и подключение к Интернету. Инструменты используют модель искусственного интеллекта для преобразования ввода текста, известного как подсказка, в изображение.

Подсказка является ключевой: добавление или удаление одного слова может привести к совершенно разным результатам. «Оперативное проектирование» быстро становится ценным навыком, и модели, которые обучаются на одних и тех же данных и с правильными подсказками, должны давать одинаковые результаты», — говорит Пранав Вайдхьянатан, главный технический директор платформы социальных сетей GenerAI , основанной на искусственном интеллекте . Существует даже растущий рынок подсказок, дающих конкретные результаты .

Вот пять инструментов, которые помогут вам начать работу. Чтобы их сравнить, я дал им всем одну и ту же подсказку: «Человек и робот стоят возле большого дуба на холме с облаками в небе».

ИЗ-Е 2
Компания OpenAI , основанная в 2015 году, попала в заголовки газет после выпуска модели естественного языка GPT-3 в 2020 году. В январе 2021 года последовала модель цифрового изображения DALL-E, которая с тех пор превратилась в DALL-E 2. Модель предлагает отличные образы в самых разных стилях. Конкретные подсказки могут привести к конкретным результатам, или вы можете предложить расплывчатую подсказку и получить несколько совершенно разных результатов.

DALL-E 2, который теперь открыт для всех через веб-сайт OpenAI , является лучшим инструментом для тех, кому интересно, о чем ажиотаж. Это быстро, с заметным отрывом превосходит другие, которые я пробовал, и на сайте легко ориентироваться. Он выдает сразу четыре результата, как правило, в совершенно разных стилях, что снижает частоту повторного запуска подсказки. Результаты DALL-E 2 тоже хорошие. Это единственная модель ИИ, которая изображала и человека, и робота.

Это коммерческий инструмент. Регистрация дает вам 50 бесплатных кредитов, а ежемесячно предлагается еще 15 бесплатных кредитов. Дополнительные кредиты можно приобрести по курсу 115 кредитов за 15 долларов США.

Стабильная диффузия / Dream Studio
Stable Diffusion от Stability AI популярен по тем же причинам, что и DALL-E 2: он быстрый, эффективный и может создавать полезные изображения из самых разных подсказок.

Любой может бесплатно использовать Stable Diffusion через демо-страницу Stable Diffusion . Это не так быстро, как DALL-E 2, но обычно предлагает результаты за 30 секунд или меньше. Он также предоставляет сразу четыре варианта, как и DALL-E 2.

Модель Stable Diffusion имеет открытый исходный код, поэтому серьезные пользователи могут тщательно настроить ее работу. Это увеличило его популярность, поскольку энтузиасты стекаются к этой модели. «Мы определенно наблюдаем тенденцию, когда художников и других людей привлекают модели с открытым исходным кодом, такие как Stable Diffusion, а не модели с закрытым исходным кодом и контролируемые модели, такие как DALL-E 2 от OpenAI», — говорит Вайдхьянатан.

Stability AI имеет коммерческий инструмент Dream Studio , построенный на Stable Diffusion. Он предоставляет пробную версию, после чего продает кредиты для создания новых изображений. Взамен пользователи могут получить доступ к ползункам для настройки результатов модели.

Середина пути
Midjourney заработал репутацию благодаря качеству и вызвал споры после того, как участник конкурса использовал его, чтобы выиграть приз в области цифрового искусства на Ярмарке штата Колорадо, не раскрывая метод создания изображения. Инструмент отлично подходит для ярких, неземных, сюрреалистичных изображений, и пользовательская база приняла его стиль.

Инструмент доступен только через Discord, популярную платформу для обмена мгновенными сообщениями. Подсказки вводятся непосредственно в чат. Чат является общедоступным, поэтому все участники канала могут просматривать введенное вами приглашение и результаты. Это наверняка запутает читателей, не разбирающихся в том, как работает Discord, что, вероятно, считается функцией, а не ошибкой.

Midjourney — это коммерческий продукт, который монетизируется, как и другие коммерческие инструменты искусственного интеллекта. Каждый начинает с примерно 25 кредитов, но для получения большего необходимо ежемесячно платить за членство. Оплата осуществляется через веб-приложение, которое также можно использовать для просмотра изображений, созданных в ответ на ваши запросы.

мелок
Первоначально называвшийся DALL-E Mini, Craiyon не имеет прямой связи с моделью OpenAI, и его создатели предлагают инструмент бесплатно. Для получения результатов может потребоваться до 2 минут, и они имеют низкое разрешение, но одновременно отображаются девять результатов.

Craiyon отличается тем, что использует нефильтрованные данные и не прилагает особых усилий для уточнения, обучения или исправления результатов. Результаты обычно тусклые по сравнению с результатами других инструментов, и ему трудно обрабатывать мелкие детали. Человеческие лица, например, выглядят совершенно тревожно.

Есть новинка в инструменте. Предоставление необработанных результатов раскрывает общие сильные и слабые стороны генерации изображений ИИ, а также сложность создания пригодных для использования результатов. Это также подчеркивает этические проблемы, поскольку Craiyon не фильтрует подсказки. Ввод оскорбительного приглашения демонстрирует, насколько тревожной может быть генерация изображений ИИ, если она используется со злым умыслом.

ВКГАН+КЛИП
Недавняя популярность генераторов изображений ИИ вдохновила на создание сотен инструментов, сочетающих передовые модели ИИ с простым интерфейсом. Одним из таких инструментов является VQGAN+CLIP , полностью работающий в блокноте Google Colaboratory.

Он заслуживает упоминания, потому что он (несколько) прост в использовании, но предлагает заглянуть под капот. Вы увидите, как инструмент повторяет новые варианты в режиме реального времени. И хотя доступ к модели осуществляется в записной книжке Colaboratory, она работает на вашем локальном компьютере. Каждое приглашение начинается как капля, но постепенно превращается в пригодное для использования изображение.

Ну, иногда, по крайней мере. Результаты инструмента часто не очень хороши. Он медленный, выдает только один вариант за раз и потребляет значительное количество видеопамяти. С положительной стороны, однако, это совершенно бесплатно и не содержит рекламы, так что это хороший выбор, если у вас есть свободное время.