Может ли ИИ вдохновить вас на создание следующего уродливого праздничного свитера?
Как бы странно это ни звучало, последние достижения в области машинного обучения сделали это возможным. CALA , «операционная система для моды», которая помогает дизайнерам создавать эскизы, прототипы и производить новые продукты, является первым сервисом, реализующим API DALL-E OpenAI . Его новый генеративный инструмент искусственного интеллекта доступен бесплатно.
«Сценарий использования позволяет любому донести свою идею без полного эскиза или 3D-рендеринга, поскольку DALL-E генерирует идеи с помощью текстового ввода», — говорит Эндрю Вятт , соучредитель и генеральный директор CALA. «Мы продолжаем демократизировать доступ в отрасли, которая исторически была очень изолированной».
DALL-E для электронной моды?
Основанная в 2016 году, CALA — это модная платформа, созданная для дизайнеров, которые ищут доступный способ превратить идеи в материальные продукты. Сервис доступен как на сайте, так и в мобильном приложении. Любой может зарегистрироваться и попробовать платформу бесплатно, что я и сделал.
Он во многом похож на художественные генераторы искусственного интеллекта, такие как DALL-E 2 и Stable Diffusion , но адаптирован для платформы CALA. Вместо того, чтобы вводить текстовую подсказку в виде одной длинной строки текста, дизайнерам рекомендуется сначала выбрать базовый стиль, например свитер, блузку или сумку, из списка из 25 вариантов. Затем дизайнеры используют генеративный ИИ для изменения стиля с помощью двух текстовых подсказок. Первый описывает дизайн на основе прилагательных и материалов, а другой описывает желаемую отделку и функции, такие как манжеты или молнии.
«Мы хотим предотвратить ситуацию, когда кто-то приходит, набирает «коричневая рубашка» и думает, что это отстой».
— Эндрю Вятт, CALA
Вятт считает, что этот альтернативный пользовательский интерфейс поможет дизайнерам сосредоточить внимание на важных функциях и избежать ошибок. «Что мы здесь делаем, так это создаем пользовательский интерфейс поверх оперативной разработки. Наша цель здесь — как можно быстрее привести людей к значимому результату». Это, как надеется Вятт, уведет дизайнеров от тупиковых или непривлекательных результатов. «Мы хотим предотвратить ситуацию, когда кто-то приходит, набирает «коричневая рубашка» и думает, что это отстой».
Я видел результаты этой тактики в своих собственных беспорядочных попытках сделать хэллоуинский свитер. Дизайн одежды, по общему признанию, находится далеко за пределами моей зоны комфорта, но я нашел этот инструмент доступным. Весь процесс, включая время ожидания результатов, занял меньше минуты. CALA представляет одновременно шесть результатов, любой из которых затем можно вставить в платформу проектирования для дальнейшей итерации.
Реализация CALA не должна восприниматься как инструмент проектирования одним щелчком мыши. Дизайнерам все еще нужно привнести свои навыки и научиться использовать платформу CALA. Тем не менее, Вятт надеется, что искусственный интеллект значительно уменьшит входной барьер для новых дизайнеров и даст дизайнерам-ветеранам возможность преодолевать творческие препятствия.
«Мы хотим, чтобы люди взяли идею и просто пошли по кроличьей тропе, переходя от варианта к варианту к варианту», — говорит Вятт. «Мы думаем, что это поможет людям придумывать более безумные и разные концепции».
Простота использования может стимулировать рост DALL-E
Инструмент CALA — это первая общедоступная реализация OpenAI DALL-E API третьей стороной. API в настоящее время недоступен для общественности и не имеет даты выпуска.
Это не первое родео OpenAI. GPT-3 , модель языка глубокого обучения компании, была выпущена в качестве API в 2020 году и была быстро принята третьими сторонами. В настоящее время GPT-3 используется десятками компаний и организаций, включая Copysmith и MessageBird . Microsoft приобрела лицензию на использование модели GPT-3 для Microsoft Power Apps и Azure OpenAI Service .
Люк Миллер, менеджер по продуктам OpenAI, говорит, что компания извлекла ценные уроки из развертывания GPT-3. «Каждое развертывание учит нас больше о безопасности, технике и, в конечном счете, о том, как наша технология может создавать ценность в мире», — говорит Миллер. «С момента выпуска GPT-3 API мы внесли ряд улучшений в наши средства защиты. Например, в августе мы объявили об обновленной конечной точке модерации и продолжаем искать способы ее улучшения».
Опыт CALA с DALL-E API указывает на то, что простота использования станет ключевым фактором принятия API после того, как он станет общедоступным. Вятт говорит, что инженеры его компании начали использовать API всего за несколько недель.
«Мы как бы разработали концепцию высокого разрешения, которую мы передали [OpenAI] для обратной связи около восьми недель назад. Тогда общая сборка и полировка заняли меньше месяца», — говорит Вятт. «Я видел, что это значимая интеграция во множество различных продуктов».
По сути, поток инструментов на основе DALL-E уже начался. Shutterstock, сервис, предлагающий стоковые фотографии, изображения и видео, планирует внедрить DALL-E API «в ближайшие месяцы». Shutterstock объединил это объявление с системой компенсации художникам на платформе, когда их работа используется для обучения моделей ИИ. Microsoft также добавляет DALL-E в свою службу Azure OpenAI , хотя в настоящее время доступ предоставляется только по приглашению.
«Мы всегда чувствовали, что будущее, особенно в сфере моды, как бы движется к дизайну с использованием искусственного интеллекта и автоматизированному производству», — говорит Вятт. «Мы просто думали, что это будет, знаете ли, через пять лет. За последние шесть месяцев, просто наблюдая за прогрессом ... [мы] думаем, что в ближайшие пару лет нас ждут огромные инновации».