Каждый месяц появляются новые нейросети, которые могут упростить работу дизайнерам и помочь в создании качественных и необычных промоматериалов, но вот только по-настоящему функциональных нейронок, которые могут создать шедевр, совсем немного. Мы потратили время и нашли нейросеть, которая является одним из лучших бесплатных аналогов всем известного Midjourney, — это Fooocus. Разберемся, на что способна это нейронка и сможет ли заменить Midjourney.
Fooocus: о нейросети
Fooocus — нейросеть на базе Stable Diffusion (бесплатной нейросети с открытым исходным кодом), выступающая младшим братом Midjourney и DALL-E, где изображения генерируются по описанию.
Сразу заметим, что использовать нейросеть можно двумя путями:
- Воспользоваться облачным приложением через Google Colab (Google Colaboratory позволяет запускать нейросеть с применением мощностей серверов Google, а не личного железа пользователя).
- Развернуть программу локально, загрузив ее с GitHub (учитывайте, что для локальной работы требуется сильное железо).
Основные преимущества Fooocus перед старшими братьями — отсутствие платных подписок (нейросеть полностью бесплатна) и функционал, который можно настроить вручную, а не только с помощью текстового запроса.
Функционал Fooocus
Функционал нейронки достаточно широкий и состоит из двух разделов — правая боковая панель и нижняя панель, которые можно увидеть после активации галочкой возле надписей Input Image и Advanced.
Правая панель включает в себя четыре раздела:
- Setting. Вкладка, где пользователь может задать необходимые настройки будущего изображения.
- Style. Раздел, где выбирается один или сразу несколько стилей, в которых будет сгенерировано изображение, рядом с каждым стилем присутствует визуальный пример.
- Model. Вкладка для настройки реалистичности модели. Можно выбрать, на какой стиль будет сделан акцент — аниме или реальность. Подгрузить свою модель нельзя, модель меняется в зависимости от выбранного пресета в разделе Setting.
- Advanced. Раздел, предлагающий два ползунка настроек. Ползунок Guidance Scale необходим для регулирования соответствия сгенерированного изображения заданному промпту, а ползунок Image Sharpness отвечает за резкость и точность изображения.
Отдельно разберем раздел Setting, в составе которого наиболее ценные функции:
- Preset. Благодаря пресету можно выбрать, какая модель будет использована при генерации изображения — стандартная, реалистичная или аниме.
- Performance. Подраздел, где юзер выбирает, на чем нейронка должна сделать акцент во время генерации изображения — скорость, качество и т. д.
- Aspect ratios. Здесь пользователь выбирает размер изображения.
- Image Number. Ползунок для выбора количества генерируемых изображений.
- Output format. Подраздел, где отмечается формат изображения (png, jpeg, webp).
- Negative Prompt. Поле негативного промпта дает возможность вписать элементы или характеристики, которых не должно быть на фотографии (к примеру, размытость, блики, яркий свет).
Нижний блок настроек, открывающийся после галочки Input Image, предлагает ряд настроек, нацеленных на обработку существующего изображения. Рассмотрим несколько из них.
Используя вкладку Upscale or Variation и выбрав Vary Strong, можно изменять как отдельные элементы сгенерированного изображения, так целиком, добавив образец, на который конечное изображение должно быть похоже.
Для этого:
- Выбираем сгенерированное изображение.
- Вставляем изображение, на которое будущее изображение должно быть похоже (нейронка перенимает саму стилистику изображения, например цвет платья, поворот тела).
- Вписываем промпт, чтобы нейронка точно понимала, что должно быть на конечном изображении, а где она может покреативить.
- Нажимаем Generate.
Вкладка Describe поможет определить примерный промпт, который использовался для генерации того или иного изображения (в случае, если эта картинка рисовалась или это реальное изображение, нейросеть попробует подобрать промпт, который подойдет для генерации похожего изображения).
Чтобы определить промпт изображения, необходимо:
- Загрузить изображение.
- Нажать кнопку Describe this image into Prompt.
- Подождать определение промпта (обычно занимает около 30 секунд).
Как использовать Fooocus
Рассмотрим, как использовать нейросеть Fooocus через Google Colab.
- Для начала переходим по ссылке, чтобы попасть в Google Colab Fooocus.
- После этого нажимаем «Подключиться» в правом верхнем углу. Необходимо подождать, пока название кнопки не изменится на «Подключено» и рядом не появится зеленая галочка.
- Далее нажимаем на запуск кода (подобие кнопки Play).
- Далее необходимо немного подождать, обычно загрузка занимает около 2–5 минут.
- После успешной фазы запуска приложения вы увидите в конце надпись App started successful, после чего можно будет переходить по ссылке и использовать Fooocus (ссылка подчеркнута желтым на скрине ниже).
P. S. Если нейронка не запускается, просто попробуйте другой браузер. - После перехода по ссылке перед пользователем откроется рабочее пространство, где можно сразу включить Input image, чтобы развернуть нижнюю панель для редактирования изображения, и Advanced, чтобы развернуть правую боковую панель с широким функционалом.
Если мы решим сгенерировать картинку, то выберем Preset, зададим Prompt (описание) и останется лишь дождаться результата (не забывайте, что если нужно качество, то необходимо выбрать Quality на панели Performance. В нашем случае используем Speed, чтобы генерировать изображения быстрее, скорость отличается в 2 раза).
Попробуем сгенерировать изображение, поменяв в Preset стиль на Realistic вместо Anime, а также выставив качество 1024 х 1024 и выбрав Quality (качество) вместо скорости генерации.
Заключение
В итоге Fooocus — это нейронка, которая сгенерирует любые фотографии в десятках разных стилей, при необходимости может генерировать по 30 фотографий сразу. Если вам нужны быстрые фотографии — используйте режим скорости, если важно качество — просто не забудьте выбрать Quality. Также Fooocus позволяет обрабатывать уже готовые изображения как изменяя отдельные элементы фотографии, так и добавляя что-то новое. Поэтому все, что вам остается, — не забывать, что существуют бесплатные решения, такие как Fooocus, которые постоянно расширяют функционал и облегчают работу всем юзерам.