12 мая 2023

Нейросеть Stable Diffusion: что умеет, как установить и пользоваться бесплатно

Команда Conversion

12845

Нейросети для генерации изображений доступны не только онлайн. При наличии персонального компьютера и капельки усилий можно развернуть у себя нейросеть Stable Diffusion — и использовать ее совершенно бесплатно без всяких ограничений. Пошаговая инструкция — уже в нашей статье.

Топ-55 нейросетей для интернет-предпринимателей, маркетологов, фрилансеров, копирайтеров, SMM и SEO-специалистов — в нашей бесплатной подборке в Telegram.

Содержание:

Что такое нейросеть Stable Diffusion
На что способна нейросеть
Системные требования и установка
Учимся писать запрос
Что получилось

Что такое нейросеть Stable Diffusion

Stable Diffusion — это нейросеть с открытым исходным кодом от компании Stability AI, которая генерирует изображения по текстовому запросу, может дорисовывать элементы и редактировать исходники, а также добавлять новые стили изображениям без цензуры.

ИИ использует диффузионные вероятностные модели, позволяющие поэтапно менять изображение, и только после нескольких повторов выдавать готовый результат. Такие модели уже используются в трехмерной графике и синтезе речи.

Пример использования:

Самое интересное, что благодаря доступности исходного кода нейросеть можно использовать практически в любых приложениях, работающих с изображениями, чем уже успели воспользоваться программа по 3D визуализации Blender и веб-редактор Canva.

Пример работы Stable Diffusion — от эскиза художника до конечного варианта:

Работа Stable Diffusion с эскизом

На что способна нейросеть

Чтобы понять, на что способна нейросеть, нужно знать, как она устроена.

Stable Diffusion состоит из:

Кодировщика текста, который получает на входе текстовый запрос, и переводит его в набор чисел.
Генератора изображений и алгоритма планирования, которые создают информацию об изображении.
Декодера, создающего рисунок.

Устройство нейросети Stable Diffusion (авторство jalammar.github.io)

Благодаря такой модели работы нейросеть способна:

1. Генерировать фотореалистичные изображения по текстовому описанию (также доступны стили аниме, пейзажи, фэнтези и различные художественные стили):

Рекламные фото еды (автор: Neural.Academy)

2. Убирать ненужные объекты с фотографий: