Исходный размер 2993x4233

Обучение генеративной нейросети Stable Diffusion стилю Эдгара Дега

Идея проекта

Меня всегда привлекали работы Эдгара Дега, поскольку мне нравится как он улавливает один момент в движении и ярко описывает его. Особенно мне нравились его работы на тему балета: художник умело погружает зрителя в волшебную атмосферу этого искусства, автор уделяет внимание цветам и текстурам, так например костюмы танцовщиц всегда выглядят невероятно воздушно.

Исходный размер 3294x3566

Картина Эдгара Дега

Исходный размер 4199x2754

Картины Эдгара Дега

Для своего проекта я выбрала картины, которые изображают одну из самых знаменитых тем художника, а именно рисунки балерин.

Исходный размер 1044x1024

Картина Эдгара Дега

Отличительными особенностями творчества Дега можно назвать: смещенные композиции, то есть художник часто обрезает фигуры краями полотна, заслоняет одних персонажей другими, ставя их на разные планы; он умело работает со светом и тенью, что придает глубину его картинам; позы персонажей не выглядят постановочными, а скорее смотрятся как случайные моменты во времени, в своих работах он любил передавать ощущение от движения; также его интересуют разнообразные текстуры и материалы, что хорошо видно в работах с балеринами.

Исходный размер 4421x1574

Картины Эдгара Дега

Для обучающей выборки я подобрала около 40  картин на которых изображены балерины Дега. Все эти работы объединены похожим авторским стилем, который я попыталась сымитировать с помощью обучения генеративной нейросети Stable Diffusion. После подборки изображений я обрезала их до квадрата 512× 512  px, я уделяла внимание тому, чтобы ключевые элементы оставались внутри квадрата. Основой проекта послужил уже существующий код, который дообучает модель Stable Diffusion при помощи LoRa.

Описание процесса обучения

Проверяем подключен ли GPU, затем загрузжаем все необходимых библиотек

Исходный размер 2818x515

Затем загружаем картинки-референсы, которые будут использоваться для обучения модели. Проводим просмотр загруженных изображений:

0

Загружаем модель BLIP, чтобы сгенерировать автоматические подписи для описания картинок

0

Далее создаем файл с подписями к картинкам и создаем префикс для промптов «EDGAR»

Заходим на Hugging Face и передаем токен доступа. Затем переходим к обучению модели, а потом загружаем ее на Hugging Face

0
Исходный размер 2869x1744
Исходный размер 2405x438
Исходный размер 2075x1739

Теперь можем генерировать изображения на основе модели

Исходный размер 3506x1081
Исходный размер 3506x331

Итоговая серия

Для начала я проверила насколько эффективно натренировалась модель. Для этого я попробовала создать несколько изображений максимально похожих на оригинальные рисунки. И я думаю, мне это удалось: я вводила промпт, описывающий примерную композицию и цветовую палитру картин, и искала самый подходящий результат. (слева оригинал, справа копия)

Исходный размер 4911x2844

prompt: a ballerina in big light pink and blue tutu stands with both arms raised above hear head, with a wooden floor and big window in a background

Исходный размер 4337x2030

prompt: a ballerina is stretching next to a bar in ballet class, front leg raised, in big white tutu, wooden floor and yellow wall in background

Исходный размер 5140x2844

prompt: a ballerina in big light pink tutu jumps on the stage, with dark brown curtains in a background

Исходный размер 4111x2133

prompt: tired ballerinas in big light blue tutus sit on a wooden bench, wooden floor and pale yellow wall behind them

Посмотрев на изображения балерин, я поняла, что их пышные пачки напоминают мне необыкновенные цветы. И для финальной серии я решила картины с танцовщицами трансформировать в изображения с цветами. Мне нужно было, чтобы каждый новый рисунок был в той же палитре, с тем же настроением и сохранил основные формы.

Исходный размер 1024x1024

prompt: big smeared fluffy peony roses, warm shades of green, cold pink, red and black color palette

Исходный размер 4437x1334

prompt: big smeared fluffy peony roses, warm shades of green, cold pink, red and black color palette

Исходный размер 1024x1024

prompt: field covered in colorful wildflowers, warm shades of green, brown and warm yellow color palette

Исходный размер 3965x1196

prompt: field covered in colorful wildflowers, warm shades of green, brown and warm yellow color palette

Исходный размер 1024x1024

prompt: big white dandelions, pale red, blue, pale green and dark brown color palette

Исходный размер 3831x1324

prompt: big white dandelions, pale red, blue, pale green and dark brown color palette

Исходный размер 1024x1024

prompt: smeared fluffy pink peony, warm shades of green, cold pink and rich black color palette

Исходный размер 3779x1318

prompt: smeared fluffy pink peony, warm shades of green, cold pink and rich black color palette

Исходный размер 1024x1024

prompt: white lilies, purple and red brown color palette

Исходный размер 3775x1632

prompt: white lilies, purple and red brown color palette

Анализ

В итоге, в финальных работах сохранилась авторская манера художника, так как в них присутствуют те же светотени — это сохраняет объем композиции. Повторяется и манера штриха, неточность образов, в которой есть какая-то недосказанность, а также работа с цветами и уникальная материальность всех предметов на картине.

Обучение генеративной нейросети Stable Diffusion стилю Эдгара Дега
Проект создан 10.04.2025