Обучение Обучение Stable Diffusion под направление фовизма на Deziiign

Идея

Цель проекта — исследовать возможность генерации изображений в художественном стиле фовизма с помощью обученной нейросети. Фовизм характеризуется яркими, насыщенными, зачастую неестественными цветами, упрощёнными формами и выразительной эмоциональностью.

Основная идея заключается в том, чтобы обучить модель воспроизводить ключевые особенности этого направления и создавать новые изображения, которые не копируют оригиналы, но передают их художественный язык.

Для обучения модели я собрала датасет из 25 картин художников, которых приписывают к стилю фовизма. При сборе я обращала внимание, чтобы картины были уже public domain

Исходный размер 1280x256

Процесс обучения

Для обучения модели я работала в Kaggle, Fine-tuning Stable Diffusion XL и с методом LoRA.

Для обучения использовалось приблизительно 25 квадратных картинок, разрешение различалось по причине разных источников.

Во время обучения были некоторые ошибки, которые не разбирались в лекции. Поэтому изначальный код мне пришлось менять, а так же работать на акселераторе GPU T4, а не как было предложено GPU P100.

painting in FOVISM style, time square, new york 250 шагов обучения / 500 шагов обучения

Как можно заметить, с увеличением численности прогонов модель лучше начинает понимать, как следует работать с выбранным стилем.

Результирующая серия

— painting in FOVISM style, time square, new york — painting in FOVISM style, red square, moscow — painting in FOVISM style, eiffel tower, paris

— painting in FOVISM style, portrait of woman in yellow — painting in FOVISM style, Portrait of a woman, face painted with green, red, and blue tones, strong color contrast, simplified facial features, expressive eyes, thick paint strokes, inspired by Henri Matisse

Исходный размер 1024x1024

painting in FOVISM style, Vibrant landscape, a winding road through a small village, bright red sky, trees in blue and purple tones, houses painted in orange and green, thick expressive brush strokes

Исходный размер 1024x1024

painting in FOVISM style, seaside with boats, water in bright yellow and turquoise, purple sky, boats in contrasting colors, rough brush strokes, simplified shapes, dynamic and emotional composition

Вывод

Серия демонстрирует вариативность генерации при сохранении общего стиля.

Модель отлично работает как с простыми запросами, так и расширенными, созданными с помощью gpt. Так же у неё получается хорошо передавать как и выдуманные вещи (портреты, пейзажи), так и определенные места (Нью-Йорк, Москва).

Код и исходники

Для исправлений ошибок кода, генерации промптов и анализа полученного проекта использовался ChatGPT (GPT-5-mini).

Исходный размер 1024x384