Пастельная хореография и смещенный фокус Эдгара Дега на Deziiign

Концепция проекта

Базовые алгоритмы искусственного интеллекта обучены правилам идеальной композиции: объект всегда находится в центре, он полностью помещается в кадр, а его текстура должна быть гладкой и физически понятной. Но что произойдет, если заставить нейросеть рисовать вопреки этим правилам: обрезать людям головы краем холста, смотреть на них сверху вниз и использовать сухую, сыпучую текстуру мелка вместо привычного масла?

Данный исследовательский проект посвящен оцифровке стиля Эдгара Дега — одного из самых выдающихся представителей французского импрессионизма.

Дега был одержим балетом, скачками, театром и повседневным трудом парижанок. Его искусство революционно благодаря двум вещам. Во-первых, он использовал фотографическое, часто случайное кадрирование (смещенный центр, фигуры «вываливаются» за край картины). Во-вторых, он был абсолютным гением пастели — техники, где цвет наносится сухими штрихами, создавая слоистое, пудровое, вибрирующее изображение.

Обучение генеративной модели на его работах — это тяжелейший стресс-тест на отказ от «правильного» рендера. Нейросеть будет до последнего сопротивляться попыткам нарисовать сцену так, словно это случайный кадр, сделанный из-за кулис или из театральной ложи сверху. А имитация сухой, пыльной фактуры пастельного мелка, сквозь который просвечивает цветная бумага, — это вызов, который заставляет алгоритм работать на пределе своих текстурных возможностей.

Исходные изображения для обучения

Ниже представлены некоторые работы Эдгара Дега, вошедшие в базу данных для обучения искусственного интеллекта.

Техническая реализация

В рамках проекта обучение проводилось в облачной среде Google Colab с использованием метода LoRA (Low-Rank Adaptation). Этот подход позволяет дообучить тяжелую базовую модель (например, Stable Diffusion), обновляя лишь небольшую часть алгоритмов, что делает процесс быстрым и эффективным.

Чтобы сделать процесс наглядным, весь технический этап (пайплайн) разбит на четыре ключевых шага:

Исходный размер 1706x648

1. Проверка оборудования (Видеокарта)

Генерация и обучение нейросетей требуют мощных видеокарт (GPU). На этом шаге мы инициализируем сервер и проверяем, какой именно вычислительный ресурс выдал нам облачный сервис Google для работы.

Исходный размер 1736x692

2. Подключение датасета и установка программ

Подключаем облачный диск, на котором лежат отобранные картины художника (датасет), и скачиваем необходимые библиотеки машинного обучения (такие как diffusers и accelerate). Это дает нашему коду «инструменты» для работы с изображениями.

Исходный размер 1736x1040

3. Запуск обучения (Тренировка стиля)

Это кульминация технического процесса. Здесь мы передаем нейросети команду: «Возьми базовую модель, проанализируй картины в нашей папке и найди в них общие стилевые черты». Процесс идет шаг за шагом, пока нейросеть не выучит уникальный почерк художника, связав его со специальным кодовым словом.

Исходный размер 1736x1252

4. Генерация первой картинки (Инференс)

После завершения обучения тестируем результат. Пишем текстовый запрос (промпт), используем выученное кодовое слово, и нейросеть «рисует» совершенно новое изображение в только что освоенном стиле.

Работы Эдгара Дега отличаются ярким, узнаваемым стилем, который характеризуется несколькими ключевыми особенностями: 1)Мастерство пастели: видимые сухие штрихи, наслоение цвета, матовая и слегка «пудровая» фактура изображения. 2)Асимметричное, фотографическое кадрирование: фигуры часто смещены от центра или резко обрезаются краем холста. 3)Необычные ракурсы: взгляд на сцену сверху вниз или снизу вверх. 4)Искусственное театральное освещение: свет, бьющий снизу вверх, создающий призрачные тени на лицах балерин. 5)Повседневность в движении: фиксация случайных, непарадных моментов (завязывание пуантов, потягивание, усталость).

Результирующая серия изображений

Примеры промптов: — «Musicians in dark suits playing violins in the orchestra pit, seen from behind, with the bright legs of dancers illuminated on the stage above them, photo in Edgar style, complex spatial composition.»

— «A woman trying on a hat in a millinery shop, surrounded in&nbsp0; colorful ribbons and hats in&nbsp1; stands, photo in&nbsp2; Edgar style, cropped viewpoint, vibrant pastel hatching.»

— «in&nbsp3; melancholic woman sitting in&nbsp4; in&nbsp5; cafe table with in&nbsp6; glass in&nbsp7; green absinthe, in&nbsp8; man beside her looking away, photo in&nbsp9; Edgar style, psychological realism, off-center framing, gritty pastel.»

— «Ballet dancers stretching of&nbsp0; of&nbsp1; wooden barre of&nbsp2; of&nbsp3; large bright room with tall mirrors, sunlight of&nbsp4; in, photo of&nbsp5; Edgar style, candid everyday moment, soft pastel blending.»

Вывод

Эксперимент с оцифровкой импрессионизма Эдгара Дега наглядно демонстрирует, как трудно иногда алгоритмам дается преодоление встроенных в них правил «хорошего кадра». Современные генеративные модели (Stable Diffusion 3.5, FLUX.1) превосходно знают, как выглядит пуанта, балетная пачка или лошадь. Они могут за секунды создать потрясающий образ в заданных цветах.

Однако стиль Дега — это не просто объекты, это взгляд вуайериста, подглядывающего за миром сквозь замочную скважину или из оркестровой ямы. Это искусство смещенных осей и обманутых ожиданий. Нейросеть же мыслит категорией идеального плаката, где всё должно быть ровно и красиво.

Описание применения генеративной модели

Для генерации промптов был использован Claude 4.5 Sonnet. — Ссылка: https://www.anthropic.com/news/claude-sonnet-4-5

Блокнот