концепция проекта
проект посвящён обучению модели Stable Diffusion стилю Караваджо: создание авторской LoRA-адаптации
цель — научить модель воспроизводить:
✦ кьяроскуро (резкий свет/тень)
✦ драматичную композицию
✦ тёмные фоны + направленный свет
датасет
для обучения был собран датасет из 63 изображений, взятых с сайта Wikipedia
ссылка на датасет

Saint Jérôme écrivant (1606)


Saint Jérôme en méditation (1605-1606) Saint Jean-Baptiste (1605-1606)
серия сгенерированных изображений
после обучения LoRA было сгенерировано 6 изображений по различным промптам, охватывающим ключевые темы творчества Караваджо
(1) мужчина с лютней
caravaggio_style, a street musician in a tavern, dark background, warm highlights
Свет акцентирует лицо и руки, детали создают ощущение объёма. На исходной генерации неудачны только лицо и рука.
(2) старик с шляпой
caravaggio_style, a portrait of an old man, solemn expression, theatrical light
(3) мужчина в красной мантии
caravaggio_style, a saint in a red cloak, intense side lighting
Тёмный фон акцентирует характер и эмоции; красный плащ выделяется, складки реалистичные. На исходных генерациях неудачны только лица и руки.
(4) натюрморт с фруктами
caravaggio_style, still life with fruit and metal bowl, deep shadows
Тёмный фон и свет создают объём фруктов. Цвет насыщен, как у Караваджо. На исходной генерации неудачная детализация.
(5) группа мужчин за столом
caravaggio_style, a biblical scene with two figures at a table, strong chiaroscuro
Персонажи в динамическом взаимодействии, выражения и движения создают драму. На исходной генерации проблемы только с лицами и анатомией.
(6) мальчик со свечой
caravaggio_style, a young boy holding a candle in a dark room, oil painting, dramatic light
Свет с левой стороны создаёт драматический контраст с тёмным фоном. Лицо тревожное, ткань реалистична. На исходной генерации неудачны руки.
описание процесса обучения
среда выполнения: Google Colab (GPU Tesla T4)
(1) проверка оборудования и установка зависимостей
(2) загрузка датасета


(3) предобработка изображений
(5) обучение LoRA
(7) генерация изображений


использование GenAI в проекте
(1) DeepSeek
✦ помощь в написании кода
✦ формулировка экспликации
(2) ChatGPT
✦ формирования идей для промптов
✦ уточнение искусствоведческих формулировок
(3) Nano-banana
Применялся на этапе постобработки. Несмотря на качественное усвоение стиля Караваджо, модель SD при генерации допускала анатомические неточности. С помощью Nano-banana были исправлены пропорции рук, детализация лиц и устранены мелкие артефакты, что позволило представить финальную серию в более качественном виде без потери стилистической целостности.




