Исходный размер 1140x1600

Обучение генеративной модели под стиль Сальвадора Дали

Концепция

Сальвадор Дали — испанский живописец, график, скульптор, один из самых известных сюрреалистов ХХ века. Мне очень импонирует его искусство, стиль, манера, мне нравится смысл в его работах, который иногда может быть скрыт от наших глаз.

Именно поэтому для обучения нейросети я решил использовать его картины. Мне было интересно проверить, насколько точно модель сможет воспроизвести характерные мазки и детали работ Дали, и сможет ли передать его узнаваемый характер картин.

Исходные изображения

Я собрал 18 работ в датасете для последующего анализа

Несмотря на сюрреалистическое содержание, Дали использовал технику реалистичной живописи, что придавало его работам особую детальность и четкость. Он тщательно прорабатывал детали, создавая эффект «фотографичности».

big
Исходный размер 880x550

Дали часто использовал искажения и метаморфозы форм, что создает сюрреалистический эффект. Он мог преобразовывать обычные объекты в фантастические создания. Также он часто искажал само пространство.

Код

Работа велась в Google Colab, датасет состоял из 18 картин

загрузка библиотек

Подключаем необходимые библиотеки, загружаем скрипт для обучения модели, а также создаём папку и копируем в неё изображения для дальнейшей обработки.

Исходный размер 546x462

Превью исходных изображений

0

Загрузка модели BLIP

Далее, я загружаю ускорение обучения модели и подключаю Hugging Face для ее сохранения

Исходный размер 931x202

подключение Hugging Face

Исходный размер 665x445

Обучение модели

Также я сохраняю модель на Hugging Face

Исходный размер 903x727

Сохранение модели на Hugging Face

И в конце генерирую изображения

Исходный размер 804x277

генерирование

Итоговая серия изображений

Исходный размер 1024x1024

Человеческая анатомия получилась достаточно хорошо, нет лишних деталей или конечностей, которые часто создает нейросеть. Также привлекает соблюдение каноничных цветов, которые использовал Дали в своих работах. Они не броские, прекрасно сочетающиеся между собой, создавая эффект фотографии и реалистичности событий. К тому же, нет и симметрии у креста, возможно из-за частого символизма и искажения в картинах, нейросеть решила добавить некий символ от себя в виде такого креста.

Здесь вышли не самые лучшие изображения, так как формы людей слишком потерялись на фоне каких-то деталей и элементов, их слишком много, из-за этого мы не можем понять, что изображено. Но сохраняются также цвета и композиция Дали.

Исходный размер 1024x1024
Исходный размер 1024x1024

Часы получились отличные, они чуть более размазанные, но сохранилась форма и узнаваемость художника. Также какие-то его детали и реалистичность изображений была сохранена.

Слоны получились хорошими, немного проблемы возникли с анатомией и снова большое количество деталей, которые превращаются в нечто непонятное

Обучение генеративной модели под стиль Сальвадора Дали
Проект создан 10.04.2025