Исходный размер 2480x3500

Принц Кристофер

Проект принимает участие в конкурсе

Моя семья привыкла называть нашего домашнего кота Кристофера «принцем», это очень подходит его характеру. Но мне всегда было интересно, как бы Крис выглядел, будь он не принцем, а кем-нибудь другим. С помощью нейросети я смогла создать несколько изображений моего кота в разных образах.

prompt = «a photo of a cat in krisstyle, wearing a pirate hat and eyepatch, standing on a pirate ship, treasure chest nearby» # @param

image = pipe (prompt=prompt, num_inference_steps=25).images[0] image

big
Исходный размер 1024x1024

Крис Пират

prompt = «a photo of a cat in krisstyle, wearing a superhero cape, flying over a city, heroic pose» # @param

image = pipe (prompt=prompt, num_inference_steps=25).images[0] image

Исходный размер 1024x1024

Крис Супергерой

prompt = «a photo of a cat in krisstyle, wearing samurai armor, holding a katana, ancient Japan background» # @param

image = pipe (prompt=prompt, num_inference_steps=25).images[0] image

Исходный размер 1024x1024

Крис Самурай

prompt = «a photo of a white cat in krisstyle, next to an easel, colorful palette nearby» # @param

image = pipe (prompt=prompt, num_inference_steps=25).images[0] image

Исходный размер 1024x1024

Крис Художник

prompt = «a photo of a cat in krisstyle, wearing a golden crown, sitting on a throne, royal palace background» # @param

image = pipe (prompt=prompt, num_inference_steps=25).images[0] image

Исходный размер 1024x1024

Крис Король

prompt = «a photo of a cat in krisstyle, wearing a chef hat, cooking in a professional kitchen, surrounded by pots and pans» # @param

image = pipe (prompt=prompt, num_inference_steps=25).images[0] image

Исходный размер 1024x1024

Крис Повар

prompt = «a photo of a cat in krisstyle, wearing a wizard hat, casting a spell, magical sparkles around» # @param

image = pipe (prompt=prompt, num_inference_steps=25).images[0] image

Исходный размер 1024x1024

Крис Волшебник

prompt = «a photo of a cat in krisstyle, sitting at a computer, coding, multiple screens, coffee cup nearby» # @param

image = pipe (prompt=prompt, num_inference_steps=25).images[0] image

Исходный размер 1024x1024

Крис Программист

prompt = «a photo of a white cat in krisstyle, wearing a cowboy hat, wild west landscape» # @param

image = pipe (prompt=prompt, num_inference_steps=25).images[0] image

Исходный размер 1024x1024

Крис Ковбой

prompt = «a photo of a cat in krisstyle, wearing knight armor, holding a sword, medieval castle background» # @param

image = pipe (prompt=prompt, num_inference_steps=25).images[0] image

Исходный размер 1024x1024

Крис Рыцарь

Итоговые изображения получились интересными и похожими на моего кота. Мне особенно понравилось, как нейросеть смогла сохранить особенности освещения в моей квартире и при этом перенести их в другие локации.

Кристофер смог побывать в роли самурая, повара и даже пирата. Теперь нашей семье будет легче представлять, что наш кот не просто самодовольный лентяй :)

Создание кода

Обучение и генерация изображений происходило на базе Stable Diffusion.

Для обучения нейросети я использовала датасет из 26 квадратных фотографий Кристофера в высоком разрешении.

0

В началае создается необходимая среда, затем загружается датасет из фотографий. С помощью BLIP к ним генерируются подписи.

Потом был создан DreamBooth «krissstyle» и обучена LoRA модель.

Обучение проводилось с разрешением 512×512 пикселей, размером батча 2, накоплением градиента 3 шага и всего 500 шагов.

После обучения обученные веса LoRA были сохранены файлом на мой компьютер и потом я создавала изображения прямо в блокноте.

Описание применения генеративной модели

Я использовала генеративную нейросеть Depseek для помощи мне в освоении ньюансов работы с кодом и генерации идей для финальных изображений Криса.