АльтернатИвные шахматные фИгуры на Deziiign

Предисловие

Я гейм-дизайнер и менеджер, работаю над учебным проектом «Пантеон»: https://clck.ru/3ShKs9. Это детективная игра, в которой мы, помимо прочих активностей, решаем головоломки.

Одной из головоломок является шахматная доска, на которой нужно поставить мат, чтобы получить фигуру-ключ.

Проблема возникла в том, что игра происходит в альтернативной вселенной: появление тех же фигур в другой реальности с другой историей почти невозможно. Из-за этого игроки перестают верить в реальность происходящего всего за экраном.

Чтобы решить эту проблему, нужно поменять правила «Идеальной настольной игры» — что сделать качественно очень сложно. Я придумал как прикрыть проблему, чтобы она хотя бы не так бросалась в глаза — создать альтернативный внешний вид для фигур.

Задача модели:

Создать концепты фигур, похожие на оригинальный внешний вид, но немного отличающиеся от привычных образов; Эти концепты будут использованы 2D-художниками, чтобы под вдохновением создать финальный концепт-ТЗ для 3D-моделлеров; Чтобы те сделали настоящие 3D-модели фигур; Чтобы кодер использовал их для создания головоломки.

Весь датасет:

https://clck.ru/3ShL5s

Пример картинок из датасета: Король

Пример картинок из датасета: Слон

Пример картинок из датасета: Конь

Итоговые генерации

Исходный размер 768x768

Prompt: skschesspiece rook and bishop composition, clean minimal studio

Исходный размер 768x768

Prompt: skschesspiece pieces on marble board, editorial style, high detail

Исходный размер 768x768

Prompt: skschesspiece pawns in formation, low angle view, moody shadows

Исходный размер 768x768

Prompt: skschesspiece chessboard scene with volumetric light and smoke

Исходный размер 1140x1600

Prompt: portrait photo of skschesspiece black king chess piece, dramatic studio lighting, ultra detailed, realistic texture, cinematic composition

Общий negative prompt: lowres, blurry, deformed, text, watermark, noisy, artifacts

Использованные нейросети

Я использовал Codex и ChatGPT (https://chatgpt.com/codex) для максимальной оптимизации своих действий: — Брейнштурм промптов для генерации; — Разъяснение как работает префикс в «skschesspiece»; — Составление списка ссылок на все файлы, которые мне нужно скачать для обучения модели; — Составление пошагового плана действий на основе транскрипции видеогайдов из курса. (Для транскрипции использовался сервис Speech2Text [https://clck.ru/3SiMpS]); — Сопроводил написанный код комментариями для навигации.

Кстати, сам код: https://clck.ru/3SiNHX И как я его написал:

— Подгрузил библиотеки для SDXL и LoRA; — Скормил zip-архив с картинками шахмат, на которых нужно обучить модель (512 шт.); — Взял скрипт, который посоветовал Codex (https://clck.ru/3SiNMn), за основу, изменил конфиг запуска и данные; — Поставил свой токен: skschesspiece; — Поставил параметры тренировки (resolution, learning_rate, etc.); — Подключил полученный LoRA-вес и сгенерировал картинки, profit: D