Предисловие
Я гейм-дизайнер и менеджер, работаю над учебным проектом «Пантеон»: https://clck.ru/3ShKs9. Это детективная игра, в которой мы, помимо прочих активностей, решаем головоломки.
Одной из головоломок является шахматная доска, на которой нужно поставить мат, чтобы получить фигуру-ключ.
Проблема возникла в том, что игра происходит в альтернативной вселенной: появление тех же фигур в другой реальности с другой историей почти невозможно. Из-за этого игроки перестают верить в реальность происходящего всего за экраном.
Чтобы решить эту проблему, нужно поменять правила «Идеальной настольной игры» — что сделать качественно очень сложно. Я придумал как прикрыть проблему, чтобы она хотя бы не так бросалась в глаза — создать альтернативный внешний вид для фигур.
Задача модели:
Создать концепты фигур, похожие на оригинальный внешний вид, но немного отличающиеся от привычных образов; Эти концепты будут использованы 2D-художниками, чтобы под вдохновением создать финальный концепт-ТЗ для 3D-моделлеров; Чтобы те сделали настоящие 3D-модели фигур; Чтобы кодер использовал их для создания головоломки.
Весь датасет:


Пример картинок из датасета: Король


Пример картинок из датасета: Слон


Пример картинок из датасета: Конь
Итоговые генерации

Prompt: skschesspiece rook and bishop composition, clean minimal studio
Prompt: skschesspiece pieces on marble board, editorial style, high detail
Prompt: skschesspiece pawns in formation, low angle view, moody shadows
Prompt: skschesspiece chessboard scene with volumetric light and smoke
Prompt: portrait photo of skschesspiece black king chess piece, dramatic studio lighting, ultra detailed, realistic texture, cinematic composition
Общий negative prompt: lowres, blurry, deformed, text, watermark, noisy, artifacts
Использованные нейросети
Я использовал Codex и ChatGPT (https://chatgpt.com/codex) для максимальной оптимизации своих действий: — Брейнштурм промптов для генерации; — Разъяснение как работает префикс в «skschesspiece»; — Составление списка ссылок на все файлы, которые мне нужно скачать для обучения модели; — Составление пошагового плана действий на основе транскрипции видеогайдов из курса. (Для транскрипции использовался сервис Speech2Text [https://clck.ru/3SiMpS]); — Сопроводил написанный код комментариями для навигации.
Кстати, сам код: https://clck.ru/3SiNHX И как я его написал:
— Подгрузил библиотеки для SDXL и LoRA; — Скормил zip-архив с картинками шахмат, на которых нужно обучить модель (512 шт.); — Взял скрипт, который посоветовал Codex (https://clck.ru/3SiNMn), за основу, изменил конфиг запуска и данные; — Поставил свой токен: skschesspiece; — Поставил параметры тренировки (resolution, learning_rate, etc.); — Подключил полученный LoRA-вес и сгенерировал картинки, profit: D




