Исходный размер 1140x1600

Flora Imaginaria: Ботанический атлас несуществующих растений

Проект принимает участие в конкурсе

Идея проекта

post

Что, если бы ботаники XIX века обнаружили растения, которых не существует в природе? Светящиеся цветы с спиральными лепестками, кристаллические суккуленты, глубоководные растения с щупальцами вместо корней — как бы они выглядели на страницах классического ботанического атласа?

Flora Imaginaria — это серия изображений фантастических растений, сгенерированных нейросетью, обученной на стиле хромолитографий из атласа Кёлера (Kohler’s Medizinal-Pflanzen, 1887). Модель научилась воспроизводить характерные черты ботанических иллюстраций: кремовый фон, детальную прорисовку корневой системы, анатомические разрезы — и применила этот визуальный язык к растениям, которых никогда не существовало.

Датасет

post

Для обучения был выбран атлас Kohler’s Medizinal-Pflanzen (1887) — классический справочник лекарственных растений, иллюстрированный методом хромолитографии. Автор — немецкий фармацевт Герман Адольф Кёлер (1834–1897). Все изображения находятся в общественном достоянии (Public Domain). Источник цифровых копий: Internet Archive / Biodiversity Heritage Library.

post

Из оцифрованного атласа через IIIF API Internet Archive были извлечены отдельные иллюстрации. Для очистки датасета был написан фильтрующий пайплайн: фильтр по насыщенности (отсеивание текстовых страниц), детекция растительных цветов (зелёный, коричневый, синий) и дедупликация через перцептивное хеширование. Итоговый датасет: 32 изображения, 1024×1024 пикселей.

0

Метод обучения

post

Базовая модель: Stable Diffusion XL 1.0 — генеративная модель на основе латентной диффузии. Для переноса стиля использовалась комбинация двух техник:

DreamBooth — метод персонализации диффузионных моделей, позволяющий обучить модель на небольшом наборе изображений, связав их с уникальным текстовым токеном.

LoRA (Low-Rank Adaptation) — метод эффективного дообучения, при котором изменяются не все веса модели, а лишь небольшие низкоранговые матрицы-адаптеры. Результат хранится в компактном файле (~50 МБ вместо ~7 ГБ полной модели).

post

В качестве идентификатора стиля выбран токен KOHLERBOTANICAL — уникальное слово, отсутствующее в словаре модели. Для автоматических подписей к датасету использовалась модель BLIP (Salesforce).

Параметры: 700 шагов, learning rate 1e-4, batch size 2, gradient accumulation 3, 8-bit Adam, fp16, разрешение 512px. Обучение на Tesla T4 (16 GB VRAM) в Google Colab.

Flora Imaginaria: серия

post

Plate I — Lux Spiralis (Спиральный Люминесцент) Светящийся цветок с голубыми спиральными лепестками. Корневая система развитая, с множеством мелких ответвлений.

post

Plate II — Crystallum Succulenta (Кристальный Суккулент) Суккулент с полупрозрачными геометрическими листьями, напоминающими кристаллическую решётку.

post

Plate III — Abyssum Medusae (Глубоководная Медуза) Биолюминесцентное растение из морских глубин с щупальцевидными корнями и цветками в форме медуз.

post

Plate IV — Machina Flora (Механический Цветок) Стимпанк-растение с шестерёнками вместо лепестков и металлическими стеблями.

post

Plate V–Ignis Orchidea (Огненная Орхидея) Орхидея с пламенеобразными лепестками красно-оранжевых оттенков, детальная прорисовка тычинок и корневой системы.

post

Plate VI — Nebula Muscus (Облачный Мох) Парящее растение с воздушными капсулами и перистыми листьями, размножается спорами.

post

Plate VII — Glacies Filix (Ледяной Папоротник) Папоротник с ледяными фрактальными вайями и спорами в форме снежинок.

post

Plate VIII — Cantus Vitis (Поющая Лоза) Вьющееся растение с колокольчатыми цветками, напоминающими музыкальные инструменты.

Сравнение: 350 vs 700 шагов

post

Слева — промежуточный чекпоинт (350 шагов), справа — финальная модель (700 шагов). На 350 шагах модель уже усвоила общую стилистику: кремовый фон, расположение элементов, палитру хромолитографии. Финальная модель даёт более детальную прорисовку: корневая система структурированнее, мелкие анатомические элементы чётче. Переобучения не наблюдается, модель генерирует новые композиции, а не копирует датасет.

Анализ результатов

post

Что получилось хорошо:

Стилистическое единство — все изображения узнаваемо принадлежат одной визуальной традиции. Кремовый фон, аккуратная компоновка, палитра хромолитографии воспроизводятся стабильно.

Анатомическая структура — модель генерирует не просто цветы, а ботанические таблицы: с корнями, разрезами, отдельными элементами (семена, пестики, тычинки).

Разнообразие — несмотря на единый стиль, каждое изображение уникально по форме, цвету и композиции.

post

Артефакты и ограничения:

Псевдотекст — модель генерирует буквоподобные формы, которые выглядят как подписи, но не являются осмысленным текстом. Типичная проблема диффузионных моделей.

Мелкие детали — при увеличении некоторые элементы выглядят размыто. Ограничение разрешения обучения (512 px) и размера датасета (32 изображения).

Реалистичность — фантастические промпты интерпретированы более реалистично, чем задумывалось. Модель тяготеет к правдоподобным ботаническим формам.

Используемые модели ИИ

Stable Diffusion XL 1.0 (stabilityai) — базовая генеративная модель, дообученная методом DreamBooth + LoRA на датасете ботанических иллюстраций.

BLIP (Salesforce) — модель для автоматической генерации подписей к изображениям датасета.

Датасет: Kohler’s Medizinal-Pflanzen (1887), 32 хромолитографии. Источник: Internet Archive / Biodiversity Heritage Library.

Лицензия: Public Domain.

Flora Imaginaria: Ботанический атлас несуществующих растений
Проект создан 23.03.2026