Проект принимает участие в конкурсе

«But one day, tiny flames will dance across the darkness. Like embers, linked by lords past.»


«Но однажды крошечные огоньки затанцуют во тьме, словно искры, связанные повелителями прошлого.»

Dark Souls 3

концепция |

post

Ингушские башни — это важные архитектурные памятники и свидетельства истории региона. Они отражают уникальные строительные традиции народа.

В моём проекте эти башни стали главным визуальным элементом и превращаются в серии изображений в свидетелей исчезнувшего мира. В отличие от обычной фотографии, где архитектура фиксируется как часть реального пейзажа, здесь башни помещены в слегка изменённую среду с туманом, пустотой и разбросанными руинами, что создаёт атмосферу мрачного фэнтези.

Исходный размер 1920x1320

Мой интерес к такой визуальной атмосфере возник ещё в детстве. Я часто играла в Dark Souls, а каждая летняя семейная поездка в горы включала прогулки по скалам и старым каменным башням. Тогда, когда я смотрела на эти башни мне всегда хотелось объединить ощущение их величия и одиночества с мистической атмосферой любимой игры.

В проекте я хотела оставить горы и долины узнаваемыми, но слегка подстроить пространство под мрачную атмосферу игры, где мир кажется заброшенным и пустым.

Туман, свет и небо усиливают ощущение изоляции, а сами башни начинают восприниматься не как часть живого мира, а как его последние следы и больше как устойчивые формы в пространстве без жизни и времени.

В результате серия изображений создаёт цельный образ мира, в котором почти ничего не осталось, кроме архитектуры, пережившей исчезновение всего остального. Башни становятся «последними хранителями» истории, словно застывшими в пространстве, где прошлое ещё ощущается, но утратило связь с настоящим.

исходные изображения |

Для обучения нейросети я собрала из личного архива датасет из 22 фотографий башенных комплексов и природы горной Ингушетии.

Исходный размер 1920x1129

Все изображения я привела к квадратному формату 1:1 и уменьшила их размер до 512×512 px.

процесс обучения |

Сначала я проверила, есть ли доступная видеокарта NVIDIA и насколько она загружена. После этого установила все нужные библиотеки для работы с генеративными моделями и настройки LoRA.

Дальше я скачала последнюю версию библиотеки diffusers с GitHub, чтобы работать со Stable Diffusion и использовать возможности DreamBooth.

Исходный размер 3342x1650

После этого я подключила хранилище и подготовила функции для отображения изображений. Затем загрузила свой датасет и внимательно просмотрела все картинки, чтобы убедиться, что они подходят для обучения.

Исходный размер 3342x1538

Затем подгружается предобученная модель BLIP и процессор для подготовки изображений. С их помощью создаются текстовые описания для каждого изображения из датасета.

Для всех файлов автоматически формируются подписи, и результат сохраняется в metadata.json, создавая пары «изображение — описание», которые нужны для обучения модели.

0

После этого я освобождаю память, удаляю временные модели и настраиваю кодировку UTF-8 для корректной работы с текстом. Затем инициализирую библиотеку Accelerate, чтобы обучение шло быстрее и стабильнее.

Далее выполняется авторизация на Hugging Face для доступа к моделям и возможности сохранения результатов.

Исходный размер 3346x728

В этом блоке я задаю параметры обучения: базовую модель, путь к датасету, размер изображений, количество шагов, learning rate и настройки LoRA.

Сам блок обучения запускается через Accelerate и показывает прогресс в реальном времени, что позволяет отслеживать результат на каждом шаге.

Исходный размер 3346x1532

После завершения я получаю готовую модель и создаю ссылку, по которой её можно открыть или использовать.

Исходный размер 3346x786

В финале модель оформляется и публикуется на Hugging Face, чтобы её можно было использовать снова или делиться с другими.

0

итоговые изображения |

На первом этапе я использовала базовый промпт, чтобы оценить работу модели.

[1] prompt = «Old mountain town»

Исходный размер 5112x2168

Дальше я начала постепенно уточнять промпты и добавлять башни, туман, состояние заброшенности.

(примеры промтов:)

[2] prompt: «Old mountain town ancient Ingush stone tower in a foggy mountain valley, abandoned world, dark medieval atmosphere, no people, cinematic lighting, desaturated colors, highly detailed realistic stone textures, moody, mysterious»

[3] prompt: «Old mountain town lonely Ingush battle tower rising above a small abandoned mountain settlement, surrounded by lower stone dwelling houses, dense mountain fog, bleak ruined landscape, cold grey palette, no characters, cinematic realism, atmospheric perspective, dramatic clouds, highly detailed»

Здесь уже появляется нужная атмосфера и очерчивается одиночная башня, туман, ощущение пустоты, но сцены всё ещё выглядят слишком «аккуратно» и не до конца передают ощущение разрушенного мира.

Исходный размер 5112x2503

Дальше я начала добавлять больше деталей, включая дома и небольшие поселения, и экспериментировать с масштабом сцен.

При этом я старалась приблизиться ближе к атмосфере Dark Souls, чтобы пространство выглядело еще более пустым и возникало ощущение отсутствия жизни.

Исходный размер 5112x2168

prompt:


Old mountain town massive ancient Ingush tower complex rising through black fog, dominant battle towers and scattered low stone dwellings, desolate mountain world, ominous silence, cinematic dark realism, cold light, rough stone walls, minimal composition, highly atmospheric

Чтобы изображения не выглядели как обычные пейзажи, я начала усиливать туман, работать со светом и добавлять ощущение пустоты.

Исходный размер 5112x2503
Исходный размер 1920x1320

prompt:


Old mountain town forgotten Ingush mountain settlement in a dead valley, broken stone walls, ruined battle towers and abandoned residential houses, heavy mist like ash, dim overcast light, dark realistic fantasy, melancholic atmosphere

Потом мне захотелось поэкспериментировать со светом. Я добавляла в промты ночь, луну и слабое освещение, чтобы сцены выглядели более тихими и немного тревожными.

Исходный размер 5112x2168
Исходный размер 5112x2503

prompt:


Old mountain town The Ingush Tower at night, completely hidden in fog, there is a lot of fog

Дальше я начала варьировать состояния среды и одновременно работать с композицией и масштабом сцен. Я пробовала добавлять разные условия, например дорогу, уходящую в туман, дождь или слабый свет внутри башен.

Также параллельно я начала работать с более крупными композициями и масштабом, добавляя несколько башен и целые комплексы.

На этом этапе изображения стали выглядеть более цельно, как части одного мира, в котором почти ничего не осталось, кроме самих башен.

Исходный размер 5065x1200

анализ результата |

Нейросеть смогла хорошо передать характерные особенности ингушских башен — их массивность, уникальную каменную кладку и ощущение заброшенности. После уточнения промптов и добавления cinematic lighting, fog, desaturated tones изображения стали более атмосферными и усилилось ощущение пустоты, изоляции и мрачного фэнтези.

Я экспериментировала с состояниями среды, добавляя туман, дождь, ночь и слабое освещение внутри башен. Это позволило создать визуально разнообразные сцены, при этом сохранить единую концепцию.

Проект показал, что нейросеть смогла научиться воспроизводить архитектуру башен и атмосферу горного пространства в разных условиях, сохраняя при этом единый стиль. Серия изображений передаёт ощущение одиночества, упадка и меланхолии, превращая обычные фотографии башен в визуальный рассказ о пустоте, истории и стойкости прошлого.

Теперь обученная модель позволяет создавать новые сцены с башнями, которые сохраняют атмосферу проекта и визуальный язык, а также демонстрирует, как генеративные нейросети могут работать с архитектурой и создавать целостные художественные миры.

Список использованных в проекте инструментов:

[1] Stable Diffusion — обучение генеративной модели на собранном датасете, генерация изображений; [2] ChatGPT 5.3 — уточнение и оптимизация промптов; [3] Google Colab — среда для выполнения кода, обучения модели и генерации изображений; [4] Adobe InDesign / Figma— оформление визуальной серии, создание лонгрида.

Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше