Original size 1140x1600

Финальный проект по анализу данных

PROTECT STATUS: not protected
3

Идея проекта

Идея проекта — обучить нейросетевую модель генерировать изображения в стиле ранних работ Винсента ван Гога. Его первые работы имеют свой уникальный стиль, отличающийся от того, что мы привыкли представлять, когда говорим о Ван Гоге.

Я сосредоточилась на формирующемся этапе творчества художника (1881–1886), где доминируют приглушённые цвета, пастозные мазки, бытовые и крестьянские сцены.

Проект исследует возможности fine-tuning нейросети и демонстрирует, как современные модели способны передавать не только внешние признаки стиля, но и эмоциональный строй художника.

Материал для обучения

Винсент ван Гог, картины для обучения

Винсент ван Гог, картины для обучения

Фокус был на работах с разнообразной палитрой и плотной фактурой мазка, чтобы сформировать узнаваемый стиль раннего периода художника.

Винсент ван Гог, картины для обучения

Результат

Посмотрим на изображения, которые получились:

Серия работ демонстрирует широкую вариативность генераций при сохранении цельного стилевого ядра. Почти все изображения выполнены с характерной вибрацией мазка, имитирующей движение кисти Ван Гога — мазки плотные, направленные, создающие ритм поверхности. Удалось передать широкую цветовую палитру: от насыщенных светлых пейзажей с ярким морем и зелёными полями до мрачных, приглушённых по тону натюрмортов, в которых чувствуется влияние нюэненского периода — времени, когда Ван Гог работал с темами бедности и быта крестьян.

Портреты сгенерированные обученной моделью

Картины, сгенерированные обученной моделью

После обучения я провела серию генераций по текстовым промптам:

«sea and boat, bright colors»

«autoportrait of van ghog»

«kids playing in the backyard in 19 century in van ghog style»

и другие

Картины, сгенерированные обученной моделью

Сгенерированные изображения убедительно воспроизводят живописную манеру Ван Гога: выразительные мазки, пастозная фактура, сдержанная (или наоборот, насыщенная — в поздних генерациях) палитра, искажения перспективы. Нейросеть уловила не только форму, но и настроение — будь то тревожная улица с собаками или яркое море с лодками.

Обучение модели

Использовалась архитектура Stable Diffusion XL, дообученная с помощью DreamBooth и метода LoRA (Low-Rank Adaptation) на Google Colab.

Original size 1230x72

Для подготовки датасета я загрузила собственную выборку изображений раннего Ван Гога и сгенерировала описания к ним с помощью модели BLIP (Salesforce).

Original size 1251x458

Во время обучения использовались методы оптимизации: градиентное контрольное сохранение (gradient checkpointing), обучение с пониженной точностью (fp16), и оптимизация с использованием 8-bit Adam.

Original size 1182x549

Модель была обучена в 500 шагов, после чего опубликована в Hugging Face Hub в виде отдельного репозитория (VanGhog_Style).

Original size 813x154

Вывод

Картина ван Гога / сгенерированное обученной моделью изображение

В результате исследования получилось создать изображения, которые отражают основные черты стиля: плотную текстуру мазков, мягкий, приглушённый свет, психологическую глубину портретов. Можно сделать вывод, что нейросеть не просто копирует стиль — она пытается продолжить интонацию, создавая новые произведения в духе выбранного художника.

В проекте не использовались никакие другие нейросети.

Файл с кодом

Датасет использованный для обучения

Финальный проект по анализу данных
3
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more