Музыкант исчезает: как я, не умея играть, записал музыку, чтобы слушать её самому

Доклад на конференции «Нечеловеческие звуки: музыкальная индустрия против ИИ» в HSE Creative Hub 4 декабря 2025 года

Изначально всё, что писалось и делалось — это делалось для себя, потому что я был стопроцентно уверен, что это не понравится вообще никому. Поэтому вот первые оригиналы я никому не давал, потому что мне было стыдно, то что я играть не умею и… по сути, это вообще не рок. Мне это было самому приятно слушать. Я включал и танцевал под то, что я сделал.

Егор Летов

big
Original size 1920x1081

У меня нет музыкального образования. Я не играю ни на чём — если не считать шестиструнной акустики, с которой мы виделись последний раз лет двадцать назад. Я не читаю ноты. Не знаю, что означают аббревиатуры в названиях аккордов и чем «фригийский лад» отличается от «гармонического минора».

При этом я всю жизнь — мелофаг. Я слушаю музыку так, будто это моя работа, пожирая её в огромных количествах. В какой-то момент ИИ-инструменты — в первую очередь Suno, а потом и плагины для мастеринга — позволили мне перейти из позиции слушателя в позицию человека, который выпускает собственные релизы.

Для кого выпускает? Для себя. Однажды я поймал себя на мысли, что никто на всём свете не делает музыку, которая устраивала бы меня на 100% — всегда что-то не так: слишком чисто, слишком напыщенно, слишком много компрессора в миксе, стыдно за текст и так далее. В какой-то момент я вспомнил антагониста Жана-Батиста Эмануэля Зорга из «Пятого элемента» в исполнении Гэри Олдмана, который произносит: «Если хочешь, чтобы что-то было сделано хорошо — сделай это сам».

Но «сам» в моём случае — это не студия, не группа и не десять лет гитарных упражнений, а голова, старые тексты, странноватые вкусы и набор мощных инструментов, которые вдруг оказались доступны любому мелофагу с компьютером. Так появился мой личный сюжет: как не-музыкант записал несколько альбомов, которые ему самому не стыдно слушать. И заодно принял участие в разговоре о том, что вообще происходит с авторством, индустрией и той самой фигурой «музыканта», который, кажется, постепенно растворяется в воздухе.

Original size 1920x1080

Если попытаться картографировать мой музыкальный вкус, получится что-то довольно тёмное, что очень грубо можно описать так: там, где большинству людей тревожно и некомфортно, мне интересно и сладко.

В центре — всё, что связано с замедлением или, наоборот, с неестественным ускорением, тяжестью, клаустрофобией, темнотой и тревогой: black metal и post-metal, разные экспериментальные или прогрессивные их варианты, хоррор-саундтреки, gothic darkwave, dark ambient, hauntology, dark cabaret, dark country, weird americana, neofolk и apocalyptic folk, post-industrial, dark jazz, который звучит как музыка из несуществующего фильма Линча и тому подобная чернуха. На периферии — witch house, trip-hop, trap, phonk, drill, grime, иногда странная поп-музыка, и, да, не для протокола, иногда и очень выборочно «русский рэп» (извините). Мне нравится музыка, которая делает что-то с телом, и я люблю те жанры, где звук индуцирует психофизиологическое переживание, точнее сказать, целый спектр состояний: некое стеснение в груди, какие-то вестибулярные чудеса, нервные тики, ощущения, похожие на те, которые возникают, когда из комнаты вдруг исчезает весь воздух (всем, конечно же, это чувство хорошо знакомо, не так ли?).

Когда я говорю, что делаю «идеальную для себя музыку», я имею в виду попытки собрать все эти, иногда несовместимые, вещи в один чёрный коктейль: чтобы и было мрачно, и немного смешно, и местами, что называется, «кринжово», а порою вдруг даже неожиданно красиво.

Original size 1927x1080

Официальный анонс нашей конференции говорит, что мы обсуждаем влияние ИИ и алгоритмов на создание композиций и практики прослушивания: от ИИ-подборок до генеративной музыки.

Моё амплуа в этом спектакле — «непрофессионал, вооружённый очень мощными инструментами». С одной стороны, это демократизация: человеку без музыкального образования становится доступен продакшн на уровне, который раньше требовал бы студии, участия живых музыкантов и очень много времени. С другой стороны — это вызов для индустрии: как жить в мире, где люди вроде меня могут заливать на стриминги альбомы, сделанные вместе с ИИ?

Original size 1920x1080

Началось всё, извините за банальность, в девяностых. У меня были тексты и акустическая гитара. Мы с другом моим Никитой Поляковым пытались мои песни записывать. Были регулярные репетиции и рекорд-сессии (которые на самом деле представляли собой страшное чёрное пьянство на кухне: разбавленный водой из-под крана спирт «Рояль» под черемшу и всё такое), были какие-то амбиции, мечты о студии, были даже немногочисленные и всегда безуспешные попытки играть в электричестве с живыми людьми. По ощущениям это было, с одной стороны, карго-рок-музицированием — с другой, всё же, чем чёрт не шутит, подготовкой к настоящему альбому, который, должно быть, состоится когда-нибудь позже, когда у нас будут деньги, время, оборудование, связи и навыки.

Альбом, разумеется, не случился. Тексты остались в тетрадках, а иногда только в памяти, отдельные оцифрованные записи хранятся у Никиты в личном архиве, но это, конечно, стыд и срам.

С тех пор прошло тридцать с лишним лет, девяностые превратились в то, о чём говорят «верните мне мой 93-й», некоторые тексты вышли в сборнике «Узелковое письмо» на бумаге, песен же так и не было. Ну и вот, значит, появляются генеративные нейросети — и, наконец, мой первый более или менее нестыдный альбом «Тахикардия». Все тексты на нём — мои, большинство — старые, из девяностых (хотя есть и сравнительно свежие). Мелодии же чаще всего сохранялись ещё те самые, потому что я скармливал Suno архивные оцифровки в качестве референсов.

Технически всё довольно просто. Начал я с того, что клонировал свой голос с помощью ИИ-сервиса ElevenLabs, напев, наговорив, нашептав, нарычав и навизжав примерно полминуты материала в довольно дешёвый микрофон, из чего потом сделал Persona в Suno, которую позже использовал как тембровый референс. Затем я беру текст, набрасываю промпт в Suno — объясняю, что мне нужен какой-нибудь «raw dark jazz with post-punk and industrial flavour, slow, anxious, heavy». Получаю несколько версий. Поначалу всё не нравится, но я тогда уточняю промпт, снова генерирую, иногда делаю кавер-версии уже сгенерированного, чтобы лучше проявились некоторые конкретные качества аранжировки, интонации и звучания. Удаляю я девяносто пять из ста генераций, оставшиеся переименовываю, помечая те или иные особенности. В конце концов остаётся пять удовлетворительных вариантов, которые я скачиваю (иногда в виде треков, разделённых на отдельные стемы).

Затем я создаю мультитрековый проект в Adobe Audition (и да, я знаю, что нормальные люди пользуются Ableton Live или, на худой конец, Apple Logic Pro), в который импортирую весь аудио-футаж, нарезаю и склеиваю, поверх всего на мастер-трек вешаю некий FX-Rack, который впоследствии стал составлять и настраивать, консультируясь с ChatGPT (об этом позже). Для «Тахикардии» я использовал нативные фильтры Audition, позже стал пользоваться Ozone 12 Advanced. Сведение и мастеринг — наверное, два самых долгих и трудоёмких этапа всего процесса. Например, в Suno я могу делать генерации в течение, условно, двух часов, иногда я даже занимаюсь этим в телефоне в метро по дороге на работу, но мастеринг одного трека может занять пять-десять вечеров.

Короче говоря, в результате я получил вполне конкретный объект: альбом, который можно послушать, проигнорировать (в большинстве случаев), поставить на репит (это, разумеется, делаю только я), можно даже купить его на Bandcamp, правда, я не получу ни копейки, потому что выводить оттуда выручку в РФ сейчас, разумеется, никак не возможно.

Для меня это было довольно болезненное и одновременно освобождающее событие: я наконец-то сделал то, чего не сделал, когда мне было двадцать лет. Кстати, насколько я могу судить, Никите моя ИИ-музыка категорически не нравится. Возможно, она искажает его собственную версию нашей общей юности, но и наши музыкальные вкусы за тридцать лет разошлись радикально и стали почти противоположными. Никита, о сюрприз, не любит black metal! А я, соответственно, тоже многого не люблю.

Возможно, это столкновение моей радости «наконец-то я услышал свои песни!» с его негодованием «что ты сделал с нашей памятью?!» — уже само по себе сюжет для отдельного, такого, знаете, горько-исповедального трека (смайл).

Original size 1920x1080

Слово dérive у ситуационистов означало практику бесцельных блужданий по городу, маршруты которых определяются не целесообразностью, а настроениями, запахами, случайными встречами и происшествиями. EP «la dérive noire» рассказывает о том, как ты идёшь по городу, пока постепенно темнеет и наконец наступает ночь (под ночью мы тут будем понимать кавер-версию песни Black Metal британской группы Venom).

Отдельная личная точка здесь — трек «ο ακάθιστος». Его текст был написан примерно в 2009-м; в 2018-м мы с композитором-другом пытались сделать из него рэп-трек, но у нас не получилось. Потом в 2024 году появился мой первый полноценный ИИ-альбом «Это не я», сделанный с помощью сервиса Udio (который в тот момент был лучше, чем Suno — сейчас он хуже). Альбом получился довольно стыдным, хотя тогда я впервые испытал настоящую эйфорию от нового инструмента и его возможностей, но та версия «Акафиста» послужила референсом для римейка в составе «la dérive noire»: я очень хорошо понимал, чего больше не хочу, и как можно вытянуть этот текст в другую сторону.

Прототипы треков «луна в созвездии говна» и «la dérive» ещё в 2018-м были доведены-таки до релиза, но когда я их сейчас слышу, мне хочется спрятаться под стол. Но это полезный стыд: он показывает, сколько мусора приходится производить, прежде чем начинает хоть что-то получаться. Я даже не стал удалять их с Bandcamp — пусть висят как назидание.

Некоторая ирония заключается в том, что композитор, с которым мы пытались работать в 2018 (тогда его звали иначе, а теперь он совершил транс-переход, говорит о себе во множественном числе и обозначает себя именем legiones nonbinaryrussia) сейчас стал, возможно, моим единственным по-настоящему внимательным и компетентным слушателем. Он — то есть они — слушают мои ИИ-альбомы, записывают длинные, иногда беспощадные голосовые отклики, слышат то, чего я сам не слышу. В каком-то смысле «la dérive noire» — это окончание того нашего с ними незаконченного диалога.

Original size 1920x1080

«#000000» — это, по сути, шутка, которая зашла слишком далеко. Я заметил, что в моей голове живёт некоторое количество «чёрных» песен: «Очи чёрные», «Black Trombone» Сержа Гинсбура, «Black Star» Элвиса Пресли, «Black Betty», «Paint It Black», «Чёрный ворон» и так далее. Все эти песни давно существуют в культурном поле, все успешно эксплуатируют «чёрную» образность — от трагедии или бесовщины до карнавала.

Мне захотелось собрать этот чёрный хор в один альбом, пропустив через себя и свою, так сказать, рецепцию. Технически это выглядит как серия каверов или переосмыслений: иногда я пытался держался недалеко от оригинала (что всё равно не получилось), но в большинстве случаев от оригинала не осталось почти ничего. В частности, потому, что модель не даёт написать «сделай мне, пожалуйста, кавер Black Trombone от Гинсбура в стиле Peste Noire» — приходится описывать, что именно мне важно: грязь, темп, вокальная манера, структура риффов и тембр искажённой гитары, общее настроение и так далее.

Получился довольно странный объект: знакомые песни, которые звучат как альтернативная ветка истории популярной музыки, когда всё пошло как-то не так.

Тут, разумеется, особенно остро встают вопросы авторства и этики: где заканчиваются цитаты и начинается «своё»? Практика сэмплинга, например, в хип-хопе, кажется, нормализована и легитимирована, но ли я право превращать «Очи чёрные» в авангардный блэк-метал? Кому принадлежит результат — мне, алгоритму, авторам оригиналов или всем сразу?

Мой ответ: я не знаю. Меня это вопрос беспокоит, но не парализует. На стриминги этот альбом, кстати, залить оказалось невозможно из-за проблем с авторскими правами, ну и ладно.

Original size 1920x1080

Последний на данный момент завершённый крупный проект — «Conclave Obscurum» — тоже построен на странной петле времени. В 2004 году у меня была флеш-инсталляция с тем же названием. Она жила в браузере, работала как zero-content сетевое искусство, в котором я пытался совмещать готический пафос с дешёвым хоррором и веб-эстетикой нулевых.

Original size 1920x1080

Спустя двадцать лет я возвращаюсь к этому же названию и к этим же образам — и к музыке, которая тогда была непосильной. Теперь у меня есть Suno, есть Audition, есть доступ к чужим и своим референсам и сильно возросшая за 20 лет «наслушанность».

Часть треков на «Conclave Obscurum» основана на музыке других авторов — я честно пишу об этом в описании: там и Алексей «hiddenkid» Базунов, который писал музыку специально для того проекта, и Георгий Свиридов, и Серж Гинзбур, и Coil, и Rompeprop, и Sopor Aeternus. Остальное — моё. Все программирование, аранжировки, сведение, мастеринг и обложка — тоже мои. По жанровой шкале это обретается где-то между neoclassical avant-garde, gothic, progressive black metal, dark jazz и dark ambient, а по моим внутренним ощущениям — ещё один музыкальный ритуал по реконструкции самого себя и своей ушедшей молодости. В каком-то смысле это самый «человеческий» мой альбом, потому что ИИ здесь работает не как автор, а как инструмент реминисценции и рефлексии.

Original size 1920x1080

Suno прошёл путь от простого «напиши мне песню в стиле…» до довольно сложного инструмента, где важны структура промпта, работа с текстовым полем и понимание ограничений модели.

Original size 1920x1080

В какой-то момент я понял, что пишу не только песни, но и язык общения с моделью. По сути, формируется странный диалект машинного английского, который переводит мои интуиции в инструкции. Типичный промпт для Suno у меня выглядит примерно так:

Жанр: не просто black metal, а avant-garde dissonant black metal song, fused with dark trip-hop and dark jazz.

Тональность: in A minor, use a strict repeating 4-bar chord progression for all main distorted guitars and bass riffs: | Am | Am (b5) with a flattened fifth (A minor with Eb in the chord) | B7b9 | E7b9 | (repeat), tritone-heavy.

Ритм: use the uploaded audio as the strict rhythmic reference, odd meter: 13/8 (grouped 3+3+3+4), feels like 6/8+7/8 waltz, keep 13/8 throughout, avoid ¾ and 4/4, tempo ~94 bpm, no backbeat on 2& 4, shaker on straight 8ths; kick on 1, 4, 7, 10; gentle push on 11.

Структура: bass outlines roots at group starts, no catchy riffs, only jagged dissonant clusters, no chorus, no hooks.

Инструменты: main focus: painful sandpaper abrasive low-tuned distorted guitars, tremolo riffs, chaotic but precise drums, deep bass rumble, ritual harsh male growling vocals plus distant slavic funeral lament voices, with slavic flutes and jaw harp as haunted textures.

Продакшен: suffocating style production, claustrophobic mix, guitars as a narrow wall of noise.

Настроение: heavy horror industrial vibes, haunted textures, mood of metaphysical dread, unstable, no catharsis.

Отдельная история — поле текста: многие пользователи Suno используют поле Lyrics не только для текста песни, но и для передачи дополнительных инструкций, отсылок, ритмических паттернов и так далее.

Original size 1920x1080

Дальше начинается рутина. Первая генерация почти всегда бывает «мимо кассы», и я ищу способы быть более внятным в своих пожеланиях. Например, если Suno выдаёт слишком попсовое звучание, я радикализирую язык: вместо простого «dark» пишу «lo-fi, raw, distorted, dissonant, underproduced». Если вокал слишком чистый, в промпте добавляю «harsh hoarse distorted vocals, low-pitch male guttural growling and screaming, weary and drunk, mongolian throat singing» и дальше отбираю наиболее удачные варианты.

Когда говоришь «ИИ сделал для меня музыку», в голове у людей часто возникает сценарий: я написал одну строчку, нажал кнопку, и через 30 секунд получил готовый релиз.

Всё несколько сложнее. В реальности, как я говорил выше, мой процесс выглядит так: сначала я генерирую множество версий трека с разными промптами и настройками — например, добавляю слова вроде «raw», «underproduced», «dissonant», «whispered harsh vocals», «tape hiss», меняю параметры Weirdness или Audio Influence, перебираю разные Personas, которых у меня накопилось несколько десятков.

На этом этапе нейросеть перестаёт быть волшебным существом с нечеловеческой субъектностью и превращается в очень терпеливого, но туповатого музыканта, которому надо по сто раз объяснять, что именно меня бесит: «сделай грязнее», «убери этот героический подъём, мы не Marvel-саундтрек пишем», «дай, пожалуйста, ощущение, что запись делалась в избушке в норвежском лесу, а не у Васи Вакуленко на студии Gazgolder».

Original size 1920x1080

Из ста генераций я выбираю, например, пять и скачиваю (иногда по отдельным стемам). В Adobe Audition я нарезаю и склеиваю лучшие куски: например, куплет из одной версии, припев из другой, атмосферное интро из третьей, удачно интонированное слово из четвёртой и соло из пятой.

Original size 1920x1080

Следующая серия мытарств — сведение и мастеринг. Схема обычно такая. Собрав композицию в Audition из кусочков разных генераций, настроив кроссфейды и вычистив очевидные артефакты, я спрашиваю у ChatGPT: как лучше всего ма́стерить, например, авангардный диссонансный блэк метал в манере Deathspell Omega? Он объясняет; я собираю стек фильтров (раньше это были нативные фильтры Audition, но в последнее время мне очень нравится Ozone 12 Advanced).

Original size 1920x1080

Делаю пробный миксдаун и провожу анализ: спектрограмма, Amplitude Statistics, True Peaks, средняя громкость, вот это всё красивое и страшное. Описываю картину для ChatGPT, иногда посылая скриншоты, иногда словесно жалуясь на то, что вот, дескать, слышу, например, мутную середину, перегруженные низы около 60–80 Hz, а в районе 3–4 kHz — «песок».

Модель отвечает в реальном времени, как такой вполне себе учитель звукорежиссуры: попробуй чуть прижать голос; прибери компрессор; раздвинь стереобазу в верхах, а бас, наоборот, собери в кучу; аккуратнее с лимитером. Я подкручиваю настройки, снова смотрю анализ, снова отчитываюсь. Сцена в целом довольно комичная: немузыкант спорит с текстовым роботом о том, как правильнее увеличить динамический диапазон у трека, который сгенерировала другая модель.

Результат, скорее всего, никакой не «идеальный мастер». Но меня устраивает сама фигура человека между двумя ИИ, модерирующего их конфликт в соответствии со своими вкусами. Блажени миротворци, яко тии сынове Божии нарекутся, не так ли?

Original size 1920x1080

Где во всей этой конструкции «музыкант»? Есть ли он вообще? Если смотреть глазами человека, который прошёл через музыкальную школу, консерваторию, игру в живых группах и студийную рутину, моя практика выглядит примерно так: дилетант, генеративный ИИ, плагины, и, как вишенка на торте, ещё один ИИ в роли консультанта. Собственно, этого достаточно, чтобы сказать: «ну понятно, это не музыка, а контент».

Я хорошо понимаю эту реакцию, но я никогда не относился к генеративным инструментам как к игрушке (нажали кнопку, посмеялись, забыли). Вот у меня за спиной десятилетия меломании (мелофагии), старые тексты, несостоявшаяся группа из девяностых, любовь к блэку и Бадаламенти, и этот «кнопочный» подход совершенно не работает.

Я не вижу в Suno «композитора» или «аранжировщика», а в себе — «музыканта» или «звукорежиссёра». Скорее я вижу распределённый организм, где разработчики моделей приводят в движение библиотеки звука и статистику, датасеты содержат в себе тени реальных музыкантов, алгоритмы предлагают варианты, в которых слышно и чужие стили, и ограниченность самой системы, я приношу на эту литургию свои тексты, концепции и вкусовой фильтр, слушатели (если они есть) приносят интерпретации, эмоции, раздражение, иногда поддержку.

Мне тут представляется очень актуальным Ролан Барт с его «Смертью автора»: автор не умирает буквально, но перестаёт быть осью вращения, становясь одним из многих акторов в сети, довольно важным, но не центральным.

Я довольно долго не проговаривал публично, что мои альбомы сделаны с помощью ИИ (полагаясь на то, что по звуку и моим постам в соцсетях всё и так ясно). В кредитах на Bandcamp я писал: humanimalien — lyrics, programming, arrangements, mixing, mastering. Когда меня спрашивали в комментариях, кто играл партию скрипки, я отвечал: ангелы.

Сейчас я, пожалуй, склонен считать это этическим слепым пятном, и именно поэтому мне кажется важным говорить об этом прямо (если спросят): да, здесь участвуют ИИ-модели, да, это построено на огромных чужих архивах, да, юридически и морально тут много серого.

При этом я принципиально не монетизирую эти релизы. Это вообще не бизнес и не «быстрый способ залететь на Spotify», а скорее художественный, исследовательский и терапевтический проект. Музыкант исчезает? В старом смысле — да, несомненно. Вместо суверенной фигуры «автора всего» появляется фигура куратора, мелофага, монтажёра, программиста аффектов, который работает не только с людьми, но и с машинами.

Original size 1920x1080

Есть ещё одна важная для меня аудитория — студенты. Проблема возникнет, если после такой истории кто-нибудь скажет: «Ага. Значит, чтобы делать альбомы, не обязательно учиться играть. Пойду-ка я тоже нажму пару кнопок».

Тут мне хотелось бы сказать две вещи.

Во-первых, без наслушанности и меломанской квалификации всё это превращается в фабрику по производству одноразового ИИ-слопа. Если ты не слышишь, чем atmospheric black metal отличается от DSBM, не понимаешь, где у тебя компрессор превращает микс в шлакоблок, не чувствуешь драматургию трека, то нейросеть только усилит твою глухоту.

Во-вторых, ИИ-музицирование для меня — это эксперимент и учёба, а не профессия, и я совсем не претендую на идентичность «музыканта». Мне интересен процесс и меня радует результат; как писал Егор Летов: «…если сотворённое тобой не заставляет тебя самого обезуметь и бесноваться от восторга — значит оно — вздорная бренная срань». Это и виртуальная лаборатория, где за вечер можно сделать то, на что в живой группе ушло бы несколько месяцев, и — одновременно — уникальная по эффективности практика саморефлексии и самотерапии. Практика причём фундаментально индивидуальная, потому что «смерть — одинокое дело».

Есть популярный сценарий: через пару лет генеративные модели станут настолько эффективными, что каждый человек сможет за 10 минут собрать себе идеально звучащий альбом; это фантазия про бесконечный Spotify, где всё точно под тебя.

Если это случится, мои сегодняшние релизы будут выглядеть как археология. Это нормально, потому что я не воздвигаю себе памятника, а скорее веду дневник, фиксирующий, как человек без музыкального образования, но с клинической меломанией пытался договориться с машинами о своём идеальном альбоме и выяснить, что остаётся, когда «музыкант исчезает».

Вопросы при этом останутся прежними: зачем мне вообще музыка, что именно я слышу в том, что мне нравится, с кем я разговариваю, когда пишу текст «акафиста» или превращаю «жестокий романс» в black metal, и так далее. Нейросети в этой истории — просто очень сильная лупа, которая увеличивает и мои сильные стороны, и слабости, может находить такие ходы, до которых я сам бы не додумался в силу своей музыкальной бездарности, и помогает много и часто пробовать и оглушительно лажать, что всегда душеполезно.

We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more