Мечтают ли андроиды об электрогитарах? Будущее ИИ в музыке

30 июня 2017 timetorock

Рассказываем о проектах Google и Sony, которые используют технологию машинного обучения для создания музыки

do-androids-4

Послушайте «Daddy’s Car». Этот гипотетический хит легко затеряется в потоке контекстной рекламы. Написанный под копирку с каталога ливерпульской четверки, он полностью вымывается из памяти уже через пару минут, и это не удивляет: бесталанного ретроградства сегодня хватает. «Daddy’s Car», тем не менее, для общества не типичен, ведь это результат работы искусственного интеллекта компании Flow Machines, дочерней программы техногиганта Sony. Другими словами, написана эта цепкая мелодия «а-ля THE BEATLES» с помощью обширной нейронной сети под надзором французского музыканта Бенуа Карре. И хотя вторичность ее очевидна, «Daddy’s Car» — это одна из самых примечательных незаметных песен в истории.

Компьютеры все ближе подбираются к музыке. Но это происходит не ради таинственной музы, а по воле дорогостоящего программного кода, который и обеспечивает сложный акт чревовещания. Flow Machines, получившие гранд в размере 2,5 млн. долларов от Европейского исследовательского совета, не одиноки в своих начинаниях. Существует также проект Magenta от Google, запущенный год назад.

Никто не спорит: мы действительно хотим побеседовать с роботами. Будь то органическая речь или электронная, мы нуждаемся в компаньоне. С тех пор как человеческий голос прошел по телефонным проводам, мы смотрели на холодные катушки и конденсаторы с мечтой оживить их. Сейчас речевая часть получила значительное развитие, и мы тут же поспешили разбудить компьютеры.

Следующий шаг – командная работа машины и человека. Но создание творческого начала, буквального вдохновения – задача для программирования все еще слишком скользкая. Чтобы вынуть свечение из своего нутра, прикоснуться к инструменту и ухватить самую суть звука нужно нечто особенное. Какова математика? Где останавливаются ноты и начинается настоящая музыка?

Дуглас Эк (Douglas Eck) работает на Magenta, ответвление Google Brain, целью которого является разработка «алгоритмов генерирования искусства». Он инженер и музыкант с бэкграундом в виде блюграсса и панка; «эдакая смесь Джонни Кэша и Джонни Роттена». Он много времени посвятил изучению различий между нотой и музыкой в философском смысле.

Возможно вас удивит, что Эк отвергает фундаментальный тест Тьюринга в рамках поп-музыки. Он не хочет, чтобы Magenta обманывал слушателей или имитировал музыкантов. «Мы не хотим создавать человеческую музыку без людей. Мне не интересно нажимать кнопку и слышать что-то рефлективно-эмоциональное».

Он признает, что главным камнем преткновения является не машина, а человек, и тут поднимает голову старая когнитивная предвзятость: «Одна из проблем умных машин заключается в том, что мы привыкли к зрительному контакту с водителем; это дает чувство безопасности. Но как побороть эмоции без водителя? По той же причине сложно создать музыкальный инструмент на основе машинного обучения».

Искусственный интеллект, по словам Эка, должен пройти так называемый тест с «гитарной педалью» (the guitar pedal test). Возможно, это означает, что музыкантов просят вертеть, переключать и изучать все виды звуков, на которые способен робот.

Сейчас Magenta – это игровая площадка для кодеров. Они загружают на форум свои результаты и делятся опытом, но даже они не могут избавиться от чувства стеснения. Мелодии звучат непривычно, неуклюже, будто студент-новичок только открыл для себя гармонику. Когда синтезатор пытается выйти за рамки возможностей школяра, глубина мгновенно теряется и ноты ломают логическую структуру. Лексика машин ограничена, но можно почувствовать, как интеллект ведет себя в рамках базовых правил.

Эк тоже не может избавиться от ощущения «медведя на велосипеде» – цирковые номера опасного хищника впечатляют, но сам факт наблюдения за медведем заставляет игнорировать уровень его мастерства. Это нормально, говорит разработчик, что Magenta иногда получают «отвратительные» результаты.

На данный момент проект нуждается в группе реальных артистов, готовых использовать программное обеспечение непривычным образом. «Взгляните на драм-машину, — продолжает Эк. – Она стала культовым инструментом, когда творческая сфера ее применения преодолела задумку первоначальную».

Недавно Magenta представили новый инструмент NSynth — нейронную сеть, обученную 300.000 звукам. Способ «обучения» сам по себе – прорыв. Обычно, когда речь идет о воспроизведении звука на компьютере, физические вибрации звуковой волны переводятся в цифровые значения, и машина оперирует этими данными; так вы нажимаете кнопку на клавиатуре и слышите флейту, трубу или виолончель.

NSynth отличается. Вместо того, чтобы преобразовывать волны в числа, синтезатор работает на базе «идей» о звучании инструмента — это материал коры, а не клетки головного мозга. По сути, это умный синтезатор, а его опрятный трюк — перекрестный перебор между отдельными звуками в базе данных. Когда вы просите его смешать, скажем, звук гусиного гуканья и арфы, он выдает нечто среднее, странное приближение двух вещей.

Игра с фейдером — это, конечно, весело, но процесс морально устарел. NSynth сейчас больше похож на разобранное крыло самолета, чем на факт покорения вышины.

То ли дело Flow Machines. Зайдите на сайт, и программа с готовностью покажет вам гармонизацию «Оды к радости» Бетховена в стиле хоралов Баха или «Chi Mai» Морриконе.

Затем посмотрите видеоролик вышеупомянутого француза Бенуа Карре, который исполняет ошеломляющую версию «I Feel Fine» THE BEATLES с «умной» педалью. Вместо того, чтобы записывать «петлю» по нажатию кнопки, рефлексивный «лупер» слушает вашу игру и сам принимает решения о том, что записывать и зацикливать. Ему хватает ума, чтобы брать зацикленный материал и самостоятельно переводить его в новую гамму. Наблюдение за тест-драйвом в режиме реального времени захватывает.

Там, где Magenta «исследуют», Flow Machines захватывают рынок. Скоро они выпустят альбом с музыкантами, которые используют «умное» программное обеспечение. Франсуа Пашет (François Pachet), глава компании Flow Machines, пока не готов раскрывать детали, но он надеется, что проекты перейдут в новую фазу, где факт существования алгоритмической музыки уже не будет вызывать недоумения.

Flow Machines — это обширная база данных из песен различных стилей. Сначала вы выбираете несколько элементов в качестве отправной точки и сообщаете пару фактов о музыке, которую хотите создать. Например: умеренное число нот и аккордов, средний темп, наличие голосовой партии. Затем Flow Machines комбинирует идеи, и вы сохраняете те, что вам приглянулись. Если не нравится ни одна, можно обнулить мелодию или отбросить все лишнее, подталкивая программу к дальнейшему развитию.

Иными словами, Flow Machines — виртуальный помощник, достаточно гибкий и отзывчивый, очень начитанный, открытый для сотрудничества. Сейчас он учится двум вещам: писать музыку и сотрудничать с человеком. «Вы даете идею, и система заполняет пробелы, а затем вы критикуете результаты», — говорит директор.

Философия искусственного интеллекта включает несколько мысленных экспериментов. Один из них, опубликованный Джоном Сирлом в 1980 году, называется «Китайская комната». Выглядит он следующим образом: человек заперт в камере; некто извне передает ему записки с китайскими иероглифами, однако субъект не владеет китайской письменностью. В камере, однако, присутствует библиотека, и в книгах указано, какие символы нужно пересылать в ответ. Человек послушно копирует иероглифы от руки и передает листок своему таинственному собеседнику. Он не знает, о чем идет речь в записках; он не знает, что пишет в ответ. Это могут быть рецепты блюд русской кухни, бытовая рутина или обсуждение природы Вселенной.

Интересно, что люди, ответственные за записки вне камеры, понятия не имеют о невежественности своего визави. Для них субъект – виртуозный китайский спикер, участник осмысленной дискуссии. Таким метафорическим экспериментом Джон Сирл критиковал тесты Тьюринга и саму идею существования сознательной машины. Манипуляция символами – это одно, врожденное понимание – совсем другое.

«Китайская комната» справедлива и для музыки. Правда, Magenta и Flow Machines сопротивляются. «Это технология, — настаивает Эк. – Вообразите художественную форму, не использующую ни одной более ранней технологии? В каждом случае при использовании новой техники творчество развивается. Мы должны признать, что наш мозг не так уж полезен без привязки к окружению. Например, многие даже не смогут начертить длинную линию без технологий в форме бумаги или карандаша».

Пашет предлагает аналогичный ответ, но слегка углубляется в философию. Он убежден, что Flow Machines может генерировать отличные песни самостоятельно, но по-настоящему уникальное событие происходит только в присутствии человека. «Музыка слишком вариативна; только артист делает выбор, который приводит к великолепной пьесе».

Эти микрорешения – та или иная фразировка, длительность ноты, эмоция – осуществляются на том уровне, к которому у машин нет доступа. По крайней мере, пока. Воистину, великая музыка рождается от горячего желания. Этот жар, будучи стержнем большинства человеческих начинаний, по-прежнему чужд системам обработки. Легко научить машины стремится к сладкому, но не жаждать его.

И все же, отмечает Пашет, иногда программа генерирует потрясающую музыку.

«Это здорово, но мы не знаем, почему. Конечно, система тоже не знает – у нее нет представлений о том, что такое хорошо или плохо. Это похоже на человеческое отношение к музыке. Мы любим определенные звуки и решаем, что не можем жить без них, тогда как другие отталкивают нас. Разве мы понимаем причину? Мы пытаемся объяснить ее для себя, но импульс и притяжение происходят где-то в глубинах нашего бессознательного».

Пашет, работающий на последнем рубеже человеческой идентичности, не считает машину призраком будущего, который однажды встанет с конвейера и шагнет в мир разума. Он сравнивает достижения с изобретением цифрового синтезатора: «Это всего лишь новое поколение инструментов, и нам нужно научиться их использовать».

Иронично, что единственный, кто уповает на мистику — музыкант Бенуа Карре. Работа со сложными алгоритмами Flow Machines подтолкнула его к бессознательной стороне личности.

Взять, к примеру, «Mr. Shadow», трек, сгенерированный программой на базе сотен стандартов американского джаза. Француз выбрал один вариант и дописал его.

Бенуа очарован умением программного обеспечения «считывать» человеческие голоса. Он видит в этом нечто неудержимое. «Как будто я захватил душу солиста, — говорит он. — Я получаю не просто голос, который рассказывает истории в стихах; я получаю эмоции, стиль, способ пения — вещи, которые формируют суть автора. Это как песенный архетип, но очень эмоциональный. Это самое интересное; инструмент воссоздает ощущение детства, когда вы могли слушать музыку опосредованно, не понимая слов. Вы просто чувствовали ее. Это новый вид песенного творчества».

Создание музыки — суть мечтание, и в этом ее отличие от других форм художественного творчества. В такие моменты мы ближе всего к подсознанию. Единственное вещество, которое мы используем — воздух, и, как только очередная волна угасает, среда умирает. Все, что у нас остается, — это запись. Музыка — самое эфирное из искусств, а поскольку машины берут на себя «ручной труд», музыканты могут мечтать старательнее.

«Flow Machines связывает меня с бессознательным, — говорит Карре, называя процесс игры инстинктивным. — Музыка, созданная с помощью этого инструмента, помогает заглянуть внутрь себя, исследовать теневую сторону творчества. Я открываю новый способ создания музыки. Попутно я узнаю, что такое стиль. Мелодии, которые получаются как будто не в моем стиле, являются результатом моего выбора».

«Здесь есть нечто большее, что-то не похожее на нашу реальность».

Вероятно, Бенуа считает Flow Machine настоящим «интеллектом». В конце концов, он написал с машинами много музыки, и именно в его голове звучат их мелодии. Для него машины реальны. «Во время работы я чувствую диалог», — отмечает он.

«Я не чувствую себя одиноким. Эти программы пишут мелодии, и я могу спеть их следующим утром. Иногда они западают в голову: как будто ты засыпаешь, но в то же время охвачен мыслями, которые невозможно идентифицировать. Они реальны и не реальны одновременно. В них есть что-то потустороннее».

Материал впервые появился на сайте Pitchfork.

comments