Искусственное искусство: как нейросети научились творить

Фото Christie's
Нейронные сети научились рисовать, и при том почти не хуже людей: картина, созданная искусственным интеллектом, ушла с молотка за $0,5 млн

Едва мир искусства оправился от порезанной прямо во время торгов Sotheby’s картины Бэнкси, как в четверг, 25 октября, на нью-йоркском аукционе Christie’s произошло еще одно знаменательное событие: там впервые была продана работа, созданная искусственным интеллектом. При первоначальной оценке в $7000-$10 000, ее продажная цена составила $432 000. Порядок цен соответствует мастерам «первой величины»: на том же аукционе серия принтов Энди Уорхола была продана за $780 000.

Работа была создана трио 25-летних французских студентов Obvious, которые, по их собственным словам, занимаются «демократизацией» искусственного интеллекта через искусство. За последний год они сделали серию портретов, изображающих членов вымышленной семьи Белами. Можно было бы сказать, что портрет Эдмонда Белами стал вершиной их творчества, однако творили не они, а программный код, — к тому же созданный не ими.

Автор кода — 19-летний Робби Баррат, студент Стэнфордского университета. Когда Баррату было 17 лет, он начал экспериментировать с искусственным интеллектом. Сначала он обучил компьютер писать рэп, загрузив в него 6000 строк из композиций Канье Уэста, а потом пошел дальше и загрузил в программу несколько тысяч изображений из Интернета, чтобы научить ее рисовать. Свой код он загрузил на GitHub. Так нейросеть, которой и воспользовались Obvious, оказалась в открытом доступе.

«Я действительно ожидал, что люди будут использовать код в качестве компонентов для своего собственного проекта. Но я никогда не думал, что кто-нибудь продаст его, потому что это некачественная работа», — сказал Баррат The Washington Post.

Нейронная сеть чаще всего применяется для распознавания образов: на вход подается некоторая неструктурированная информация, например, изображения, звук или текст, а на выходе мы хотим получить некоторый семантический вывод. Например, для изображения это может быть информация о находящихся на нем объектах. Однако нейронная сеть может также использоваться и для генерации новых данных, — такие сети называются генеративными. «Подобные сети на вход могут получать некоторый набор случайных значений, а задача сети — сгенерировать выход, который будет похож на реальное изображение, например, лицо человека», — объясняет ведущий исследователь VisionLabs Сергей Миляев. Obvious, к примеру, показали нейросети 15 000 портретов, написанных между XIV и XX веками — этим и объясняется своеобразный стиль картины, созданной компьютером.

Основная идея GAN заключается в том, чтобы тренировать сеть на поиск шаблонов в определенном наборе данных. Обнаружив общие черты, которые присущи всем предложенным объектам, программа-генератор на их основе создает свой вариант компиляции. Затем вторая сеть — дискриминатор — оценивает ее работу, и если она может определить разницу между оригиналами и новым образцом, то отправляет изделие на доработку. Первая сеть (генератор) модифицирует свои данные и пытается снова провести их через дискриминатор, повторяя это до тех пор, пока вторая сеть не перестанет отличать подделку от оригинала. «При этом на вход такой сети может подаваться как реальное фото (как, например, в приложении Prisma, которое создает картины на основе загруженных фотографий), так и другие данные, например, набросок карандашом, или даже портрет другого художника, у которого мы хотим изменить стиль», — объясняет Миляев.

Эта концепция сетей оказалась чрезвычайно мощным инструментом машинного обучения. Благодаря ему сети знают, как копировать основные визуальные шаблоны, но они не имеют ни малейшего представления, как они сочетаются друг с другом. На выходе мы получаем изображения, в которых границы нечеткие и фигуры перетекают друг в друга. Инженеры Google даже предложили для этой эстетики специальное название, по аналогии с историей искусства — GANism.

Наиболее известная из подобных сетей — генеративная состязательная сеть (GAN), тип алгоритма, впервые разработанный Яном Гудфеллоу, исследователем, который сейчас работает в Google. В честь него Obvious и назвали свою серию работ портретами семейства Белами — это переведенный с французского каламбур «бел-ами», что означает «хороший друг», то же самое, что и «гуд-феллоу» — с английского.

Как исследователей ИИ, так и художников эта история вводит в заблуждение: кажется, что сети GAN более сложны и автономны, чем они есть на самом деле. В частности, художников беспокоит вопрос об авторских прав на подобное искусство: если Obvious ничего не придумывали сами, а использовали готовый код Робби Баррата, то кто является создателем картины? И вообще, можно ли считать это искусством? Надо сказать, в своих вопросах они не оригинальны. 100 лет назад Вальтер Беньямин точно так же отвечал на вопрос об искусстве фотографии. Он даже написал эссе «Искусство в эпоху его технической воспроизводимости», где определил, что и фотография, и другие «объекты», произведенные машиной без участия человеческого таланта, вполне могут стать произведением искусства, как, например, фотография или кино в начале XX века. А Марсель Дюшан тогда же стал делать редимэйды и выставил в музее свой знаменитый «Фонтан» (то есть писсуар). Картина, созданная ИИ, ничем не хуже.

Поэтому во всей истории с портретом Белами важно даже не кто и как сделал эту работу, а то, что покупатель был готов заплатить за нее почти $0,5 млн. Это и стало причиной всех дискуссий: принт, созданный нейронной сетью и проданный за $7000, вряд ли послужил бы предметом жарких споров.

Новости партнеров