«Нейросети – это продолжение нашего коллективного сознания»

Фотограф The New York Times Мария Маврополу убедила алгоритм нарисовать её предков и самого себя

Греческая фотохудожница Мария Мавропулу создала альбом своей семьи с помощью генеративного искусственного интеллекта. Она использовала систему DALLE-2 от компании Open AI (другой известный её продукт – Chat GPT), отправляя алгоритму текстовые подсказки с описанием событий из жизни её близких. Изображения сложились в полуреальный альбом, который рассказал художнице о её семье больше, чем она сама знала.

«Соль» поговорила с Марией о том, что искусственный интеллект сделает с понятиями «факт» и «правда» и почему он оказался так сильно похож на человека.

Мария Мавропулу. Фото – из архива автора

Мария Мавропулу родилась в советском Ташкенте, но выросла и сейчас живёт в Афинах. В основном она работает с фотографией и новыми визуальными формами: VR (virtual reality, искусственная реальность) и изображениями, созданными с помощью генеративного искусственного интеллекта. Исследует алгоритмы, сетевую культуру и отношения между людьми и машинами. Сотрудничает с The New York Times, освещая события в Греции и на Балканах. Среди её личных проектов: «Автопортрет искусственного интеллекта» (A self portrait of an Algorithm), «Семейные портреты» (Family Portraits), «По образу своему, по образу Божию сотворили Их» (In Their own image, in the image of God, They created Them), «Воображаемые изображения» (Imagined Images).

— Вы сгенерировали семейный альбом с помощью нейросети. Расскажите, как это было. Часто ли приходилось корректировать запрос и что вы почувствовали, когда увидели результат?

Идея проекта возникла в конце 2021 года, когда генераторы искусственного интеллекта только начали появляться в сети. Даже первые результаты их работы меня очаровали, хотя по нашим сегодняшним меркам они выглядели смехотворно плохими. Я почувствовала, что нужно изучать инструмент дальше, потому что скоро он станет работать намного лучше.

Через полгода у меня появился доступ к DALLE-2 (тогда он принимал лишь ограниченное число юзеров), и те изображения, которые я от него получила, показались мне умопомрачительными. Они были гораздо ближе к настоящей фотографии, чем у других генераторов. ИИ всё ещё искажал лица, но уже хорошо передавал атмосферу.

Тогда я стала добавлять в текстовые подсказки место и время: например, «Греция, 90-е». Результаты получались на удивление точными. Цвета – как на старых фотографиях, соответствующая эпохе одежда и даже мелкие детали, которые добавляли сюжету реалистичности.

Фото из серии «Воображаемые изображения», сгенерированы нейросетью 

Работа с ИИ, как игра в казино, стала вызывать привыкание. Я часами по ночам нажимала кнопку «создать», чтобы увидеть следующий набор картинок. Многие из них генерировались с помощью одной и той же подсказки, пока не получалось одно нужное фото, которое, как мне казалось, могло быть частью моего семейного альбома.

— Вы говорили, что искусственный интеллект рассказал о вашей семье то, чего не знали даже вы сами. Что это было?

— Генеративный ИИ учится, используя огромное количество данных. Например, большая языковая модель, такая, как Chat GPT, тренировалась на всём, что читала в интернете. Она потому и может писать осмысленные тексты, что научилась анализировать вероятность, с которой одно слово последует за другим. Это похоже на автозаполнение на мобильных телефонах, но работает в гораздо большем масштабе.

Системы генерации изображений устроены так же. Когда пользователь подсказывает им некое понятие, они связывают его с другими понятиями, хотя автор запроса мог и не упоминать их. Если я попрошу фотографию яблока, то получу зелёное или красное яблоко, а не синее и фиолетовое – даже если не буду уточнять цвет.

Допустим, раньше я никогда не видела яблок. Значит, искусственный интеллект может показать мне, что они бывают красными, зелёными или имеют промежуточный цвет. Кажется, будто в сгенерированных изображениях есть своего рода «правда», которую ИИ достигает за счёт большой выборки.

Отвечая на вопрос о моей семейной истории, я не скажу, что проявились какие-то драматические откровения. Но этих деталей я раньше не знала. Архитектура дома, где я родилась в Ташкенте. Тот факт, что моя мама в советские времена носила на работе форму. Или место на Пелопоннесе, откуда родом мой дедушка.

Фото из серии «Воображаемые изображения», сгенерировано нейросетью

— Почему ИИ сработал настолько точно? Может быть, черты эпохи – такие, как мода и фототехника – соединяют частные портреты в один коллективный, и наши личные истории оказываются не такими уж уникальными?

— Этот проект начинался как исследование новых возможностей генеративного ИИ. Но, кроме того, он был и остаётся интеллектуальным упражнением, помогающим разобраться, что общего у нового поколения изображений с традиционными фото и живописью.

В надежде понять, как он работает и «думает», я старалась делать подсказки очень простыми, чтобы дать ИИ больше пространства для интерпретаций. Сначала я написала «семейный ужин», но получила фото, которые выглядели, как стоковые, и были слишком «западными». Тогда я добавила: «семейный ужин, Греция, 90-е» – и вот тут случилось волшебство. Это были именно те изображения, что я искала: любительские, знакомые всем, такие, с которыми каждый может почувствовать связь.

Я не соглашусь, что наши истории не уникальны. Но образы из семейных альбомов, безусловно, имеют много общего. Как будто существует «негласный сценарий» обязательных и ненужных элементов. Я взяла свою семью для вдохновения, но на самом деле хотелось спровоцировать дискуссию о том, как это путешествие во времени позволяет поправить свою личную историю. Нам стоит подумать, особенно сейчас, в эпоху потрясений, что будет, если можно так легко «захватывать» другие идентичности.

— У вас есть серия изображений под названием «Автопортрет алгоритма». Чьей фантазии здесь больше: искусственного интеллекта или вашей? И почему он так похож на человека?

— Этот проект развивался с конца 2021 года одновременно с другим – «По образу своему, по образу Божию сотворили Их». Они связаны. Образы одного – это мои попытки визуализировать ИИ через аппаратуру, в которой он проявляется. В другом он показывает самого себя.

Я не могу «поправить» его в процессе. Могу лишь выбрать те изображения, которые кажутся мне самыми интересными. Но даже если бы и можно было контролировать результат, это не входило в мои планы. Напротив, я хотела сделать подсказку короткой и простой, позволив ему самому решить, как себя изобразить.

Фото из серии «Автопортрет искусственного интеллекта», сгенерированы нейросетью

Да, везде человек. Я тоже удивилась и решила проверить, получу ли такие антропоморфные изображения, если попрошу нарисовать портреты других [абстрактных] вещей. Не получила.

В какой-то момент я решила спросить у Chat GPT, почему так происходит. Он написал, что алгоритм учится на контенте, ориентированном на человека, и поэтому ему не хватает прямого контакта с концепцией алгоритма [то есть самого себя]. Получается, что в ответ на просьбу нарисовать автопортрет, интерпретация модели ограничивается приобретенным ею человекоцентричным пониманием.

ИИ вдохновлён всем объёмом человеческой культуры, которая есть в интернете. Автопортреты он создал сам, но с моей подсказкой. Так что я бы сказала, мы сотрудничали.

— Если человек создал изображение с помощью нейросети, предварительно просмотревшей миллионы других картин и фото, то кто автор?

— Мне часто задают этот вопрос, и у меня есть очевидный ответ: а что насчёт художественных школ? Когда человек ходит в школу и изучает искусство великих мастеров, то он находится под влиянием всей визуальной культуры, которую видит. В таком случае кому принадлежит произведение, которое он потом создаст? Разве он не учился на том, что видел? Не будем забывать, что ИИ развился на основе нейронных функций человека. При всех различиях именно в процессе обучения у нас много общего.

Фото из серии «Автопортрет искусственного интеллекта», сгенерировано нейросетью

Противники ИИ говорят, что сгенерированные изображения лишены художественности и создаются без особых трудов. Как будто усилия и потраченное время – мерила для оценки качества.

— Как думаете, вы полностью понимаете принцип работы искусственной нейросети?

Сомневаюсь, что даже опытные разработчики ИИ сказали бы «да». На самом деле, это предмет горячих дискуссий об этике и безопасности. Если крупнейшие компании, которые сами производят эту технологию, не до конца представляют, как она принимает решение, то как нам использовать этот продукт и доверять ему?

— В таком случае как искусственный интеллект изменит фотожурналистику? 

— Думаю, что первыми устареют изображения, слабо связанные с реальностью. Стоковые или коммерческие. А вот документальная фотографии вряд ли исчезнет.

Самая серьёзная угроза – это искусственные фото, которые нельзя будет отличить от настоящих. И если мы не найдём способ регулировать их распространение, особенно в новостных СМИ, то потеряем фундаментальное доверие [читателей]. Больше всего я боюсь, что однажды мы увидим реальное фото и не поверим ему, зная, что это может быть подделка.

— Медиаисследователь Маршалл Маклюэн писал, что любая технология – это расширение человеческого тела вовне. Поэтому средства массовой информации, созданные в электрическую эпоху, например, телевидение, он назвал продолжением нашей нервной системы. Если он прав, то какую часть нас расширяет искусственная нейронная сеть?

— Ответ без колебаний: наше коллективное сознание.

— У вас есть серия фотографий «Семейные портреты» — о том, как экран гаджета заменил людям всё, даже близких и любовь. Что даст нам генеративный искусственный интеллект? И что отнимет?

Фото из серии «Семейные портреты»

— Я чувствую: сейчас тот момент, когда любые сценарии ещё возможны. И это в наших руках – компаний, которые создают и внедряют свои продукты, и регулирующих органов – защититься от потенциальных рисков, когда технология может выйти из-под контроля или попасть не в те руки.

Искусственный интеллект откроет большие возможности во многих областях – образование, научные исследования, производство, медицинские испытания и диагностика. Его огромная сила не сосредоточена в руках его создателей, а открыта всем людям. И раз уж ИИ был обучен на [всех достижениях] человеческой цивилизации, я думаю, его следует использовать по лицензии Creative Commons – на благо многих. Давайте помнить, что этот инструмент сверхмощный, но пока ещё находится под нашим контролем.

Беседовала Елена Верещагина. 

Актуальное

Лучшее на Соли