«Кажется, у нейросети есть воображение»

Лев Манович – о ChatGPT, алгоритмах и новой технической революции

Лев Манович. Фото – manovich.net

Лев Манович (Lev Manovich) – исследователь цифровой культуры, профессор компьютерных наук Городского университета Нью-Йорка, создатель лаборатории Software Studies Initiative, которая визуализировала данные для Google и Публичной библиотеки Нью-Йорка; автор 15 книг, включая «Эстетику искусственного интеллекта», «Культурную аналитику» и «Язык новых медиа». По версии популярного американского издания The Vergе, входит в список «50 наиболее интересных людей, создающих будущее».

– В конце 90-х вы писали, что постиндустриальное общество создаст новый тип медиа. Они не будут тиражировать одни и те же идеи для огромного числа людей (таким был индустриальный мир), а научатся точно в срок доставлять читателю то, что нужно именно ему. Это реальность, в которой ключевым фактором станет свобода воли читателя. Получилось? 

– В любой новой технологии, которую использует миллионы людей – машина, телефон, интернет или город – можно найти и положительные, и отрицательные эффекты. В 90-е, когда web стал популярным, у многих было ощущение, что сейчас наступит утопия. Западные интеллектуалы, а они в основном «левые», спроецировали на интернет все свои идеалы. Они надеялись на демократичное пространство. Более свободное, горизонтальное, где каждый сможет делиться своим творчеством или развивать бизнес.

Прошло 20 лет, и в середине 2010-х стало понятно, что люди пользуются не то чтобы интернетом, а, скорее, социальными медиа. А социальные медиа – это корпорации. И алгоритмы, которые они задействуют, не только помогают, но и направляют нас.

И тогда всеобщий энтузиазм превратился в свою противоположность – жуткий пессимизм. Стало модным всё это ругать.

Конечно, не без причины. Мы увидели, как алгоритмы использовались в предвыборной кампании Дональда Трампа. С помощью таргета пользователям отправляли месседжи, которые изначально были им интересны. То же самое с «Брекситом». Иногда технология действительно служит дурным целям – людям могут показывать спам или сомнительные лозунги. Правда, для этого можно использовать и обычный телефон, а не только новые медиа.

Но есть и другой момент. Вся коммуникация, всё распространение информации сегодня организованы на софте и с помощью алгоритмов. Ведёт ли это к негативным эффектам? В каком-то смысле да. То, что нравится многим, алгоритм начинает показывать всем. Я говорю про условные топ-10 и топ-20, популярные темы в Twitter.

В этом и парадокс. Компьютер – сравнительно новая технология, которая позволяет обрабатывать и хранить неограниченное количество информации. Но, в конечном итоге, всё разнообразие свелось к нескольким рейтингам «самого популярного». Хотя по идее можно настроить интерфейсы сервисов по-другому – так, чтобы они подталкивали нас к открытию нового.

– Недавно Instagram подбросил мне видео про поросёнка. Я его посмотрела, и всю следующую неделю приложение безостановочно показывало свиней. Это происходит потому, что в сервисах вроде Instagram или TikTok алгоритм следит за кликами. Но если что-то зацепило мой взгляд, это совсем не значит, что я хочу видеть это второй раз. 

– Хороший пример. У нас нет stable identity, мы не набор неких постоянных интересов. По крайней мере, хочется надеяться, что мы сложнее.

20-30 лет назад гораздо меньше людей, чем сейчас, пользовались компьютером. Теперь телефон и доступ к социальным медиа есть у двух третей населения земного шара. Поэтому компании делают интерфейсы своих сервисов как можно проще.

Google очень простой – вы видите бокс, где сразу можно набирать текст. У него нет таких алгоритмов, как в Instagram, но как только вы начинаете печатать, поисковик использует самые популярные запросы и подсказывает, как продолжить текст.

Программа пытается вам помочь. Самые гениальные люди на земле, которые работают в этих компаниях, в том числе некоторые мои ученики, действительно хотят как лучше, я в этом уверен. Но в результате они шепчут вам на ушко, что напечатать. Слишком простой интерфейс и подсказки не дают возможности выбирать.

Ещё одна проблема – непрозрачная механика алгоритма. Представьте, что вы ведёте машину и просите навигатор составить для вас маршрут. Программа предлагает один или несколько вариантов, но вы не знаете, по каким принципам она этот маршрут построила. И почему один лучше другого.

С интернет-сервисами так же. Я не призываю слишком сильно усложнять интерфейс, но, мне кажется, стоило бы хоть немного «обнажить механику» и объяснить пользователю, почему он видит то, что видит.

Сегодня мы переходим на нейронные сети. И снова – неизвестно, как сеть принимает решение. Мы уделяем много внимания вопросам приватности или чувствительности в интернете. Но не проблемам прозрачности. А ведь можно было бы посмотреть, что там происходит и как решения распределяются между связями нейронов – если бы общество создало такой запрос.

– Думаю, компании скрывают принципы работы алгоритмов из-за конкуренции.

– Да. Но конкурировать можно по-разному. Кто сказал, что самый простой продукт будет самым востребованным? Возьмём Photoshop. Он безумно сложный. Профессионально использовать Photoshop – то же самое, что управлять самолётом. И всё же это программа номер один в своей нише. Оказалось, люди готовы работать со сложным продуктом. Так что идея упрощения, когда вся механика спрятана от пользователя, не всегда ведёт к успеху.

– Вы упомянули нейронные сети. Как раз сейчас Midjourney и другие сервисы, которые генерируют изображения, взорвали мир медиа. Все генерируют картинки, даже крупнейшие СМИ. Как думаете, сам принцип, когда программа анализирует уже существующие картины и на их основе создаёт свою – это новое явление? Или любой художник по сути действует так же? 

– Художник, который жил несколько веков назад, до изобретения фотографии, не видел миллионы культурных объектов. Он мог быть мастером, но никогда бы не нарисовал картину мгновенно и в тысяче разных стилей. Конечно, это современный эффект.

Программа рисует разнообразно, очень быстро, а кроме того, она ведь не копирует имеющиеся изображения, а придумывает новые. Мы можем увидеть на рисунке животное, которое едет на велосипеде по луне, а луна при этом выглядит как бейгл. Кажется, что у нейронной сети есть воображение и представление о законах физики.

Мы говорим о феномене генеративных медиа. И это не только картинки, но и тексты, и музыка. Можно вспомнить сервис Google, который изобретёт для вас мелодию по простому текстовому описанию. Хорошую или плохую – я не могу сказать, я не музыковед. Но уверен, что 90% юзеров будут удовлетворены.

Значит, музыку для подкастов можно делать автоматически, и платить никому не нужно. То же самое с дизайном, video games. Вы можете создавать анимацию, видео, аудио – да всё, что угодно.

Конечно, это техническая революция. И не меньшего масштаба, чем предыдущие. Люди сравнивают её с появлением фотографии и кино. А я бы сравнил с распространением книг в Европе XVI века.

Всё это провоцирует много страхов. Но так было всегда, когда появлялась новая технология. И если посмотреть на дискурс вокруг нейросетей, то он не отличается от того, что говорилось о Википедии.

– Как генеративные медиа изменят работу с информацией? 

– Уже сегодня интернет заполнен контентом, который люди генерируют с помощью нейронной сети. Вы можете завести аккаунт в YouTube, потом ChatGPT напишет вам текст, другая программа найдет подходящие видео и картинки или нарисует их сама, третья – создаст ведущего-аватар, а четвёртая поможет озвучить.

Недавно вышла статья о том, что 51% американских школьных учителей уже используют ChatGPT, чтобы готовить тесты. И мы с вами говорим не о будущем, а о том, что происходит сегодня. Будьте уверены: некоторые из ваших коллег-журналистов уже пишут тексты с помощью чат-бота.

ChatGPT был обучен на триллионах страниц. Это практически 70% всего содержания Интернета. То есть он уже прочел почти всё, что люди когда-то написали.

Я спросил его, кто такой Лев Манович, он сказал, что знает, и прекрасно меня описал. Но когда я попросил написать параграф про будущее искусства в моём стиле, то не узнал себя. Это были абсолютно стереотипные идеи, которые я никогда бы не озвучил.

Выходит, ChatGPT может отвечать на огромное количество вопросов и даже сдавать экзамены. Но всё-таки выдает пока лишь то, что уже существует в больших количествах.

– Давайте представим современный цифровой ландшафт и читателя, который в нём оказывается. Раньше он целенаправленно заходил, скажем, на новостной сайт. Там была своя иерархия информации: сверху политика и экономика, то есть самое важное, потом ещё что-то и «подвал». Сейчас человек листает ленту Facebook или Instagram, которую для него составил алгоритм. Что он видит? И что это значит? 

– Это серьёзный вопрос. Раньше мы шли на сайт условной Financial Times, видели текст в специальной рубрике и воспринимали его в контексте всей газеты. Теперь куски, или «атомы», этой информации отрываются от места, где они «родились» и приносятся нам в ленту вместе с сообщениями друзей и прочим контентом.

Это фрагментарность, и она неизбежно ведёт к тому, что их изначальный смысл улетучивается. А иерархия [информации], существовавшая раньше, разрушается. У нас были энциклопедии, институты, искусствоведы и писатели, которые говорили, какая газета, фильм или книга самые важные. А теперь Сеть всё смешала.

С другой стороны, эти «атомы» доступны миллионам людей. Не нужно платить за них, идти в кинотеатр или покупать DVD. С точки зрения нашей старой культуры, существовавшей до конца 90-х, это ужасно. Но, возможно, в точки зрения культуры будущего, которая ещё не возникла, это демократизация и первый шаг к чему-то хорошему.

Что важнее? Чтобы все кирпичики были аккуратно уложены в прекрасную иерархию и существовали для ограниченного числа людей, которые могут за них заплатить? Или чтобы они рассыпались, но стали доступны всем?

Мне кажется, на этот вопрос нельзя ответить объективно.

Беседовала Елена Верещагина. 

Актуальное

Лучшее на Соли