ИИ Прогресс

Стимпанк и мыслящий кристалл

https://tinyurl.com/t-invariant/2023/03/steampunk-and-thinking-crystal/

Война, идущая на границах с архаическим миром не всем ещё позволила по достоинству оценить революцию, которая прямо сейчас меняет лицо нашей цивилизации. Выход на публику нового поколения систем искусственного интеллекта запустил процессы поистине тектонического масштаба. Отслеживать их теперь придется постоянно, а начать хочется с разговора о судьбе копирайта в ИИ-мире.

В истории человечества насчитывается всего два-три десятка таких инноваций, которые проникали во все аспекты жизни, меняли мышление и поведение людей, формировали новый образ жизни. Происходящий на наших глазах и неожиданный для многих прорыв в области искусственного интеллекта — как раз из их числа.

Хотя мечта об искусственном интеллекте ровесница ядерных и ракетных технологий, прогресс в этой области оставался очень скромным. У темы ИИ успела сформироваться репутация, как у работ по термоядерному синтезу: когда ни спроси о результате, он ожидается через 30 лет. При малейшем успехе разработчики старались дистанцироваться от темы ИИ: мол, мы делом занимаемся — распознаванием образов или там многофакторной оптимизацией, а не фантазиями о думающих машинах. Да и сегодня специалисты говорят о нейросетях лишь как о новых методах обработки информации. Однако возможности, которые все желающие тестируют с прошлого года, показывают: мы имеем дело с качественным прорывом. Какие бы технические приемы ни применили инженеры, главное, что их проявления все чаще воспринимаются людьми как во многом подобные их собственному мышлению. Важен не технологический, а гуманитарный аспект. 

 

Юридический стимпанк

Когда паровой двигатель запустил массовый переход промышленности на машинное производство, многое из того, что еще недавно требовало колоссального труда, стало выполняться механически. Лишившиеся работы ремесленники даже поднимались на стихийные бунты против машин, но им резонно отвечали: машины освобождают от тяжелого физического труда и монотонной рутины, заниматься которыми ниже человеческого достоинства. Рождалась светлая мечта о будущем, где «вкалывают роботы, счастлив человек», занятый исключительно творческим трудом, в котором машина заменить его не в состоянии. 

Луддиты разрушают машину. Генерация нейросети Midjourney.

Примерно в ту же эпоху по миру стремительно распространяется новый юридический институт — авторское право. В его основе лежит представление о том, что творческий труд — это божья искра, а тираж — лишь механическое, машинное повторение. Тем самым творческий труд признавался качественно превосходящим физический, и для его вознаграждения авторов наделяли правом контролировать использование своих произведений, в первую очередь их копирование. Отсюда английское название этого института — copyright. 

По своей юридической сути копирайт (как, кстати, и его дальний родственник патент на изобретение) — это привилегия. Он состоит в наделении автора особыми правомочиями за счет ограничения гражданских свобод других людей. Риторическим оправданием для это перераспределения свобод служила общественная польза от поощрения творческой деятельности авторов. Злые языки, правда, указывали, что копирайт гораздо важнее для издателей, которые, купив у автора его привилегию, получали защиту от конкурентов, то есть маленькую монополию, а в бизнесе нет ничего ценнее. 

Малые монополии объединялись в крупные, обзаводились юридическими службами и успешно лоббировали в парламентах увеличение сроков и объемов охраны авторских прав. Авторы же со своими выстраданными рукописями оказывались слабой стороной в сделках с издателями, для которых все эти творения (за редким исключением) были взаимозаменяемы. Так возник демпинг на первичном рынке авторских прав. Лишь во второй половине прошлого века и только в развитых странах под давлением литературных агентов средняя ставка роялти выросла до 10% розничной цены, но с переходом в электронный формат она снова стала снижаться. 

Цифра 10% за божью искру творчества на удивление напоминает церковную десятину — налог, который с давних времен считался своего рода отступными за церковное покровительство мирской деятельности. А еще 10% — это характерный КПД паровой машины. У копирайта КПД примерно такой же, если оценивать его по доле собранных с рынка средств, доходящей до авторов. Остальное уходит на функционирование самого этого юридического механизма. Вот только и от церковной десятины, и от паровозов почти везде отказались, а копирайт дожил до эпохи искусственного интеллекта, став настоящим юридическим стимпанком. Но сейчас для него наступают трудные времена. 

 

Коллизии

Обратимся к новостям. Фотобанк подает в суд на разработчиков нейросети Midjourney, генерирующей картинки по словесным запросам, за то, что, по его мнению, сеть обучали на охраняемых копирайтом изображениях. Программист подает иск против Copilot, созданного при участии Microsoft публично доступного ИИ-ассистента программиста, за возможное нарушение им копирайта. Союз дикторов России требует законодательно защитить голоса от использования при синтетическом озвучивании. Писатель с помощью ИИ сочинил и проиллюстрировал детскую книжку, стал продавать ее на Amazon, а конкуренты возмущены и требуют снять ее с продажи, потому что он не сам ее писал и вообще мало над ней трудился. 

Работа, которая прежде считалась исключительно творческой, неожиданно оказалась если не полностью, то в значительной мере по силам машине. Да, конечно, ChatGPT не выдвинет новую научную идею, Copilot не придумает нового алгоритма, а Midjourney не создаст нового художественного стиля. Пока, во всяком случае. Однако они уже берут на себя колоссальную по объему рутинную составляющую той самой интеллектуальной работы, которая в эпоху рождения копирайта считалась творческой. Оказывается, большую часть этой искры божьей легко высекает машина. 

Казалось бы, как и в случае с механизацией физического труда, можно только порадоваться, что компьютер теперь готов избавить нас от массы интеллектуальных рутин, высвобождая ресурсы для более глубоких размышлений, которые еще не под силу ИИ. Однако новые луддиты возмущены покушением машин на святое и требуют искусственно ограничить их инновационный потенциал, чтобы творческие потуги интеллектуальных кустарей оставались востребованы рынком. В качестве главного инструмента защиты консерватизма они апеллируют к копирайту, который всегда преподносился как механизм поддержки творцов и инноваторов. 

Ничего удивительного тут нет. Копирайт и раньше ограничивал свободу творчества и распространения информации. Во многих странах он изначально внедрялся в одном пакете с государственной цензурой. В более близкую к нам эпоху путь копирайта отмечен такими скандальными историями как: 

  • попытка запрета видеомагнитофонов (Sony v. Universal, 1983-1984);
  • судебные преследования за обход искусственной несовместимости DVD из разных регионов мира (DeCSS, 1996-2003); 
  • уничтожение музыкального P2P-сервиса Napster (2001), сильно задержавшее развитие сетевой дистрибуции мультимедиа; 
  • массовое вымогательство под угрозой копирайтных исков за скачивание порнофильмов с торрентов (Prenda Law, 2012-2013); 
  • уничтожение масштабного проекта Google по оцифровке книг (Open Book Alliance, 2011-2016);
  • преследование авторов фанфиков, например, иск Paramount против любительского фильма по мотивам «Звездного пути» (Axanar, 2015-2017); 

 

Копирайт и цензура

Последний пункт списка иллюстрирует наиболее разрушительный для культуры негативный эффект копирайта — проблему производных произведений. Они почти полностью выпали из сферы свободного творчества и перешли в разряд регламентированного производства, поскольку их создание теперь начинается с юридического отдела, а вовсе не с автора, задумавшего перевод или постановку, фанфик или кроссовер, аранжировку или ремейк. 

В мире, переполненном брендами и цитатами, независимому автору вообще становится небезопасно отражать реальность. Даже фоновая музыка в кафе при записи видеоблога может стать причиной удаления ролика с Youtube. И это еще один класс коллизий: когда нарушения нет, но публичной платформе проще запретить подозрительную публикацию, чем рисковать юридическими издержками. Это уже очень близко к логике цензуры и самоцензуры, знакомой жителям идеологических диктатур. Блокируется не только то, что запрещено, но и всё, что может кому-то показаться похожим на запрещенное. 

Чтобы хотя бы примерно охарактеризовать масштаб беды, сделаем количественную оценку. В СССР под цензурными ограничениями находились несколько тысяч авторов и десятки тысяч произведений. Многие из них были доступны в спецхране по особому разрешению, а несколько тысяч циркулировали в самиздате. Точных цифр нет, но разные исследователи сходятся в оценках по порядку величины. 

В США есть множество так называемых орфанных книг, то есть таких, которые нельзя ни переиздать, ни оцифровать из-за утраты данных о правообладателях. Большинство из них доступны только в крупнейших библиотеках или частных коллекциях, что до некоторой степени сопоставимо с доступностью спецхрана и самиздата в СССР. Согласно отчету американского Бюро по авторским правам (U.S. Copyright Office, 2015) счет орфанных книг идет на миллионы, а по оценкам британских исследователей их число к 2009 году составляло 13-15 млн. Это около трети от всех когда либо изданных в США книг.

Получается, что количественно с копирайтом в США связано на два порядка больше ограничений доступа к книгам, чем с цензурой в СССР при сравнимом населении стран. И этот только в одном аспекте орфанных изданий. Приведенные примеры иллюстрируют архаическую природу института копирайта, который, декларируя поддержку творчества и инноваций, на практике в значительной мере подавляет их в интересах тех, кто уже смог закрепиться на этом мультимонопольном рынке. 

 

Паровоз в тупике

И все же копирайт до сих пор не сталкивался — в открытую, по крайней мере, — с тектоническими инновациями, которые меняют траекторию движения цивилизации. Искусственный интеллект — это, по-видимому, достойный противник, у которого есть потенциал если не остановить, то сильно затормозить копирайтный паровоз. 

В основании копирайта лежит защита не самих творческих идей, а только формы их воплощения. В паровом веке машина могла воспроизводить лишь форму, и копирайт позволял творцу поучаствовать в прибылях от ее репродуцирования. 

Возьмем предыдущий абзац, переведем его на английский с помощью ИИ-сервиса Deepl.com, затем попросим ChatGPT перефразировать сказанное, сохраняя смысл, но по возможности меняя слова и обороты речи, а потом переведем обратно. Вот, результат, в котором вручную не изменено ни одной буквы: 

Авторское право предназначено для защиты не творческих идей как таковых, а материального выражения этих идей. Во время промышленной революции машины могли воспроизводить только форму произведения, и закон об авторском праве предоставил создателям возможность извлечь выгоду из этого воспроизведения.

Чуть менее литературно, чуть более многословно, но вполне приемлемо по смыслу и стилю, и ни один антиплагиат не подкопается. Но это в чистом виде машинный продукт, и такой можно приготовить из любого другого текста. 

Вот пример посложнее. Знаменитое стихотворение Киплинга ‘If–’ как нельзя более подходит к нынешним непростым временам:

If you can keep your head when all about you
Are losing theirs and blaming it on you,
If you can trust yourself when all men doubt you,
But make allowance for their doubting too…

Попросим ChatGPT переписать его другими словами и с другой рифмой:

If you can stay composed when those around
Are losing grip and laying blame on you,
If you can keep belief in what you’ve found,
But understand when doubt clouds others’ view…

Можно ли попросить еще одну версию? «Sure», — отвечает нейросеть:

When those around you are caught in fear,
And point their fingers to lay blame severe,
Trust in yourself, though others may sneer,
And grant them space, as doubt may yet appear.

Шах и мат, начинающие поэты. Защищены ли эти стихи авторским правом? Кому они принадлежат? Конечно, если во всем признаться, как здесь, то многие скажут: это производные произведения — автоматический стихотворный перевод с английского на английский. А если не признаваться? Знатоки, конечно, заметят повторение идеи, но копирайт ее не защищает. И кто же автор новых версий? 

Редьярд Киплинг и андроид с искусственным интеллектом. Генерация нейросети Midjourney

 

Угроза будущему

Общепризнанного ответа на этот вопрос нет, хотя обсуждается он уже давно (2017). Еще раньше (2011) возникали споры об авторских правах на произведения, созданные слонами и обезьянами. В ряде стран, например, в Германии, законодательство не позволяет считать автором никого кроме человека, — наследство древних представлений о «божьей искре». В США и Австралии такого ограничения нет, но судебная практика, имеющая силу прецедента, отказывает машинному творчеству в копирайте. А вот в Великобритании и Новой Зеландии закон признает авторство за лицом, «совершившим необходимые действия для создания произведения». 

Последний вариант выглядит, на первый взгляд, наиболее разумным. Авторы и раньше использовали сложную технику — тот же фотоаппарат, например. И даже если кадры делаются легко, из них еще надо выбрать удачные. Вот и сейчас, чтобы заставить нейросеть создать интересный рисунок или текст может понадобиться определенная оригинальность в формулировке задания. Однако в таком подходе кроется опасность, способная при неблагоприятном развитии событий подорвать всю индустрию искусственного интеллекта. 

Во-первых, сама нейросеть кем-то создается и обучается. А значит, ее разработчики по букве английского закона автоматически становятся соавторами всех ее произведений. Это может привести к чудовищной концентрации авторских прав и инструментов цензуры в руках таких разработчиков нейросетей. Они уже сейчас ставят ограничения, не позволяющие, например, заказывать написание фишинговых писем, программ для взлома паролей, да и просто оскорбительных или неполиткорректных текстов. 

Во-вторых, для обучения нейросетей нужны огромные массивы информации. В дело идут самые разные тексты и изображения, в том числе защищенные авторским правом. Авторы и правообладатели, почувствовав угрозу конкуренции со стороны нейросетей, бьют тревогу и требуют запретить обучать искусственный интеллект на их произведениях. Такое требование может казаться резонным, пока мы не оценим его разрушительный потенциал.

Системы ИИ уже вошли в нашу жизнь гораздо глубже, чем принято думать. Достаточно сказать, что такие поисковики, как Google, Bind или Яндекс, — это специализированные ИИ, обученные на доступных в интернете страницах, защищенных, естественно, копирайтом. Если сейчас потребовать, чтобы на использование текстов для индексации поисковики получали предварительное письменное согласие правообладателей, интернет рухнет. Машинные переводчики, фактические снявшие языковой барьер в деловом общении, тоже обучены на защищенных копирайтом параллельных текстах. Запретить такое использование — это снова разрушить вавилонскую башню. 

Очевидно, что к подобным катастрофам никто не готов. А раз так, то и накладывать копирайтные ограничения на учебные материалы для нейросетей в многочисленных других случаях было бы неправомерной дискриминацией. Тем более, что нейросети в своих работах не копируют других авторов, что было бы нарушением копирайта. Если они что-то и заимствуют, то выразить это объективным образом весьма трудно, тем более, что никакой закон не запрещает одному автору подражать стилю и манере другого, если при этом нет прямых заимствований. 

Однако, если системы ИИ продолжат совершенствоваться, впитывая всю накопленную человечеством культуру, нельзя не признать, что многие авторские произведения, особенно утилитарного характера, сильно обесценятся. Ведь каждый желающий сможет очень недорого сгенерировать себе аналог с помощью искусственного интеллекта. Более того, такой сгенерированный аналог — например, учебник по определенной теме — может быть дополнительно адаптирован под нужды заказчика, чего никогда не обеспечит продукт, ориентированный на тираж. 

Конец пути? 

Так что же, нас ждет исчезновение профессии автора, живущего за счет роялти? Отчасти да, но, как обычно в таких случаях, не до конца. В случае упадка копирайта, авторский труд до известной степени станет похож на обычный, когда человек в большей мере зарабатывает личным участием, нежели отчислениями с машинных тиражей. Этот процесс идет уже давно. Художники и раньше больше зарабатывали на продаже оригиналов, чем на правах репродуцирования, у музыкантов доходы смещаются от тиражей к концертам, роялти литераторов снижаются (The Authors Guild, 2018), и многие из них все чаще видят в книгах продвижение личного бренда, а не заработок. 

Безусловно, всегда сохранится особое ощущение от личного контакта с творческими людьми, но их копирайтные произведения, вероятно, займут примерно такое же место на информационном рынке, какое занимают хэнд-мэйд и лакшери на рынке хозтоваров. Произведения, сделанные с чувством и выпущенные небольшим тиражом при личном участии автора, всегда будут находить спрос, но эпоха массового тиражирования культуры испытает смещение в сторону машинной персонализации. Примерно так, как это уже случилось с новостями, которые мы стали получать из личной ленты в соцсетях.

Подводя итоги, мы констатируем, что копирайт и искусственный интеллект как культурные феномены входят в глубокое противоречие друг с другом. Успех одного из них плохо совместим с успехом другого. При этом копирайт принадлежит миру архаики, может быть теплому и уютному, но уходящему в прошлое, а мыслящий кристалл с искусственным интеллектом — это как раз тот случай, о котором Иосиф Бродский писал, что «вторжение будущего в настоящее носит характер несколько некомфортабельный, если не обескураживающий».

  17.03.2023