AI е брилянтен, но дали краде авторски права?

Генеративният изкуствен интелект предизвика творческа експлозия в писането на текстове, музиката, изображенията и видеопродукцията. Интернет е пълен със съдържание, създадено от AI, а пазарите активно "наливат" инвестиции в сектора.

Компанията OpenAI, създател на ChatGPT, се оценява на близо 90 милиарда долара, а нейният партньор Microsoft се превърна в най-ценната компания в света с пазарна капитализация от 3.2 трлн. долара.

Много хора обаче се чудят колко креативна е технологията в действителност и дали тези, които печелят от нея, са компенсирали справедливо творците, върху чиято работа са били обучени езиковите модели.

ChatGPT може да връща леко преработени журналистически материали, които изглежда е запомнил. Claude - чатбот, създаден от Anthropic, може да "рециклира" текстове от добре познати песни. Stable Diffusion на Stability AI възпроизвежда характеристики на чужди изображения, включително водния знак на Getty, върху чийто архив е обучен.

Генеративният AI предизвиква възмущение у хората, които държат правата върху тези творчески произведения, но в същото време той им предоставя и възможност, пише The Economist.

В ход са серия от съдебни спорове и преговори, в които притежателите на права търсят компенсации за осигуряването на материалите, с които работят "машините на бъдещето".

"За създателите на AI модели това е тревожен период. Те са създали невероятна сграда, която е изградена върху основа от пясък", отбелязва Дан Хънтър, професор по право в Кралския колеж в Лондон.

AI се обучава върху огромни количества произведения, създадени от човека - от романи до снимки и песни. Тези данни се разделят на т. нар. „токени“ – числови представяния на части от текстове, изображения или звуци.

След това моделът научава на принципа на пробата и грешката как токените обикновено се комбинират помежду си. Следвайки командите на потребителите, обученият модел може да създава свои собствени творения. Повече и по-добри данни за обучение означават по-добри резултати.

Microsoft отваря AI център в Лондон

"Черна кутия" на езиковите модели

Много компании за изкуствен интелект не споделят много подробности за данните, върху които се обучават техните модели, позовавайки се на фирмената тайна, но, според техните недоброжелатели, тази тайнственост е продиктувана и от страх от евентуални правни последици.

За много хора обаче е ясно, че поне в ранните етапи на развитието си много от компаниите са прехвърляли данни, които са били обект на авторско право.

Модел GPT-3 на OpenAI, например, е бил обучен върху масиви от данни, защитени с авторски права. Смята се, че повечето от съперниците му са възприели подобен подход.

Технологичните фирми твърдят, че няма нищо лошо в използването на чужди данни за обучение на техните модели. В крайна сметка, и хората четат, гледат и слушат защитени с авторски права произведения, а след това създават собствени оригинални такива.

Но, според притежателите на правата, има съществена разлика. Медийните компании бяха ударени тежко в ранната епоха на интернет. Рекламните приходи на издателите бяха погълнати от търсачките и социалните мрежи, а музиката на звукозаписните компании се споделяше незаконно в различни торенти и приложения.

Създателите на съдържание са решени да не повтарят грешките си отново. Издателите блокират автоматизираните алгоритми на компаниите за изкуствен интелект.

Звукозаписните компании пък изискват от услугите за стрийминг на музика да спрат компаниите с изкуствен интелект да използват техните мелодии. Има широко разпространено раздразнение, че технологичните фирми отново търсят прошка, а не разрешение.

Amazon инвестира още $2.75 млрд. в AI компанията Anthropic

За честната и нечестната употреба

В САЩ технологичните компании разчитат на правната концепция за честна употреба, която предоставя широки изключения от иначе свирепите закони за авторското право на страната. Те имат окуражаващ прецедент под формата на решение относно Google Books през 2015 г.

Тогава Гилдията на авторите съди компанията заради сканиране на защитени с авторски права книги без разрешение. Но съдът установи, че използването на материала от Google показва само малки откъси, а не целите произведения и е достатъчно „трансформиращо“, за да се счита за честна употреба.

Фирмите, работещи с AI, твърдят, че тяхното използване на защитени с авторски права материали следва подобна философия.

Междувременно, притежателите на права възлагат надежди на решение на Върховния съд миналата година, което затегна дефиницията за трансформативност, като постанови, че поредица от произведения на изкуството на Анди Уорхол, които са променили защитена с авторски права снимка на поп звездата Принс, се разминават с дефиницията за честна употреба.

Не всички видове медии обаче се ползват с еднаква защита. Законът за авторското право обхваща творческото изразяване, а не идеите или информацията. Това означава, че компютърният код, например, е слабо защитен, тъй като е предимно функционален, а не изразителен, казва Матю Саг, който преподава право в университета Емори в Атланта.

Група програмисти се стремят да изпробват тази идея в съда, като твърдят, че GitHub Copilot на Microsoft и CodexComputer на OpenAI са нарушили авторските им права чрез обучение върху тяхната работа.

Новините могат да бъдат трудни за защита по същата причина. Вестниците в САЩ изобщо не са били защитени от авторско право до 1909 г., отбелязва журналистът Джеф Джарвис.

При визуалните изображения нещата са малко по-ясни. The Economist прави експеримент с алгоритъма на Microsoft, базиран на Dall-E на OpenAI, който съвсем спокойно "рисува" изображения на Капитан Америка, който пуши Marlboro и на Малката русалка, пиеща Гинес, въпреки липсата на изрично разрешение от въпросните марки.

Музикантите също са на сравнително силни позиции. Музикалните авторски права в САЩ се спазват стриктно, като артистите изискват лицензи дори за кратки аудио семпли. По тази причина много компании за изкуствен интелект бяха особено предпазливи при пускането на своите модели за създаване на музика.

Какво предвижда първата резолюция на ООН за AI?

Сделки за права

Извън Америка правният климат е по-суров за технологичните фирми. Европейският съюз, където е базирана френската AI компания Mistral, има ограничено изключение от авторското право за извличане на данни, но няма широка защита за честна употреба. До голяма степен същото важи и във Великобритания, където Getty заведе дело срещу Stability AI.

Някои юрисдикции предлагат по-безопасни убежища. Израел и Япония, например, имат закони за авторското право, които са благоприятни за обучението на AI.

Технологичните компании намекват за потенциалната заплаха за американския бизнес, ако съдилищата на страната предприемат по-твърда позиция. OpenAI казва за спора си с New York Times, че използването на защитени с авторски права данни за обучение е „критично за конкурентоспособността на САЩ“.

Притежателите на права се възмущават от идеята, че защитата им трябва да бъде занижена до нивото на други юрисдикции, само за да запази технологичния бизнес. Но това е една от причините големите случаи да се окажат решени в полза на компаниите за AI.

И докато адвокатите подготвят аргументите си, вече се сключват сделки в тази сфера. В някои случаи съдебните дела се използва само като "лост" в преговорния процес.

Дори веднъж обучен, изкуственият интелект се нуждае от постоянен достъп до създадено от човека съдържание, за да бъде актуален, а някои притежатели на права са сключили сделки, за да снабдяват алгоритмите със свежи материали.

OpenAI казва, че е сключил около дузина лицензионни сделки, като в процес на работа са още много. Партньорите им включват имена, като Associated Press, Axel Springer (собственик на Bild и Politico), Le Monde и испанската Prisa Media.

News Corp на Рупърт Мърдок, която притежава Wall Street Journal и Sun наред с други заглавия, заяви през февруари, че е в „напреднали преговори“ с неназовани технологични фирми. Има и данни, че онлайн форумите Reddit и Tumbl също лицензират съдържанието си на фирми за изкуствен интелект.

Повечето притежатели на права обаче са песимисти. Проучване на Ройтерс сред медийни ръководители в 56 държави установява, че 48% от техните представители очакват да има „много малко“ пари от сделки за лицензиране на AI. Axel Springer, който отчете приходи от 3.9 милиарда евро през 2022 г., ще спечели няколко десетки милиона евро от тригодишната си сделка с OpenAI.

„Няма голяма възможност за лицензиране. Не мисля, че целта на моделите е да предоставят алтернативи на новините“, казва Алис Ендерс от Enders Analysis. По тази причина и предлаганите лицензионни сделки са „анемични“.

Приложение, генериращо AI изображения за секунда, вече се оценява на $500 млн.

AI за вътрешна употреба

Ето защо някои собственици на материали, защитени с авторски права, се справят сами. Миналата година Getty стартира свой собствен генеративен AI в партньорство с Nvidia. Създателят на изображения на Getty е обучен само в собствената библиотека на компанията, което го прави „безопасен за търговската мрежа".

Тя планира да пусне и видео AI платформа тази година, захранвана от Nvidia и Runway. Освен премахването на риска от дела за авторски права, Getty отсява всичко друго, което би могло да създаде проблеми на клиентите му с адвокатите по интелектуална собственост - марки, личности и много по-малко очевидни неща, като дизайни на татуировки и фойерверки.

Само малък процент от абонатите на Getty са изпробвали инструментите досега, но ръководството се надява, че периодичните приходи от услугата, в крайна сметка, ще надвишат еднократната печалба от евентуална лицензионна сделка.

Редица издатели на новини са стигнали до подобно заключение. Миналата година Bloomberg обяви, че е обучила AI алгоритъм на база на собствените си данни и текст.

Schibsted - голям норвежки издател, полага усилия за създаване на модел на норвежки език, използвайки неговото съдържание и това на други медийни компании. Други са създали чатботове.

Миналия месец Financial Times разкри Ask FT, който позволява на читателите да "разпитват" архива на вестника. Chowbot на San Francisco Chronicle, пуснат през февруари, позволява на читателите да търсят най-добрите заведения в града въз основа на рецензиите на ресторантите от вестника.

BBC обяви, че проучва разработването на AI инструменти около своя 100-годишен архив.

Рано е да се каже дали публиката ще възприеме подобни формати. Специализираните инструменти за изкуствен интелект може и да не успеят да се конкурират успешно с добрите универсални платформи.

ChatGPT на OpenAI превъзхожда AI на Bloomberg, дори при специфични финансови запитвания, според доклад на изследователи от Queen’s University, Канада, и JPMorgan Chase.

Но лицензирането на съдържание на технологичните фирми крие и своите рискове, посочва Джеймс Гримелман от университета Корнел. "Притежателите на права трябва да се замислят много за степента, в която това се използва за обучение на техните заместници", смята той.

Новите въпроси, повдигнати от AI, може да доведат до приемането на нови закони. Миналия месец Тенеси прие Закона за гарантиране на сигурността на гласа и изображенията (Ensuring Likeness Voice and Image Security, или ELVIS), забраняващ неоторизирана употреба в щата.

Но изглежда по-вероятно Конгресът да позволи на съдилищата да решат този въпрос. Някои европейски политици искат да затегнат закона в полза на притежателите на права. Директивата на ЕС относно дигиталното авторско право беше приета през 2019 г., когато генеративният AI все още не беше нещо популярно.

Друг въпрос е дали авторските права ще се разпространят и върху съдържанието, създадено от AI. Досега съдиите бяха на мнение, че произведенията, създадени от AI, сами по себе си не подлежат на авторско право.

През август американски федерален съд постанови, че "човешкото авторство е основно изискване за авторско право", като отхвърли искането на компютърен учен за авторско право върху произведение на изкуството, което той е създал с помощта на AI.

Това може да се промени, тъй като AI създава все по-голям дял от световното съдържание. На съдилищата бяха необходими няколко десетилетия, за да признаят, че лицето, което е направило снимка, може да претендира за авторски права върху изображението.

Настоящият момент припомня различен правен случай от началото на този век. Фотограф на дивата природа се опитва да предяви иск за авторски права върху снимки, направени от маймуни макак. Те използвали камера, поставена от него в индонезийска джунгла.

Съдията постановява, че тъй като ищецът не е направил снимките сам, никой не притежава авторските права върху тях (петиция от група за правата на животните за предоставяне на правото на маймуните беше отхвърлена.)

Генеративният AI обещава да изпълни света със съдържание, което няма човешки автор и следователно няма защита на авторските права. "Ние сме на път да се преместим в ерата на безкрайните маймунски селфита", казва Дан Хънтър от King’s College.

Новините на Darik Business Review във Facebook , Instagram , LinkedIn и Twitter !