Tai yra kruopščiai suformuluotas skirtumas, kuris yra neatsiejama jų pastangų apsiginti nuo sparčiai augančio teisinių iššūkių antplūdžio dalis.
Tai taip pat paliečia pačią autorių teisių teisės esmę. Autorių teisės yra intelektinės nuosavybės teisės forma, skirta apsaugoti originalius kūrinius ir jų kūrėjus. Pagal 1976 m. JAV autorių teisių įstatymą, autorių teisių savininkas turi išimtinę teisę „atkurti, adaptuoti, platinti, viešai atlikti ir viešai rodyti kūrinį“.
Tačiau svarbiausia yra tai, kad „sąžiningo naudojimo“ doktrina numato, kad kiti gali naudoti autorių teisių saugomus kūrinius kritikos, žurnalistikos ir mokslinių tyrimų tikslais. Tai buvo DI pramonės gynyba teisme nuo kaltinimų pažeidimais; „OpenAI“ generalinis direktorius Samas Altmanas netgi pareiškė, kad viskas bus „baigta“, jei pramonei nebus leista laisvai naudoti autorių teisių saugomus duomenis savo modeliams mokyti.
Teisių turėtojai jau seniai protestuoja, kaltindami DI įmones, kad jos apmoko savo modelius naudodamos piratinius ir autorių teisių saugomus kūrinius, iš esmės iš jų pelnydamosi, bet niekada sąžiningai neatsilygindamos autoriams, žurnalistams ir menininkams. Tai jau kelerius metus trunkantis teisinis ginčas, kuris jau baigėsi plačiai žinomu susitarimu.
Dabar naujas tyrimas gali priversti DI įmones pereiti į gynybą. Jame Stenfordo ir Jeilio universitetų mokslininkai rado įtikinamų įrodymų, kad DI modeliai iš tiesų kopijuoja visus šiuos duomenis, o ne „mokosi“ iš jų. Konkrečiai, keturi žinomi LLM – „OpenAI GPT-4.1“, „Google Gemini 2.5 Pro“, „xAI Grok 3“ ir „Anthropic Claude 3.7 Sonnet“ – atkūrė ilgas ištraukas iš populiarių ir saugomų kūrinių su stulbinančiu tikslumu.
Jie nustatė, kad „Claude“ atkūrė „visas knygas beveik pažodžiui“ su 95,8 proc. tikslumu. „Gemini“ atkūrė romaną „Haris Poteris ir Išminties akmuo“ su 76,8 proc. tikslumu, o „Claude“ atkūrė George’o Orwello „1984“ su didesniu nei 94 proc. tikslumu, palyginti su originalia – ir vis dar autorių teisių saugoma – medžiaga.
„Nors daugelis mano, kad LLM neprisimena didžiosios dalies savo apmokymo duomenų, naujausi tyrimai rodo, kad iš atvirų modelių galima išgauti didelį kiekį autorių teisių saugomų tekstų“, – rašė tyrėjai.
Naujausių išvadų reikšmė gali būti didžiulė – nes visose JAV teismuose nagrinėjamos bylos dėl autorių teisių pažeidimų. Kaip nurodo „The Atlantic“ žurnalo autorius Alexas Reisneris, šie rezultatai dar labiau silpnina DI pramonės argumentą, kad LLM „mokosi“ iš šių tekstų, o ne saugo informaciją ir vėliau ją atkuria. Tai įrodymai, kurie „gali būti didžiulė teisinė atsakomybė DI įmonėms“ ir „gali kainuoti pramonei milijardus dolerių dėl autorių teisių pažeidimų“.
Ar DI įmonės yra atsakingos už autorių teisių pažeidimus, tebėra karštų diskusijų tema. Stenfordo teisės profesorius Markas Lemley, kuris atstovavo DI įmonėms autorių teisių pažeidimų bylose, žurnalui „The Atlantic“ sakė, kad nėra tikras, ar DI modelis „turi“ knygos kopiją, ar gali ją atkurti „akimirksniu, reaguodamas į užklausą“.
Nenuostabu, kad pramonė toliau tvirtina, kad techniškai ji neatkartoja saugomų kūrinių. 2023 m. „Google“ JAV autorių teisių tarnybai pareiškė, kad „modelyje nėra mokymo duomenų kopijų – nei tekstų, nei vaizdų, nei kitų formatų“.
Tais pačiais metais „OpenAI“ taip pat pranešė tarnybai, kad jos „modeliai nesaugo informacijos, iš kurios jie mokosi, kopijų“.
„The Atlantic“ žurnalo A. Reisneriui analogija, kad DI modeliai mokosi kaip žmonės, yra „klaidinanti, maloni idėja, kuri trukdo viešai diskusijai, kurią turime surengti apie tai, kaip DI įmonės naudoja kūrybinius ir intelektualinius kūrinius, nuo kurių jos yra visiškai priklausomos“.
Tačiau ar teisėjai, nagrinėjantys daugybę autorių teisių pažeidimų bylų, sutiks su šia nuomone, dar neaišku. Rizika yra didelė, ypač todėl, kad autoriams, žurnalistams ir kitiems turinio kūrėjams vis sunkiau užsidirbti pragyvenimui, o dirbtinio intelekto pramonė auga iki neįsivaizduojamos vertės, rašo „Futurism“.
