Tusenvis av forfattere signerer brev som oppfordrer AI-produsenter til å slutte å stjele bøker

Hvis du ber GPT-4 om å gjøre en passasje i stil med Carmen Machado eller Margaret Atwood eller Alexander Chee, vil den gjøre en grei jobb med det, og med god grunn: Den har sannsynligvis fått i seg alle arbeidene deres i treningsprosessen, og bruker nå deres oppfinnsomhet til sin egen. Men disse forfatterne, og tusenvis andre, er ikke fornøyd med dette faktum.

I et åpent brev signert av mer enn 8500 forfattere av skjønnlitteratur, sakprosa og poesi, blir teknologiselskapene bak store språkmodeller som ChatGPT, Bard, LLaMa og flere tatt til oppgave for å bruke forfatterskapet deres uten tillatelse eller kompensasjon.

“Disse teknologiene etterligner og gjengir språket, historiene, stilen og ideene våre. Millioner av opphavsrettsbeskyttede bøker, artikler, essays og poesi gir “maten” for AI-systemer, endeløse måltider som det ikke har vært noen regning for», heter det i brevet.

Til tross for at systemene deres har vist seg i stand til å sitere og etterligne de aktuelle forfatterne, har AI-utviklere ikke i vesentlig grad tatt opp herkomsten til disse verkene. Er de trent på prøver skrapet fra bokhandlere og anmeldelser? Lånte de alle bøker på biblioteket? Eller kanskje de rett og slett lastet ned et av de mange ulovlige arkivene, som Libgen?

En ting er sikkert: De gikk ikke til utgivere og lisensierte dem – uten tvil den foretrukne metoden, og uten tvil den eneste lovlige og etiske. Som forfatterne skriver:

Ikke bare gjør den nylige høyesterettsavgjørelsen i Warhol v. Goldsmith det klart at den høye kommersialiteten til bruken din argumenterer mot rimelig bruk, men ingen domstol vil unnskylde kopiering av ulovlige verk som rimelig bruk. Som et resultat av å bygge inn skriftene våre i systemene dine, truer generativ AI med å skade profesjonen vår ved å oversvømme markedet med middelmådige, maskinskrevne bøker, historier og journalistikk basert på arbeidet vårt.

Vi har faktisk allerede sett dette skje. Nylig klatret en rekke AI-genererte verk av svært lav kvalitet på YA bestselgerlistene hos Amazon; utgivere oversvømmes med genererte verk; og hver dag blir denne nettsiden (og snart dette innlegget) skrapet for innhold som skal omdannes til en venn for SEO.

Disse ondsinnede aktørene bruker verktøyene, APIene og agentene utviklet av slike som OpenAI og Meta, som selv kan sies å være ondsinnede aktører selv i denne sammenhengen. Tross alt, hvem andre ville bevisst stjele millioner av verk for å drive et nytt kommersielt produkt? (Vel, Google, selvfølgelig – men søkeindeksering er meningsfullt forskjellig fra AI-inntak, og Google Books hadde i det minste unnskyldningen at det var ment å være en dedikert indeks.)

Med færre forfattere som er i stand til å leve av å skrive på grunn av kompleksiteten og de smale marginene ved storskala publisering, advarer det åpne brevet om at dette er en uholdbar situasjon for dem, spesielt nyere forfattere, «spesielt unge forfattere og stemmer fra underrepresenterte miljøer».

Brevet ber selskapene om å gjøre følgende:

1. Få tillatelse til bruk av vårt opphavsrettsbeskyttede materiale i dine generative AI-programmer.

2. Kompenser forfattere rettferdig for tidligere og pågående bruk av verkene våre i dine generative AI-programmer.

3. Kompenser forfattere rettferdig for bruken av verkene våre i AI-utdata, uansett om utdataene er i strid med gjeldende lov eller ikke.

Ingen juridisk trussel er fremsatt – som administrerende direktør i The Author’s Guild (og underskriver) Mary Rasenberger sa til NPR, “Søkssaker er en enorm sum penger. De tar veldig lang tid.” Og AI skader forfattere nå.

Hvilket selskap vil være det første til å si “ja, vi bygget vår AI på stjålne verk, og vi beklager, og vi kommer til å betale for det”? Det er noens gjetning, men det ser ut til å være lite insentiv til å gjøre det. De fleste mennesker er ikke klar over eller bekymret for at LLM-er er opprettet på hva som utgjør ulovlige midler, og at de faktisk kan inneholde og oppgi opphavsrettsbeskyttede verk. Det er lettere å se problemet (svært likt) når det er et generert bilde som gjengir en kunstners særegne stil, og det er noe tilbakeslag der.

Men den mer subtile skaden ved å bruke alle bøkene til George Saunders eller Diana Gabaldon som “mat” for ens AI kan kanskje ikke spore like mange til handling – selv om mange forfattere er klare til å kjempe.

Read More